CN107391703A - 图像库的建立方法及***、图像库和图像分类方法 - Google Patents
图像库的建立方法及***、图像库和图像分类方法 Download PDFInfo
- Publication number
- CN107391703A CN107391703A CN201710630738.XA CN201710630738A CN107391703A CN 107391703 A CN107391703 A CN 107391703A CN 201710630738 A CN201710630738 A CN 201710630738A CN 107391703 A CN107391703 A CN 107391703A
- Authority
- CN
- China
- Prior art keywords
- image
- described image
- labels
- label
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000002372 labelling Methods 0.000 abstract description 6
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000009739 binding Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种图像库的建立方法及***、图像库和图像分类方法。所述图像库的建立方法包括:获取待标注的图像;根据图像识别算法确定所述图像的初始标签;获取所述图像的自定义标签,所述自定义标签为用户的输入文本;根据所述初始标签和所述自定义标签确定所述图像的目标标签;存储所述图像和所述目标标签,形成训练样本。本发明提供的图像库建立方法,首先根据图像识别算法确定图像的初始标签;再根据初始标签和用户标注的自定义标签共同对图像进行标注,增加了图像标注的专业性,同时参考了人工的意见,提高了标注质量和训练样本的纯度。
Description
技术领域
本发明涉及图像分类领域,特别是涉及一种图像库的建立方法及***、图像库和图像分类方法。
背景技术
机器视觉作为人工智能的重要组成部分,在如今的生活中发挥着越来越重要的作用。但是机器视觉***在训练过程中需要通过识别大量已经标注好的样本来提高机器视觉识别***识别图片的准确性。传统的图片标注方法是直接通过人工方式对图片进行标注,然后将标签集作为图片的最终标签用作机器视觉学习的训练样本。
传统的人工标注方式不仅效率低下,而且由于个人专业知识的不同,会导致图片的标签过于发散,标注质量参差不齐,训练样本不纯,最终导致机器视觉识别图片***识别率低。
发明内容
本发明的目的是提供一种图像库的建立方法及***、图像库和图像分类方法,用于解决传统的人工标注方式标注质量参差不齐的问题。
为实现上述目的,本发明提供了如下方案:
本发明提供了一种图像库的建立方法,其特征在于,包括:
获取待标注的图像;
根据图像识别算法确定所述图像的初始标签;
获取所述图像的自定义标签;所述自定义标签为用户的输入文本;
根据所述初始标签和所述自定义标签确定所述图像的目标标签;
存储所述图像和所述目标标签,形成训练样本。
可选的,所述根据图像识别算法确定所述图像的初始标签,具体包括:
提取所述图像的特征信息;
将所述特征信息与特征库里的图像参照特征信息进行对比,得到对比结果;
根据所述对比结果确定所述图像的的初始标签。
可选的,所述获取所述图像的自定义标签,具体包括:
获取用户的输入文本;
判断所述输入文本是否为所述初始标签,得到第一判断结果;
若第一判断结果表示所述输入文本为所述初始标签,确定所述输入文本为自定义标签;
若第一判断结果表示所述输入文本不为所述初始标签,对所述输入文本进行预处理,得到自定义标签。
可选的,所述对所述输入文本进行预处理,具体包括:
对所述输入文本进行分词,得到分词结果;
将所述分词结果转换成词向量;
判断两个所述词向量的距离是否小于阈值,得到第二判断结果;
当第二判断结果表示两个所述词向量的距离小于阈值时,将两个所述向量对应的分词结果进行合并;
当第二判断结果表示两个所述词向量的距离不小于阈值时,保留所述向量对应的分词结果;
得到自定义标签。
可选的,所述根据所述自定义标签确定所述图像的目标标签,具体包括:
获取所述用户的置信度;
根据所述置信度确定所述自定义标签的权重;
根据所述权重确定所述自定义标签的优选结果。
可选的,所述获取用户的置信度,具体包括:
将带有数学期望最大的若干个标签的图片呈现给所述用户;
获取所述用户对所述图片标注的结果;
根据所述结果计算所述用户标注的准确率;
根据置信度公式计算所述用户的置信度,所述置信度公式为:其中,y表示置信度,x表示准确率。
本发明还提供了一种图像库的建立***,包括:
图像获取模块,用于获取待标注的图像;
初始标签确定模块,用于根据图像识别算法确定所述图像的初始标签;
自定义标签获取模块,用于获取所述图像的自定义标签;
目标标签确定模块,用于根据所述初始标签和所述自定义标签确定所述图像的目标标签;
存储模块,用于存储所述图像和所述目标标签,形成训练样本。
本发明还提供了一种图像库,所述图像库根据所述图像库的建立方法获得。
本发明还提供了一种图像分类的方法,根据所述的图像库对待分类的图像进行分类,所述图像分类方法包括:
获取待分类的图像;
提取所述图像的特征信息;
将所述特征信息与图像库里的图像参照特征信息进行对比,得到对比结果;
根据所述对比结果确定所述图像的的分类结果。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的图像库建立方法,首先根据图像识别算法确定图像的初始标签;再根据初始标签和用户标注的自定义标签共同对图像进行标注,增加了图像标注的专业性,同时参考了人工的意见,提高了标注质量和训练样本的纯度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明图像库的建立方法的实施例的流程图;
图2为起始模块(Inception module)的结构图;
图3为起始模块(Inception module)的结构改进图;
图4为本发明图像库的建立***的实施例的结构连接图;
图5为本发明图像分类方法的实施例的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种图像库的建立方法,所述图像库的建立方法包括:获取待标注的图像;根据图像识别算法确定所述图像的初始标签;获取所述图像的自定义标签;所述自定义标签为用户的输入文本;根据所述初始标签和所述自定义标签确定所述图像的目标标签;存储所述图像和所述目标标签,形成训练样本。
本发明提供的图像库建立方法,首先根据图像识别算法确定图像的初始标签;再根据初始标签和用户标注的自定义标签共同对图像进行标注,增加了图像标注的专业性,同时参考了人工的意见,提高了标注质量和训练样本的纯度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例
图1为本发明图像库的建立方法的实施例1的流程图,如图1所示,所述图像库的建立方法包括:
步骤101,获取待标注的图像;
步骤102,根据图像识别算法确定所述图像的初始标签,具体包括:
步骤A1,提取所述图像的特征信息;
步骤A2,将所述特征信息与特征库里的图像参照特征信息进行对比,得到对比结果;
步骤A3,根据所述对比结果确定所述图像的的初始标签,具体为:当所述对比结果满足某一预设条件时,将特征库里的图像的标签赋给所述待标注的图像。
我们选择ImageNet-1K作为训练样本,ImageNet-1K是目前公认的图像分类数据集,总共为1000个类,数据集覆盖广。
对于分类模型,我们选用了2014年的ImageNet比赛中的佼佼者----Google。GoogLeNet第一次提出了Inception module(起始模块),一般情况下,在进行对图像的卷积(一种提取图像特征的操作,且具有一定的降低图像数据维度的作用)操作时仅仅只使用一种卷积核(进行卷积操作时计算单元,主要参数包括卷积核的尺寸,以及步距,即相应几个像素点进行一次卷积操作,当步距大于1时,卷积操作也起到了降低数据维度的作用),而Inception module则在同一层中使用了多个卷积核,即在同一层中可以提取到不同的特征,结构图如图2所示。数据从下向上流,可以看到总共有4个不同尺寸的卷积核,其中包括1*1、3*3、5*5和一个3*3的max pooling,pooling是一种特殊的卷积操作,通常是取一个区域像素点的平均值或者最大值,max pooling即代表取原图像3*3区域内的最值)。
但是采用此种方法,会使得网络的参数量很大,且特征图数量不断增加(即经过卷积操作之后的图像),5*5的卷积操作将非常耗时,所以对网络的结构进行了调整,如图3所示。
我们假设前一层传来的数据为96*96*256,其中96*96代表经过卷积操作后的图像长宽,256代表图像的个数,这里的图像均为先前提到的特征图,我们考虑图一的结构,对于5*5的卷积,如果我们想要得到维度为512的输出,即最终的输出为96*96*512,根据矩阵运算,参数量为256*5*5*512,但是加上32个1*1的卷积后,参数量为256x1x1x32+32x5x5x512,缩小了4倍左右。
本发明通过上述方法确定待标注图像的10个初始标签。
步骤103,获取所述图像的自定义标签,具体包括:
步骤B1,获取用户的输入文本;
步骤B2,判断所述输入文本是否为所述初始标签;
步骤B3,若所述输入文本为所述初始标签,确定所述输入文本为自定义标签;
步骤B4,若所述输入文本不为所述初始标签,对所述输入文本进行预处理,得到自定义标签。所述预处理包括:对所述输入文本进行分词,得到分词结果;将所述分词结果转换成词向量;判断两个所述词向量的距离是否小于阈值;当两个所述词向量的距离小于阈值时,将两个所述向量对应的分词结果进行合并;当两个所述词向量的距离不小于阈值时,保留所述向量对应的分词结果;得到自定义标签。
具体实施方式为:对于每一张待标签化的图片,先在后台用图片识别算法获得10个初始标签,然后将这张图片跟这10个初始标签绑定一起推向多个用户。
用户可以从10个给定的初始标签中任选若干理想的标签提交至后台。
用户还可以在输入栏中输入自定义的文本内容提交至后台。后台基于某种分词策略(例如词典字符串最长匹配)对用户自定义输入文本内容进行分词。例如用户输入为“奔跑的小狗”,分词的结果为“奔跑”、“的”、“小狗”;用户的输入为“调皮的泰迪狗”,分词的结果为“调皮”、“的”、“泰迪狗”。
分词结果池中收集分词结果(可重复)至一定的数量N后(N>=30),使用word2vec将每一个词转换成向量,两两计算彼此的距离,将距离小于某个既定值的两个向量所对应的词进行任取其一合并。
词向量获得方法:
Word2vec是基于迭代的方法获取词向量,下面的两个公式分别对应一元语言模型(当前词的概率只和自己有关)和二元语言模型(当前词的概率和前一个词有关),利用CBOW(Continuous Bag ofWords Model)和Skip-Gram Model,可以从语料库中计算出给定上下文预测当前词的概率值,从而得到词向量。即通过建模,每个词与其上下文建立了联系;通过训练,参数和输入得到优化。最终,在实现损失函数最小化的同时,得到词向量。
计算两个向量之间的距离,即cos距离:
假设两个词向量为x(x1,x2,x3,…,xn),y(y1,y2,y3,…,yn),则两个向量之间的距离公式如下:
本发明弃用纯人工标注,加入了机器学习已有的成果先进行图片分类,再由人工选取标签标注。传统的图片标注是纯人力的对一张图片进行手动输入标签,没有任何范围限制,由于每个人的专业知识以及思维不一样,所以标注的结果往往会很混乱,而且传统标注一般一张图片仅由一人标注一次便出结果,最终造成生成的训练集质量低。我们加入现有的图片分类算法后,可以将图片的类别缩小到一定范围,避免标注人员的主观意见的影响。在得到一定范围的标签后,我们再由标注人员从范围标签内选择他所认为正确的标签进行该轮次的统计。每张图片均由多人标注,虽然标注的频率高,但是由于只是采取标注,所以每张图片标注的时间大大减少了。
步骤104,根据所述初始标签和所述自定义标签确定所述图像的目标标签;
步骤C1,获取所述用户的置信度。用户的置信度最初是一致的,但是可以通过每次标注进行调整。
在每次图片标注完成以后,通过以下步骤进行调整:
a、统计每个用户标注结果中正确的标签数和错误的标签数,计算每个用户的准确率。
b、利用置信度评测公式对所有的标签统计结果进行计算,得到该用户的置信度。置信度评测公式为:其中y是置信度,x代表准确率。
步骤C2,根据所述置信度确定所述自定义标签的权重。
后台结合用户的置信度对一张图片中的每一个标签进行加权,得到每个标签的当前总分值。例如有1个用户的置信度为10,选了标签A;而另外有8个用户的置信度都为1,都选了标签B,此时,标签A的当前总分值即为1*10,而标签B的当前总分值即为8*1。
步骤C3,根据所述权重确定所述自定义标签的优选结果。
选出权重最高的5个标签,将这5个标签与任意5个图片初始标签,再推向用户进行打标签过程,如此重复K次(K>=3),得到最终结果,即目标标签。
采用迭代方式进行图片标注,增加图片标注准确度。在每次得到足够多的标注结果后,我们会从中选取出标签数量最多的几个,然后将其作为下一轮标注的原始标签重新进行标注。重复迭代数次可得到最终图片标签。
将这5个标签与之前每个用户选定的标签与或自定义输入的标签文本做word2vec计算距离,若距离小于某个既定值,则认为该标签正确,根据正确率修改用户的置信度。
步骤105,存储所述图像和所述目标标签,形成训练样本。
将所有图像进行上述操作,获得尽量多的训练样本,共同构成图像库。
将得到的标签生成的测试集以备机器学习使用,做到反哺。在得到图片标注结果标签后,我们将其规范化成训练集,提供给机器学习者直接使用。
本发明还提供了一种图像库,所述图像库根据上述的图像库的建立方法获得。
本发明提供了一种图像库的构建***。图4为本发明图像库的建立***的实施例的结构连接图,如图4所示,所述图像库的构建***包括:图像获取模块401、初始标签确定模块402、自定义标签获取模块403、目标标签确定模块404和存储模块405。
图像获取模块401,用于获取待标注的图像;
初始标签确定模块402,用于根据图像识别算法确定所述图像的初始标签;
自定义标签获取模块403,用于获取所述图像的自定义标签;
目标标签确定模块404,用于根据所述初始标签和所述自定义标签确定所述图像的目标标签;
存储模块405,用于存储所述图像和所述目标标签,形成训练样本。
本发明还提供了一种图像分类方法,根据上述的图像库对待分类的图像进行分类。
图5为本发明图像分类方法的实施例的流程图,如图5所示,所述图像分类方法包括:
步骤501,获取待分类的图像;
步骤502,提取所述图像的特征信息;
步骤503,将所述特征信息与图像库里的图像参照特征信息进行对比,得到对比结果;
步骤504,根据所述对比结果确定所述图像的的分类结果。当所述对比结果满足某一预设条件时,将特征库里的图像的标签赋给所述待标注的图像。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种图像库的建立方法,其特征在于,包括:
获取待标注的图像;
根据图像识别算法确定所述图像的初始标签;
获取所述图像的自定义标签;所述自定义标签为用户的输入文本;
根据所述初始标签和所述自定义标签确定所述图像的目标标签;
存储所述图像和所述目标标签,形成训练样本。
2.根据权利要求1所述的图像库的建立方法,其特征在于,所述根据图像识别算法确定所述图像的初始标签,具体包括:
提取所述图像的特征信息;
将所述特征信息与特征库里的图像参照特征信息进行对比,得到对比结果;
根据所述对比结果确定所述图像的的初始标签。
3.根据权利要求1所述的图像库的建立方法,其特征在于,所述获取所述图像的自定义标签,具体包括:
获取用户的输入文本;
判断所述输入文本是否为所述初始标签,得到第一判断结果;
若第一判断结果表示所述输入文本为所述初始标签,确定所述输入文本为自定义标签;
若第一判断结果表示所述输入文本不为所述初始标签,对所述输入文本进行预处理,得到自定义标签。
4.根据权利要求3所述的图像库的建立方法,其特征在于,所述对所述输入文本进行预处理,具体包括:
对所述输入文本进行分词,得到分词结果;
将所述分词结果转换成词向量;
判断两个所述词向量的距离是否小于阈值,得到第二判断结果;
当第二判断结果表示两个所述词向量的距离小于阈值时,将两个所述向量对应的分词结果进行合并;
当第二判断结果表示两个所述词向量的距离不小于阈值时,保留所述向量对应的分词结果;
得到自定义标签。
5.根据权利要求1所述的图像库的建立方法,其特征在于,所述根据所述初始标签和所述自定义标签确定所述图像的目标标签,具体包括:
获取所述用户的置信度;
根据所述置信度确定所述自定义标签的权重;
根据所述权重确定所述自定义标签的优选结果。
6.根据权利要求5所述的图像库的建立方法,其特征在于,所述获取用户的置信度,具体包括:
将带有数学期望最大的若干个标签的图片呈现给所述用户;
获取所述用户对所述图片标注的结果;
根据所述结果计算所用户标注的准确率;
根据置信度公式计算所述用户的置信度,所述置信度公式为:其中,y表示置信度,x表示准确率。
7.一种图像库的建立***,其特征在于,包括:
图像获取模块,用于获取待标注的图像;
初始标签确定模块,用于根据图像识别算法确定所述图像的初始标签;
自定义标签获取模块,用于获取所述图像的自定义标签;
目标标签确定模块,用于根据所述初始标签和所述自定义标签确定所述图像的目标标签;
存储模块,用于存储所述图像和所述目标标签,形成训练样本。
8.一种图像库,其特征在于,所述图像库根据权利要求1至6任一项所述的图像库的建立方法获得。
9.一种图像分类方法,其特征在于,根据权利要求8所述的图像库对待分类的图像进行分类,所述图像分类方法包括:
获取待分类的图像;
提取所述图像的特征信息;
将所述特征信息与图像库里的图像参照特征信息进行对比,得到对比结果;
根据所述对比结果确定所述图像的的分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710630738.XA CN107391703B (zh) | 2017-07-28 | 2017-07-28 | 图像库的建立方法及***、图像库和图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710630738.XA CN107391703B (zh) | 2017-07-28 | 2017-07-28 | 图像库的建立方法及***、图像库和图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107391703A true CN107391703A (zh) | 2017-11-24 |
CN107391703B CN107391703B (zh) | 2019-11-15 |
Family
ID=60342794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710630738.XA Expired - Fee Related CN107391703B (zh) | 2017-07-28 | 2017-07-28 | 图像库的建立方法及***、图像库和图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107391703B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108536662A (zh) * | 2018-04-16 | 2018-09-14 | 苏州大学 | 一种数据标注方法及装置 |
CN109446065A (zh) * | 2018-09-18 | 2019-03-08 | 深圳壹账通智能科技有限公司 | 用户标签测试方法、装置、计算机设备和存储介质 |
CN109657710A (zh) * | 2018-12-06 | 2019-04-19 | 北京达佳互联信息技术有限公司 | 数据筛选方法、装置、服务器及存储介质 |
CN110085299A (zh) * | 2019-04-19 | 2019-08-02 | 合肥中科离子医学技术装备有限公司 | 一种图像识别去燥方法、***及图像库 |
CN110688509A (zh) * | 2018-06-19 | 2020-01-14 | 新智数字科技有限公司 | 一种样本数据的存储方法及装置 |
CN110866086A (zh) * | 2018-12-29 | 2020-03-06 | 北京安妮全版权科技发展有限公司 | 一种文章配图*** |
CN110929760A (zh) * | 2019-10-30 | 2020-03-27 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于计算机视觉的垃圾分类软件 |
CN111274427A (zh) * | 2020-01-08 | 2020-06-12 | 上海擎感智能科技有限公司 | 一种图片处理方法、装置及计算机存储介质 |
CN111381743A (zh) * | 2018-12-29 | 2020-07-07 | 杭州光启人工智能研究院 | 数据打标方法、计算机装置及计算机可读存储介质 |
CN111382651A (zh) * | 2018-12-29 | 2020-07-07 | 杭州光启人工智能研究院 | 数据打标方法、计算机装置及计算机可读存储介质 |
CN111401464A (zh) * | 2020-03-25 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 分类方法、装置、电子设备及计算机可读存储介质 |
CN111444372A (zh) * | 2019-04-04 | 2020-07-24 | 北京京东尚科信息技术有限公司 | 用于图像处理的***和方法 |
CN111738197A (zh) * | 2020-06-30 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种训练图像信息处理的方法和装置 |
CN112328896A (zh) * | 2020-11-26 | 2021-02-05 | 北京百度网讯科技有限公司 | 用于输出信息的方法、装置、电子设备和介质 |
CN112861934A (zh) * | 2021-01-25 | 2021-05-28 | 深圳市优必选科技股份有限公司 | 一种嵌入式终端的图像分类方法、装置及嵌入式终端 |
US11853352B2 (en) | 2018-10-10 | 2023-12-26 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for establishing image set for image recognition, network device, and storage medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186538A (zh) * | 2011-12-27 | 2013-07-03 | 阿里巴巴集团控股有限公司 | 一种图像分类方法和装置、图像检索方法和装置 |
CN103513890A (zh) * | 2012-06-28 | 2014-01-15 | 腾讯科技(深圳)有限公司 | 一种基于图片的交互方法、装置和服务器 |
CN105809096A (zh) * | 2014-12-31 | 2016-07-27 | 中兴通讯股份有限公司 | 人物标注方法和终端 |
CN105808782A (zh) * | 2016-03-31 | 2016-07-27 | 广东小天才科技有限公司 | 一种图片标签的添加方法及装置 |
US20160379091A1 (en) * | 2015-06-23 | 2016-12-29 | Adobe Systems Incorporated | Training a classifier algorithm used for automatically generating tags to be applied to images |
-
2017
- 2017-07-28 CN CN201710630738.XA patent/CN107391703B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186538A (zh) * | 2011-12-27 | 2013-07-03 | 阿里巴巴集团控股有限公司 | 一种图像分类方法和装置、图像检索方法和装置 |
CN103513890A (zh) * | 2012-06-28 | 2014-01-15 | 腾讯科技(深圳)有限公司 | 一种基于图片的交互方法、装置和服务器 |
CN105809096A (zh) * | 2014-12-31 | 2016-07-27 | 中兴通讯股份有限公司 | 人物标注方法和终端 |
US20160379091A1 (en) * | 2015-06-23 | 2016-12-29 | Adobe Systems Incorporated | Training a classifier algorithm used for automatically generating tags to be applied to images |
CN105808782A (zh) * | 2016-03-31 | 2016-07-27 | 广东小天才科技有限公司 | 一种图片标签的添加方法及装置 |
Non-Patent Citations (1)
Title |
---|
许红涛等: "一种自适应的Web图像语义自动标注方法", 《软件学报》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108536662B (zh) * | 2018-04-16 | 2022-04-12 | 苏州大学 | 一种数据标注方法及装置 |
CN108536662A (zh) * | 2018-04-16 | 2018-09-14 | 苏州大学 | 一种数据标注方法及装置 |
CN110688509A (zh) * | 2018-06-19 | 2020-01-14 | 新智数字科技有限公司 | 一种样本数据的存储方法及装置 |
CN109446065A (zh) * | 2018-09-18 | 2019-03-08 | 深圳壹账通智能科技有限公司 | 用户标签测试方法、装置、计算机设备和存储介质 |
US11853352B2 (en) | 2018-10-10 | 2023-12-26 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for establishing image set for image recognition, network device, and storage medium |
CN109657710A (zh) * | 2018-12-06 | 2019-04-19 | 北京达佳互联信息技术有限公司 | 数据筛选方法、装置、服务器及存储介质 |
CN109657710B (zh) * | 2018-12-06 | 2022-01-21 | 北京达佳互联信息技术有限公司 | 数据筛选方法、装置、服务器及存储介质 |
CN111381743A (zh) * | 2018-12-29 | 2020-07-07 | 杭州光启人工智能研究院 | 数据打标方法、计算机装置及计算机可读存储介质 |
CN111382651A (zh) * | 2018-12-29 | 2020-07-07 | 杭州光启人工智能研究院 | 数据打标方法、计算机装置及计算机可读存储介质 |
CN110866086A (zh) * | 2018-12-29 | 2020-03-06 | 北京安妮全版权科技发展有限公司 | 一种文章配图*** |
CN111381743B (zh) * | 2018-12-29 | 2022-07-12 | 深圳光启高等理工研究院 | 数据打标方法、计算机装置及计算机可读存储介质 |
CN111444372A (zh) * | 2019-04-04 | 2020-07-24 | 北京京东尚科信息技术有限公司 | 用于图像处理的***和方法 |
CN111444372B (zh) * | 2019-04-04 | 2024-03-08 | 北京京东尚科信息技术有限公司 | 用于图像处理的***和方法 |
CN110085299B (zh) * | 2019-04-19 | 2020-12-08 | 合肥中科离子医学技术装备有限公司 | 一种图像识别去燥方法、***及图像库 |
CN110085299A (zh) * | 2019-04-19 | 2019-08-02 | 合肥中科离子医学技术装备有限公司 | 一种图像识别去燥方法、***及图像库 |
CN110929760A (zh) * | 2019-10-30 | 2020-03-27 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 一种基于计算机视觉的垃圾分类软件 |
CN111274427A (zh) * | 2020-01-08 | 2020-06-12 | 上海擎感智能科技有限公司 | 一种图片处理方法、装置及计算机存储介质 |
CN111401464A (zh) * | 2020-03-25 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 分类方法、装置、电子设备及计算机可读存储介质 |
CN111738197B (zh) * | 2020-06-30 | 2023-09-05 | 中国联合网络通信集团有限公司 | 一种训练图像信息处理的方法和装置 |
CN111738197A (zh) * | 2020-06-30 | 2020-10-02 | 中国联合网络通信集团有限公司 | 一种训练图像信息处理的方法和装置 |
CN112328896A (zh) * | 2020-11-26 | 2021-02-05 | 北京百度网讯科技有限公司 | 用于输出信息的方法、装置、电子设备和介质 |
CN112328896B (zh) * | 2020-11-26 | 2024-03-15 | 北京百度网讯科技有限公司 | 用于输出信息的方法、装置、电子设备和介质 |
CN112861934A (zh) * | 2021-01-25 | 2021-05-28 | 深圳市优必选科技股份有限公司 | 一种嵌入式终端的图像分类方法、装置及嵌入式终端 |
Also Published As
Publication number | Publication date |
---|---|
CN107391703B (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107391703B (zh) | 图像库的建立方法及***、图像库和图像分类方法 | |
CN109815801A (zh) | 基于深度学习的人脸识别方法及装置 | |
CN110399905B (zh) | 施工场景中安全帽佩戴情况的检测及描述方法 | |
CN110110715A (zh) | 文本检测模型训练方法、文本区域、内容确定方法和装置 | |
CN103577475B (zh) | 一种图片自动化分类方法、图片处理方法及其装置 | |
CN110136154A (zh) | 基于全卷积网络与形态学处理的遥感图像语义分割方法 | |
CN107742107A (zh) | 人脸图像分类方法、装置及服务器 | |
CN108961245A (zh) | 基于双通道深度并行卷积网络的图像质量分类方法 | |
CN108229397A (zh) | 基于Faster R-CNN的图像中文本检测方法 | |
CN108109055B (zh) | 一种基于图像渲染的跨场景服装检索方法 | |
CN106126581A (zh) | 基于深度学习的手绘草图图像检索方法 | |
CN110096641A (zh) | 基于图像分析的图文匹配方法、装置、设备及存储介质 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN106778852A (zh) | 一种修正误判的图像内容识别方法 | |
CN110427990A (zh) | 一种基于卷积神经网络的艺术图像分类方法 | |
CN107729312A (zh) | 基于序列标注建模的多粒度分词方法及*** | |
CN103186538A (zh) | 一种图像分类方法和装置、图像检索方法和装置 | |
Termritthikun et al. | NU-InNet: Thai food image recognition using convolutional neural networks on smartphone | |
CN106897669A (zh) | 一种基于一致迭代多视角迁移学习的行人再辨识方法 | |
CN108509833A (zh) | 一种基于结构化分析字典的人脸识别方法、装置及设备 | |
CN109886153A (zh) | 一种基于深度卷积神经网络的实时人脸检测方法 | |
CN108595558A (zh) | 一种数据均衡策略和多特征融合的图像标注方法 | |
CN110728307A (zh) | 自生成数据集与标签实现x光影像图小样本字符识别方法 | |
CN110263174A (zh) | —基于焦点关注的主题类别分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191115 |