CN110309339B - 图片标签生成方法及装置、终端及存储介质 - Google Patents

图片标签生成方法及装置、终端及存储介质 Download PDF

Info

Publication number
CN110309339B
CN110309339B CN201810836429.2A CN201810836429A CN110309339B CN 110309339 B CN110309339 B CN 110309339B CN 201810836429 A CN201810836429 A CN 201810836429A CN 110309339 B CN110309339 B CN 110309339B
Authority
CN
China
Prior art keywords
picture
identification unit
label
category
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810836429.2A
Other languages
English (en)
Other versions
CN110309339A (zh
Inventor
任旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201810836429.2A priority Critical patent/CN110309339B/zh
Publication of CN110309339A publication Critical patent/CN110309339A/zh
Application granted granted Critical
Publication of CN110309339B publication Critical patent/CN110309339B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图片标签生成方法及装置、终端及存储介质;本发明实施例在获取到图片之后,使用类别识别单元,根据图片的视觉内容确定图片对应的类别标签,使用类别标签对应的内容识别单元,根据图片的视觉内容确定图片对应的视觉内容标签,最后基于类别标签以及视觉内容标签生成并显示图片的标签信息;在该过程中,类别标签以及视觉内容标签都是根据图片的视觉内容得到的,进而标签信息也是与图片的视觉内容相关的,这样用户就可以基于图片内容查找到对应的图片,解决了现有图片标签生成方式存在的用户不能准确搜索图片的技术问题。

Description

图片标签生成方法及装置、终端及存储介质
技术领域
本发明涉及数据查询领域,具体涉及一种图片标签生成方法及装置、终端及存储介质。
背景技术
随着技术的发展,图片在用户日常生活中的作用日益重要,例如用户使用照片、视频交流信息,来替换纯文本的聊天方式。
当手机内图片较多时,用户在查找图片时,就需要花费较多的时间和精力。现有技术为了便于用户查找图片,往往会将图片日期或者图片存储位置或者图片名称等作为图片标签,以便于用户查找。但是这些基于时间或者存储位置或者图片名称方式,需要用户知道图片时间或者存储位置或者图片名称,才能查找到对应图片,若用户仅记得图片的大致内容而不记得时间或者存储位置或者图片名称等,则无法准确的搜索应图片。
即现有图片标签的生成方式存在用户不能准确搜索图片的技术问题。
发明内容
本发明实施例提供一种图片标签生成方法及装置、终端及存储介质,以解决现有图片标签生成方式存在的用户不能准确搜索图片的技术问题。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例提供了一种图片标签生成方法,其包括:
获取图片;
使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签;
基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
本发明实施例提供了一种图片标签生成方法,其包括:
服务器根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元,发送所述类别识别单元以及内容识别单元至终端;
所述终端获取图片,使用类别识别单元根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
本发明实施例提供了一种图片标签生成装置,其包括:
扫描模块,用于获取图片;
第一识别模块,用于使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
第二识别模块,用于使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签;
生成模块,用于基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
本发明实施例提供了一种终端,其包括处理器和存储器,所述存储器存储有多条指令,所述指令适于处理器进行加载,以执行上述图片标签生成方法中的步骤。
本发明实施例提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述图片标签生成方法中的步骤。
本发明实施例在获取到图片之后,使用类别识别单元,根据图片的视觉内容确定图片对应的类别标签,使用类别标签对应的内容识别单元,根据图片的视觉内容确定图片对应的视觉内容标签,最后基于类别标签以及视觉内容标签生成并显示图片的标签信息;在该过程中,类别标签以及视觉内容标签都是机器学习模型根据图片的视觉内容得到的,可以较为准确的反映图片的视觉内容,进而基于类别标签以及视觉内容标签所生成的标签信息也是与图片的视觉内容相关的,这样用户就可以基于知道的大概图片内容,如海景、沙滩、文本等,查找到对应的图片,解决了现有图片标签生成方式存在的用户不能准确搜索图片的技术问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的通信***的组网示意图;
图2是本发明实施例提供的图片标签生成方法的***交互流程示意图;
图3是本发明实施例提供的图片标签生成方法的终端侧流程示意图;
图4是本发明实施例提供的图片标签生成方法的服务器侧流程示意图;
图5是本发明实施例提供的通信***的应用场景示意图;
图6是本发明实施例提供的通信方法的流程示意图;
图7是本发明实施例提供的标签识别方法的流程示意图;
图8是本发明实施例提供的图片标签生成装置的第一种结构示意图;
图9是本发明实施例提供的图片标签生成装置的第二种结构示意图;
图10是本发明实施例提供的机器学习模块的第一种示意图;
图11是本发明实施例提供的机器学习模块的第二种示意图;
图12是本发明实施例提供的下载界面的示意图;
图13是本发明实施例提供的图片标签的第一种示意图;
图14是本发明实施例提供的图片标签的第二种示意图;
图15是本发明实施例提供的图片标签的第三种示意图;
图16是本发明实施例提供的图片标签的第四种示意图;
图17是本发明实施例提供的图片标签的第五种示意图;
图18是本发明实施例提供的多级标签的示意图;
图19是本发明实施例提供的显示界面的示意图;
图20是本发明实施例提供的终端的结构示意图;
图21是本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例所提供的通信***的场景示意图,该***可以包括终端11、网关12以及提供各种数据以及业务支持的服务器13;其中:
终端11包括但不局限于手机、平板等便携终端,以及电脑等固定终端,用于为用户提供业务访问接口,并根据用户各种操作,展示服务器返回的消息,并通过网关12传输至服务器13,如用户使用终端从服务器获取图片,获取机器学习模型等,以及终端将用户的编辑操作上传至服务器,供服务器进行模型训练等;
网关12是连接服务器13与用户终端11的枢纽,主要进行数据请求以及响应的交互;
服务器13用于为用户提供各种业务服务,如消息交互服务等、模型下载服务。
在本发明实施例中,终端11至少用于获取图片,使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息;在该过程中,类别标签以及视觉内容标签都是根据图片的视觉内容得到的,可以较为准确的反映图片的视觉内容,进而基于类别标签以及视觉内容标签所生成的标签信息也是与图片的视觉内容相关的,这样用户就可以基于知道的大概图片内容,如海景、沙滩、文本等,查找到对应的图片,解决了现有图片标签生成方式存在的用户不能准确搜索图片的技术问题。
在本发明实施例中,类别识别单元与内容识别单元都是基于图片的视觉内容进行识别的,其实现可以基于纯硬件实现,例如固化有识别算法的FPGA器件等,也可以由计算机程序实现,如各种算法对应的代码等,下文以类别识别单元与内容识别单元通过代码(如机器学习模型对应的代码等)实现为例进行说明,纯硬件实际方式与此类型,不再赘述。
在本发明实施例中,服务器13至少用于根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元;其中,所述类别识别单元用于根据所述图片的视觉内容确定所述图片对应的类别标签,所述内容识别单元用于根据所述图片的视觉内容确定所述图片对应的视觉内容标签,然后发送所述类别识别单元以及内容识别单元;这样图片的标签信息是在终端侧生成的,不需要将数据传输至服务器,加快了识别速度,节省了服务器资源。
在本发明中,图片的视觉内容不同于图片的大小、生成时间、名称、地理位置、存储位置等需要采用额外文件存储的内容,是指图片在被打开后展示给用户的,需要用户通过视觉才能观察到的数据,例如图片内的文本、花、风景等内容。
在本发明中,视觉内容标签包括图片内的文本内容、具体人物信息(人脸识别的结果)、建筑物信息等等。
在本发明中,将标签分为多个级别,例如第一级别的类别标签、以及第二级别的视觉内容标签等;一个类别标签对应至少一个视觉内容标签等,一个图片的视觉内容可以对应多个类别标签,例如一个包含人物的海景图片,该图片的类别标签就包含“人物”、“海景”等。
在本发明中,为了对应类别识别单元以及内容识别单元,将机器学习模型也分为多个级别,例如对应类别识别单元的第一级机器学习模型、以及对应内容识别单元的第二级机器学习模型,终端侧可以实现一个第一级机器学习模型的识别功能,以及实现多个第二级机器学习模型的识别功能,服务器侧的代码可以实现对个第一级机器学习模型的识别功能,以及实现多个第二级机器学习模型的识别功能。
在本发明中,类别识别单元以及内容识别单元都可以包括多个基础单元,这些基础单元中部分是相同的,称为通用基础单元,而另外一些是专用的,称为专用基础单元,这些所有的基础单元组合为基础单元集。在类别识别单元以及内容识别单元对应机器学习模型时,为了降低终端内机器学习模型的代码体积,将模型内的数据(主要是代码)分为通用部分和专用部分,通用部分和所有的专用部分组成基础单元集对应的基础机器学习模型数据,即基础机器学习模型数据包括所有的程序代码(即算法代码),第一级机器学习模型由通用部分、对应的专用部分以及参数数据(即算法对应的加权参数等参数)形成,第二级机器学习模型由通用部分、对应的专用部分以及参数数据形成,这样就实现了通用部分对应代码的复用,减小了代码体积。
需要说明的是,图1所示的***场景示意图仅仅是一个示例,本发明实施例描述的服务器以及场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着***的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别从3个角度,针对本发明进行详细说明。
图2是本发明实施例提供的图片标签生成方法的***交互流程示意图,请参阅图2,该图片标签生成方法包括以下步骤:
S201:服务器根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元,发送所述类别识别单元以及内容识别单元至终端;
在本发明实施例中,服务器首先对视觉内容标签等进行聚类等处理,得到类别标签,如图18所示,类别标签包括风景、建筑等,风景对应的视觉内容标签包括海、海滩、瀑布等。
在本发明实施例中,类别识别单元对应的第一级机器学习模型、以及内容识别单元对应的第二级机器学习模型,是服务器基于样本库内的图片以及图片对应的类别标签和视觉内容标签,对模型进行训练得到的。这里的模型可以是各种各样的,下文将以CNN卷积神经网络技术的实现方式进行描述,此处不再赘述。
S202:终端获取图片,使用类别识别单元根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
本步骤在生成图片对应的视觉内容标签时,不是直接使用所有内容识别单元对应的第二级机器学习模型分别对图片的视觉内容进行识别,而是仅使用类别标签对应的内容识别单元对应的第二级机器学习模型对图片的视觉内容进行识别,大大降低了计算量,同时加快了计算速率。
以终端侧常见的90类标签识别技术,针对一个图片,现有技术需要识别90次才能得到所有的标签,而本步骤仅需要识别1(采用第一级机器学习模型得到类别标签)+n(类别标签对应的n个第二级机器学习模型得到视觉内容标签,根据聚类程度n的大小一般为5至15)即可,即针对一个图片仅需要识别16次即可得到所有的标签,这样进行对比就可以知道,本实施例采用多级识别技术可以大大降低终端负荷,降低资源浪费。
可选的,机器学习模型在识别图片内容时,可能存在是否不准确或者识别不完整的问题,用户可以手动修改图片的标签信息,服务器还可以根据用户的编辑操作,重新训练机器学习模型,此时,图2所示的方法还包括:
所述终端接收编辑操作,根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息,上传所述编辑操作至所述服务器;
所述服务器获取所述编辑操作对应的图片以及标签信息,基于所述编辑操作对应的图片以及标签信息,对所述类别识别单元以及所述内容识别单元中的至少一个进行训练。
现结合图3对本发明在终端侧的实现进行说明。
图3是本发明实施例提供的图片标签生成方法的终端侧流程示意图,请参阅图3,该图片标签生成方法包括以下步骤:
S301:获取图片。
终端在满意预定条件时,对预定存储位置进行扫描,得到图片,例如终端实时或者周期对社交软件的会话记录文件夹、相册文件夹等存储位置进行扫描,得到需要生成标签信息的图片。
S302:使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签。
本步骤是为了得到图片对应的类别标签,以便于调用对应的内容识别单元进行进一步的识别。
可选的,在本步骤之前,本实施例包括:
在基础单元集中,调用所述类别识别单元对应的基础单元;
根据所述类别识别单元的参数数据,以及所述类别识别单元对应的基础单元,得到所述类别识别单元。
以基础单元集为基础机器学习模型数据为例进行说明;如图11所示,本发明提供的基础机器学习模型数据包括:
通用部分C1、S2、C3、S4这4个计算层、以及F5和F9这两个全连接层,C1以及C3为卷积层,S2以及S4为下采样层;
专用部分C6a、C6b、C6c、C6d、C6e、S7a、S7b、S7c、S7d、S7e、C8a、C8b、C8c、C8d、C8e等这15个计算层,C6a、C6b、C6c、C6d、C6e、C8a、C8b、C8c、C8d、C8e为卷积层,S7a、S7b、S7c、S7d、S7e为下采样层。
计算层以及全连接层是由程序代码实现的。
假设第一级机器学习模型的算法数据包括C1、S2、C3、S4、F5、C6a、S7a、C8a和F9这9个层对应的算法代码等,此时终端调用C1、S2、C3、S4、F5、C6a、S7a、C8a和F9这9个层,然后将第一级机器学习模型的参数数据(包括各层对应的系数等)添加到对应层,构建得到第一级机器学习模型;然后得到该图片对应的类别标签。
例如图13所示的图片,使用第一级机器学习模型对图片的视觉内容进行识别后,得到“花”这个类别标签。
S303:使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签。
本步骤是对图片的视觉内容进一步识别,以得到图片对应的视觉内容标签。
可选的,为了实现本步骤,在本步骤之前,还包括:
获取所述内容识别单元对应的基础单元以及参数数据;
在基础单元集中,调用所述内容识别单元对应的基础单元;
根据所述内容识别单元对应的参数数据,以及所述内容识别单元对应的基础单元,得到所述内容识别单元。
在如图11所示的实施例中,假设第二级机器学习模型的算法数据包括C1、S2、C3、S4、F5、C6b、S7b、C8b和F9这9个层对应的算法代码等,此时终端调用C1、S2、C3、S4、F5、C6b、S7b、C8b和F9这9个层,然后将第二级机器学习模型的参数数据(包括各层对应的系数等)添加到对应层,构建得到第二级机器学习模型;然后得到该图片对应的视觉内容标签。
如图14所示,针对图片的内容进一步识别,得到“梅花”这个视觉内容标签。
S304:基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
本步骤可以通过多种方式实现,例如直接将类别标签以及视觉内容标签,作为图片的标签信息,也可以将类别标签以及视觉内容标签的关键词作为图片的标签信息。
图4是本发明实施例提供的图片标签生成方法的服务器侧流程示意图,请参阅图4,该图片标签生成方法包括以下步骤:
S401:根据视觉内容标签,得到类别标签。
本步骤是指服务器对视觉内容标签进行聚类等处理,得到类别标签。
S402:获取类别识别单元以及内容识别单元。
在本步骤中,所述类别识别单元用于根据所述图片的视觉内容确定所述图片对应的类别标签,所述内容识别单元用于根据所述图片的视觉内容确定所述图片对应的视觉内容标签。
针对类别识别单元以及内容识别单元在上文已经进行了描述,不再赘述。
S403:发送类别识别单元以及内容识别单元。
可选的,为了降低数据传输所占用的资源,本步骤包括:
获取基础单元集中各基础单元的生成数据;
发送所述基础单元集中各基础单元的生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据。
可选的,为了降低数据传输所占用的资源,终端可以仅从服务器获取部分类别标签对应的第二级机器学习模型,例如用户喜好拍摄风景,就可以仅下载风景这一类别标签对应的第二级机器学习模型。那么,终端在满足某些预设条件时,就可以重新从服务器下载新的机器学习模型。因此,在一些实施例中,图3所述的方法包括:在满足预设条件时,生成并发送下载请求至服务器;接收服务器反馈的所述模型下载请求对应的基础单元数据;所述基础单元数据包括基础单元生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据中的至少一种。
可选的,所述预设条件包括以下条件中的至少一种:
条件一、终端当前的类别识别单元和/或内容识别单元的版本低于服务器;如图6所示,为了避免终端因为更新不及时、掉线等问题,导致的终端当前第一级机器学习模型和/或第二级机器学习模型的版本低于服务器的版本(将服务器的版本作为阈值),服务器与终端进行定期的保活,保活消息内携带服务器内版本号,终端根据保活消息判断是否需要下载模型,将在下文进行详细描述;
条件二、终端内无法得到视觉内容标签的图片数量大于阈值;例如终端仅下载了“风景”对应的第二级机器学习模型,若某段时间内收到大量的人物图片,这些人物图片将无法得到视觉内容标签,在某时刻大于阈值(例如20张),则自动或者提示用户从服务器下载“人物”对应的第二级机器学习模型;
条件三、终端接收到下载操作;如图12所示,用户在下载界面选择下载“人物”对应的第二级机器学习模型,此时终端判定接收到模型下载操作,生成对应的模型下载请求。
可选的,为了终端内图片的标签信息的准确性,终端可以周期性的从服务器获取图片对应的标签信息,此时,图3所示的方法还包括:获取所述图片对应的图片标识;基于所述图片标识,从服务器获取所述图片的标签信息;该更新方式将在下文进行描述,不再赘述。
可选的,机器学习模型在识别图片内容时,可能存在是否不准确或者识别不完整的问题,用户可以手动修改图片的标签信息,此时,图3所示的方法还包括:接收编辑操作;根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息。
如图15所示,针对图片识别得到的标签信息包括“风景”、“花”、“梅花”,图片还包含了狗狗的画像,此时用户可以点击图片中狗狗的位置,增加标签“宠物”和“狗狗”。
为了使得其他用户的用户终端可以准确的识别图片内容,得到正确的标签信息,图3所示的方法还包括:上传所述编辑操作对应的编辑对象;此时,服务器就可以将编辑对象发送至其他终端。
可选的,服务器还可以根据用户的编辑操作,重新训练机器学习模型,此时,图4所示的方法还包括:接收编辑操作;获取所述编辑操作对应的图片以及标签信息;基于所述编辑操作对应的图片以及标签信息,对类别识别单元以及内容识别单元中的至少一个进行训练。在重新训练之后,更新对应模型的版本号。
若对整个模型重新训练,则会导致较大的训练工作,本申请将完整的模型分离为计算层(包括卷积层和采样层)和全连接层。这样当标签分类需要调整时,仅需要重新训练全连接层即可,在标签分类调整后,终端仅需更新全连接层的参数即可。因此,可选的,对所述类别识别单元以及内容识别单元中的至少一个进行训练包括:对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行训练。
基于上述描述可知,在本实施例中,终端获取图片后,使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息;在该过程中,类别标签以及视觉内容标签都是机器学习模型根据图片的视觉内容得到的,可以较为准确的反映图片的视觉内容,进而基于类别标签以及视觉内容标签所生成的标签信息也是与图片的视觉内容相关的,这样用户就可以基于知道的大概图片内容,如海景、沙滩、文本等,查找到对应的图片,解决了现有图片标签生成方式存在的用户不能准确搜索图片的技术问题。服务器根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元,发送类别识别单元以及内容识别单元;这样图片的标签信息是在终端侧生成的,加快了识别速度,节省了服务器资源。
现以***为社交平台、类别识别单元通过第一级机器学习模型实现、内容识别单元通过第二级机器学习模型实现为例,对本发明进行进一步的说明。
如图5所示,本实施例提供的***包括:第一终端51、第二终端52、社交服务器53以及标签服务器54;其中:第一终端51与第二终端52通过社交服务器53进行图片交互,标签服务器54根据视觉内容标签,得到类别标签,获取第一级机器学习模型以及第二级机器学习模型,发送所述第一级机器学习模型以及第二级机器学习模型。
可选的,社交服务器53以及标签服务器54的功能可以由一个服务器实体实现。
在本实施例中,为了便于描述,将机器学习模型称为识别模块,那么识别模型将包括一个一级识别模块以及多个二级识别模块;将类别标签称为一级标签,视觉内容标签称为二级标签。
如图6所述,本实施例提供的方法包括以下步骤:
S601:标签服务器生成一级标签以及二级标签。
服务器对采集现有的标签,将其作为二级标签,然后对二级标签进行聚类,得到多个一级标签。
如图18所示,一级标签包括“风景”、“建筑”、“人脸”、“文本”等。
各一级标签包括不定项的二级标签。
S602:标签服务器训练得到一级识别模块以及二级识别模块。
本步骤为常规的模型训练,在本实施例中,模型采用CNN卷积神经网络技术来实现。
LeNet-5的结构如图10所示,LeNet-5共有7层,不包含输入,每层都包含可训练参数;每个层有多个Feature Map,每个FeatureMap通过一种卷积滤波器提取输入的一种特征,然后每个FeatureMap有多个神经元,其中卷积层(C1-C5层)通过卷积和降采样的计算进行特征提取,得到120维向量,F6是全连接层,通过C5输入的120维向量进行分类。
如果采用复杂卷积层,则特征提取的充分,标签分类调整后,也能取得较好的识别率。但是会导致代码体积较大,计算耗时较长。反之,简化卷积层,可以减少体积和运算时长,但是由于提取特征不充分,导致调整分类后识别率下降。因此需要合理设置卷积层,使之在保持特征提取较为充分的情况下,尽量减少提交和运算复杂度。因此,在本实施例中,模型采用图11所示的10层结构,图11所示的模型为基础模块,一级识别模块以及二级识别模块(如识花模块、OCR模块、人脸识别模块等)调用基础模块中的算法数据,然后使用对应的参数数据,形成对应的识别模块。
S603:标签服务器发送一级识别模块以及二级识别模块至终端。
本步骤是服务器发送所述基础机器学习模型数据、所述第一级机器学习模型的参数数据以及所述第二级机器学习模型的参数数据到终端。
S604:标签服务器与终端进行保活。
在本步骤中,终端通过保活消息获得服务器内各识别模块的版本号。
服务器内各识别模块的版本号如下表1所示:
识别模块名称 版本 识别类型
一级识别模块 1.0.1 All
识花 1.2 花、植物
OCR模块 1.1 文字
人脸识别 1.0 人、合影、儿童
动物识别 1.0 宠物
表1
然后获取终端内各识别模块的版本号,如下表2所示:
识别模块名称 版本 识别类型
一级识别模块 1.0.1 All
识花 1.2 花、植物
表2
比较表1和表2可知,一级识别模块以及识花模块的版本号相同,不需要更新。
S605:第一终端接收到来自第二终端的图片a、图片b和图片c。
第二终端在用户的控制下,通过社交服务器向第一终端发送了图13所示的图片a、图15所示的图片b、以及图16所示的图片c。
S606:第一终端使用一级分类模块得到图片a、图片b和图片c的标签。
现结合图7,对本步骤进行具体说明,如图7所示,本步骤包括:
S701:获取图片。
本步骤是常规的图片接收步骤,不再赘述。
S702:判断图片是否为没有生成标签的图片。
终端接收到一个图片后,根据图片标识,如全网唯一编码等,在终端内查找是否存储该图片标识对应的标签,若不存在,则判断该图片为没有生成标签的图片,执行步骤S703;若存在,则该图片不需要生成标签,返回获取下一个图片。
S703:针对图片,使用一级识别模块得到一级标签。
假设,针对图片a,得到的一级标签为花,针对图片b,得到的一级标签为花,针对图片c,得到的一级标签为人物和文本。
S704:选择一个一级标签,判断是否存在对应的二级识别模块。
例如针对一级标签花,对应的二级识别模块为识花模块,针对一级标签人物,对应的二级识别模块为人脸识别模块,针对一级标签文本,对应的二级识别模块为OCR识别模块。
本步骤进行简单的判断,若判读结果为是,则执行步骤S705,若判读结果为不存在,则执行步骤S709。
例如,针对一级标签花,存在对应的二级识别模块识花,执行步骤S705;针对一级标签人物和文本,不存在对应的二级识别模块,执行步骤S70。
S705:针对图片,使用二级识别模块得到二级标签。
假设,针对图片a,得到的二级标签为梅花,针对图片b,得到的二级标签为梅花。
S706:选择一个二级标签,判断是否存在对应的二级识别模块。
本步骤进行简单的判断,若判读结果为是,则执行步骤S707,若判读结果为不存在,则执行步骤S708。
S707:针对图片,使用二级识别模块得到二级标签。
本步骤与步骤S705相同,不再赘述。
S708:判断该二级标签是否是最后一个二级标签。
因为一个图片可能存在多个二级标签,需要对所有二级标签都进行判断及识别,若该二级标签不是最后一个二级标签,则识别没有结束,返回执行步骤S706,若该二级标签是最后一个二级标签,则识别结束,执行步骤S710。
S709:判断该一级标签是否是最后一个一级标签。
因为一个图片可能存在多个一级标签,需要对所有一级标签都进行判断及识别,若该一级标签不是最后一个一级标签,则调用二级识别模块进行识别的步骤没有结束,返回执行步骤S704,若该一级标签是最后一个一级标签,则调用二级识别模块进行识别的步骤结束,执行步骤S710。
S710:保存识别得到的图片标签。
可以采用表格的方式存储识别得到的图片标签。
S607:第一终端从服务器下载二级识别模块。
因为针对图片c,得到的一级标签为人物和文本,不存在对应的二级识别模块,因此需要从服务器下载对应的二级识别模块,即人脸识别模块和OCR识别模块。
在一些实施例中,终端可以比较本地已安装的模块版本,如果本地版本低,则提示用户更新。用户同意后,下载安装新模块。
在一些实施例中,终端可以检查未安装模块的识别类型中的标签,如果用户本地图片中包含大量对应标签,则提示用户是否下载新模块。例如:用户图库中有大量人物、合影的图片,则提示用户是否下载“人脸识别”模块。
S608:第一终端使用新下载的二级识别模块识别图片得到二级标签。
如图17所示,第一终端对图片c进行识别,得到二级标签“黄某某”和“电话1**********”。
S609:第一终端根据用户修改操作,修改图片b的标签。
如图15所示,第一终端将图片b的标签修改为“风景”、“花”、“梅花”、“宠物”和“狗狗”。
S610:第一终端上传修改结果到识别服务器。
本步骤为常规的数据上传,不再赘述。
S611:识别服务器将修改结果发送至其他终端。
识别服务器将图片b修改后的标签,发送至第二终端。
S612:识别服务器重新训练识别模块。
当用户添加或修改图片标签之后,修改结果会发送到服务器。服务器按照图片ID汇总每个标签的数量。当某个标签的数量超过阈值,则该标签进入更新列表。更新列表中的标签,可以加入到样本库中,用于优化识别模块,提高识别准确度。
S613:第一终端从识别服务器更新图片的标签。
终端定期检查本地的列表标签表,将时间戳早于一定时间(如30天)的图片ID,发送到服务器,检查是否有更新。如果图片ID有更新,则在本地更新标签。
S614:第一终端存储图片的标签。
针对上述3个图片,第一终端内存储的标签新区如下表3以及表4所示:
表3
ID OCR 来源
c 电话1********** OCR识别模块
表4
S615:第一终端根据图片的标签,展示图片。
如图19所示,当用户打开展示界面时,可以选择根据图片的标签,对图片进行分钟,此时第一终端根据图片的标签,展示图片。
基于上述描述,本实施例至少具备这样的有益效果:图片在终端进行识别,加快了识别速度,节省了服务器资源;提供了识别模块更新机制,识别效果更好;提供了用户反馈机制,反馈结果可以更新用户端数据,也可以作为训练样本,优化识别算法,不仅提高了用户端识别的正确率,还降低了获取训练样本的成本。
相应的,图8是本发明实施例提供的图片标签生成装置的结构示意图,请参阅图8,该图片标签生成装置包括以下模块:
扫描模块81,用于获取图片;
第一识别模块82,用于使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
第二识别模块83,用于使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签;
生成模块84,用于基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
在一实施例中,第一识别模块82可以具体用于:在基础单元集中,调用所述类别识别单元对应的基础单元;根据所述类别识别单元的参数数据,以及所述类别识别单元对应的基础单元,得到所述类别识别单元。
在一实施例中,第二识别模块83可以具体用于:获取所述内容识别单元对应的基础单元以及参数数据;在基础单元集中,调用所述内容识别单元对应的基础单元;根据所述内容识别单元对应的参数数据,以及所述内容识别单元对应的基础单元,得到所述内容识别单元。
在一实施例中,图8所示的图片标签生成装置还包括下载模块,用于在满足预设条件时,生成并发送下载请求;接收所述下载请求对应的基础单元数据;所述基础单元数据包括基础单元生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据中的至少一种。
在一实施例中,图8所示的图片标签生成装置还包括编辑模块,用于接收编辑操作;根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息。
在一实施例中,编辑模块还用于上传所述编辑操作对应的编辑对象。
在一实施例中,图8所示的图片标签生成装置还包括更新模块用于:获取所述图片对应的图片标识;基于所述图片标识,从服务器获取所述图片的标签信息。
相应的,图9是本发明实施例提供的图片标签生成装置的结构示意图,请参阅图9,该图片标签生成装置包括以下模块:
聚类模块91,用于根据视觉内容标签,得到类别标签;
获取模块92,用于获取类别识别单元以及内容识别单元;其中,所述类别识别单元用于根据所述图片的视觉内容确定所述图片对应的类别标签,所述内容识别单元用于根据所述图片的视觉内容确定所述图片对应的视觉内容标签;
发送模块93,用于发送类别识别单元以及内容识别单元。
在一实施例中,发送模块93可以具体用于:获取基础单元集中各基础单元的生成数据;发送所述基础单元集中各基础单元的生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据。
在一实施例中,训练模块92还用于:接收编辑操作;获取所述编辑操作对应的图片以及标签信息;基于所述编辑操作对应的图片以及标签信息,对所述类别识别单元以及所述内容识别单元中的至少一个进行训练。
在一实施例中,训练模块92还用于:对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行训练。
本发明提供的方法以及装置可以仅由服务器实现,也可以仅由手机等用户终端实现,还可以由用户终端与服务器配合实现。
本发明提供的方法中的各个步骤可以顺序运行,也可以多线程同时运行,现以多线程同时运行为例进行说明。
相应的,本发明实施例还提供一种终端,如图20所示,该终端可以包括射频(RF,Radio Frequency)电路2001、包括有一个或一个以上计算机可读存储介质的存储器2002、输入单元2003、显示单元2004、传感器2005、音频电路2006、无线保真(WiFi,WirelessFidelity)模块2007、包括有一个或者一个以上处理核心的处理器2008、以及电源2009等部件。本领域技术人员可以理解,图20中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路2001可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器2008处理;另外,将涉及上行的数据发送给基站。通常,RF电路2001包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路2001还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器2002可用于存储软件程序以及模块,处理器2008通过运行存储在存储器2002的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器2002可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器2002可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器2002还可以包括存储器控制器,以提供处理器2008和输入单元2003对存储器2002的访问。
输入单元2003可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元2003可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。在一实施例中,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器2008,并能接收处理器2008发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元2003还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元2004可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元2004可包括显示面板,在一实施例中,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器2008以确定触摸事件的类型,随后处理器2008根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图20中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器2005,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路2006、扬声器,传声器可提供用户与终端之间的音频接口。音频电路2006可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路2006接收后转换为音频数据,再将音频数据输出处理器2008处理后,经RF电路2001以发送给比如另一终端,或者将音频数据输出至存储器2002以便进一步处理。音频电路2006还可能包括耳塞插孔,以提供外设耳机与终端的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块2007可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图20示出了WiFi模块2007,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器2008是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器2002内的软件程序和/或模块,以及调用存储在存储器2002内的数据,执行终端的各种功能和处理数据,从而对手机进行整体检测。在一实施例中,处理器2008可包括一个或多个处理核心;优选的,处理器2008可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器2008中。
终端还包括给各个部件供电的电源2009(比如电池),优选的,电源可以通过电源管理***与处理器2008逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源2009还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,终端中的处理器2008会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器2002中,并由处理器2008来运行存储在存储器2002中的应用程序,从而实现各种功能:
获取图片;
使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签;
基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
在一实施例中,实现功能:在基础单元集中,调用所述类别识别单元对应的基础单元;根据所述类别识别单元的参数数据,以及所述类别识别单元对应的基础单元,得到所述类别识别单元。
在一实施例中,实现功能:获取所述内容识别单元对应的基础单元以及参数数据;在基础单元集中,调用所述内容识别单元对应的基础单元;根据所述内容识别单元对应的参数数据,以及所述内容识别单元对应的基础单元,得到所述内容识别单元。
在一实施例中,实现功能:在满足预设条件时,生成并发送下载请求;接收所述下载请求对应的基础单元数据;所述基础单元数据包括基础单元生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据中的至少一种。
在一实施例中,实现功能:接收编辑操作;根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息。
在一实施例中,实现功能:上传所述编辑操作对应的编辑对象。
在一实施例中,实现功能:获取所述图片对应的图片标识;基于所述图片标识,从服务器获取所述图片的标签信息。
相应的,本发明实施例还提供一种服务器,如图21所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器2101、一个或一个以上计算机可读存储介质的存储器2102、电源2103和输入单元2104等部件。本领域技术人员可以理解,图21中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中:
处理器2101是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器2102内的软件程序和/或模块,以及调用存储在存储器2102内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体检测。可选的,处理器2101可包括一个或多个处理核心;优选的,处理器2101可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器2101中。
存储器2102可用于存储软件程序以及模块,处理器2101通过运行存储在存储器2102的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器2102可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器2102可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器2102还可以包括存储器控制器,以提供处理器2101对存储器2102的访问。
服务器还包括给各个部件供电的电源2103,优选的,电源2103可以通过电源管理***与处理器2101逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源2103还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元2104,该输入单元2104可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器2101会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器2102中,并由处理器2101来运行存储在存储器2102中的应用程序,从而实现各种功能,如下:
根据视觉内容标签,得到类别标签;
获取类别识别单元以及内容识别单元;其中,所述类别识别单元用于根据所述图片的视觉内容确定所述图片对应的类别标签,所述内容识别单元用于根据所述图片的视觉内容确定所述图片对应的视觉内容标签;
发送类别识别单元以及内容识别单元。
在一实施例中,实现功能:获取基础单元集中各基础单元的生成数据;发送所述基础单元集中各基础单元的生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据。
在一实施例中,实现功能:接收编辑操作;获取所述编辑操作对应的图片以及标签信息;基于所述编辑操作对应的图片以及标签信息,对类别识别单元以及所述内容识别单元中的至少一个进行训练。
在一实施例中,实现功能:对对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行训练。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对资源管理方法的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种方法中的步骤。例如,该指令可以执行如下步骤:
获取图片;
使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签;
基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
在一实施例中,实现功能:在基础单元集中,调用所述类别识别单元对应的基础单元;根据所述类别识别单元的参数数据,以及所述类别识别单元对应的基础单元,得到所述类别识别单元。
在一实施例中,实现功能:获取所述内容识别单元对应的基础单元以及参数数据;在基础单元集中,调用所述内容识别单元对应的基础单元;根据所述内容识别单元对应的参数数据,以及所述内容识别单元对应的基础单元,得到所述内容识别单元。
在一实施例中,实现功能:在满足预设条件时,生成并发送下载请求;接收所述下载请求对应的基础单元数据;所述基础单元数据包括基础单元生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据中的至少一种。
在一实施例中,实现功能:接收编辑操作;根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息。
在一实施例中,实现功能:上传所述编辑操作对应的编辑对象。
在一实施例中,实现功能:获取所述图片对应的图片标识;基于所述图片标识,从服务器获取所述图片的标签信息。
同时,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种方法中的步骤。例如,该指令可以执行如下步骤:
根据视觉内容标签,得到类别标签;
获取类别识别单元以及内容识别单元;其中,所述类别识别单元用于根据所述图片的视觉内容确定所述图片对应的类别标签,所述内容识别单元用于根据所述图片的视觉内容确定所述图片对应的视觉内容标签;
发送类别识别单元以及内容识别单元。
在一实施例中,实现功能:获取基础单元集中各基础单元的生成数据;发送所述基础单元集中各基础单元的生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据。
在一实施例中,实现功能:接收编辑操作;获取所述编辑操作对应的图片以及标签信息;基于所述编辑操作对应的图片以及标签信息,对类别识别单元以及所述内容识别单元中的至少一个进行训练。
在一实施例中,实现功能:对对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行训练。
同时,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种方法中的步骤。例如,该指令可以执行如下步骤:
服务器根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元,发送所述类别识别单元以及内容识别单元至终端;
终端获取图片,使用类别识别单元根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种方法中的步骤,因此,可以实现本发明实施例所提供的任一种方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种图片标签生成方法及装置、终端及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种图片标签生成方法,其特征在于,包括:
获取图片;
使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,所述类别识别单元以及内容识别单元对应的基础单元包括计算层和全连接层;
基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息;
接收编辑操作,根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息,上传所述编辑操作至服务器,当所述编辑操作对应的标签数量超过阈值,所述服务器将所述编辑操作对应的标签信息加入样本库,以便所述服务器获取所述编辑操作对应的图片以及标签信息,基于所述编辑操作对应的图片以及标签信息,所述服务器对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行重新训练。
2.根据权利要求1所述的方法,其特征在于,在使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签的步骤之前,还包括:
在基础单元集中,调用所述类别识别单元对应的基础单元;
根据所述类别识别单元的参数数据,以及所述类别识别单元对应的基础单元,得到所述类别识别单元。
3.根据权利要求1所述的方法,其特征在于,在使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签的步骤之前,还包括:
获取所述内容识别单元对应的基础单元以及参数数据;
在基础单元集中,调用所述内容识别单元对应的基础单元;
根据所述内容识别单元对应的参数数据,以及所述内容识别单元对应的基础单元,得到所述内容识别单元。
4.根据权利要求1所述的方法,其特征在于,还包括:
在满足预设条件时,生成并发送下载请求;
接收所述下载请求对应的基础单元数据;所述基础单元数据包括基础单元生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据中的至少一种。
5.根据权利要求4所述的方法,其特征在于,所述预设条件包括以下条件中的至少一种:
条件一、终端当前的类别识别单元和/或内容识别单元的版本低于服务器;
条件二、终端内无法得到视觉内容标签的图片数量大于阈值;
条件三、终端接收到下载操作。
6.根据权利要求1所述的方法,其特征在于,还包括:
接收编辑操作;
根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息。
7.根据权利要求6所述的方法,其特征在于,还包括:
上传所述编辑操作对应的编辑对象。
8.根据权利要求1至7任一项所述的方法,其特征在于,还包括:
获取所述图片对应的图片标识;
基于所述图片标识,从服务器获取所述图片的标签信息。
9.一种图片标签生成方法,其特征在于,包括:
服务器根据视觉内容标签,得到类别标签,获取类别识别单元以及内容识别单元,发送所述类别识别单元以及内容识别单元至终端,所述类别识别单元以及内容识别单元对应的基础单元包括计算层和全连接层;
所述终端获取图片,使用所述类别识别单元根据所述图片的视觉内容,确定所述图片对应的类别标签,使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息;
所述终端接收编辑操作,根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息,上传所述编辑操作至所述服务器;
当所述编辑操作对应的标签数量超过阈值,所述服务器将所述编辑操作对应的标签信息加入样本库;
所述服务器从所述样本库获取所述编辑操作对应的图片以及标签信息,基于所述编辑操作对应的图片以及标签信息,所述服务器对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行重新训练。
10.根据权利要求9所述的方法,其特征在于,所述服务器发送所述类别识别单元以及内容识别单元至终端的步骤,包括:
所述服务器获取基础单元集中各基础单元的生成数据;
发送所述基础单元集中各基础单元的生成数据、所述类别识别单元的参数数据以及所述内容识别单元的参数数据。
11.一种图片标签生成装置,其特征在于,包括:
扫描模块,用于获取图片;
第一识别模块,用于使用类别识别单元,根据所述图片的视觉内容,确定所述图片对应的类别标签;
第二识别模块,用于使用所述类别标签对应的内容识别单元,根据所述图片的视觉内容,确定所述图片对应的视觉内容标签,所述类别识别单元以及内容识别单元对应的基础单元包括计算层和全连接层;
生成模块,用于基于所述类别标签以及所述视觉内容标签,生成并显示所述图片的标签信息;
编辑模块,用于接收编辑操作,根据所述编辑操作对应的编辑对象,编辑所述图片的标签信息,上传所述编辑操作至服务器,当所述编辑操作对应的标签数量超过阈值,所述服务器将所述编辑操作对应的标签信息加入样本库,以便所述服务器获取所述编辑操作对应的图片以及标签信息,基于所述编辑操作对应的图片以及标签信息,所述服务器对所述类别识别单元以及所述内容识别单元中与全连接层相关的参数数据进行重新训练。
12.一种终端,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的图片标签生成方法中的步骤。
13.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的图片标签生成方法中的步骤,或者以执行权利要求9至10任一项所述的图片标签生成方法中的步骤。
CN201810836429.2A 2018-07-26 2018-07-26 图片标签生成方法及装置、终端及存储介质 Active CN110309339B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810836429.2A CN110309339B (zh) 2018-07-26 2018-07-26 图片标签生成方法及装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810836429.2A CN110309339B (zh) 2018-07-26 2018-07-26 图片标签生成方法及装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN110309339A CN110309339A (zh) 2019-10-08
CN110309339B true CN110309339B (zh) 2024-05-31

Family

ID=68074114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810836429.2A Active CN110309339B (zh) 2018-07-26 2018-07-26 图片标签生成方法及装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN110309339B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766460A (zh) * 2019-10-21 2020-02-07 海南高灯科技有限公司 一种用户画像的方法、装置、存储介质及计算机设备
CN114578999A (zh) * 2020-11-16 2022-06-03 深圳市万普拉斯科技有限公司 一种图像分享的方法、装置及终端设备
CN112949334B (zh) * 2021-03-04 2022-06-10 武汉大学 一种基于分组复用的可靠射频识别方法
CN115168637B (zh) * 2022-06-17 2023-03-17 杭州晶彩数字科技有限公司 一种图片添加标签方法、***及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160111756A (ko) * 2015-03-17 2016-09-27 엘지전자 주식회사 이동 단말기 및 그의 사진 관리방법
CN107015998A (zh) * 2016-01-28 2017-08-04 阿里巴巴集团控股有限公司 一种图片处理方法、装置和智能终端
CN107169560A (zh) * 2017-04-19 2017-09-15 清华大学 一种自适应可重构的深度卷积神经网络计算方法和装置
CN107358169A (zh) * 2017-06-21 2017-11-17 厦门中控智慧信息技术有限公司 一种人脸表情识别方法及人脸表情识别装置
CN107592839A (zh) * 2015-01-19 2018-01-16 电子湾有限公司 细粒度分类

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107592839A (zh) * 2015-01-19 2018-01-16 电子湾有限公司 细粒度分类
KR20160111756A (ko) * 2015-03-17 2016-09-27 엘지전자 주식회사 이동 단말기 및 그의 사진 관리방법
CN107015998A (zh) * 2016-01-28 2017-08-04 阿里巴巴集团控股有限公司 一种图片处理方法、装置和智能终端
CN107169560A (zh) * 2017-04-19 2017-09-15 清华大学 一种自适应可重构的深度卷积神经网络计算方法和装置
CN107358169A (zh) * 2017-06-21 2017-11-17 厦门中控智慧信息技术有限公司 一种人脸表情识别方法及人脸表情识别装置

Also Published As

Publication number Publication date
CN110309339A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110309339B (zh) 图片标签生成方法及装置、终端及存储介质
TWI684148B (zh) 聯絡人的分組處理方法及裝置
CN108280458B (zh) 群体关系类型识别方法及装置
CN108228270B (zh) 启动资源加载方法及装置
CN110798718B (zh) 一种视频推荐方法以及装置
CN107729946B (zh) 图片分类方法、装置、终端及存储介质
CN110969056B (zh) 文档图像的文档版面分析方法、装置及存储介质
CN110852109A (zh) 语料生成方法、语料生成装置、和存储介质
CN111563151B (zh) 一种信息采集的方法、会话配置的方法、装置及存储介质
CN106293738A (zh) 一种表情图像的更新方法及装置
CN112036492B (zh) 样本集处理方法、装置、设备及存储介质
CN104281610B (zh) 过滤微博的方法和装置
CN115841575A (zh) 关键点检测方法、装置、电子设备、存储介质和程序产品
CN115981798B (zh) 文件解析方法、装置、计算机设备及可读存储介质
CN116795780A (zh) 文档格式转换方法、装置、存储介质及电子设备
CN113836329B (zh) 多媒体内容分类方法、装置、电子设备和存储介质
CN110209924B (zh) 推荐参数获取方法、装置、服务器及存储介质
CN113110868B (zh) 文件合并方法、装置、计算机设备及存储介质
CN116564311B (zh) 设备控制方法、装置、电子设备及可读存储介质
CN110047076B (zh) 一种图像信息的处理方法、装置及存储介质
CN117172219A (zh) 文档自动生成方法、装置、存储介质及电子设备
CN116564312B (zh) 设备控制方法、装置、电子设备及可读存储介质
CN117787207A (zh) 标准单元库验证方法、装置、存储介质及电子设备
CN117093779A (zh) 求职岗位个性化推荐方法、装置、存储介质及电子设备
CN116935852A (zh) 语音识别方法、装置、计算机可读存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant