CN109740671B - 一种图像识别方法及装置 - Google Patents
一种图像识别方法及装置 Download PDFInfo
- Publication number
- CN109740671B CN109740671B CN201910003872.6A CN201910003872A CN109740671B CN 109740671 B CN109740671 B CN 109740671B CN 201910003872 A CN201910003872 A CN 201910003872A CN 109740671 B CN109740671 B CN 109740671B
- Authority
- CN
- China
- Prior art keywords
- category
- categories
- score value
- threshold range
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种图像识别方法及装置,涉及计算机视觉领域。方法包括:获得对象为至少两个类别中每个类别的得分,其中,每个类别的得分为对包含对象的图像进行处理而获得;基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。由确定出对象的与至少两个类别相关的新的类别替换与对象的类别相关性低的类别,可以使得对象为至少两个类别中的每个类别与每个类别之间的相关性增加,进而在输出展示对象时,提高了用户的体验度。
Description
技术领域
本申请涉及计算机视觉领域,具体而言,涉及一种图像识别方法及装置。
背景技术
随着深度学习的兴起,计算机在图片分类领域可以达到越来越高的识别率,甚至可以达到超越人眼识别率的精度,不同种类的图片识别***应运而生。
不同的图片识别***主要依赖深度学习技术构建相应的分类模型,通过分类模型输出的对象为至少两个类别。而输出的对象为至少两个类别中每个类别与每个类别之间的相关性可能不高,导致用户体验不好。
发明内容
本申请的目的在于提供一种图像识别方法及装置,以有效的改善分类模型输出的多个对象之间相关性差的技术缺陷。
本申请的实施例通过如下方式实现:
第一方面,本申请实施例提供了一种图像识别方法,方法包括:获得对象为至少两个类别中每个类别的得分,其中,每个类别的得分为对包含对象的图像进行处理而获得;基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
在本申请实施例中,基于获得的每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。由确定出对象的与至少两个类别相关的新的类别替换与对象的类别相关性低的类别,可以使得对象为至少两个类别中的每个类别与每个类别之间的相关性增加,进而在输出展示对象时,提高了用户的体验度。
结合第一方面提供的技术方案,在一些可能的实现方式中,基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别包括:基于获得的每个类别的得分以及每个类别的得分的大小关系,确定出每个类别的得分中的最大值为第一得分值;基于第一得分值,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
在本申请实施例中,通过确定每个类别的得分中的最大得分值为第一得分值,获得对象为至少两个类别中每个类别与目标对象向匹配的概率最大的类别。也就是说,第一得分值所对应的类别为与目标对象相匹配概率最大的类别,通过第一得分值从对象类别库中确定出对象的与至少两个类别相关的新的类别,提高了与目标对象的类别的相关性,进而在输出展示对象时,提高了用户的体验度。
结合第一方面提供的技术方案,在一些可能的实现方式中,预设了包括:与第一得分值所对应的第一阈值范围、与第一阈值范围不同的第二阈值范围、与第一阈值范围和所述第二阈值范围均不同的第三阈值范围,与每个类别的得分中仅小于第一得分值的第二得分值所对应的第四阈值范围、与第四阈值范围至少部分不同的第五阈值范围;与每个类别的得分中小于第一得分值和第二得分值的第三得分值所对应的第六阈值范围,基于第一得分值,从对象类别库中确定出对象的与至少两个类别相关的新的类别,包括:在第一得分值位于第一阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第二阈值范围内时,判断第二得分值是否位于第四阈值范围内,若是,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值位于第五阈值范围内时,判断第三得分值是否位于第六阈值范围内,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值不位于第五阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别。
在本申请实施例中,通过第一得分值处于不同的阈值范围内,从对象类别库中确定出对象的与至少两个类别相关的新的类别的数量不同。通过这样的处理方式,使得确定出对象的与至少两个类别相关的新的类别替换了与对象的类别相关性低的类别,保证对象为至少两个类别中每个类别与每个类别之间具有高的相关性,进而在输出展示对象时,提高了用户的体验度。
结合第一方面提供的技术方案,在一些可能的实现方式中,从对象类别库中确定出对象的与至少两个类别相关的新的类别包括:
确定第一得分值所对应的类别为第一类别;基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出至少一个类别中相关度最高的类别为对象的与至少两个类别相关的新的类别。
在本申请实施例中,通过第一类别从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度,将相关度高的类别确定为新的类别,保证了保证对象为至少两个类别中每个类别与每个类别之间具有高的相关性,进而在输出展示对象时,提高了用户的体验度。
结合第一方面提供的技术方案,在一些可能的实现方式中,在获得对象为至少两个类别中每个类别的得分之前,方法还包括:判断对象的类别是否含有目标类别,若否,输出报错信息,其中,目标类别包含至少两个类别中每个类别。
在本申请实施例中,先优先识别对象是否含有可识别的对象,这个可以提高对象的识别能力,有效区别出所识别的图像中是否含有可识别的对象,进而提高识别的效率和用户的体验度。
第二方面,本申请实施例提供了一种图像识别装置,装置包括:获得模块,用于获得对象为至少两个类别中每个类别的得分,其中,每个类别的得分为对包含对象的图像进行处理而获得;处理模块,用于基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
结合第二方面提供的技术方案,在一些可能的实现方式中,处理模块,还用于基于获得的每个类别的得分以及每个类别的得分的大小关系,确定出每个类别的得分中的最大值为第一得分值;基于第一得分值,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
结合第二方面提供的技术方案,在一些可能的实现方式中,预设了包括:与第一得分值所对应的第一阈值范围、与第一阈值范围不同的第二阈值范围、与第一阈值范围和第二阈值范围均不同的第三阈值范围,与每个类别的得分中仅小于第一得分值的第二得分值所对应的第四阈值范围、与第四阈值范围至少部分不同的第五阈值范围;与每个类别的得分中小于第一得分值和第二得分值的第三得分值所对应的第六阈值范围,处理模块还用于,在第一得分值位于第一阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第二阈值范围内时,判断第二得分值是否位于第四阈值范围内,若是,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值位于第五阈值范围内时,判断第三得分值是否位于第六阈值范围内,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值不位于第五阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别。
结合第二方面提供的技术方案,在一些可能的实现方式中,处理模块,还用于确定第一得分值所对应的类别为第一类别;基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出至少一个类别中相关度最高的类别为对象的与至少两个类别相关的新的类别。
结合第二方面提供的技术方案,在一些可能的实现方式中,装置还包括:判断模块,用于判断对象的类别是否含有目标类别,若否,输出报错信息,其中,目标类别为包含至少两个类别中每个类别。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请第一实施例提供的一种电子设备的结构框图;
图2示出了本申请第二实施例提供的一种图像识别方法的流程图;
图3示出了本申请第三实施例提供的一种图像识别装置的结构框图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
第一实施例
本申请实施例提供了一种电子设备10。电子设备10可以为个人电脑(personalcomputer,PC)、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)等,或电子设备10可以为网络服务器、数据库服务器、云服务器或由多个子服务器构成的服务器集成等。
请参阅图1,该电子设备10可以包括:存储器111、通信模块112、总线113和处理器114。其中,处理器114、通信模块112和存储器111通过总线113连接。处理器114用于执行存储器111中存储的可执行模块,例如计算机程序。图1所示的电子设备10的组件和结构只是示例性的,而非限制性的,根据需要,电子设备10也可以具有其他组件和结构。
其中,存储器111可能包含高速随机存取存储器(Random Access Memory RAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。本实施例中,存储器111存储了当前时刻获得的电场强度分布特征。
总线113可以是ISA总线((Industry Standard Architecture,工业标准体系结构)、PCI总线(Peripheral Component Interconnect,外设部件互连标准)或EISA总线(Extended Industry Standard Architecture,扩展工业标准结构)等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器114可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器114中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器114可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。
本发明实施例定义的装置所执行的方法可以应用于处理器114中,或者由处理器114实现。处理器114在接收到电子设备10发出的响应指令后,通过通总线113控制通信模块112可以完成对图像的识别。
第二实施例
请参阅图2,本申请第二实施例提供的一种图像识别方法的流程图。该图像识别方法包括:步骤S11和步骤S12。
步骤S11:获得对象为至少两个类别中每个所述类别的得分,其中,每个所述类别的得分为对包含所述对象的图像进行处理而获得。
步骤S12:基于每个所述类别的得分,从对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别。
下面将对该图像识别方法的流程做详细说明。
步骤S11:获得对象为至少两个类别中每个所述类别的得分,其中,每个所述类别的得分为对包含所述对象的图像进行处理而获得。
获得对象为至少两个类别中每个所述类别的得分中,对象是人对各种具体物体抽象后的一个概念。类别可以为用于定义一个对象是什么,以区分对象与对象。不同的对象对应不同的类别。
对象与类别的对应关系可以为:一个对象对应一种类别、一个对象对应多种类别或者多个对象对应一种类别。可选地,在本实施例中,对象与类别的对应关系为一个对象对应一种类别。一个对象对应一种类别的对应关系可以使得分类的准确率更高。
包含对象的载体可以为包含对象的图像、包含对象的视频或者包含对象的文字,可选地,在本申请实施例中,本方法可以为对包含对象的图像作为包含对象的载体。
获得至少两个类别中每个类别的得分,每个类别的得分为对包含对象的图像进行处理而获得。对包含对象的图像进行处理可以是基于深度学习进行处理的过程,深度学习结构包括卷积神经网络、循环神经网络和深度神经网络。可选地,在本实施例中,采用卷积神经网络算法处理包含对象的图像。卷积神经网络可以通过结合局部感知区域、共享权重、空间或者时间上的降采样来充分利用数据本身包含的局部性等特征,优化网络结构,并且特征分类效果好。
卷积神经网络的层级结构包括:数据输入层、卷积计算层、激励层、池化层、全连接层。数据输入层要做的处理主要是对原始图像数据进行包括去均值、归一化和白化的预处理。卷积计算层是卷积神经网络最重要的一个层次,主要进行局部关联和窗口滑动,卷积核对局部数据计算这两个操作。激励层为把卷积层输出结果做非线性映射。池化层夹在连续的卷积层中间,用于压缩数据和参数的量,减小过拟合。两层之间所有神经元都有权重连接,通常全连接层在卷积神经网络尾部。
基于深度学习技术,通过构建不同架构的卷积神经网络以及应用神经元权值调参技巧,完成一个分类模型的构建。在构建分类模型的过程中,根据分类模型的输出结果调整分类模型中各个神经元权值,使得分类模型的输出结果和目标结果更匹配,这个过程也就是模型的训练过程。构建完成的分类模型可以预测分类模型中的包含目标对象的图像为输入到分类模型中的包含对象的图像的概率大小。
分类模型可以识别多种属性的对象,例如,食物、电器或者交通工具。可选地,在本实施例中,分类模型的识别对象的属性为食物,并可以进一步根据分类模型的输出结果所对应的对象计算出该对象所具有的食物热量。
在获得对象为至少两个类别中每个类别的得分中,每个类别的得分表示输入分类模型中的与每个类别所对应的对象被预测成为分类模型中目标对象的概率大小。得分越高,输入分类模型中的与每个类别所对应的对象为分类模型中目标对象的概率越大。其中,每个类别的得分可以为与每个类别所对应的对象输入分类模型后所对应的输出结果。
详细地,一个分类模型所能识别的对象的数量为有限个,且通过卷积神经网络预测的结果概率总和为1。假设,分类模型可以识别1000种类别的食物,那么,在向该分类模型输入一张包含对象的图像后,经过分类模型后的输出结果可以有1000个,获得的每一个输出结果的大小为分类模型中的每一个类别所对应的对象的得分,且这1000个得分的总和为1。
步骤S12:基于每个所述类别的得分,从对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别。
基于构建的分类模型,向分类模型输入一张包含对象的图像后,可以获得至少两个类别中每个类别的得分。在本实施例中,可以将确定出的分类模型中的三个得分值所一一对应的对象作为待输出对象,该三个得分值为在所有得分值中排名前三高的得分值。
基于获得的每个类别的得分以及每个类别的得分的大小关系,先确定出每个类别的得分中的最大值为第一得分值。
确定出每个类别的得分中的最大值为第一得分值的过程可以为:对获得的每个类别的得分按照从大到小或者从小到大任一种的关系对每个类别的得分进行排序,进而找到得分最大值成为第一得分值。或者从分类模型中的每个类别的得分进行抽取,将每次抽取的每个类别的得分与上一个类别的得分进行比较,若当前抽取的每个类别的得分大于上一个类别的得分,将当前抽取到的类别的得分更新成为当前时刻最大值得分,若当前抽取的每个类别的得分小于上一个类别的得分,保留上一个类别的得分,继续抽取,直至抽取的次数远远大于分类模型的模型容量,确定当前得分值为具有最大得分值的第一得分值,其中,模型容量表示分类模型可以识别的种类的数量。
可选地,在本实施例中,确定最大得分值为第一得分值的方式为通过对每个类别的得分进行排序。采用排序的方式既可以快速地确定出最大得分值,也可以得到得分值仅小于第一得分值的第二得分值、得分值小于第一得分值和第二得分值的第三得分值,进而可以使分类模型返回的得分值为第一得分值、第二得分值和第三得分值,从而,输出结果与目标结果更匹配的可能性更大。
为了使得分类模型输出的对象与对象之间的相关性高,在分类模型直接输出第一得分值、第二得分值和第三得分值所一一对应的对象前,对第一得分值、第二得分值和第三得分值所一一对应的对象进行处理再输出。
预设了与第一得分值所对应的第一阈值范围、与第一阈值范围不同的第二阈值范围、与第一阈值范围和所述第二阈值范围均不同的第三阈值范围,与每个类别的得分中仅小于第一得分值的第二得分值所对应的第四阈值范围、与第四阈值范围至少部分不同的第五阈值范围;与每个类别的得分中小于第一得分值和第二得分值的第三得分值所对应的第六阈值范围。
根据确定出的最大得分值为第一得分值,第一得分值的分值范围可以处于第一阈值范围、第二阈值范围和第三阈值范围。在第一得分值位于第一阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第二阈值范围内时,判断第二得分值是否位于第四阈值范围内,若是,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值位于第五阈值范围内时,判断第三得分值是否位于第六阈值范围内,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值不位于第五阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别。
详细地,第一阈值范围为不小于0.8;第二阈值范围为不小于0.4且小于0.8;第三阈值范围为不小于0.25且小于0.4;第四阈值范围为不小于0.15;第五阈值范围为不小于0.15,且小于0.4;第六阈值范围为不小于0.15。在第一得分值位于第一阈值范围内时,保留第一得分值所对应的类别,且将第一得分值所对应的类别确定为第一类别,基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出两个与第一类别相关度最高的类别为对象的与至少两个类别相关的新的类别,这两个新的类别将分别替换原第二得分值对应的类别和原第三得分值对应的类别,成为输出对象。
在第一得分值位于第二阈值范围内,且第二得分值位于第四阈值范围内时,保留第一得分值和第二得分值所对应的类别,且将第一得分值所对应的类别确定为第一类别,基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出一个与第一类别相关度最高的类别为对象的与至少两个类别相关的新的类别,这一个新的类别将替换原第三得分值对应的类别,成为输出对象。
在第一得分值位于第二阈值范围内,且第二得分值不位于第四阈值范围内时,保留第一得分值所对应的类别,且将第一得分值所对应的类别确定为第一类别,基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出两个与第一类别相关度最高的类别为对象的与至少两个类别相关的新的类别,这两个新的类别将分别替换原第二得分值对应的类别和原第三得分值对应的类别,成为输出对象。
在第一得分值位于第三阈值范围内,第二得分值位于第五阈值范围内,且第三得分值不位于第六阈值范围时,保留第一得分值和第二得分值所对应的类别,且将第一得分值所对应的类别确定为第一类别,基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出一个与第一类别相关度最高的类别为对象的与至少两个类别相关的新的类别,这一个新的类别将替换原第三得分值对应的类别,成为输出对象。
在第一得分值位于第三阈值范围内,且第二得分值不位于第五阈值范围内时,保留第一得分值所对应的类别,且将第一得分值所对应的类别确定为第一类别,基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出两个与第一类别相关度最高的类别为对象的与至少两个类别相关的新的类别,这两个新的类别将分别替换原第二得分值对应的类别和原第三得分值对应的类别,成为输出对象。
在基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度中,可以基于第一类别所对应的关键词或者第一类别所对应的包含对象的图像,从对象类别库中确定出与第一类别的相关度。可选地,在本实施例中,以第一类别所对应的关键词确定从对象类别库中确定出与第一类别的相关度。以关键词进行相关度的确定,具有准确、快速、易实现的优点。
另外,在第一得分值不位于第一阈值范围、第二阈值范围和第三阈值范围内时,表示输入分类模型的图像在分类模型中,未找到目标对象与输入对象进行匹配,即识别失败。
在第一得分值位于第三阈值范围内,第二得分值位于第五阈值范围,且第三得分值在第六阈值范围内时,保留第一得分值、第二得分值和第三得分值所一一对应的类别,作为输出对象。
另外,在获得对象为至少两个类别中每个类别的得分之前,方法还包括:判断对象的类别是否包含目标类别,若否,输出报错信息,其中,目标类别包含至少两个类别中每个类别。
详细地,在利用分类模型获得至少两个类别中每个类别的得分前,先判断输入的包含对象的图像的属性是否含有食物。若判断的结果为输入的包含对象的图像的属性含有食物,获得基于分类模型获得至少两个类别中每个类别的得分。若判断的结果为输入的包含对象的图像的属性不含有食物,发出提示消息,提醒输入的包含对象的图像的属性不含有食物。
第三实施例
请参阅图3,图3为本实施例提供的一种图像识别20的结构框图,该图像识别装置20包括:
判断模块210,用于判断对象的类别是否为目标类别,若否,输出报错信息,其中,目标类别包含至少两个类别中每个类别。
获得模块220,用于获得对象为至少两个类别中每个类别的得分,其中,每个类别的得分为对包含对象的图像进行处理而获得。
处理模块230,用于基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
其中,处理模块230,还用于基于获得的每个类别的得分以及每个类别的得分的大小关系,确定出每个类别的得分中的最大值为第一得分值;基于第一得分值,从对象类别库中确定出对象的与至少两个类别相关的新的类别。
在预设了包括:与第一得分值所对应的第一阈值范围、与第一阈值范围不同的第二阈值范围、与第一阈值范围和第二阈值范围均不同的第三阈值范围,与每个类别的得分中仅小于第一得分值的第二得分值所对应的第四阈值范围、与第四阈值范围至少部分不同的第五阈值范围;与每个类别的得分中小于第一得分值和第二得分值的第三得分值所对应的第六阈值范围下,处理模块230还用于,在第一得分值位于第一阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第二阈值范围内时,判断第二得分值是否位于第四阈值范围内,若是,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值位于第五阈值范围内时,判断第三得分值是否位于第六阈值范围内,若否,基于第一得分值所对应的类别,从对象类别库中确定出至少一个与至少两个类别相关的新的类别;或在第一得分值位于第三阈值范围内,且第二得分值不位于第五阈值范围内时,基于第一得分值所对应的类别,从对象类别库中确定出至少两个与至少两个类别相关的新的类别。
处理模块230,还用于确定第一得分值所对应的类别为第一类别;基于第一类别,从对象类别库中确定出与第一类别相关的至少一个类别中每个类别与第一类别的相关度;根据每个类别与第一类别的相关度,确定出至少一个类别中相关度最高的类别为对象的与至少两个类别相关的新的类别。
需要说明的是,由于所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
综上所述,本申请实施例提供了一种图像识别方法,方法包括:获得对象为至少两个类别中每个类别的得分,其中,每个类别的得分为对包含对象的图像进行处理而获得;基于每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。基于获得的每个类别的得分,从对象类别库中确定出对象的与至少两个类别相关的新的类别。由确定出对象的与至少两个类别相关的新的类别替换与对象的类别相关性低的类别,可以使得对象为至少两个类别中的每个类别与每个类别之间的相关性增加,进而在输出展示对象时,提高了用户的体验度。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种图像识别方法,其特征在于,所述方法包括:
获得对象为至少两个类别中每个所述类别的得分,其中,每个所述类别的得分为对包含所述对象的图像进行处理而获得;
基于每个所述类别的得分,从对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别包括:
基于获得的每个所述类别的得分以及每个所述类别的得分的大小关系,确定出每个所述类别的得分中的最大值为第一得分值;
预设阈值范围,所述阈值范围包括:与所述第一得分值所对应的第一阈值范围、与所述第一阈值范围不同的第二阈值范围、与所述第一阈值范围和所述第二阈值范围均不同的第三阈值范围,与每个所述类别的得分中仅小于所述第一得分值的第二得分值所对应的第四阈值范围、与所述第四阈值范围至少部分不同的第五阈值范围;与每个所述类别的得分中小于所述第一得分值和所述第二得分值的第三得分值所对应的第六阈值范围;
基于所述第一得分值;从所述对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别,包括:在所述第一得分值位于所述第一阈值范围内时,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第二阈值范围内时,判断所述第二得分值是否位于所述第四阈值范围内,若是,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少一个与所述至少两个类别相关的新的类别,若否,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第三阈值范围内,且所述第二得分值位于所述第五阈值范围内时,判断所述第三得分值是否位于所述第六阈值范围内,若否,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少一个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第三阈值范围内,且所述第二得分值不位于所述第五阈值范围内时,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别。
2.根据权利要求1所述的图像识别方法,其特征在于,所述从对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别包括:
确定所述第一得分值所对应的类别为第一类别;
基于所述第一类别,从所述对象类别库中确定出与所述第一类别相关的至少一个类别中每个所述类别与所述第一类别的相关度;
根据每个所述类别与所述第一类别的相关度,确定出所述至少一个类别中相关度最高的类别为所述对象的与所述至少两个类别相关的新的类别。
3.根据权利要求1所述的图像识别方法,其特征在于,在所述获得对象为至少两个类别中每个所述类别的得分之前,所述方法还包括:
判断对象的类别是否含有目标类别,若否,输出报错信息,其中,所述目标类别包含所述至少两个类别中每个所述类别。
4.一种图像识别装置,其特征在于,所述装置包括:
获得模块,用于获得对象为至少两个类别中每个所述类别的得分,其中,每个所述类别的得分为对包含所述对象的图像进行处理而获得;
处理模块,用于基于每个所述类别的得分,从对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别;
所述处理模块,还用于基于获得的每个所述类别的得分以及每个所述类别的得分的大小关系,确定出每个所述类别的得分中的最大值为第一得分值;
基于所述第一得分值,从所述对象类别库中确定出所述对象的与所述至少两个类别相关的新的类别;
所述处理模块预设了包括:与所述第一得分值所对应的第一阈值范围、与所述第一阈值范围不同的第二阈值范围、与所述第一阈值范围和所述第二阈值范围均不同的第三阈值范围,与每个所述类别的得分中仅小于所述第一得分值的第二得分值所对应的第四阈值范围、与所述第四阈值范围至少部分不同的第五阈值范围;与每个所述类别的得分中小于所述第一得分值和所述第二得分值的第三得分值所对应的第六阈值范围,所述处理模块还用于,
在所述第一得分值位于所述第一阈值范围内时,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第二阈值范围内时,判断所述第二得分值是否位于所述第四阈值范围内,若是,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少一个与所述至少两个类别相关的新的类别,若否,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第三阈值范围内,且所述第二得分值位于所述第五阈值范围内时,判断所述第三得分值是否位于所述第六阈值范围内,若否,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少一个与所述至少两个类别相关的新的类别;或
在所述第一得分值位于所述第三阈值范围内,且所述第二得分值不位于第五阈值范围内时,基于所述第一得分值所对应的类别,从所述对象类别库中确定出至少两个与所述至少两个类别相关的新的类别。
5.根据权利要求4所述的图像识别装置,其特征在于,所述处理模块,还用于确定所述第一得分值所对应的类别为第一类别;
基于所述第一类别,从所述对象类别库中确定出与所述第一类别相关的至少一个类别中每个所述类别与所述第一类别的相关度;
根据每个所述类别与所述第一类别的相关度,确定出所述至少一个类别中相关度最高的类别为所述对象的与所述至少两个类别相关的新的类别。
6.根据权利要求4所述的图像识别装置,其特征在于,所述装置还包括:
判断模块,用于判断对象的类别是否含有目标类别,若否,输出报错信息,其中,所述目标类别包含所述至少两个类别中每个所述类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003872.6A CN109740671B (zh) | 2019-01-03 | 2019-01-03 | 一种图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910003872.6A CN109740671B (zh) | 2019-01-03 | 2019-01-03 | 一种图像识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109740671A CN109740671A (zh) | 2019-05-10 |
CN109740671B true CN109740671B (zh) | 2021-02-23 |
Family
ID=66363312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910003872.6A Active CN109740671B (zh) | 2019-01-03 | 2019-01-03 | 一种图像识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740671B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542531A (zh) * | 2007-06-14 | 2009-09-23 | 松下电器产业株式会社 | 图像识别装置及图像识别方法 |
CN101655909A (zh) * | 2008-08-21 | 2010-02-24 | 索尼(中国)有限公司 | 匹配程度计算装置及方法 |
CN103984746A (zh) * | 2014-05-26 | 2014-08-13 | 西安电子科技大学 | 基于半监督分类与区域距离测度的sar图像识别方法 |
CN106529606A (zh) * | 2016-12-01 | 2017-03-22 | 中译语通科技(北京)有限公司 | 一种提升图像识别准确率的方法 |
CN107066928A (zh) * | 2017-01-04 | 2017-08-18 | 深圳市保千里电子有限公司 | 一种基于分类器的行人检测方法及*** |
CN108921206A (zh) * | 2018-06-15 | 2018-11-30 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103399870A (zh) * | 2013-07-08 | 2013-11-20 | 华中科技大学 | 一种基于分类驱动的可视化词袋特征权重化方法和*** |
CN105844283B (zh) * | 2015-01-16 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 用于识别图像类目归属的方法、图像搜索方法及装置 |
US20160358075A1 (en) * | 2015-06-08 | 2016-12-08 | The Regents Of The University Of Michigan | System for implementing a sparse coding algorithm |
CN107690659B (zh) * | 2016-12-27 | 2021-08-10 | 达闼机器人有限公司 | 一种图像识别***及图像识别方法 |
CN108171274B (zh) * | 2018-01-17 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 用于识别动物的方法和装置 |
CN108537177A (zh) * | 2018-04-12 | 2018-09-14 | 徐州乐健天合健康科技有限公司 | 一种基于深度卷积神经网络的菜谱识别方法 |
-
2019
- 2019-01-03 CN CN201910003872.6A patent/CN109740671B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542531A (zh) * | 2007-06-14 | 2009-09-23 | 松下电器产业株式会社 | 图像识别装置及图像识别方法 |
CN101655909A (zh) * | 2008-08-21 | 2010-02-24 | 索尼(中国)有限公司 | 匹配程度计算装置及方法 |
CN103984746A (zh) * | 2014-05-26 | 2014-08-13 | 西安电子科技大学 | 基于半监督分类与区域距离测度的sar图像识别方法 |
CN106529606A (zh) * | 2016-12-01 | 2017-03-22 | 中译语通科技(北京)有限公司 | 一种提升图像识别准确率的方法 |
CN107066928A (zh) * | 2017-01-04 | 2017-08-18 | 深圳市保千里电子有限公司 | 一种基于分类器的行人检测方法及*** |
CN108921206A (zh) * | 2018-06-15 | 2018-11-30 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109740671A (zh) | 2019-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598845B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
EP3660700B1 (en) | Image retrieval method and apparatus, and electronic device | |
CN109634698B (zh) | 菜单显示方法、装置、计算机设备及存储介质 | |
CN109471944B (zh) | 文本分类模型的训练方法、装置及可读存储介质 | |
CN110766096A (zh) | 视频分类方法、装置及电子设备 | |
US20170337449A1 (en) | Program, system, and method for determining similarity of objects | |
CN112085565B (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
CN108960314B (zh) | 基于难样本的训练方法、装置及电子设备 | |
CN107943792B (zh) | 一种语句分析方法、装置及终端设备、存储介质 | |
CN112328909B (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN107203558B (zh) | 对象推荐方法和装置、推荐信息处理方法和装置 | |
CN110210457A (zh) | 人脸检测方法、装置、设备及计算机可读存储介质 | |
CN112995414B (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN111898675A (zh) | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 | |
US20230206121A1 (en) | Modal information completion method, apparatus, and device | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN113094478A (zh) | 表情回复方法、装置、设备及存储介质 | |
CN110490058B (zh) | 行人检测模型的训练方法、装置、***和计算机可读介质 | |
CN109740671B (zh) | 一种图像识别方法及装置 | |
CN110597985A (zh) | 基于数据分析的数据分类方法、装置、终端及介质 | |
CN116680401A (zh) | 文档处理方法、文档处理装置、设备及存储介质 | |
CN111401317B (zh) | 视频分类方法、装置、设备及存储介质 | |
CN114117037A (zh) | 意图识别方法、装置、设备和存储介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |