CN109214411A - 一种基于训练模型识别典型图片对新增实体的验证方法及*** - Google Patents

一种基于训练模型识别典型图片对新增实体的验证方法及*** Download PDF

Info

Publication number
CN109214411A
CN109214411A CN201810762081.7A CN201810762081A CN109214411A CN 109214411 A CN109214411 A CN 109214411A CN 201810762081 A CN201810762081 A CN 201810762081A CN 109214411 A CN109214411 A CN 109214411A
Authority
CN
China
Prior art keywords
newly
training pattern
increased entity
entity
confidence level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810762081.7A
Other languages
English (en)
Inventor
李春雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jiji Intellectual Property Operation Co., Ltd
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201810762081.7A priority Critical patent/CN109214411A/zh
Publication of CN109214411A publication Critical patent/CN109214411A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于训练模型识别典型图片对新增实体的验证方法及***,该方法包括步骤:S11.获取新增实体典型图片集;S12.通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;S13.根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。本发明在现有训练模型的基础上,通过对新增实体的典型图片进行识别,得到top1和top5的置信度,然后根据一定的算法,从而判断该新增实体是否已经存在现有训练模型中,有效的解决了单纯使用名字匹配或者语义分析进行判断产生误判,漏判断,或者错判的情况,大大提高对新增实体判断的准确性。

Description

一种基于训练模型识别典型图片对新增实体的验证方法及 ***
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于训练模型识别典型图片对新增实体的验证方法及***。
背景技术
图像识别技术是人工智能的一个重要领域,其原理是基于深度学习及大规模图像训练,通过提取大量图片的特征来训练模型,准确识别图片中的物体类别、置信度等综合信息,随着现在识别模型健全,新增种类也越来越多,怎么判断新增的事物是否在已经存在该模型中,以及判断的标准,对于模型增广和扩大有很重要的意义。
但是现有的典型判断新增实体是否存在现有模型中的方法主要是通过字符的匹配或者字符语义的分析,即新增实体的名字与现有模型中的label进行判断,会产生对应的true和false结果,虽然现有的新增实体的判断方法对于特征分明或者名字唯一的实体进行判断不存在问题,但是在实际生活中,不同的实体在不同的国家、区域有不同的名字,这时就会出现一个实体对应多个名字的情况,甚至同样名字对应不同的实体,这样对于新增实体的判断,就会出现偏差甚至是错误,所以对于一个实体对应多个名字,或者一个名字对应多个实体这种情况,仅仅通过关键字的判断或者语义判断的方式就不足以解决新增实体的验证。
公开号为CN 107688822A的专利公开了一种基于深度学习的新增类别识别方法,包括以下步骤:将预测样本输入到深度网络获得预测样本的输出向量;计算所述预测样本的输出向量,与训练样本中每种类别的代表向量之间的相似度值,从而识别所述预测样本的类别;其中,所述训练样本中每种类别的代表向量是通过将所述训练样本集输入到深度网络获得输出向量集,并根据所述训练样本的输出向量集计算得出的。该方法是通过将新增实体与训练样本中的每种类别进行相似度比较,从而来判断该新增实体是否在训练样本中,该方法通过计算相似度的方式实质就是通过语义判断的方式来验证新增实体,还是无法保证验证新增实体的准确性。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种基于训练模型识别典型图片对新增实体的验证方法及***,判断该新增实体是否已经存在已有的模型,有效的解决了单纯使用名字匹配或者语义分析进行判断产生误判,漏判断,或者错判的情况。
为了实现以上目的,本发明采用以下技术方案:
一种基于训练模型识别典型图片对新增实体的验证方法,包括步骤:
S1.获取新增实体典型图片集;
S2.通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
S3.根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
进一步的,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
进一步的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
进一步的,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
进一步的,所述步骤S1之后步骤S2之前还包括步骤:
对所述新增实体典型图片集中的所有典型图片进行图像预处理。
相应的,还提供一种基于训练模型识别典型图片对新增实体的验证***,包括:
获取模块,用于获取新增实体典型图片集;
计算模块,用于通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
判断模块,用于根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
进一步的,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
进一步的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
进一步的,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
进一步的,还包括:
预处理模块,用于对所述新增实体典型图片集中的所有典型图片进行图像预处理。
与现有技术相比,本发明在现有训练模型的基础上,通过对新增实体的典型图片进行识别,得到top1和top5的置信度,然后根据一定的算法,从而判断该新增实体是否已经存在现有训练模型中,有效的解决了单纯使用名字匹配或者语义分析进行判断产生误判,漏判断,或者错判的情况,大大提高对新增实体判断的准确性。
附图说明
图1是实施例一提供的一种基于训练模型识别典型图片对新增实体的验证方法流程图;
图2是本发明提供的利用现有训练模型对3张新增典型图片的识别结果示意图;
图3是实施例一提供的一种基于训练模型识别典型图片对新增实体的验证***结构图;
图4是实施例二提供的一种基于训练模型识别典型图片对新增实体的验证方法流程图;
图5是实施例二提供的一种基于训练模型识别典型图片对新增实体的验证***结构图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明是以图像识别技术为研究对象,主要的着力点在于改善验证新增实体的方法,提供了一种基于训练模型识别典型图片对新增实体的验证方法及***,判断该新增实体是否已经存在已有的模型,有效的解决了单纯使用名字匹配或者语义分析进行判断产生误判,漏判断,或者错判的情况。
实施例一
本实施例提供一种基于训练模型识别典型图片对新增实体的验证方法,如图1所示,包括步骤:
S11.获取新增实体典型图片集;
S12.通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
S13.根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
本实施例的基于训练模型识别典型图片对新增实体的验证方法的执行主体为计算机,所述步骤S11至步骤S13都是计算机中的算法实现软件来完成。所述的算法实现软件为MATLAB。
首先获取新增实体典型图片集。当然所述新增实体典型图片集中的图片特征分明、分布广泛并且来源于现实生活,通常是3到5张最佳。
获取到新增实体典型图片集后,将所述新增实体典型图片集输入到现有训练模型中,通过现有训练模型对所述新增实体典型图片集进行识别计算新增实体典型图片集中每一张典型图片的top1和top5的置信度。如图2所示,为本发明提供的利用现有训练模型对3张新增典型图片的识别结果,图中典型图片A被识别的概率分别为PAi,被识别的实体为Ai,典型图片B被识别的概率依次为PBi,被识别为的实体分别为Bi,同理该新增实体其他的典型图片依次识别的概率为PXi,被识别的是被为Xi。所有典型图片被识别的概率分别为P1-P15的结果,相对应的实体分别为R1-R15,其中角标1-5分别表示为识别的top1和top5的实体。
具体的,所述现有训练模型中的实体种类可以是1000种也可以是5000种,数量尽可能在这个范围之内,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%,以确保现有训练模型可以充分识别已包含的实体种类。
需要说明的是,top1表示预测出来最大概率的那个分类是正确的概率;top5表示预测出来最大概率的5个分类里有正确的概率。
得到所述新增实体典型图片集中每一张典型图片的top1和top5的置信度后结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
具体的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
这样根据上述算法就能准确判断出新增实体是否存在现有模型中。
进一步的,若果判断结果为所述新增实体不存在现有训练模型中就将所述新增实体加入到所述现有训练模型中。
相应的,本实施例还提供一种基于训练模型识别典型图片对新增实体的验证***,如图3所示,包括:
获取模块11,用于获取新增实体典型图片集;
计算模块12,用于通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
判断模块13,用于根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
具体的,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
具体的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
具体的,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
实施例二
本实施例提供一种基于训练模型识别典型图片对新增实体的验证方法,如图4所示,包括步骤:
S21.获取新增实体典型图片集;
S22.对所述新增实体典型图片集中的所有典型图片进行图像预处理;
S23.通过现有训练模型对预处理后的新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
S24.根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
本实施例与实施例一相比,增加了步骤S22对所述新增实体典型图片集中的所有典型图片进行了图片预处理。
首先获取新增实体典型图片集。当然所述新增实体典型图片集中的图片特征分明、分布广泛并且来源于现实生活,通常是3到5张最佳。
获取到新增实体典型图片集后对所述新增实体典型图片集中的所有典型图片进行图像预处理。本实施例中的图像预处理步骤主要是对典型图像的尺寸进行调整和归一化,这两个步骤的具体设置和后续使用的现有训练模型图像输入的尺寸相关,主要是将新增实体典型图片的尺寸归一化成现有训练模型图像输入的尺寸,这样就可以减小现有训练模型的计算量,提高验证新增实体的效率。
对新增实体典型图片进行预处理后将其输入到现有训练模型中,通过现有训练模型对所述新增实体典型图片集进行识别计算新增实体典型图片集中每一张典型图片的top1和top5的置信度。
具体的,所述现有训练模型中的实体种类可以是1000种也可以是5000种,数量尽可能在这个范围之内,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%,以确保现有训练模型可以充分识别已包含的实体种类。
需要说明的是,top1表示预测出来最大概率的那个分类是正确的概率;top5表示预测出来最大概率的5个分类里有正确的概率。
得到所述新增实体典型图片集中每一张典型图片的top1和top5的置信度后结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
具体的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
这样根据上述算法就能准确判断出新增实体是否存在现有模型中。
进一步的,若果判断结果为所述新增实体不存在现有训练模型中就将所述新增实体加入到所述现有训练模型中。
相应的,本实施例还提供一种基于训练模型识别典型图片对新增实体的验证***,如图5所示,包括:
获取模块21,用于获取新增实体典型图片集;
预处理模块22,用于对所述新增实体典型图片集中的所有典型图片进行图像预处理;
计算模块23,用于通过现有训练模型对预处理后的新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
判断模块24,用于根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
具体的,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
具体的,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
具体的,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
本实施例在现有训练模型的基础上,通过对预处理后的新增实体的典型图片进行识别,得到top1和top5的置信度,然后根据一定的算法,从而判断该新增实体是否已经存在现有训练模型中,有效的解决了单纯使用名字匹配或者语义分析进行判断产生误判,漏判断,或者错判的情况,大大提高对新增实体判断的准确性和效率。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种基于训练模型识别典型图片对新增实体的验证方法,其特征在于,包括步骤:
S1.获取新增实体典型图片集;
S2.通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
S3.根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
2.根据权利要求1所述的一种基于训练模型识别典型图片对新增实体的验证方法,其特征在于,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
3.根据权利要求1所述的一种基于训练模型识别典型图片对新增实体的验证方法,其特征在于,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+3+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
4.根据权利要求1所述的一种基于训练模型识别典型图片对新增实体的验证方法,其特征在于,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
5.根据权利要求1所述的一种基于训练模型识别典型图片对新增实体的验证方法,其特征在于,所述步骤S1之后步骤S2之前还包括步骤:对所述新增实体典型图片集中的所有典型图片进行图像预处理。
6.一种基于训练模型识别典型图片对新增实体的验证***,其特征在于,包括:
获取模块,用于获取新增实体典型图片集;
计算模块,用于通过现有训练模型对所述新增实体典型图片集进行识别计算所述新增实体典型图片集中每一张典型图片的top1和top5的置信度;
判断模块,用于根据所述top1和top5的置信度结合预设的算法判断出所述新增实体是否已经存在于所述现有训练模型中。
7.根据权利要求6所述的一种基于训练模型识别典型图片对新增实体的验证***,其特征在于,所述现有训练模型对当前种类的识别top1的置信度大于75%、top 5的置信度大于90%。
8.根据权利要求6所述的一种基于训练模型识别典型图片对新增实体的验证***,其特征在于,所述预设的算法具体为:
A1.计算新增实体典型图片集中所有典型图片的top5的置信度之和M=P1+P2+P3+…+Pn以及top1的置信度之和Tn=P1+P2+P3+…+Pn
A2.若M>0.9*n或T>0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否则跳到步骤A3;
A3.去掉所有典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tn-1=P1+P2+P3+…Pn-1,若Tn-1>0.75*(n-1)并且T<0.75*n,则说明所述新增实体已经在现有训练模型中并结束判断,若否跳到步骤A4;
A4.去掉剩余典型图片中top1的置信度最小的进行重新计算top1的置信度之和Tx=P1+P2+P3+…+Px
A5.若并且Tx>0.75*x以及Tx+1<0.75*(x+1),则说明该新增实体已经在现有训练模型中并结束判断;若且Tx<0.75*x,则跳到步骤A4;若则说明该新增实体不存在现有训练模型中并结束判断。
9.根据权利要求6所述的一种基于训练模型识别典型图片对新增实体的验证***,其特征在于,若判断结果为所述新增实体不存在现有训练模型中则将所述新增实体加入到现有训练模型中。
10.根据权利要求6所述的一种基于训练模型识别典型图片对新增实体的验证***,其特征在于,还包括:
预处理模块,用于对所述新增实体典型图片集中的所有典型图片进行图像预处理。
CN201810762081.7A 2018-07-12 2018-07-12 一种基于训练模型识别典型图片对新增实体的验证方法及*** Pending CN109214411A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810762081.7A CN109214411A (zh) 2018-07-12 2018-07-12 一种基于训练模型识别典型图片对新增实体的验证方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810762081.7A CN109214411A (zh) 2018-07-12 2018-07-12 一种基于训练模型识别典型图片对新增实体的验证方法及***

Publications (1)

Publication Number Publication Date
CN109214411A true CN109214411A (zh) 2019-01-15

Family

ID=64990041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810762081.7A Pending CN109214411A (zh) 2018-07-12 2018-07-12 一种基于训练模型识别典型图片对新增实体的验证方法及***

Country Status (1)

Country Link
CN (1) CN109214411A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161976A1 (en) * 2007-12-21 2009-06-25 Sony Corporation Image processing device, image processing method, program, and learning device
CN105023025A (zh) * 2015-08-03 2015-11-04 大连海事大学 一种开集痕迹图像分类方法及***
CN105844286A (zh) * 2016-03-11 2016-08-10 博康智能信息技术有限公司 新增车标的识别方法和装置
CN107688822A (zh) * 2017-07-18 2018-02-13 中国科学院计算技术研究所 基于深度学习的新增类别识别方法
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、***及计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161976A1 (en) * 2007-12-21 2009-06-25 Sony Corporation Image processing device, image processing method, program, and learning device
CN105023025A (zh) * 2015-08-03 2015-11-04 大连海事大学 一种开集痕迹图像分类方法及***
CN105844286A (zh) * 2016-03-11 2016-08-10 博康智能信息技术有限公司 新增车标的识别方法和装置
CN107688822A (zh) * 2017-07-18 2018-02-13 中国科学院计算技术研究所 基于深度学习的新增类别识别方法
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、***及计算机存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAI TIAN;SHUIGENG ZHOU;JIHONG GUAN: "DeepCluster: A General Clustering Framework Based on Deep Learning", MACHINE LEARNING AND KNOWLEDGE DISCOVERY IN DATABASES, 30 December 2017 (2017-12-30), pages 21 - 45 *
吉卫卫;: "基于增量标号噪声数据学习的人脸识别研究", 南京航空航天大学, 1 December 2011 (2011-12-01), pages 1 - 48 *
李念;廖闻剑;彭艳兵;: "动态置信度的序列选择增量学习方法", 计算机***应用, vol. 25, no. 2, 15 February 2016 (2016-02-15), pages 135 *

Similar Documents

Publication Publication Date Title
CN109829430B (zh) 基于异构层次化注意机制的跨模态行人再识别方法及***
US12039447B2 (en) Information processing method and terminal, and computer storage medium
CN103324745B (zh) 基于贝叶斯模型的文本垃圾识别方法和***
CN109710744B (zh) 一种数据匹配方法、装置、设备及存储介质
CN113254643B (zh) 文本分类方法、装置、电子设备和
CN108564955A (zh) 电子装置、身份验证方法和计算机可读存储介质
CN114490953B (zh) 训练事件抽取模型的方法、事件抽取的方法、装置及介质
US20230032728A1 (en) Method and apparatus for recognizing multimedia content
CN104462064A (zh) 一种移动终端信息通讯提示输入内容的方法和***
CN116795973A (zh) 基于人工智能的文本处理方法及装置、电子设备、介质
CN113761887A (zh) 基于文本处理的匹配方法、装置、计算机设备和存储介质
CN116450829A (zh) 医疗文本分类方法、装置、设备及介质
CN114880431A (zh) 一种基于prompt的事件论元抽取方法及***
CN113254575B (zh) 一种基于多步证据推理的机器阅读理解方法与***
CN108197274B (zh) 基于对话的异常个性检测方法及装置
CN112200260B (zh) 一种基于丢弃损失函数的人物属性识别方法
Lu et al. Orientation-aware pedestrian attribute recognition based on graph convolution network
CN107688594B (zh) 基于社交信息的风险事件的识别***及方法
Shao et al. Action sensitivity learning for the ego4d episodic memory challenge 2023
CN109214411A (zh) 一种基于训练模型识别典型图片对新增实体的验证方法及***
CN107133218A (zh) 商品名称智能匹配方法、***及计算机可读存储介质
CN116628162A (zh) 语义问答方法、装置、设备及存储介质
CN115687939A (zh) 一种基于多任务学习的Mask文本匹配方法及介质
CN110909132B (zh) 一种基于语义分析的警务学习内容分析划归方法
CN113282715A (zh) 结合深度学习的大数据话题评论情绪分析方法及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201203

Address after: Room 10242, No. 260, Jiangshu Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Jiji Intellectual Property Operation Co., Ltd

Address before: 201616 Shanghai city Songjiang District Sixian Road No. 3666

Applicant before: Phicomm (Shanghai) Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination