CN111476275A - 基于图片识别的目标检测方法、服务器及存储介质 - Google Patents

基于图片识别的目标检测方法、服务器及存储介质 Download PDF

Info

Publication number
CN111476275A
CN111476275A CN202010185440.4A CN202010185440A CN111476275A CN 111476275 A CN111476275 A CN 111476275A CN 202010185440 A CN202010185440 A CN 202010185440A CN 111476275 A CN111476275 A CN 111476275A
Authority
CN
China
Prior art keywords
target
preset
frame
frames
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010185440.4A
Other languages
English (en)
Inventor
付美蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202010185440.4A priority Critical patent/CN111476275A/zh
Publication of CN111476275A publication Critical patent/CN111476275A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图片识别的目标检测方法,应用于服务器,该方法包括接收客户端上传的待检测图像,提取对应的图像特征图,将图像特征图输入目标提取模型输出第一图像数据,判断第一图像数据中是否包含至少两种第一预设目标类型、且数量为第一预设数量的第一目标框,若满足条件则判断各第一目标框之间的位置关系,从数据库中找出对应的判断结果,若判断结果为第一判断结果则分别判断第一目标框中是否包含第二目标框,若包含则分别识别判断第二目标框对应的第一预设数据是否与数据库中的第二预设数据对应,并根据分析结果生成反馈信息反馈至客户端。本发明能够代替人工判断照片的救援情况是否属实,提高判断效率。

Description

基于图片识别的目标检测方法、服务器及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于图片识别的目标检测方法、服务器及存储介质。
背景技术
保险公司对于购买了车险的用户,会赠送对应的救援服务,并委托救援商为用户提供救援服务。当救援商为用户提供救援服务后,为了向保险公司证明救援的真实性,而非假冒行为,因此救援商在完成救援后需要对现场进行拍照取证,所拍摄的照片中需要显示故障车放置在拖车上并上传给服务商,通过服务商人工判断是否真实救援。
但是通过肉眼来判断照片中的救援是否属实的方式不仅存在效率低下,同时人工判断存在误差较大的情况,导致判断结果不准确。因此如何提高识别照片真伪的效率成为了亟需解决的技术问题。
发明内容
本发明的主要目的在于提供一种基于图片识别的目标检测方法、服务器及存储介质,旨在如何提高识别照片真伪的效率的问题。
为实现上述目的,本发明提供的一种基于图片识别的目标检测方法,应用于服务器,该方法包括:
接收步骤:接收客户端上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图;
第一判断步骤:将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量;
第二判断步骤:若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量,则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系;
第三判断步骤:根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实;及
反馈步骤:若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端,其中,所述分析结果包括属实及不属实。
优选地,所述目标提取模型为SSD模型,所述判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中的每一个像素点生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
优选地,所述目标提取模型的训练过程包括:
获取图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型。
优选地,所述损失函数通过以下公式计算:
Figure BDA0002414021680000031
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
优选地,所述反馈步骤还包括:
若所述分析结果为不属实,则将所述待检测图像进行直方图均衡化处理得到第二图像数据,将所述第二图像数据调整至预设角度后重新输入所述接收步骤中的图像特征提取模型。
为实现上述目的,本发明还进一步提供一种服务器,所述服务器包括存储器和处理器,所述存储器上存储有基于图片识别的目标检测程序,所述基于图片识别的目标检测程序被所述处理器执行时实现如下步骤:
接收步骤:接收客户端上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图;
第一判断步骤:将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量;
第二判断步骤:若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量,则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系;
第三判断步骤:根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实;及
反馈步骤:若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端,其中,所述分析结果包括属实及不属实。
优选地,所述目标提取模型为SSD模型,所述判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中每一个像素点生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取第二预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
优选地,所述目标提取模型的训练过程包括:
获取图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型。
优选地,所述损失函数通过以下公式计算:
Figure BDA0002414021680000061
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
为实现上述目的,本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于图片识别的目标检测程序,所述基于图片识别的目标检测程序可被一个或者多个处理器执行,以实现如上所述的基于图片识别的目标检测方法的步骤。
本发明提出的基于图片识别的目标检测方法、服务器及存储介质,通过接收客户端上传的待检测图像,将待检测图像输入图像数据特征提取模型得到图像特征图,将图像特征图输入目标提取模型输出第一图像数据,判断第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种第一目标框的数量为第一预设数量,若满足条件则分别获取各第一目标框的位置坐标,并判断各第一目标框之间的位置关系,根据所述位置关系,从数据库中的映射关系表中找出对应的判断结果,若判断结果为第一判断结果,则分别判断第一目标框中是否包含第二目标框,若包含则分别识别第二目标框对应的第一预设数据,判断第一预设数据是否与数据库中的第二预设数据对应,并根据分析结果生成反馈信息反馈至客户端。本发明能够代替人工通过判断照片判断救援情况是否属实,提高判断效率,同时减少人工判断导致的误差。
附图说明
图1为本发明服务器较佳实施例的应用环境图;
图2为图1中基于图片识别的目标检测程序较佳实施例的程序模块示意图;
图3为本发明基于图片识别的目标检测方法较佳实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参附图做进一步说明。
具体实施方式
为了使本发明的目的、技术本实施例及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术本实施例可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术本实施例的结合出现相互矛盾或无法实现时应当认为这种技术本实施例的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种服务器1。
所述服务器1包括,但不仅限于,存储器11、处理器12及网络接口13。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是服务器1的内部存储单元,例如该服务器1的硬盘。存储器11在另一些实施例中也可以是服务器1的外部存储设备,例如该服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,存储器11还可以既包括服务器1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于服务器1的应用软件及各类数据,例如基于图片识别的目标检测程序10的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行基于图片识别的目标检测程序10等。
网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该服务器与其他电子设备之间建立通信连接。
客户端14可以是桌上型计算机、笔记本、平板电脑、手机等。
网络15可以为互联网、云网络、无线保真(Wi-Fi)网络、个人网(PAN)、局域网(LAN)和/或城域网(MAN)。网络环境中的各种设备可以被配置为根据各种有线和无线通信协议连接到通信网络。这样的有线和无线通信协议的例子可以包括但不限于以下中的至少一个:传输控制协议和互联网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、文件传输协议(FTP)、ZigBee、EDGE、IEEE 802.11、光保真(Li-Fi)、802.16、IEEE 802.11s、IEEE 802.11g、多跳通信、无线接入点(AP)、设备对设备通信、蜂窝通信协议和/或蓝牙(BlueTooth)通信协议或其组合。
可选地,该服务器1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在服务器1中处理的信息以及用于显示可视化的用户界面。
图1仅示出了具有组件11-15以及基于图片识别的目标检测程序10的服务器1,本领域技术人员可以理解的是,图1示出的结构并不构成对服务器1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在本实施例中,图1的基于图片识别的目标检测程序10被处理器12执行时,实现以下步骤:
接收步骤:接收客户端14上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图;
第一判断步骤:将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量;
第二判断步骤:若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量,则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系;
第三判断步骤:根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实;及
反馈步骤:若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端14,其中,所述分析结果包括属实及不属实。
在另一实施例中,所述反馈步骤还包括:
若所述分析结果为不属实,则将所述待检测图像进行直方图均衡化处理得到第二图像数据,将所述第二图像数据调整至预设角度后重新输入所述接收步骤中的图像特征提取模型。
关于上述步骤的详细介绍,请参照下述图2关于基于图片识别的目标检测程序10实施例的程序模块示意图及图3关于基于图片识别的目标检测方法实施例的方法流程示意图的说明。
参照图2所示,为图1中基于图片识别的目标检测程序10实施例的程序模块示意图。基于图片识别的目标检测程序10被分割为多个模块,该多个模块存储于存储器11中,并由处理器12执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。
在本实施例中,所述基于图片识别的目标检测程序10包括接收模块110、第一判断模块120、第二判断模块130、第三判断模块140及反馈模块150。
接收模块110,用于接收客户端14上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图。
在本实施例中,服务器1接收客户端14(例如摄像机或其他具有拍摄功能的拍摄终端、或具有拍摄功能及传输图像功能的设备)上传的待检测图像,利用预先训练的图像特征提取模型从待检测图像中提取出图像特征图。在本实施例中,图像特征提取模型由MobileNetV2网络模型训练得到,MobileNetV2网络模型是一种轻量级的卷积神经网络结构模型,MobileNetV2网络模型可以高效地对分辨率不高的图像进行快速识别,且具有运算占用带宽较小的特点,可以搭载于移动设备上使用。MobileNetV2网络模型包括依次连接的53层卷积层、1层池化层以及1层全连接层,其中,53层卷积层包括依次连接的1层输入层、17个瓶颈构建块、1层输出层,每个瓶颈构建块分别包括3层卷积层,53层卷积层的卷积核均为3×3。
在其他实施例中,还可以在训练MobileNetV2网络模型时,预先为所述MobileNetV2网络模型设定损失函数,将训练样本输入到MobileNetV2网络模型中,对输入的训练样本进行前向传播得到实际输出,将预设的目标输出和实际输出代入损失函数中,计算损失函数的损失值,进行反向传播并利用损失值对所述MobileNetV2网络模型的参数进行优化,得到优化后的MobileNetV2网络模型。然后再选取一个训练样本输入到优化后的MobileNetV2网络模型中,参照前述操作,再次对优化后的MobileNetV2网络模型进行训练,直到达到停止训练的条件为止。
第一判断模块120,用于将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量。
在本实施例中,当判断第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种预设类型的第一目标框的数量为第一预设数量(在本实施例中,第一预设数量为1)时,说明客户端14上传的待检测图像符合要求,则执行后续步骤;否则,说明客户端14上传的待检测图像不符合要求,并生成反馈信息反馈至客户端14。
其中,所述目标框是基于第三方标记工具(例如RectLabel)绘制的,每个目标框对应一种第一预设目标类型。
以下通过具体例子进一步说明:
例如保险公司对于购买了车险的用户,赠送对应的救援服务,并委托救援商为用户提供救援服务。当救援商为用户提供救援服务后,为了向保险公司证明救援的真实性,而非假冒行为,因此救援商在完成救援后需要对现场进行拍照取证并反馈给服务商。
因此,通过本方案将救援商现场拍摄的照片输入图像特征提取模型后,得到所述照片的图像特征图,之后将图像特征图输入目标提取模型中得到所述照片的第一图像数据,对第一图像数据行进分析判断,当判断所述第一图像数据中包含至少两种第一预设目标类型(例如故障车、拖车)的第一目标框(至少包含故障车的图框及拖车的图框),且每种预设类型的第一目标框的数量为第一预设数量时,说明客户端14上传的待检测图像符合要求,则执行后续步骤;否则,说明客户端14上传的待检测图像不符合要求,可能存在造假行为,或者拍摄的图片不符合要求,并生成反馈信息反馈至客户端14。
之后,将所述图像特征图输入预先训练的目标提取模型得到所述待监测图像对应的第一图像数据。所述目标提取模型为SSD模型。上述步骤中,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中的每一个像素点生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取第二预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
所述目标提取模型的训练过程包括:
获取的图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型;
所述损失函数通过以下公式计算:
Figure BDA0002414021680000131
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
第二判断模块130,用于若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量(在本实施例中,第一预设数量为1),则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系。
在本实施例中,当识别出第一图像数据中包含至少两种第一预设目标类型的第一目标框时,分别获取目标提取模型输出的第一目标框的四个顶点的位置坐标,并基于预设计算规则判断各第一目标框之间的位置关系,以故障车和拖车为例,所述位置关系可以是故障车在拖车上方,或者故障车在拖车下方,或者故障车在拖车左方,或者故障车在拖车右方。
其中,所述计算规则为:分别取故障车代表的第一目标框和拖车代表的第一目标框各顶点的坐标,即故障车左上坐标(x1,y1),故障车右上坐标(x2,y2),故障车左下坐标(x4,y4),故障车右下坐标(x3,y3),拖车左上坐标(a1,b1),拖车右上坐标(a2,b2),拖车左下坐标(a4,b4),拖车右下坐标(a3,b3),利用x1减去a1,x2减去a2,若结果为一正一负,说明故障车处于拖车的中间位置,同时利用y1减去b1,y2减去b2,若结果均为正,说明故障车位于拖车上方,在同时满足上述两个条件时,则说明故障车位于拖车的正上方,能够初步判断救援方上传的照片满足保险商对现场取证的要求。
第三判断模块140,用于根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实。
为了进一步说明该步骤的具体方案,在本实施例中,继续以上述的例子进行说明。通过从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,判断结果包括第一判断结果及第二判断结果。当第一图像数据中显示故障车在拖车的上方时,则说明救援方上传的照片符合要求,但是由于故障车或拖车的真实性可能存在不确定性,即待定,因此向客户端14发出第一判断结果(待定,即故障车及/或故障车的真实身份待定)的反馈信息,反馈信息显示第一图像数据对应信息的真实性为待定。当第一图像数据中未显示故障车置于拖车上方时,则说明救援商上传的照片不符合要求,即向客户端14发出第二判断结果(不属实)的反馈信息。
反馈模块150,用于若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端14,其中,所述分析结果包括属实及不属实。
为了避免故障车或拖车的真实性可能存在不确定性的情况发生,例如救援商可能上传假冒照片,照片中的故障车或拖车不是救援商现场拍摄的,因此在本实施例中,在判断出不同第一目标框之间的位置关系之后,还需要对第一目标框进行分析,继续以上述的例子进行说明该步骤的具体方案。若判断结果为第一判断结果,即救援商上传的照片中显示故障车在拖车上方,则分别判断第一目标框中是否包含第二目标框,例如故障车或拖车的车牌。其中,若第一目标框中包含第二目标框,则分别识别第二目标框对应的第一预设数据(例如车牌号),分析第一预设数据与预先存储在数据库中的第二预设数据(例如车主姓名)是否对应,并根据分析结果生成反馈信息反馈至客户端14。
在另一实施例中,所述反馈模块150还用于若所述分析结果为不属实,则将所述待检测图像进行直方图均衡化处理得到第二图像数据,将所述第二图像数据调整至预设角度后重新输入所述接收步骤中的图像特征提取模型。
在本实施例中,若出现分析结果为不属实,可能是救援商上传的照片为假冒照片,也可能是救援商上传的照片不符合服务器识别要求,例如照片光线暗或者角度摆放不好导致的。因此,当出现分析结果为不属实时,可以将待检测图像进行直方图均衡化处理得到第二图像数据,并将第二图像数据调整预设角度(例如270°,即对称翻转)后重新输入接收步骤中的图像特征提取模型,重复上述步骤。
此外,本发明还提供一种基于图片识别的目标检测方法。参照图3所示,为本发明基于图片识别的目标检测方法的实施例的方法流程示意图。服务器1的处理器12执行存储器11中存储的基于图片识别的目标检测程序10时实现基于图片识别的目标检测方法的如下步骤:
S110,接收客户端14上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图。
在本实施例中,服务器1接收客户端14(例如摄像机或其他具有拍摄功能的拍摄终端、或具有拍摄功能及传输图像功能的设备)上传的待检测图像,利用预先训练的图像特征提取模型从待检测图像中提取出图像特征图。在本实施例中,图像特征提取模型由MobileNetV2网络模型训练得到,MobileNetV2网络模型是一种轻量级的卷积神经网络结构模型,MobileNetV2网络模型可以高效地对分辨率不高的图像进行快速识别,且具有运算占用带宽较小的特点,可以搭载于移动设备上使用。MobileNetV2网络模型包括依次连接的53层卷积层、1层池化层以及1层全连接层,其中,53层卷积层包括依次连接的1层输入层、17个瓶颈构建块、1层输出层,每个瓶颈构建块分别包括3层卷积层,53层卷积层的卷积核均为3×3。
在其他实施例中,还可以在训练MobileNetV2网络模型时,预先为所述MobileNetV2网络模型设定损失函数,将训练样本输入到MobileNetV2网络模型中,对输入的训练样本进行前向传播得到实际输出,将预设的目标输出和实际输出代入损失函数中,计算损失函数的损失值,进行反向传播并利用损失值对所述MobileNetV2网络模型的参数进行优化,得到优化后的MobileNetV2网络模型。然后再选取一个训练样本输入到优化后的MobileNetV2网络模型中,参照前述操作,再次对优化后的MobileNetV2网络模型进行训练,直到达到停止训练的条件为止。
S120,将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量。
在本实施例中,当判断第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种预设类型的第一目标框的数量为第一预设数量(在本实施例中,第一预设数量为1)时,说明客户端14上传的待检测图像符合要求,则执行后续步骤;否则,说明客户端14上传的待检测图像不符合要求,并生成反馈信息反馈至客户端14。
其中,所述目标框是基于第三方标记工具(例如RectLabel)绘制的,每个目标框对应一种第一预设目标类型。
以下通过具体例子进一步说明:
例如保险公司对于购买了车险的用户,赠送对应的救援服务,并委托救援商为用户提供救援服务。当救援商为用户提供救援服务后,为了向保险公司证明救援的真实性,而非假冒行为,因此救援商在完成救援后需要对现场进行拍照取证并反馈给服务商。
因此,通过本方案将救援商现场拍摄的照片输入图像特征提取模型后,得到所述照片的图像特征图,之后将图像特征图输入目标提取模型中得到所述照片的第一图像数据,对第一图像数据进行分析判断,当判断所述第一图像数据中包含至少两种第一预设目标类型(例如故障车、拖车)的第一目标框(至少包含故障车的图框及拖车的图框),且每种预设类型的第一目标框的数量为第一预设数量时,说明客户端14上传的待检测图像符合要求,则执行后续步骤;否则,说明客户端14上传的待检测图像不符合要求,可能存在造假行为,或者拍摄的图片不符合要求,并生成反馈信息反馈至客户端14。
之后,将所述图像特征图输入预先训练的目标提取模型得到所述待监测图像对应的第一图像数据。所述目标提取模型为SSD模型。上述步骤中,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中的每一个像素点生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取第二预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
所述目标提取模型的训练过程包括:
获取的图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型;
所述损失函数通过以下公式计算:
Figure BDA0002414021680000181
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
S130,若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量(在本实施例中,第一预设数量为1),则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系。
在本实施例中,当识别出第一图像数据中包含至少两种第一预设目标类型的第一目标框时,分别获取目标提取模型输出的第一目标框的四个顶点的位置坐标,并基于预设计算规则判断各第一目标框之间的位置关系,以故障车和拖车为例,所述位置关系可以是故障车在拖车上方,或者故障车在拖车下方,或者故障车在拖车左方,或者故障车在拖车右方。
其中,所述计算规则为:分别取故障车代表的第一目标框和拖车代表的第一目标框各顶点的坐标,即故障车左上坐标(x1,y1),故障车右上坐标(x2,y2),故障车左下坐标(x4,y4),故障车右下坐标(x3,y3),拖车左上坐标(a1,b1),拖车右上坐标(a2,b2),拖车左下坐标(a4,b4),拖车右下坐标(a3,b3),利用x1减去a1,x2减去a2,若结果为一正一负,说明故障车处于拖车的中间位置,同时利用y1减去b1,y2减去b2,若结果均为正,说明故障车位于拖车上方,在同时满足上述两个条件时,则说明故障车位于拖车的正上方,能够初步判断救援方上传的照片满足保险商对现场取证的要求。
S140,根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实。
为了进一步说明该步骤的具体方案,在本实施例中,继续以上述的例子进行说明。通过从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,判断结果包括第一判断结果及第二判断结果。当第一图像数据中显示故障车在拖车的上方时,则说明救援方上传的照片符合要求,但是由于故障车或拖车的真实性可能存在不确定性,即待定,因此向客户端14发出第一判断结果(待定,即故障车及/或故障车的真实身份待定)的反馈信息,反馈信息显示第一图像数据对应信息的真实性为待定。当第一图像数据中未显示故障车置于拖车上方时,则说明救援商上传的照片不符合要求,即向客户端14发出第二判断结果(不属实)的反馈信息。
S150,若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端14,其中,所述分析结果包括属实及不属实。
为了避免故障车或拖车的真实性可能存在不确定性的情况发生,例如救援商可能上传假冒照片,照片中的故障车或拖车不是救援商现场拍摄的,因此在本实施例中,在判断出不同第一目标框之间的位置关系之后,还需要对第一目标框进行分析,继续以上述的例子进行说明该步骤的具体方案。若判断结果为第一判断结果,即救援商上传的照片中显示故障车在拖车上方,则分别判断第一目标框中是否包含第二目标框,例如故障车或拖车的车牌。其中,若第一目标框中包含第二目标框,则分别识别第二目标框对应的第一预设数据(例如车牌号),分析第一预设数据与预先存储在数据库中的第二预设数据(例如车主姓名)是否对应,并根据分析结果生成反馈信息反馈至客户端14。
在另一实施例中,该方法还包括以下步骤:
若所述分析结果为不属实,则将所述待检测图像进行直方图均衡化处理得到第二图像数据,将所述第二图像数据调整至预设角度后重新输入所述接收步骤中的图像特征提取模型。
在本实施例中,若出现分析结果为不属实,可能是救援商上传的照片为假冒照片,也可能是救援商上传的照片不符合服务器识别要求,例如照片光线暗或者角度摆放不好导致的。因此,当出现分析结果为不属实时,可以将待检测图像进行直方图均衡化处理得到第二图像数据,并将第二图像数据调整预设角度(例如270°,即对称翻转)后重新输入接收步骤中的图像特征提取模型,重复上述步骤。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括基于图片识别的目标检测程序10,本发明之计算机可读存储介质的具体实施方式与上述基于图片识别的目标检测方法以及服务器1的具体实施方式大致相同,在此不再赘述。
需要说明的是,上述本发明实施例序日仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序日仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术本实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于图片识别的目标检测方法,应用于服务器,其特征在于,该方法包括:
接收步骤:接收客户端上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图;
第一判断步骤:将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量;
第二判断步骤:若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量,则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系;
第三判断步骤:根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实;及
反馈步骤:若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端,其中,所述分析结果包括属实及不属实。
2.如权利要求1所述的基于图片识别的目标检测方法,其特征在于,所述目标提取模型为SSD模型,所述判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中的每一个像素点生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取第二预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
3.如权利要求2所述的基于图片识别的目标检测方法,其特征在于,所述目标提取模型的训练过程包括:
获取图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型。
4.如权利要求3所述的基于图片识别的目标检测方法,其特征在于,所述损失函数通过以下公式计算:
Figure FDA0002414021670000031
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
5.如权利要求1-4任一项所述的基于图片识别的目标检测方法,其特征在于,所述反馈步骤还包括:
若所述分析结果为不属实,则将所述待检测图像进行直方图均衡化处理得到第二图像数据,将所述第二图像数据调整至预设角度后重新输入所述接收步骤中的图像特征提取模型。
6.一种服务器,其特征在于,所述服务器包括存储器和处理器,所述存储器上存储有基于图片识别的目标检测程序,所述基于图片识别的目标检测程序被所述处理器执行时实现如下步骤:
接收步骤:接收客户端上传的待检测图像,将所述待检测图像输入预先训练的图像数据特征提取模型,得到与所述待检测图像对应的图像特征图;
第一判断步骤:将所述得到的图像特征图输入预先训练的目标提取模型,输出第一图像数据,判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量;
第二判断步骤:若所述第一图像数据中包含至少两种第一预设目标类型的第一目标框,且每种所述预设类型的第一目标框的数量为第一预设数量,则分别获取各所述第一目标框的位置坐标,并基于预设计算规则判断各所述第一目标框之间的位置关系;
第三判断步骤:根据所述位置关系,从数据库中预先建立的位置关系与判断结果之间的映射关系表中找出对应的判断结果,其中,所述判断结果包括第一判断结果及第二判断结果,所述第一判断结果表示第一图像数据对应信息的真实性为待定,所述第二判断结果表示第一图像数据对应信息的真实性为不属实;及
反馈步骤:若所述判断结果为第一判断结果,则分别判断所述第一目标框中是否包含第二目标框,若包含所述第二目标框,则分别识别所述第二目标框对应的第一预设数据,分析第一预设数据与预先存储在数据库中的第二预设数据是否对应,并根据分析结果生成反馈信息反馈至所述客户端,其中,所述分析结果包括属实及不属实。
7.如权利要求6所述的服务器,其特征在于,所述目标提取模型为SSD模型,所述判断所述第一图像数据中是否包含至少两种第一预设目标类型的第一目标框包括:
基于所述SSD模型分别为所述图像特征图中的每一个像素点分别生成对应的默认框,并获取各所述默认框在图像特征图中的位置坐标及对应于不同第一预设目标类型的概率评分,并将各所述默认框的概率评分中的最大值设置为初级置信度;
对所述初级置信度对应的默认框按照概率评分从大到小进行排序,以所述概率评分最大值对应的默认框为起始点,依次获取第二预设数量的所述默认框作为目标候选框,基于各所述目标候选框的位置坐标进行包围盒回归分析,得到对应于各目标候选框的区域大小;
对各所述目标候选框的概率评分进行softxmax分类,得到各所述目标候选框对应于不同预设目标类型分类的目标置信度;及
基于非极大值抑制算法,获取第三预设数量的iou(M,b)高于预设阈值的目标候选框作为第一目标框,其中,M表示概率评分最大值对应的默认框,b表示图像特征图中除默认框M之外的其他默认框,iou(M,b)表示默认框M与默认框b之间的重叠度。
8.如权利要求7所述的服务器,其特征在于,所述目标提取模型的训练过程包括:
获取图像特征图样本,基于所述目标提取模型对所述图像特征图样本中的每个像素点分别生成对应的默认框样本,并获取各默认框样本在该图像特征图样本中的坐标位置,以及对应于不同第一预设目标类型的概率评分;
基于每个默认框样本的所述位置坐标和概率评分,分别计算各默认框样本的softmax分类损失和包围盒回归损失之和;及
对所述softmax分类损失和包围盒回归损失之和按照从大到小进行排序,以所述softmax分类损失和包围盒回归损失之和最小者对应的默认框样本为起始点,依次获取预设数量的所述默认框样本,计算所述预设数量的默认框样本的损失函数,并将计算出的所述预设数量的默认框样本的损失函数,在所述目标提取模型中反向传播,以对所述目标提取模型的各层网络的权重值进行更新,训练得到该目标提取模型。
9.如权利要求8所述的服务器,其特征在于,所述损失函数通过以下公式计算:
Figure FDA0002414021670000051
其中,Lconf(x,c)为softmax分类损失,Lloc(x,l,g)为包围盒回归损失,K=|fk|*|fk|*α,|fk|为最大图像特征图的尺寸,α为权重值,x为默认框,c为默认框的类别信息,l为默认框的位置信息,g为默认框的标定区域结果。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于图片识别的目标检测程序,所述基于图片识别的目标检测程序可被一个或者多个处理器执行,以实现如权利要求1-5中任一项所述的基于图片识别的目标检测方法的步骤。
CN202010185440.4A 2020-03-17 2020-03-17 基于图片识别的目标检测方法、服务器及存储介质 Pending CN111476275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010185440.4A CN111476275A (zh) 2020-03-17 2020-03-17 基于图片识别的目标检测方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010185440.4A CN111476275A (zh) 2020-03-17 2020-03-17 基于图片识别的目标检测方法、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN111476275A true CN111476275A (zh) 2020-07-31

Family

ID=71748340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010185440.4A Pending CN111476275A (zh) 2020-03-17 2020-03-17 基于图片识别的目标检测方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111476275A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084932A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 基于图像识别的数据处理方法、装置、设备及存储介质
CN112270671A (zh) * 2020-11-10 2021-01-26 杭州海康威视数字技术股份有限公司 图像检测方法、装置、电子设备及存储介质
CN113378969A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 一种目标检测结果的融合方法、装置、设备及介质
CN113516161A (zh) * 2021-04-23 2021-10-19 中国铁建重工集团股份有限公司 一种隧道施工人员风险预警方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084932A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 基于图像识别的数据处理方法、装置、设备及存储介质
CN112084932B (zh) * 2020-09-07 2023-08-08 中国平安财产保险股份有限公司 基于图像识别的数据处理方法、装置、设备及存储介质
CN112270671A (zh) * 2020-11-10 2021-01-26 杭州海康威视数字技术股份有限公司 图像检测方法、装置、电子设备及存储介质
CN112270671B (zh) * 2020-11-10 2023-06-02 杭州海康威视数字技术股份有限公司 图像检测方法、装置、电子设备及存储介质
CN113516161A (zh) * 2021-04-23 2021-10-19 中国铁建重工集团股份有限公司 一种隧道施工人员风险预警方法
CN113378969A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 一种目标检测结果的融合方法、装置、设备及介质
CN113378969B (zh) * 2021-06-28 2023-08-08 北京百度网讯科技有限公司 一种目标检测结果的融合方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108108754B (zh) 重识别网络的训练、重识别方法、装置和***
CN111476275A (zh) 基于图片识别的目标检测方法、服务器及存储介质
EP3520045B1 (en) Image-based vehicle loss assessment method, apparatus, and system, and electronic device
US10885397B2 (en) Computer-executed method and apparatus for assessing vehicle damage
WO2018166116A1 (zh) 车损识别方法、电子装置及计算机可读存储介质
CN107679475B (zh) 门店监控评价方法、装置及存储介质
CN108427927B (zh) 目标再识别方法和装置、电子设备、程序和存储介质
CN110751043B (zh) 基于人脸可见性的人脸识别方法、装置及存储介质
CN108229297B (zh) 人脸识别方法和装置、电子设备、计算机存储介质
WO2019033572A1 (zh) 人脸遮挡检测方法、装置及存储介质
US8923628B2 (en) Computer readable medium, image processing apparatus, and image processing method for learning images based on classification information
CN109858375B (zh) 活体人脸检测方法、终端及计算机可读存储介质
CN108491866B (zh) ***鉴定方法、电子装置及可读存储介质
WO2020019765A1 (zh) 双目图像的深度估计方法及装置、设备、程序及介质
CN112036400B (zh) 构建用于目标检测的网络的方法和目标检测方法及***
CN111178147B (zh) 屏幕破碎分级方法、装置、设备及计算机可读存储介质
CN110795714A (zh) 一种身份验证方法、装置、计算机设备及存储介质
CN110660078B (zh) 对象追踪方法、装置、计算机设备和存储介质
CN111144372A (zh) 车辆检测方法、装置、计算机设备和存储介质
WO2019033567A1 (zh) 眼球动作捕捉方法、装置及存储介质
CN111144398A (zh) 目标检测方法、装置、计算机设备和存储介质
CN111191507A (zh) 智慧社区的安全预警分析方法及***
CN114663871A (zh) 图像识别方法、训练方法、装置、***及存储介质
CN108389053B (zh) 支付方法、装置、电子设备及可读存储介质
CN113643260A (zh) 用于检测图像质量的方法、装置、设备、介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination