CN117079195B - 一种基于图像视频的野生动物识别方法和*** - Google Patents
一种基于图像视频的野生动物识别方法和*** Download PDFInfo
- Publication number
- CN117079195B CN117079195B CN202311322143.XA CN202311322143A CN117079195B CN 117079195 B CN117079195 B CN 117079195B CN 202311322143 A CN202311322143 A CN 202311322143A CN 117079195 B CN117079195 B CN 117079195B
- Authority
- CN
- China
- Prior art keywords
- animal
- data set
- pictures
- reasoning
- night
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241001465754 Metazoa Species 0.000 title claims abstract description 182
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 29
- 238000013135 deep learning Methods 0.000 claims abstract description 20
- 238000002372 labelling Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000012216 screening Methods 0.000 claims abstract description 7
- 241000894007 species Species 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 238000012805 post-processing Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 claims description 2
- 230000004807 localization Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims 1
- 230000001960 triggered effect Effects 0.000 claims 1
- 238000012795 verification Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 12
- 230000000694 effects Effects 0.000 abstract description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 abstract description 2
- 241000219357 Cactaceae Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 241000282465 Canis Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 206010037180 Psychiatric symptoms Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/817—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level by voting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于图像视频的野生动物识别方法和***,属于机器学***台上,对野生动物的原始数据进行识别任务。本发明大幅度减少人工标注的时间和人力成本,并且对于新的数据能够快速地进行模型迭代更新保证识别效果,实现了更加自动化的识别过程。
Description
技术领域
本发明属于机器学习和人工智能领域,具体涉及一种基于图像视频的野生动物识别方法和***。
背景技术
现有的野生动物识别主要是基于神经网络的深度学习技术为基础,通过目标检测算法来实现对于野生动物图像的自动识别和检测。首先在野外不同环境,不同点位布设红外相机收集野生动物图片,这些动物图片涵盖着不同的野生动物种类,并具有不同的角度、光照和背景条件;然后通过对这些收集到的野生动物图片进行预处理,并进行数据标注工作,将带有标注信息的动物图片作为训练数据集;将训练数据集输入到CNN模型当中,对模型进行训练。训练过程当中,对模型的参数和权重不断地调整实验,从而确定相对性能最好的参数配置和权重,使得该模型能够更好地应用于野生动物识别项目当中。
一个较为完整的野生动物自动识别方法和***应该是能够对野外收集到的动物图片和视频进行记录并生成较为稳健的识别结果,并能够对其进行***的管理和结果分析。现有技术的主要缺陷有以下几点:
(1)复杂的野外环境。真实的野外场景是复杂多样的,包含着复杂多样的背景信息、不同的光照条件以及不同的季节特征。包含春夏季枝叶茂密的背景、秋季枯枝落叶背景、冬季雪地背景等,地点涵盖植被茂密的林内及相对空旷的裸土地等。并且在实际收集到的数据当中动物经常会出现肢体遮挡,模糊不清等各种拍摄问题,对于识别结果的正确性有较大的影响。
(2)物种间的差异以及分布不均衡。在动物的分类***等级当中,等级越小的物种相似度越高,其区分难度越大。一些所属科目相同的近似物种往往在外形上区别很小,在识别上具有一定的难度。而有的物种在自然环境中,收到本身种群数量以及生活习性等因素,能够捕获到的图片数据十分有限。
(3)有限的人工标注数据。一方面,不同种类间数据不平衡,造成训练数据集呈现严重的长尾分布。另一方面,现有的数据标注工作需要具有专业动物学科知识的专家对原始数据进行分类筛选,再交由数据标注人员进行标注工作,整个过程参与人员多、耗时长、效率较低。
发明内容
为解决上述技术问题,本发明提供一种基于图像视频的野生动物识别方法和***,其为高效通用的野生动物识别方法和***,能够将红外相机在自然环境下收集到的图片视频文件进行检测,输出检测结果;并且对检测结果进行结果统计和分析以及可视化,帮助科研管理人员对所属保护区域内制定相应的野生动物保护措施。本发明能够在***层面对于检测结果的数据进行预标注工作,大幅度减少人工标注的时间和人力成本。并且对于新的数据能够快速地进行模型迭代更新保证识别效果,实现了更加自动化的识别过程。
为达到上述目的,本发明采用如下技术方案:
一种基于目标检测算法的野生动物识别方法,包含以下步骤:
步骤S01、收集动物的照片和视频并进行预处理形成动物图片;
步骤S02、进行动物图片的标注,建立野生动物图像库;
步骤S03、将动物图片按层级分类为不同的数据集,包括:将步骤S02中标注后的动物图片划分为白天动物图片数据集和黑夜动物图片数据集,然后按照动物的所属科分别对白天动物图片数据集和黑夜动物图片数据集进行划分;
步骤S04、构建深度学习网络,用于特征提取;
步骤S05、分层级进行特征提取,根据步骤S03中的不同的数据集生成包括初级推理模型和次级推理模型的推理模型;
步骤S06、将待查询文件输入步骤S06中的推理模型中,最终输出检测结果,所述待查询文件为待查询图片或待查询视频;
步骤S07、对推理模型进行部署和应用。
本发明还提供一种基于目标检测算法的野生动物识别***,包括:
图片文件获取模块,用于收集动物的照片和视频并进行预处理获得动物图片;
图片标注模块,用于进行动物图片的标注工作,建立野生动物图像库:
推理模型生成模块,用于构建深度学习网络,进行特征提取,生成推理模型;
识别模块,用于输入待检测的动物的照片或视频进行结果推理检测,得到识别的动物物种;
应用模块,用于对推理模型进行服务器上的部署和应用。
有益效果:
(1)本发明设计了一套较为完整并独立性较好的野生动物识别方法和***。在整个过程当中,包括数据的标注、模型训练、应用开发、模型部署都是较为完整独立的一套体系,对外部应用的依赖较少。
(2)本发明根据野生动物的自然习性和族群特征分为了白天和黑夜两个大场景对物种进行检测,并在单独场景下对野生动物分层级地进行检测,先从动物的所属科层级进行初级推理,再从所属种层面进行次级推理,最终输出识别结果。
(3)本发明不同于传统的野生动物的静态图像识别方法,加入了时间序列信息,在视频检测层面进一步地加强野生动物识别过程为一个整体动态过程,加强识别图像的前后关系,使得识别检测过程不是一个个体化、独立化的识别过程,对检测结果的前后进行规则判定,并采用投票法进行结果后处理统计,进一步提高识别效果。
附图说明
图1为本发明的一种基于图像视频的野生动物识别方法的流程图;
图2为图片分类流程示意图;
图3为深度学习网络结构示意图;
图4为动物识别流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明的一种基于图像视频的野生动物识别方法,包含以下步骤:
步骤S01、收集动物的照片和视频并进行预处理形成动物图片,每个动物物种的类别的动物图片至少两百张,所述动物图片包括由视频抽帧生成的图片。
具体的,本实施例中,工作人员会在野外实际场景当中,在不同位置不同环境下,设置多个红外相机在野生动物经过时触发红外相机拍摄照片和视频,从而保证在这整个过程当中,所收集和使用到的动物数据是贴近实际自然场景的真实数据。
收集和预处理后得到的动物图片会通过筛选去除掉模糊不清,动物遮挡严重,特征不明显的动物图片;收集到的视频会通过视频抽帧的方法按照1s的时间间隔进行抽帧,生成相应的动物图片,通过筛选、去重等方式对相似度高的动物图片进行过滤,保留下符合要求的动物图片。
步骤S02、进行动物图片的标注工作,建立野生动物图像库:
具体的,本实施例中,对筛选过后的动物图片,通过标注软件对每张动物图片当中出现动物的具***置进行点位框标注,并选择该动物正确的类别,生成该图片的标注信息,标注信息包含位置信息和类别信息。
步骤S03、将动物图片按层级分类为不同的数据集:
具体的,如图2所示,所述步骤S03包括:
步骤S0301、采用颜色分类算法将步骤S02当中标注后的动物图片进行分类,主要分为白天动物图片数据集(视觉上为彩色图片)和黑夜动物图片数据集(视觉上为黑白图片)。
所述颜色分类算法的依据为:黑白图片和彩色图片在RGB三通道上的平均值具有较为明显的区别,黑白图片的三通道值往往是一样的,或者误差很小。
步骤S0302、在步骤S0301当中划分好的白天动物图片数据集和黑夜动物图片数据集当中按照动物的所属科进行动物图片数据集的划分,即将白天动物图片数据集分为白天物种A数据集、白天物种B数据集、……、白天物种N数据集,将黑夜动物图片数据集分为黑夜物种A数据集、黑夜物种B数据集、……、黑夜物种N数据集;
步骤S0303、在步骤S0302分类好的数据集当中各自划分训练数据集、验证数据集以及测试数据集。用划分出来的训练数据集生成COCO格式的数据集用于模型训练,从而提取特征。
步骤S04、构建深度学习网络,用于特征提取:
具体的,如图3所示,深度学习网络包含输入端、主干网络、颈部结构和预测层。
步骤S0401、在深度学习网络的输入端,主要采用了Mosaic、Mixup两种数据增强方法。
步骤S0402、主干网络采用DarkNet53的网络结构,输入的步骤S0301的动物图片首先经过一个卷积层,将输入通道数变换为深度学习网络中的第一个输出通道数。然后,这个卷积层的输出张量被输入到Darknet53的第一个“残差块”中。在这个残差块中,输入张量被送入一系列的卷积层和批归一化层,经过非线性激活函数(LeakyReLU)之后,再经过一个跳跃连接(skip connection)与输入张量相加,最后输出张量送到下一层。
步骤S0403、颈部结构采用FPN结构进行融合。FPN自顶向下,将高层的特征信息,通过上采样的方式进行传递融合,得到进行预测的特征图。
步骤S0404、预测层的检测头部当中具有Cls.分支、Reg.分支以及Obj.分支;
Cls.分支(类别分支)主要对目标框的类别、分数进行预测。
Reg.分支(目标框分支)主要对目标框的坐标信息(x,y,w,h)进行预测,x,y,w,h分别代表起始横坐标,起始纵坐标,宽,高。
Obj.分支(置信度分支)主要判断目标框是前景还是背景。
所以损失由、/>、/>这三个部分组成,其中/>和/>采用的都是二值交叉熵损失,而/>采用的是IoULoss(并交比损失)。
其中,预测层的检测部分损失的计算公式为:
,
其中,代表分类损失、/>代表定位损失、/>代表obj损失(置信度分支的损失)、/>代表定位损失的平衡系数、/>代表被分为正样的Anchor Point(锚点)数。
步骤S05、分层级进行特征提取,生成推理模型:
具体的,所述步骤S05包括:
步骤S0501、将步骤S0301当中划分的白天图片数据集和黑夜图片数据集放在步骤S04构建的深度学习网络当中按照动物的所属科进行特征提取,生成初级推理模型。
由于不同科甚至于不同种类的动物具有不同的活动习性和活动时间,因此在白天和黑夜活跃的动物种类和动物数量是会有较大差异的,因此将划分的白天和黑夜两个图片数据集分别进行特征提取,能够更有侧重地对该活动时间段的动物进行检测,提高推理模型的推理准确率。
不同动物在同一所属科范围下,具有相对重合的一些特征,这是与所属不同科动物所不同的一些特征,但同一科目的动物往往只会有颜色,体型差异等较小的区别,因此初级推理模型先通过对不同科特征的提取,给出包含所属科信息的检测结果,在针对检测结果进入次级推理模型对相似度较高的同科物种进行更进一步地识别,从而提高准确率。
步骤S0502、将步骤S0302当中的动物图片数据集放在步骤S04构建的深度学习网络当中按照动物的物种进行特征提取,生成次级推理模型。
次级推理模型主要是为了针对相似度较高的各类所属科相同的物种(例如藏酋猴和猕猴、大灵猫和小灵猫等),在初级推理模型确定了检测动物图片的所属科范围之后,进行物种具体类别的识别,随后会返回动物的所属种类识别结果。
步骤S06、将待查询文件输入步骤S06中的推理模型中,最终输出检测结果,所述待查询文件为待查询图片或待查询视频。
具体的,如图4所示,所述步骤S06包括:
步骤S0601、所述待查询文件为待查询图片时,根据步骤S0301将待查询图片现根据颜色分类算法判别出其属于白天或者黑夜。
将判别好的图片按照类别,即白天或黑夜,输入到步骤S0501所生成的初级推理模型当中进行推理,获得推理结果,即得到其对应的所属科结果。
根据得到的所属科结果,输入到步骤S0502所对应的次级推理模型当中进行推理,得到动物的物种识别结果。
步骤S0602、所述待查询文件为待查询视频时,将待查询视频按每1s抽帧成图片,按顺序根据步骤S0601得到推理结果并返回加入到所述待查询视频的结果队列当中。
对结果队列进行后处理操作,主要是针对推理结果进行组合统计,按照投票法选出组合数最多的推理结果作为待查询视频的总推理结果。
所述总推理结果包含动物的物种的类别、检测框点位信息以及推理算法对于动物物种类别的推理得分。
物种的类别包含所属科、所属种、点位信息、得分:
所属科是检测结果根据生物分类定义给出的科信息,例如:猴科、猫科、犬科等。
所属种是检测结果根据生物分类定义给出的种类信息,是最详细的动物类别信息,例如:藏酋猴、猕猴等。
点位信息是检测结果识别到动物在图片当中出现的一个检测矩形框位置信息,(x1,y1)代表矩形框的左上角坐标,(x2,y2)代表矩形框的右下角坐标。
得分是推理模型对待检测图片中的动物检测结果对应的推理得分:一张待检测图片通过推理模型得到的所有结果的得分总和是1,推理结果只会返回得分最高的所属种和其对应的得分。
步骤S07、对推理模型进行部署和应用。
具体的,所述步骤07包括:
步骤S0701、将通过步骤步骤S05生成的推理模型进行实验测试后,部署到服务器上。
步骤S0702、建立野生动物自动识别***,并与服务器上的推理模型建立API接口调用,使得用户都能够使用野生动物自动识别***进行野生动物的识别任务。
所述野生动物自动识别***包含用户管理模块,动物识别模块,结果复检模块,数据统计模块等。
综上所述,本发明对收集到的野生动物图像经过筛选后,进行相应的标注工作,从而构建野生动物图像数据集,通过构建深度学***台上对野生动物的原始数据进行识别任务。
本发明还提供一种基于图像视频的野生动物识别***,包括:
图片文件获取模块,用于收集动物的照片和视频并进行预处理获得动物图片;
图片标注模块,用于进行动物图片的标注工作,建立野生动物图像库:
推理模型生成模块,用于构建深度学习网络,进行特征提取,生成推理模型;
识别模块,用于输入待检测的动物的照片或视频进行结果推理检测,得到识别的动物物种;
应用模块,用于对推理模型进行服务器上的部署和应用。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于图像视频的野生动物识别方法,其特征在于,包含以下步骤:
步骤S01、收集动物的照片和视频并进行预处理形成动物图片;
步骤S02、进行动物图片的标注,建立野生动物图像库;
步骤S03、将动物图片按层级分类为不同的数据集,包括:将步骤S02中标注后的动物图片划分为白天动物图片数据集和黑夜动物图片数据集,然后按照动物的所属科分别对白天动物图片数据集和黑夜动物图片数据集进行划分,包括:
步骤S0301、采用颜色分类算法将步骤S02当中标注后的动物图片进行划分,分为白天动物图片数据集和黑夜动物图片数据集,所述白天动物图片数据集视觉上为彩色图片,所述黑夜动物图片数据集视觉上为黑白图片;
步骤S0302、在步骤S0301中划分好的白天动物图片数据集和黑夜动物图片数据集中,按照动物的所属科进行白天动物图片数据集和黑夜动物图片数据集的划分,即将白天动物图片数据集分为白天物种A数据集、白天物种B数据集、……、白天物种N数据集,将黑夜动物图片数据集分为黑夜物种A数据集、黑夜物种B数据集、……、黑夜物种N数据集;
步骤S0303、在步骤S0302中划分好的白天动物图片数据集和黑夜动物图片数据集中,分别划分训练数据集、验证数据集以及测试数据集;用划分出来的训练数据集生成COCO格式的数据集用于推理模型训练,从而提取特征;
步骤S04、构建深度学习网络,用于特征提取;所述深度学习网络包含输入端、主干网络、颈部结构和预测层,所述步骤S04包括:
步骤S0401、在深度学习网络的输入端,采用Mosaic、Mixup两种数据增强方法;
步骤S0402、主干网络采用DarkNet53的网络结构,输入的标注后的动物图片首先经过一个卷积层,将输入通道数变换为深度学习网络中的第一个输出通道数;然后,这个卷积层的输出张量被输入到DarkNet53的第一个残差块中;在第一个残差块中,输入张量被送入一系列的卷积层和批归一化层,经过非线性激活函数之后,再经过一个跳跃连接与输入张量相加,最后输出张量送到下一层;
步骤S0403、颈部结构采用FPN结构进行融合,FPN自顶向下,将高层的特征信息通过上采样的方式进行传递融合,得到预测的特征图;
步骤S0404、预测层的检测头部具有Cls.分支、Reg.分支以及Obj.分支;
所述Cls.分支表示类别分支,对目标框的类别、分数进行预测;
所述Reg.分支表示目标框分支,对目标框的坐标信息(x,y,w,h)进行预测,x,y,w,h分别代表起始横坐标,起始纵坐标,宽,高;
所述Obj.分支表示置信度分支,判断目标框是前景还是背景;
损失由、/>、/>组成,其中/>和/>均采用二值交叉熵损失,采用IoULoss,IoULoss表示并交比损失;
预测层的检测部分损失的计算公式为:
;
其中,代表分类损失、/>代表定位损失、/>代表并交比分支的损失、/>代表定位损失的平衡系数、/>代表被分为正样的锚点数;
步骤S05、分层级进行特征提取,根据步骤S03中的不同的数据集生成包括初级推理模型和次级推理模型的推理模型,包括:
步骤S0501、将步骤S0301当中划分的白天图片数据集和黑夜图片数据集放在步骤S04构建的深度学习网络中按照动物的所属科进行特征提取,生成初级推理模型;
步骤S0502、将步骤S0302当中的按照动物的所属科划分好的白天动物图片数据集和黑夜动物图片数据集放在步骤S04构建的深度学习网络当中按照动物的物种进行特征提取,生成次级推理模型;
步骤S06、将待查询文件输入步骤S05中的推理模型中,最终输出检测结果,所述待查询文件为待查询图片或待查询视频,包括:
步骤S0601、所述待查询文件为待查询图片时,根据步骤S0301将待查询图片根据颜色分类算法判别出其属于白天或者黑夜;
将判别好的待查询图片按照类别,即白天或黑夜,输入到步骤S0501所生成的初级推理模型当中进行推理,获得推理结果,即得到其对应的所属科结果;
根据得到的所属科结果,输入到步骤S0502所对应的次级推理模型当中进行推理,得到动物的物种识别结果;
步骤S0602、所述待查询文件为待查询视频时,将待查询视频按每1s抽帧成图片,按顺序根据步骤S0601得到的推理结果并返回加入到所述待查询视频的结果队列当中;
对结果队列进行后处理操作,针对推理结果进行组合统计,按照投票法选出组合数最多的推理结果作为待查询视频的总推理结果;
所述总推理结果包含动物的物种的类别、检测框点位信息以及推理算法对于动物物种类别的推理得分;
步骤S07、对推理模型进行部署和应用。
2.根据权利要求1所述的一种基于图像视频的野生动物识别方法,其特征在于,所述步骤S01中,工作人员在野外实际场景当中,在不同位置不同环境下设置多个红外相机,在野生动物经过时触发红外相机拍摄动物的照片和视频;
对预处理后的动物图片进行筛选,去除模糊不清、动物遮挡严重、特征不明显的动物图片;收集到的视频通过视频抽帧的方法按照1s的时间间隔进行抽帧,生成相应的动物图片,通过筛选、去重对相似度高的动物图片进行过滤,保留下符合要求的动物图片。
3.根据权利要求2所述的一种基于图像视频的野生动物识别方法,其特征在于,所述步骤S02中,对于筛选后的动物图片,通过标注软件对每张动物图片中出现的动物的具***置进行点位框标注,并选择该动物的正确的类别,生成该动物图片的标注信息,标注信息包含位置信息和类别信息。
4.根据权利要求3所述的一种基于图像视频的野生动物识别方法,其特征在于,所述步骤S07包括:
步骤S0701、将通过步骤S05生成的推理模型进行实验测试后,部署到服务器上;
步骤S0702、建立野生动物自动识别***,并与服务器上的推理模型建立API接口调用,使得用户能够使用野生动物自动识别***进行野生动物的识别任务。
5.实现权利要求1-4之一所述的一种基于图像视频的野生动物识别方法的识别***,其特征在于,包括:
图片文件获取模块,用于收集动物的照片和视频并进行预处理获得动物图片;
图片标注模块,用于进行动物图片的标注工作,建立野生动物图像库:
推理模型生成模块,用于构建深度学习网络,进行特征提取,生成推理模型;
识别模块,用于输入待检测的动物的照片或视频进行结果推理检测,得到识别的动物物种;
应用模块,用于对推理模型进行服务器上的部署和应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311322143.XA CN117079195B (zh) | 2023-10-13 | 2023-10-13 | 一种基于图像视频的野生动物识别方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311322143.XA CN117079195B (zh) | 2023-10-13 | 2023-10-13 | 一种基于图像视频的野生动物识别方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117079195A CN117079195A (zh) | 2023-11-17 |
CN117079195B true CN117079195B (zh) | 2024-02-23 |
Family
ID=88702763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311322143.XA Active CN117079195B (zh) | 2023-10-13 | 2023-10-13 | 一种基于图像视频的野生动物识别方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117079195B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117765480B (zh) * | 2024-02-20 | 2024-05-10 | 天科院环境科技发展(天津)有限公司 | 一种道路沿线野生动物迁徙预警方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046858A (zh) * | 2020-03-18 | 2020-04-21 | 成都大熊猫繁育研究基地 | 一种基于图像的动物物种细分类方法、***及介质 |
CN113361405A (zh) * | 2021-06-07 | 2021-09-07 | 浪潮软件科技有限公司 | 一种基于yolo v3的亚洲象识别方法及*** |
CN114639047A (zh) * | 2022-03-18 | 2022-06-17 | 海南大学 | 一种基于卷积神经网络的海南长臂猿野外图像检测***及方法 |
CN115830490A (zh) * | 2022-11-07 | 2023-03-21 | 华南农业大学 | 一种群养生猪多目标跟踪及行为统计方法 |
CN116052211A (zh) * | 2023-01-04 | 2023-05-02 | 内蒙古科技大学 | 一种基于知识蒸馏的YOLOv5s轻量级羊只品种识别方法及*** |
CN116071338A (zh) * | 2023-02-20 | 2023-05-05 | 苏州大学 | 一种基于yolox的钢板表面缺陷检测方法、装置及设备 |
CN116740808A (zh) * | 2023-05-31 | 2023-09-12 | 广东省科学院动物研究所 | 基于深度学习目标检测和图像分类的动物行为识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8571259B2 (en) * | 2009-06-17 | 2013-10-29 | Robert Allan Margolis | System and method for automatic identification of wildlife |
US11954988B2 (en) * | 2021-09-03 | 2024-04-09 | Vivek Satya Bharati | Image processing system for wildlife detection and method thereof |
US20230137337A1 (en) * | 2021-10-28 | 2023-05-04 | Texas Instruments Incorporated | Enhanced machine learning model for joint detection and multi person pose estimation |
CN114119582B (zh) * | 2021-12-01 | 2024-04-26 | 安徽大学 | 一种合成孔径雷达图像目标检测方法 |
-
2023
- 2023-10-13 CN CN202311322143.XA patent/CN117079195B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046858A (zh) * | 2020-03-18 | 2020-04-21 | 成都大熊猫繁育研究基地 | 一种基于图像的动物物种细分类方法、***及介质 |
CN113361405A (zh) * | 2021-06-07 | 2021-09-07 | 浪潮软件科技有限公司 | 一种基于yolo v3的亚洲象识别方法及*** |
CN114639047A (zh) * | 2022-03-18 | 2022-06-17 | 海南大学 | 一种基于卷积神经网络的海南长臂猿野外图像检测***及方法 |
CN115830490A (zh) * | 2022-11-07 | 2023-03-21 | 华南农业大学 | 一种群养生猪多目标跟踪及行为统计方法 |
CN116052211A (zh) * | 2023-01-04 | 2023-05-02 | 内蒙古科技大学 | 一种基于知识蒸馏的YOLOv5s轻量级羊只品种识别方法及*** |
CN116071338A (zh) * | 2023-02-20 | 2023-05-05 | 苏州大学 | 一种基于yolox的钢板表面缺陷检测方法、装置及设备 |
CN116740808A (zh) * | 2023-05-31 | 2023-09-12 | 广东省科学院动物研究所 | 基于深度学习目标检测和图像分类的动物行为识别方法 |
Non-Patent Citations (2)
Title |
---|
Wildlife target detection based on improved YOLOXs network;Zheng Su等;2022 10th International Conference on Information Systems and Computing Technology (ISCTech);354-358 * |
基于ROI-CNN的赛罕乌拉国家级自然保护区陆生野生动物自动识别;刘文定;李安琪;张军国;谢将剑;鲍伟东;;北京林业大学学报(第08期);127-135 * |
Also Published As
Publication number | Publication date |
---|---|
CN117079195A (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310862B (zh) | 复杂环境下基于图像增强的深度神经网络车牌定位方法 | |
CN111178197B (zh) | 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法 | |
CN107016405B (zh) | 一种基于分级预测卷积神经网络的害虫图像分类方法 | |
Chen et al. | Deep convolutional neural network based species recognition for wild animal monitoring | |
Mathur et al. | Crosspooled FishNet: transfer learning based fish species classification model | |
CN111368895B (zh) | 一种湿垃圾中垃圾袋目标检测方法及检测*** | |
US11048928B1 (en) | Systems and methods of entomology classification based on extracted anatomies | |
CN117079195B (zh) | 一种基于图像视频的野生动物识别方法和*** | |
CN110689093B (zh) | 一种复杂场景下的图像目标精细分类方法 | |
Shi et al. | Amur tiger stripes: Individual identification based on deep convolutional neural network | |
CN114387499A (zh) | 一种海岛滨海湿地水鸟识别方法、分布查询***及介质 | |
CN112560623B (zh) | 一种基于无人机的红树植物种类快速识别方法 | |
Rong et al. | Pest Identification and Counting of Yellow Plate in Field Based on Improved Mask R‐CNN | |
CN114359727A (zh) | 基于轻量级优化Yolo v4的茶叶病害识别方法及*** | |
CN113435407B (zh) | 一种输电***的小目标识别方法及装置 | |
Minakshi et al. | Leveraging smart-phone cameras and image processing techniques to classify mosquito species | |
CN110533100A (zh) | 一种基于机器学习进行cme检测和跟踪的方法 | |
CN112926429A (zh) | 机审模型训练、视频机审方法、装置、设备及存储介质 | |
CN114548256A (zh) | 一种基于对比学习的小样本珍稀鸟类识别方法 | |
CN115713715A (zh) | 一种基于深度学习的人体行为识别方法及识别*** | |
CN113158891A (zh) | 一种基于全局特征匹配的跨摄像头行人重识别方法 | |
Khan et al. | Comparitive study of tree counting algorithms in dense and sparse vegetative regions | |
CN115393666A (zh) | 图像分类中基于原型补全的小样本扩充方法及*** | |
Song et al. | Benchmarking wild bird detection in complex forest scenes | |
CN117132805A (zh) | 一种基于着装识别行人的目标定位方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |