CN115294108B - 目标检测方法、目标检测模型的量化方法、装置和介质 - Google Patents

目标检测方法、目标检测模型的量化方法、装置和介质 Download PDF

Info

Publication number
CN115294108B
CN115294108B CN202211197005.9A CN202211197005A CN115294108B CN 115294108 B CN115294108 B CN 115294108B CN 202211197005 A CN202211197005 A CN 202211197005A CN 115294108 B CN115294108 B CN 115294108B
Authority
CN
China
Prior art keywords
parameter
target
quantized
information
quantization information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211197005.9A
Other languages
English (en)
Other versions
CN115294108A (zh
Inventor
王程
艾国
杨作兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen MicroBT Electronics Technology Co Ltd
Original Assignee
Shenzhen MicroBT Electronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen MicroBT Electronics Technology Co Ltd filed Critical Shenzhen MicroBT Electronics Technology Co Ltd
Priority to CN202211197005.9A priority Critical patent/CN115294108B/zh
Publication of CN115294108A publication Critical patent/CN115294108A/zh
Application granted granted Critical
Publication of CN115294108B publication Critical patent/CN115294108B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供了一种目标检测方法、目标检测模型的量化方法、装置和介质,其中的目标检测方法具体包括:接收待检测图像;根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;对检测结果进行输出;其中,定点计算结果的确定过程包括:确定网络层的待量化参数对应的原始量化信息;确定网络层的待量化参数对应量化信息的变化信息;根据变化信息,建立参数标识与目标量化信息之间的映射关系;将网络层的待量化参数的量化信息映射为目标量化信息;根据目标量化信息进行定点计算。本申请实施例可以提高目标检测模型的处理性能。

Description

目标检测方法、目标检测模型的量化方法、装置和介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种目标检测方法、目标检测模型的量化方法、装置和介质。
背景技术
神经网络模型在计算机视觉、语音识别等人工智能领域得到了广泛应用。神经网络模型在训练完成后通常拥有几百甚至上千万的参数,并且,通常基于浮点数进行参数的存储和计算;这些都增加了神经网络模型的存储资源和计算资源。目前,可以对神经网络模型的参数进行量化;由于量化可以将神经网络模型的参数从较高比特的浮点数转化为较低比特的定点数,因此可以减少神经网络模型耗费的存储资源和计算资源。
目前的量化方法,会针对网络层获取参数的浮点数,对浮点数进行定点计算,并对定点计算结果进行保存。网络层的定点计算结果可用于神经网络模型的处理过程,处理过程可以包括:计算机视觉的处理过程、或者语音识别过程等。
在实际应用中,对于一个网络层而言,可能存在定点计算结果对应的参数与处理过程要求的参数不匹配的情况;此种情况下,将定点计算结果应用于这个网络层的处理过程,将导致神经网络模型的处理性能的下降。
发明内容
本申请实施例提供了一种目标检测模型的量化方法,能够实现定点计算结果对应的参数与处理过程要求的参数之间的匹配,因此能够提高目标检测模型的处理性能。
相应的,本申请实施例还提供了一种目标检测模型的量化装置、一种目标检测方法和装置、一种电子设备和一种机器可读介质,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种目标检测方法,应用于嵌入式神经网络处理器,所述方法包括:
接收待检测图像;
根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据所述目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
对所述检测结果进行输出;
其中,所述定点计算结果的确定过程包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
为了解决上述问题,本申请实施例公开了一种目标检测模型的量化方法,所述方法用于对所述目标检测模型中网络层的待量化参数进行量化,包括:
接收校准图像集合;
根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;
根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;
根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
根据网络层的待量化参数的目标量化信息进行定点计算;
对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
为了解决上述问题,本申请实施例公开了一种目标检测装置,应用于嵌入式神经网络处理器,所述装置包括:
接收模块,用于接收待检测图像;
处理模块,用于根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据所述目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
输出模块,用于对所述检测结果进行输出;
其中,所述定点计算结果的确定过程包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
可选地,所述处理结果包括:网络层的第一参数在校准图像集合的条件下对应的浮点数;
则所述确定网络层的待量化参数的原始量化信息,包括:
对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;
根据所述统计结果,确定网络层的第二参数的原始量化信息。
可选地,所述确定网络层的待量化参数的变化信息,包括:
在利用目标检测模型对预设图像进行处理的过程中,若网络层的待量化参数对应的原始量化信息不符合预设条件,则生成网络层的待量化参数的变化信息。
可选地,所述确定网络层的待量化参数的原始量化信息,包括:
建立第一映射表;所述第一映射表包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
可选地,所述参数标识包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息。
可选地,所述参数标识与目标量化信息之间的映射关系包括:
待量化参数的参数索引与目标量化信息之间的映射关系;或者
待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系;或者
待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。
可选地,所述将网络层的待量化参数的量化信息映射为目标量化信息,包括:
根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
可选地,所述待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,包括:
执行针对映射关系C的N次查询;N为正整数;
在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
为了解决上述问题,本申请实施例公开了一种目标检测模型的量化装置,所述装置用于对所述目标检测模型中网络层的待量化参数进行量化,包括:
接收模块,用于接收校准图像集合;
原始量化信息确定模块,用于根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
变化信息确定模块,用于在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;
第一建立模块,用于根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;
映射模块,用于根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
定点计算模块,用于根据网络层的待量化参数的目标量化信息进行定点计算;
保存模块,用于对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
可选地,所述处理结果包括:网络层的第一参数在校准图像集合的条件下对应的浮点数;
则所述原始量化信息确定模块包括:
统计模块,用于对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;
参数确定模块,用于根据所述统计结果,确定网络层的第二参数的原始量化信息。
可选地,所述变化信息确定模块,具体用于在利用目标检测模型对预设图像进行处理的过程中,若网络层的待量化参数对应的原始量化信息不符合预设条件,则生成网络层的待量化参数的变化信息。
可选地,所述原始量化信息确定模块包括:
第二建立模块,用于建立第一映射表;所述第一映射表包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
可选地,所述参数标识包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息。
可选地,所述参数标识与目标量化信息之间的映射关系包括:
待量化参数的参数索引与目标量化信息之间的映射关系;或者
待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系;或者
待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。
可选地,所述映射模块包括:
第一映射模块,用于根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
第二映射模块,用于根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
第三映射模块,用于根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
可选地,所述第三映射模块包括:
查询模块,用于执行针对映射关系C的N次查询;N为正整数;
目标参数含义信息确定模块,用于在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
本申请实施例还公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例所述的方法。
本申请实施例还公开了一种机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例所述的方法。
本申请实施例包括以下优点:
本申请实施例在统计环节确定网络层的待量化参数对应的原始量化信息后,还增加了利用目标检测模型对预设图像进行处理的伪造处理环节、以及将网络层的待量化参数的量化信息映射为目标量化信息的映射环节。其中,伪造处理环节是与利用目标检测模型对待检测图像进行处理的实际处理环节相对应的;在伪造处理环节,可以确定网络层的待量化参数对应量化信息的变化信息,并根据该变化信息,建立参数标识与目标量化信息之间的映射关系。在映射环节,会根据该映射关系,将网络层的待量化参数的量化信息映射为目标量化信息。
由于本申请实施例的伪造处理环节建立了参数标识与目标量化信息之间的映射关系,而该映射关系包含了一个参数标识所对应的符合预设条件的目标量化信息的信息;这样,映射环节将网络层的待量化参数的量化信息映射为符合预设条件的目标量化信息,能够使参与定点计算的目标量化信息符合预设条件。而该预设条件可用于表征目标检测模型的处理过程对于量化信息的要求,故本申请实施例能够实现定点计算结果对应的参数与处理过程要求的参数之间的匹配,因此能够提高目标检测模型的处理性能。
本申请实施例可以对待量化参数对应的定点计算结果进行保存,以在NPU(嵌入式神经网络处理器,neural-network processing units)环境下对待检测图像进行处理的过程中进行整数计算。由于目标检测模型的处理过程中可以利用整数形式的定点计算结果,对待检测图像进行处理,因此能够增加目标检测模型的处理过程中整数计算的范围,进而能够减少目标检测模型耗费的存储资源和计算资源,以及能够提高目标检测模型的处理效率。例如,目标检测模型的处理过程中的计算可以包括:整数计算,如整数乘法、整数加法以及整数移位,由于目标检测模型的处理过程可以不涉及浮点数的计算,因此能够减少目标检测模型耗费的存储资源和计算资源,且能够提高目标检测模型的处理效率。
附图说明
图1是本申请实施例一个实施例的目标检测模型的结构示意图;
图2是本申请一个实施例的目标检测模型中网络层的结构示意图;
图3是本申请一个实施例的残差网络的网络层的结构示意图;
图4是本申请一个实施例的目标检测模型的量化方法的步骤流程示意图;
图5是本申请一个实施例的目标检测方法的步骤流程示意图;
图6是本申请一个实施例的目标检测模型的量化装置的结构示意图;
图7是本申请一个实施例的目标检测装置的结构示意图;
图8是本申请一个实施例提供的装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术,是深度学习的基础。神经网络模型是以神经网络为基础的数学模型,神经网络模型可以应用于计算机视觉、语音识别等人工智能领域,且用于对图像进行处理,以完成人工智能领域中的任务。人工智能领域中的任务可以包括:计算机视觉任务、语音识别任务等,计算机视觉任务可以进一步包括:图像分类任务、目标检测任务等。其中,图像分类任务可以把图像或图像中的像素点或区域划归为若干个类别中的一种;目标检测任务可以检测待检测图像中是否包含行人、交通工具等目标,若是,则可以给出目标的位置信息。
神经网络模型可以包括:多个网络层,不同的网络层之间可以相互连接。网络层的参数可以是网络层的参数本身,也可以是与网络层的参数相关的相关参数。网络层的参数可以包括:权重参数、输入参数和输出参数中的至少一种。
一个网络层可以包括多个神经元。权重参数可以表征神经元之间的连接强度。输入参数可以指一个网络层提供的输入特征对应的参数。输出参数可以指一个网络层的输出特征对应的参数。
本申请实施例的神经网络模型可以为目标检测模型,目标检测模型可以提取待检测图像的特征表示,并根据特征表示,检测待检测图像中是否包含行人等目标,若是,则可以给出行人等目标的位置信息。目标可以包括:行人、车辆、动物等运动物体,可以理解,本申请实施例对于待检测的具体目标不加以限制。
参照图1,示出了本申请实施例一个实施例的目标检测模型的结构示意图,该目标检测模型具体可以包括:特征提取单元101、特征融合单元102和检测单元103。
其中,特征提取单元101可用于对待检测图像进行特征提取。特征提取单元101可用于接收待检测图像,并从待检测图像中提取该图像的图像特征,图像特征可以指深层次的图像特征。
特征融合单元102是目标检测模型中承上启下的单元,其可以对特征提取单元101提取的图像特征进行融合,得到融合图像特征,其能够提高特征的多样性和目标检测模型的性能。
检测单元103用于根据特征融合单元102输出的融合图像特征进行目标检测,以得到对应的检测结果。
特征提取单元101可以是主干(backbone)网络,可以包括:VGG(视觉几何群网络,Visual Geometry Group Network)、ResNet(残差网络,Residual Network)、轻量级网络等。可以理解,本申请实施例对于特征提取单元101对应的具体网络不加以限制。
其中,残差网络可以为卷积网络。卷积网络可以是一种深度前馈人工神经网络,在图像识别中具有较好的性能表现。卷积网络具体可以包括卷积层(convolutional layer)和池化层(pooling layer)。卷积层用于从输入的图像中自动抽取特征,得到特征图(feature map)。池化层用于对特征图进行池化处理,以减少特征图中的特征数量。池化层的池化处理可以包括:最大池化、或者平均池化、或者随机池化等方式,其可根据实际需求选择合适的方式。
参照图2,示出了本申请实施例的一种目标检测模型中网络层的结构示意图,图2中的网络层可以作为目标检测模型的组成部分的示例,而不应理解为本申请实施例对于目标检测模型中网络层的结构的限制,例如,本申请实施例的网络层的结构可以为分组卷积网络结构、或者残差网络结构等。图2中的网络层可以包括:第一网络层201、第二网络层202、第三网络层203、第四网络层204、第五网络层205和第六网络层206。
目前的量化方法,通常将第i(i可以为正整数)个网络层的输出参数,作为第(i+1)个网络层的输入参数。例如,图2中第三网络层203的输入参数可以称为第三入参数;目前的量化方法,会将第二网络层202的出参数(第二出参数)作为第三入参数,对第二出参数的浮点数进行定点计算,并将得到的定点计算结果A作为第三网络层203的定点计算结果进行保存。
在实际应用中,目标检测模型的处理过程可能会要求将第一网络层201的出参数(第一出参数)作为第三入参数。此种情况下,由于定点计算结果A对应的第二出参数与处理过程要求的第一出参数不匹配,因此,将定点计算结果A应用于这个网络层的处理过程,将导致目标检测模型的处理性能的下降。
针对定点计算结果对应的参数与处理过程要求的参数不匹配、导致目标检测模型的处理性能的下降的技术问题,本申请实施例提供了一种目标检测模型的量化方法,该方法具体可以包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;该变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;该预设条件可用于表征目标检测模型的处理过程对于量化信息的要求;根据该变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算;对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
传统技术在确定网络层的待量化参数对应的原始量化信息后,会根据原始量化信息进行定点计算,以得到对应的定点计算结果A。由于定点计算结果A对应的原始量化信息与处理过程要求的参数不匹配,因此,将定点计算结果A应用于这个网络层的处理过程,将导致目标检测模型的处理性能的下降。
本申请实施例的量化方法,在统计环节确定网络层的待量化参数对应的原始量化信息后,还增加了利用目标检测模型对预设图像进行处理的伪造处理环节、以及将网络层的待量化参数的量化信息映射为目标量化信息的映射环节。其中,伪造处理环节是与利用目标检测模型对待检测图像进行处理的实际处理环节相对应的;在伪造处理环节,可以在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息,并根据该变化信息,建立参数标识与目标量化信息之间的映射关系。在映射环节,会根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息。
由于本申请实施例的伪造处理环节建立了参数标识与目标量化信息之间的映射关系,而该映射关系包含了一个参数标识所对应的符合预设条件的目标量化信息的信息;这样,映射环节将网络层的待量化参数的量化信息映射为符合预设条件的目标量化信息,能够使参与定点计算的目标量化信息符合预设条件。而该预设条件可用于表征目标检测模型的处理过程对于量化信息的要求,故本申请实施例能够实现定点计算结果对应的参数与处理过程要求的参数之间的匹配,因此能够提高目标检测模型的处理性能。
以图2为例,原始量化信息会将第二网络层202的出参数作为第三网络层203的输入参数,而目标检测模型的处理过程要求将第一网络层201的出参数作为第三网络层203的输入参数。本申请实施例在量化过程中增设伪造处理环节和映射环节,可以将第三网络层203的输入参数从第二网络层202的出参数映射为第一网络层201的出参数,因此能够使定点计算结果对应的参数与处理过程要求的参数相匹配。
参照图3,示出了本申请一个实施例的残差网络的网络层的结构示意图,图3中的网络层可以作为残差网络的组成部分的示例,图3中的网络层可以包括:激活模块、第一卷积模块、第二卷积模块、第三卷积模块和第四卷积模块。
本申请实施例中,原始量化信息会将激活模块的出参数(激活出参数)作为第四卷积模块的输入参数,而目标检测模型的处理过程要求将激活模块的入参数(激活入参数)作为第四卷积模块的输入参数。本申请实施例在量化过程中增设伪造处理环节和映射环节,可以将第四卷积模块的输入参数映射为激活入参数,因此能够使定点计算结果对应的参数与处理过程要求的参数相匹配。
本申请实施例的NPU采用“数据驱动并行计算”的架构,在电路模拟人类神经元和突出,实行人工智能计算,能够提高图像类的多媒体数据的处理效率。
方法实施例一
参考图4,示出了本申请一个实施例的目标检测模型的量化方法的步骤流程示意图,该方法可以用于对目标检测模型中网络层的待量化参数进行量化,具体可以包括如下步骤:
步骤401、接收校准图像集合;
步骤402、根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
步骤403、在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;该变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;该预设条件表征目标检测模型的处理过程对于量化信息的要求;预设图像可以是校准图像集合中的全部图像中的任一个。
步骤404、根据该变化信息,建立参数标识与目标量化信息之间的映射关系,参数标识可用于标识网络层的待量化参数;
步骤405、根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
步骤406、根据网络层的待量化参数的目标量化信息进行定点计算;
步骤407、对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
图4所示方法实施例一用于对目标检测模型中网络层的待量化参数进行量化。图4所示方法实施例一的执行主体可以是目标检测模型的运行框架,该运行框架可以支持目标检测模型的训练与处理。在实际应用中,该运行框架可以加载目标检测模型的数据,并在训练过程中对目标检测模型的参数进行量化,或者,在训练完成后对目标检测模型的参数进行量化。
本申请实施例中,量化可以是对数值范围的重新调整。假设r表示网络层的待量化参数的浮点数,q表示量化后的定点整数,那么浮点数到定点整数的映射可以表示为:
Figure 581911DEST_PATH_IMAGE001
(1)
s表征浮点数与整数之间的比例关系参数,也叫做scale;z表示zero point(零点参数),是浮点数的0映射到定点整数后对应的数;round()表示四舍五入函数。
其中,scale和zero point的计算公式为:
Figure 129567DEST_PATH_IMAGE002
(2)
Figure 946662DEST_PATH_IMAGE004
(3)
其中,
Figure 490776DEST_PATH_IMAGE005
Figure 638860DEST_PATH_IMAGE006
分别表示的是浮点数中的最大值和最小值,
Figure 460186DEST_PATH_IMAGE007
Figure 979898DEST_PATH_IMAGE008
分别表示量化后的定点整数中的最大值和最小值。
网络层的待量化参数可以是网络层的参数本身,也可以是与网络层的参数相关的相关参数。scale可以是相关参数的一种,称为比例关系参数。本申请实施例可以针对比例关系参数等参数,实现定点计算结果对应的参数与处理过程要求的参数之间的匹配。为了便于说明,将权重参数、输入参数和输出参数等参数称为第一参数,将scale、zero point等参数称为第二参数。
在步骤401中,校准图像集合可用于对第一参数的浮点数的最大值和最小值进行统计。校准图像集合中可以包括:与任务相关的多个校准图像。可以理解,本申请实施例对于具体的校准图像不加以限制。校准图像集合的路径和校准图像集合中校准图像的数量,可以作为配置参数进行保存。
本申请实施例可以利用目标检测模型对校准图像集合进行处理,得到的处理结果可以包括:网络层的第一参数在校准图像集合的条件下对应的浮点数。浮点数通常占用32个比特。
则步骤402确定网络层的待量化参数的原始量化信息的过程,具体可以包括:对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;根据所述统计结果,确定网络层的第二参数的原始量化信息。
上述统计结果可以包括:需要量化的网络层的权重参数或输入参数或输出参数的最大值和最小值。进一步,可以根据配置参数,根据公式(2)得到scale的原始量化信息,根据公式(3)得到zero point的原始量化信息。
配置参数可以包括:量化比特参数、对称量化还是非对称量化等量化方式参数。其中,量化比特参数可以表征量化后的定点计算结果所占用的比特数量,比如8bit,代表量化到8比特。在采用对称量化方式的情况下,浮点数的0点被映射到了定点计算结果的0点。在采用非对称量化方式的情况下,浮点数的0点未被映射到定点计算结果的0点。例如,在采用对称量化方式的情况下,定点计算结果的范围可以为:-127到127。
本申请实施例还可以建立第一映射表;该第一映射表可以包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
参数标识可用于唯一标识网络层的待量化参数,参数标识可以与需要量化的参数(以下简称待量化参数)相对应。参数标识可以包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息等。该参数含义信息可以包括:网络层标识、参数类型和参数编号。网络层标识可以表征参数标识所在网络层的网络层标识。网络层标识可以是网络层的名称等信息。参数类型可以表征输入类型或输出类型。参数编号可以表征参数是所在网络层的第几个输入或第几个输出。
原始量化信息可以表征基于步骤402的统计环节得到的、待量化参数的数值。本申请实施例的原始量化信息可以包括:scale和zero point等第二参数的原始量化信息。原始量化信息可以包括:第二参数的浮点数的最大值和最小值。
参照表1,示出了本申请一个实施例的第一映射表的示例。其中,参数标识可以为参数内存地址,原始量化信息可以包括:浮点数的最大值和最小值。本申请实施例可以采用键值对(key,value)的格式,对参数标识与原始量化信息之间的映射关系进行保存,其中,key对应参数标识,原始量化信息对应value。
第二浮点数的来源参数可以为layer2_scale_out。来源参数可以表征第二参数的来源,例如,来源参数layer2_scale_out可以表示scale源自网络层layer2的输出参数。可以理解,来源参数用于对第二浮点数等原始量化信息进行说明,其并不是表1的组成部分。
表1
Figure 886674DEST_PATH_IMAGE009
本申请实施例还可以建立参数内存地址到参数索引的映射关系,该映射关系如表2所示。在实际应用中,可以根据目标检测模型中网络层的参数结构信息,对目标检测模型中至少一个网络层的待量化参数内存地址进行遍历,并根据遍历结果建立参数内存地址到参数索引的映射关系。例如,目标检测模型中第一个网络层的第一个参数内存地址对应的参数索引为索引0,目标检测模型中第一个网络层的第二个参数内存地址对应的参数索引为索引1等。又如,目标检测模型中第j(j可以为正整数)个网络层的最后一个参数内存地址对应的参数索引为索引M,目标检测模型中第(j+1)个网络层的第一个参数内存地址对应的参数索引为索引(M+1)等。本申请实施例可以按照网络层从低到高的顺序,对参数索引进行排列。可以理解,本申请实施例对于参数内存地址对应的具体参数索引不加以限制。
表2
Figure 900766DEST_PATH_IMAGE010
本申请实施例还可以根据网络层的参数结构信息,建立第二映射表;该第二映射表可以包括:网络层的待量化参数对应的参数索引与参数含义信息之间的映射关系。
参照表3,示出了本申请一个实施例的网络层的待量化参数对应的参数索引与参数含义信息之间的映射关系的示意。参数含义信息可以包括:网络层标识、参数类型(输入或输出)和参数编号(第几个输入或第几个输出)。
表3
Figure 107757DEST_PATH_IMAGE011
在步骤403中,可以利用目标检测模型对至少一个预设图像进行处理,以实现预设图像的伪造处理。伪造处理环节是与利用目标检测模型对待检测图像进行处理的实际处理环节相对应的。预设图像可以为任意的图像,如预设图像可以是校准图像集合中的任一,或者,预设图像还可以是不同于校准图像的图像。
本申请实施例在利用目标检测模型对预设图像进行处理的过程中,若网络层的待量化参数对应的原始量化信息不符合预设条件,则可以生成网络层的待量化参数的变化信息。该变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息。例如,索引0对应的原始量化信息对应的来源参数为layer2_scale_out,而在利用目标检测模型对预设图像进行处理的过程中,将索引0对应的量化信息修改为:目标量化信息,该目标量化信息对应的来源参数为layer1_scale_out。可以理解,本领域技术人员可以根据实际应用需求,将原始量化信息修改为符合预设条件的目标量化信息,本申请实施例对于具体的目标量化信息不加以限制。
需要说明的是,一个待量化参数对应的量化信息可以发生一次变化或多次变化。一次变化的变化信息的例子可以包括:待量化参数的量化信息变化为来源参数A。多次变化的变化信息的例子可以包括:待量化参数的量化信息首先变化为来源参数A,再变化为来源参数B。
另外需要说明的是,目标检测模型可以包括:多个待量化参数,其中的第一部分待量化参数对应的原始量化信息可以发生一次变化或多次变化,第二部分待量化参数对应的原始量化信息可以不发生变化。因此,步骤406可以根据第一部分待量化参数对应的目标量化信息、以及第二部分待量化参数对应的原始量化信息,进行定点计算。
另外,步骤402的统计环节与步骤403的伪造处理环节,都可以用到参数内存地址。故步骤403也可以建立类似表1、或表2、或表3的映射表。
但对于相同的参数而言,其在步骤402的统计环节与步骤403的伪造处理环节,可能对应不同的参数内存地址。由于参数索引或参数含义信息是根据目标检测模型中网络层的参数结构信息得到的,目标检测模型中网络层的参数结构信息在步骤402的统计环节与步骤403的伪造处理环节可以具有固定性,故相同的参数在步骤402的统计环节与步骤403的伪造处理环节可以对应相同的参数索引或相同的参数含义信息。因此,本申请实施例在后续的处理流程中,可以采用参数索引或参数含义信息作为参数标识。
在步骤404中,可以根据该变化信息,建立参数标识与目标量化信息之间的映射关系。
在一种实现方式中,变化信息可以包括:待量化参数的参数内存地址与目标量化信息,则参数标识与目标量化信息之间的映射关系可以包括映射关系A:待量化参数的参数索引与目标量化信息之间的映射关系。其中,可以根据变化信息中待量化参数的参数内存地址,查询表2,以得到待量化参数的参数索引。
表4示出了本申请一个实施例的参数索引与目标量化信息之间的映射关系的示例。其中,索引0对应的目标量化信息可以为第一目标浮点数,其中,第一目标浮点数可以符合预设条件。
表4
Figure 565414DEST_PATH_IMAGE012
在另一种实现方式中,变化信息可以包括:待量化参数的第一参数内存地址与目标量化信息的第二参数内存地址,则参数标识与目标量化信息之间的映射关系可以包括映射关系B:待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系。其中,可以根据第一参数内存地址,查询表2,以得到第一参数索引。可以根据第二参数内存地址,查询表2,以得到第二参数索引。
表5示出了本申请一个实施例的待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系的示例。其中,索引0对应的目标量化信息可以为第一目标浮点数,其中,第一目标浮点数可以符合预设条件。
表5
Figure 959486DEST_PATH_IMAGE013
在再一种实现方式中,变化信息可以包括:待量化参数的第一参数内存地址与目标量化信息的第二参数内存地址,则参数标识与目标量化信息之间的映射关系可以包括映射关系C:待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。其中,可以根据第一参数内存地址,查询表2,以得到第一参数索引;根据第一参数索引查询表3,以得到第一参数含义信息。可以根据第二参数内存地址,查询表2,以得到第二参数索引;根据第二参数索引查询表3,以得到第二参数含义信息。
表6示出了本申请一个实施例的待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系的示例。其中,layer3-input1与layer1-out1之间的映射关系,可以表征网络层layer3的第1个输入源自网络层layer1的第1个输出。
表6
Figure 777269DEST_PATH_IMAGE014
在实际应用中,一个待量化参数的量化信息可能对应多次变化。此种情况下,可以在表6中记录一条数据记录,该一条数据记录对应的第二参数含义信息,可以与变化终点(最后一次变化)对应的目标量化信息相对应。或者,可以在表6中记录多条数据记录,其中的一条数据记录可以对应一次变化。
例如,多次变化的变化信息的例子可以包括:参数X的量化信息首先变化为来源参数A,再变化为来源参数B。则一条数据记录可以包括:参数X与参数B之间的映射关系。多条数据记录可以包括:参数X与参数A之间的映射关系、以及参数A与参数B之间的映射关系。
在步骤405中,根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息,可以实现定点计算结果对应的参数与处理过程要求的参数之间的匹配。
本申请实施例可以根据映射关系A至映射关系C,分别提供将网络层的待量化参数的量化信息映射为目标量化信息的映射方案:
映射方案A、根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
映射方案B、根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
映射方案C、根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
在实际应用中,可以对目标检测模型中网络层的参数结构信息进行遍历,根据参数结构信息中的参数含义信息,执行映射方案C。或者,可以对目标检测模型中网络层的参数结构信息进行遍历,根据参数结构信息中的参数含义信息,查询表3,确定待量化参数的参数索引,并根据待量化参数的参数索引,执行映射方案A或映射方案B。
在具体实现中,映射方案C可以执行映射关系C的一次查询、或多次查询。一次查询的示例可以包括:参数结构信息中的参数含义信息为layer3-input1,根据表6可知,layer3-input1的目标量化信息是由layer1-out1提供的,故可以根据layer1-out1对应的原始量化信息,确定layer3-input1对应的目标量化信息。
多次查询的示例可以包括:参数结构信息中的参数含义信息为参数X,根据表6可知,参数X的目标量化信息是由参数A提供的,而参数A的目标量化信息是由参数B提供的,故可以根据参数B的原始量化信息,确定参数X对应的目标量化信息。
本申请实施例可以根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的第二参数含义信息;基于二次查询,判断映射关系C中是否存在与第二参数含义信息相匹配的第三参数含义信息,若是,则基于三次查询,判断映射关系C中是否存在与第三参数含义信息相匹配的第四参数含义信息,以此类推,在第N次查询表征映射关系C中不存在与第(N-1)次的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
因此,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,具体可以包括:执行针对映射关系C的N次查询;N为正整数;在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
在步骤406中,根据网络层的待量化参数的目标量化信息进行定点计算,以根据网络层的待量化参数对应的定点计算结果、对待检测图像进行处理。
步骤406的定点计算可以包括:第二参数的定点计算。
需要说明的是,目标检测模型可以包括:多个第二参数,其中的第一部分第二参数对应的原始量化信息可以发生一次变化或多次变化,第二部分第二参数对应的原始量化信息可以不发生变化。因此,步骤406的第二参数的定点计算过程具体包括:根据第一部分第二参数对应的目标量化信息、以及第二部分第二参数对应的原始量化信息,进行定点计算。
第二参数的定点计算可用于将第二参数的浮点数转换为整数。本申请实施例可以根据公式(4)和公式(5)进行第二参数的定点计算。
Figure 890631DEST_PATH_IMAGE015
(4)
Figure 440561DEST_PATH_IMAGE016
(5)
其中,M可以为任意的浮点数,
Figure 321929DEST_PATH_IMAGE017
为中间计算结果,Mo的范围可以为[0.5,1],n可 以为正整数,Mint可以为定点计算结果。
步骤406的定点计算还可以包括:第一参数的定点计算。例如,可以利用公式(1)和第二参数对应的定点计算结果,进行第一参数的定点计算。又如,可以利用公式(6)和第二参数对应的定点计算结果,进行第一参数的定点计算。
Figure 677824DEST_PATH_IMAGE018
(6)
其中,i、w、o分别表征输入参数、权重参数和输出参数,ri表示输入参数的浮点数,rw表示权重参数的浮点数,Qo表示输出参数的定点计算结果,Qi表示输入参数的定点计算结果,Qw表示权重参数的定点计算结果;So表示输出参数的比例关系参数,Sw表示权重参数的比例关系参数,Si表示输入参数的比例关系参数,So、Sw和Si均为定点计算结果;B表示偏置参数,Zo表示输出参数中的浮点0经过量化后对应的定点整数,Zi表示输入参数中的浮点0经过量化后对应的定点整数,Zw表示权重参数中的浮点0经过量化后对应的定点整数。
本申请实施例可以对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。保存的定点计算结果可以包括:第二参数的定点计算结果和第一参数的定点计算结果等。
综上,本申请实施例的目标检测模型的量化方法,在统计环节确定网络层的待量化参数对应的原始量化信息后,还增加了利用目标检测模型对预设图像进行处理的伪造处理环节、以及将网络层的待量化参数的量化信息映射为目标量化信息的映射环节。其中,伪造处理环节是与利用目标检测模型对待检测图像进行处理的实际处理环节相对应的;在伪造处理环节,可以在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息,并根据该变化信息,建立参数标识与目标量化信息之间的映射关系。在映射环节,会根据该映射关系,将网络层的待量化参数的量化信息映射为目标量化信息。
由于本申请实施例的伪造处理环节建立了参数标识与目标量化信息之间的映射关系,而该映射关系包含了一个参数标识所对应的符合预设条件的目标量化信息的信息;这样,映射环节将网络层的待量化参数的量化信息映射为符合预设条件的目标量化信息,能够使参与定点计算的目标量化信息符合预设条件。而该预设条件可用于表征目标检测模型的处理过程对于量化信息的要求,故本申请实施例能够实现定点计算结果对应的参数与处理过程要求的参数之间的匹配,因此能够提高目标检测模型的处理性能。
本申请实施例可以对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。由于目标检测模型的处理过程中可以利用整数形式的定点计算结果,对待检测图像进行处理,因此能够增加目标检测模型的处理过程中整数计算的范围,进而能够减少目标检测模型耗费的存储资源和计算资源,以及能够提高目标检测模型的处理效率。例如,目标检测模型的处理过程中的计算可以包括:整数计算,如整数乘法、整数加法以及整数移位,由于目标检测模型的处理过程可以不涉及浮点数的计算,因此能够减少目标检测模型耗费的存储资源和计算资源,且能够提高目标检测模型的处理效率。
方法实施例二
参考图5,示出了本申请一个实施例的目标检测方法的步骤流程示意图,该方法可以应用于NPU,具体可以包括如下步骤:
步骤501、接收待检测图像;
步骤502、根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据该目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
步骤503、对该检测结果进行输出;
其中,该定点计算结果的确定过程包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
图5所示方法实施例二用于执行利用目标检测模型对待检测图像进行处理的实际处理环节。
由于目标检测模型的处理过程中可以利用整数形式的定点计算结果,对待检测图像进行处理,因此能够增加目标检测模型的处理过程中整数计算的范围,进而能够减少目标检测模型耗费的存储资源和计算资源,以及能够提高目标检测模型的处理效率。例如,目标检测模型的处理过程中的计算可以包括:整数计算,如整数乘法、整数加法以及整数移位,由于目标检测模型的处理过程可以不涉及浮点数的计算,因此能够减少目标检测模型耗费的存储资源和计算资源,且能够提高目标检测模型的处理效率。
以图1为例,该目标检测模型具体可以包括:特征提取单元101、特征融合单元102和检测单元103。则特征提取单元101、特征融合单元102和检测单元103中任一,在对待检测图像进行处理的过程中,均会根据网络层的参数对应的定点计算结果,进行整数计算。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
在上述实施例的基础上,本实施例还提供了一种目标检测模型的量化装置,参照图6,该量化装置用于对所述目标检测模型中网络层的待量化参数进行量化,具体可以包括如下模块:
接收模块601,用于接收校准图像集合;
原始量化信息确定模块602,用于根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
变化信息确定模块603,用于在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;
第一建立模块604,用于根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;
映射模块605,用于根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
定点计算模块606,用于根据网络层的待量化参数的目标量化信息进行定点计算;
保存模块607,用于对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
可选地,所述处理结果具体可以包括:网络层的第一参数在校准图像集合的条件下对应的浮点数;
则所述原始量化信息确定模块602具体可以包括:
统计模块,用于对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;
参数确定模块,用于根据所述统计结果,确定网络层的第二参数的原始量化信息。
可选地,所述变化信息确定模块603,具体用于在利用目标检测模型对预设图像进行处理的过程中,若网络层的待量化参数对应的原始量化信息不符合预设条件,则生成网络层的待量化参数的变化信息。
可选地,所述原始量化信息确定模块602具体可以包括:
第二建立模块,用于建立第一映射表;所述第一映射表包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
可选地,所述参数标识具体可以包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息。
可选地,所述参数标识与目标量化信息之间的映射关系具体可以包括:
待量化参数的参数索引与目标量化信息之间的映射关系;或者
待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系;或者
待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。
可选地,所述映射模块具体可以包括:
第一映射模块,用于根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
第二映射模块,用于根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
第三映射模块,用于根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
可选地,所述第三映射模块具体可以包括:
查询模块,用于执行针对映射关系C的N次查询;N可以为正整数;
目标参数含义信息确定模块,用于在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
本实施例还提供了一种目标检测装置,参照图7,该目标检测装置可以应用于NPU,具体可以包括如下模块:
接收模块701,用于接收待检测图像;
处理模块702,用于根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据所述目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
输出模块703,用于对所述检测结果进行输出;
其中,所述定点计算结果的确定过程具体可以包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
可选地,所述处理结果包括:网络层的第一参数在校准图像集合的条件下对应的浮点数;
则所述确定网络层的待量化参数的原始量化信息,包括:
对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;
根据所述统计结果,确定网络层的第二参数的原始量化信息。
可选地,所述确定网络层的待量化参数的变化信息,包括:
在利用目标检测模型对预设图像进行处理的过程中,若网络层的待量化参数对应的原始量化信息不符合预设条件,则生成网络层的待量化参数的变化信息。
可选地,所述确定网络层的待量化参数的原始量化信息,包括:
建立第一映射表;所述第一映射表包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
可选地,所述参数标识包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息。
可选地,所述参数标识与目标量化信息之间的映射关系包括:
待量化参数的参数索引与目标量化信息之间的映射关系;或者
待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系;或者
待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。
可选地,所述将网络层的待量化参数的量化信息映射为目标量化信息,包括:
根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
可选地,所述待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,包括:
执行针对映射关系C的N次查询;N为正整数;
在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,可以将第(N-1)次的参数含义信息作为目标参数含义信息。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括终端设备、服务器(集群)等各类型的设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括:终端设备、服务器(集群)等电子设备。图8示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1100。
对于一个实施例,图8示出了示例性装置1100,该装置具有一个或多个处理器1102、被耦合到(一个或多个)处理器1102中的至少一个的控制模块(芯片组)1104、被耦合到控制模块1104的存储器1106、被耦合到控制模块1104的非易失性存储器(NVM)/存储设备1108、被耦合到控制模块1104的一个或多个输入/输出设备1110,以及被耦合到控制模块1104的网络接口1112。
处理器1102可包括一个或多个单核或多核处理器,处理器1102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1100 能够作为本申请实施例中所述终端设备、服务器(集群)等设备。
在一些实施例中,装置1100 可包括具有指令1114的一个或多个计算机可读介质(例如,存储器1106或NVM/存储设备1108) 以及与该一个或多个计算机可读介质相合并被配置为执行指令1114以实现模块从而执行本公开中所述的动作的一个或多个处理器1102。
对于一个实施例,控制模块1104可包括任意适当的接口控制器,以向(一个或多个)处理器1102中的至少一个和/或与控制模块1104通信的任意适当的设备或组件提供任意适当的接口。
控制模块1104可包括存储器控制器模块,以向存储器1106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1106可被用于例如为装置1100加载和存储数据和/或指令1114。对于一个实施例,存储器1106可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1106可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM) 。
对于一个实施例,控制模块1104可包括一个或多个输入/输出控制器,以向NVM/存储设备1108及(一个或多个)输入/输出设备1110 提供接口。
例如,NVM/存储设备1108可被用于存储数据和/或指令1114。NVM/存储设备1108可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD) 、一个或多个光盘(CD) 驱动器和/或一个或多个数字通用光盘(DVD) 驱动器)。
NVM/存储设备1108可包括在物理上作为装置1100 被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1108可通过网络经由(一个或多个)输入/输出设备1110 进行访问。
(一个或多个)输入/输出设备1110 可为装置1100 提供接口以与任意其他适当的设备通信,输入/输出设备1110可以包括通信组件、音频组件、传感器组件等。网络接口1112可为装置1100 提供接口以通过一个或多个网络通信,装置1100 可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器(例如,存储器控制器模块) 的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑封装在一起以形成***级封装(SiP) 。对于一个实施例, (一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例, (一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上以形成片上***(SoC) 。
在各个实施例中,装置1100可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1100 可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1100包括一个或多个摄像机、键盘、液晶显示器(LCD) 屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC) 和扬声器。
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种目标检测模型的量化方法和装置、一种目标检测方法和装置、一种电子设备和一种机器可读介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (12)

1.一种目标检测方法,其特征在于,应用于嵌入式神经网络处理器,所述方法包括:
接收待检测图像;
根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据所述目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
对所述检测结果进行输出;
其中,所述定点计算结果的确定过程包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
2.根据权利要求1所述的方法,其特征在于,所述处理结果包括:网络层的第一参数在校准图像集合的条件下对应的浮点数;
则所述确定网络层的待量化参数对应的原始量化信息,包括:
对网络层的第一参数在校准图像集合的条件下对应的浮点数进行统计,以得到对应的统计结果;
根据所述统计结果,确定网络层的第二参数的原始量化信息。
3.根据权利要求1所述的方法,其特征在于,所述确定网络层的待量化参数对应的原始量化信息,包括:
建立第一映射表;所述第一映射表包括:网络层的待量化参数对应的参数标识与原始量化信息之间的映射关系。
4.根据权利要求1所述的方法,其特征在于,所述参数标识包括:参数内存地址、或者参数内存地址对应的参数索引、或者参数含义信息。
5.根据权利要求4所述的方法,其特征在于,所述参数标识与目标量化信息之间的映射关系包括:
待量化参数的参数内存地址对应的参数索引与目标量化信息之间的映射关系;或者
待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系;或者
待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系。
6.根据权利要求5所述的方法,其特征在于,所述将网络层的待量化参数的量化信息映射为目标量化信息,包括:
根据待量化参数的参数索引,在待量化参数的参数索引与目标量化信息之间的映射关系中进行查找,以得到所述待量化参数对应的目标量化信息;或者
根据待量化参数的参数索引,在待量化参数的第一参数索引与目标量化信息的第二参数索引之间的映射关系中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息;或者
根据待量化参数的第一参数含义信息,在待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,以得到所述待量化参数所对应目标量化信息的目标参数含义信息;根据待量化参数对应的参数索引与参数含义信息之间的映射关系,确定目标参数含义信息对应的目标参数索引;确定所述目标参数索引对应的目标参数内存地址;根据所述目标参数内存地址、以及参数内存地址与原始量化信息之间的映射关系,确定所述待量化参数对应的目标量化信息。
7.根据权利要求6所述的方法,其特征在于,所述待量化参数的第一参数含义信息与目标量化信息的来源参数对应的第二参数含义信息之间的映射关系C中进行查找,包括:
执行针对映射关系C的N次查询;N为正整数;
在第N次查询表征映射关系C中不存在与第(N-1)次查询得到的参数含义信息相匹配的参数含义信息的情况下,将第(N-1)次的参数含义信息作为目标参数含义信息。
8.一种目标检测模型的量化方法,其特征在于,所述方法用于对所述目标检测模型中网络层的待量化参数进行量化,包括:
接收校准图像集合;
根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;
根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;
根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
根据网络层的待量化参数的目标量化信息进行定点计算;
对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
9.一种目标检测装置,其特征在于,应用于嵌入式神经网络处理器,所述装置包括:
接收模块,用于接收待检测图像;
处理模块,用于根据目标检测模型,对待检测图像进行处理,以得到对应的检测结果;在对待检测图像进行处理的过程中,根据所述目标检测模型中网络层的参数对应的定点计算结果,进行整数计算;
输出模块,用于对所述检测结果进行输出;
其中,所述定点计算结果的确定过程包括:根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;根据网络层的待量化参数的目标量化信息进行定点计算。
10.一种目标检测模型的量化装置,其特征在于,所述装置用于对所述目标检测模型中网络层的待量化参数进行量化,包括:
接收模块,用于接收校准图像集合;
原始量化信息确定模块,用于根据目标检测模型对于校准图像集合的处理结果,确定网络层的待量化参数对应的原始量化信息;
变化信息确定模块,用于在利用目标检测模型对预设图像进行处理的过程中,确定网络层的待量化参数对应量化信息的变化信息;所述变化信息用于将不符合预设条件的原始量化信息修改为符合预设条件的目标量化信息;所述预设条件表征目标检测模型的处理过程对于量化信息的要求;
第一建立模块,用于根据所述变化信息,建立参数标识与目标量化信息之间的映射关系;
映射模块,用于根据映射关系,将网络层的待量化参数的量化信息映射为目标量化信息;
定点计算模块,用于根据网络层的待量化参数的目标量化信息进行定点计算;
保存模块,用于对待量化参数对应的定点计算结果进行保存,以在嵌入式神经网络处理器环境下对待检测图像进行处理的过程中进行整数计算。
11.一种电子设备,其特征在于,包括:处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-8中任一项所述的方法。
12.一种机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-8中任一项所述的方法。
CN202211197005.9A 2022-09-29 2022-09-29 目标检测方法、目标检测模型的量化方法、装置和介质 Active CN115294108B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211197005.9A CN115294108B (zh) 2022-09-29 2022-09-29 目标检测方法、目标检测模型的量化方法、装置和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211197005.9A CN115294108B (zh) 2022-09-29 2022-09-29 目标检测方法、目标检测模型的量化方法、装置和介质

Publications (2)

Publication Number Publication Date
CN115294108A CN115294108A (zh) 2022-11-04
CN115294108B true CN115294108B (zh) 2022-12-16

Family

ID=83834728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211197005.9A Active CN115294108B (zh) 2022-09-29 2022-09-29 目标检测方法、目标检测模型的量化方法、装置和介质

Country Status (1)

Country Link
CN (1) CN115294108B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845640A (zh) * 2017-01-12 2017-06-13 南京大学 基于深度卷积神经网络的层内非均匀的等间隔定点量化方法
CN114841325A (zh) * 2022-05-20 2022-08-02 安谋科技(中国)有限公司 神经网络模型的数据处理方法、介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11488016B2 (en) * 2019-01-23 2022-11-01 Google Llc Look-up table based neural networks
CN111860405A (zh) * 2020-07-28 2020-10-30 Oppo广东移动通信有限公司 图像识别模型的量化方法、装置、计算机设备及存储介质
CN111860841B (zh) * 2020-07-28 2023-11-14 Oppo广东移动通信有限公司 量化模型的优化方法、装置、终端及存储介质
CN112200296B (zh) * 2020-07-31 2024-04-05 星宸科技股份有限公司 网络模型量化方法、装置、存储介质及电子设备
CN114898108B (zh) * 2022-03-30 2023-01-06 哈尔滨工业大学 一种基于fpga的cnn模型轻量化方法、目标检测方法及***
CN114998438B (zh) * 2022-08-02 2022-11-01 深圳比特微电子科技有限公司 一种目标检测方法、装置和机器可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845640A (zh) * 2017-01-12 2017-06-13 南京大学 基于深度卷积神经网络的层内非均匀的等间隔定点量化方法
CN114841325A (zh) * 2022-05-20 2022-08-02 安谋科技(中国)有限公司 神经网络模型的数据处理方法、介质及电子设备

Also Published As

Publication number Publication date
CN115294108A (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN109657696B (zh) 多任务监督学习模型训练、预测方法和装置
US11093168B2 (en) Processing of neural networks on electronic devices
CN114708437B (zh) 目标检测模型的训练方法、目标检测方法、装置和介质
CN110738235A (zh) 肺结核判定方法、装置、计算机设备及存储介质
CN113836885A (zh) 文本匹配模型训练方法、文本匹配方法、装置和电子设备
CN113435499A (zh) 标签分类方法、装置、电子设备和存储介质
CN115083435A (zh) 音频数据处理方法、装置、计算机设备和存储介质
CN114708436B (zh) 语义分割模型的训练方法、语义分割方法、装置和介质
CN116469110A (zh) 图像分类方法、装置、电子设备及计算机可读存储介质
CN116912635B (zh) 目标追踪方法及装置
CN115294108B (zh) 目标检测方法、目标检测模型的量化方法、装置和介质
CN112561050B (zh) 一种神经网络模型训练方法及装置
CN116957024A (zh) 利用神经网络模型进行推理的方法和装置
CN111091099A (zh) 一种场景识别模型的构建方法、场景识别方法及设备
CN114360032B (zh) 一种多态不变性人脸识别方法及***
US12002272B2 (en) Method and device for classifing densities of cells, electronic device using method, and storage medium
CN112132031B (zh) 车款识别方法、装置、电子设备及存储介质
CN117523218A (zh) 标签生成、图像分类模型的训练、图像分类方法及装置
CN113298083A (zh) 一种数据处理方法及装置
CN113284027A (zh) 团伙识别模型的训练方法、异常团伙识别方法及装置
CN114819149B (zh) 基于变换神经网络的数据处理方法、装置和介质
CN115705486A (zh) 量化模型的训练方法、装置、电子设备和可读存储介质
CN112668332A (zh) 一种三元组抽取方法、装置、设备及存储介质
CN113963282A (zh) 视频替换检测及其模型的训练方法及装置
WO2022155787A1 (zh) 一种极限学习机训练方法、训练装置以及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant