CN107463932A - 一种使用二进制瓶颈神经网络来抽取图片特征的方法 - Google Patents

一种使用二进制瓶颈神经网络来抽取图片特征的方法 Download PDF

Info

Publication number
CN107463932A
CN107463932A CN201710568350.1A CN201710568350A CN107463932A CN 107463932 A CN107463932 A CN 107463932A CN 201710568350 A CN201710568350 A CN 201710568350A CN 107463932 A CN107463932 A CN 107463932A
Authority
CN
China
Prior art keywords
picture
layer
mrow
binary
neutral net
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710568350.1A
Other languages
English (en)
Other versions
CN107463932B (zh
Inventor
张勇
朱立松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCTV INTERNATIONAL NETWORKS WUXI Co Ltd
Original Assignee
CCTV INTERNATIONAL NETWORKS WUXI Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCTV INTERNATIONAL NETWORKS WUXI Co Ltd filed Critical CCTV INTERNATIONAL NETWORKS WUXI Co Ltd
Priority to CN201710568350.1A priority Critical patent/CN107463932B/zh
Publication of CN107463932A publication Critical patent/CN107463932A/zh
Application granted granted Critical
Publication of CN107463932B publication Critical patent/CN107463932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种使用二进制瓶颈神经网络来抽取图片特征的方法,属于视频处理技术领域,通过建立二进制瓶颈神经网络,将图片自动抽取为包含若干个二进制比特的特征向量,当要比较两幅图像之间的相似性程度时,只需要比较两个图片的二进制特征向量,然后计算两个二进制特征向量之间的汉明距离即可:汉明距离越小,说明两幅图像越相似,解决了抽取图片的二进制特征向量的技术问题,本发明计算图像的特征二进制序列,不依赖于研究者的经验进行手工设计就能获得非常好的性能;本发明计算的图像特征二进制序列可用于快速计算图像的相似性,对于图片和视频的相似性检索有重要价值。

Description

一种使用二进制瓶颈神经网络来抽取图片特征的方法
技术领域
本发明属于视频处理技术领域,特别涉及一种使用二进制瓶颈神经网络来抽取图片特征的方法。
背景技术
图像数据属于典型的非结构化数据,图像数据库的查询、检索、相似比较等都存在困难,这是由几个方面的原因造成的:1)图像数据的维度较高,一般高清图像的分辨率可达到约200万像素,而超清图像的分辨率可达到800万像素之多;2)图像所包含的语义很难从数据中直接获取,例如一副图像包含了一辆汽车,人类很容易观察到这一图像语义,而计算机却很难获取这一语义,只有通过人工智能等复杂的算法才能识别图像中包含汽车这一特定语义。
为了使图像更容易被查询、检索、比较,抽取图像特征是现阶段常用的方法。通常使用SIFT算法或SURF算法来抽取图像的局部特征点。
SIFT特征和SURF特征比较相似,都是对特征点局部区域内像素点数值分布的描述,例如SIFT特征的每一个特征点对应一个128位的描述向量,SURF特征的计算速度比SIFT快,每一个特征点对应一个64位的描述向量。
SIFT特征和SURF特征都是手工设计的特征抽取方法。经过特征抽取之后起到了一定的降低数据维度的作用。比较两个图像的相似程度可以通过比较他们之间的SIFT特征或SURF特征来实现。然而其计算得到的特征向量维度仍然较高,在图像的快速检索方面不能满足要求。
发明内容
本发明的目的是提供一种使用二进制瓶颈神经网络来抽取图片特征的方法,解决了抽取图片的二进制特征向量的技术问题。
为实现上述目的,本发明采用以下技术方案:
一种使用二进制瓶颈神经网络来抽取图片特征的方法,包括如下步骤:
步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;
步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;
对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;
步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;
步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:
式中,向量x表示输入层的状态值,W表示从输入层到隐藏层的权值矩阵,b表示隐藏层的偏置值,y表示隐藏层的状态值;
隐藏层可以有许多,每一个隐藏层均将近邻的前一个隐藏层作为自身的输入层,并通过公式1来获取输入层的状态值;
步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:
式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率;
神经网络在计算的过程中首先计算输出层的神经元激活概率值P,然后根据概率值P进行随机采样,从而最后得到输出神经元的激活状态;该神经网络将任意一个图片映射为一个固定长度的二进制序列码,即,图片的二进制特征向量;
步骤6:当需要比较图片N和图片M之间的相似度时,首先根据步骤1到步骤5的方法分别计算出图片N和图片M相应的二进制序列码,设定计算出的图片N的二进制序列码为BN,计算出的图片M的二进制序列码为BM
然后计算BN和BM之间的汉明距离H(BN,BM),汉明距离越小,图片N和图片M的相似程度越高;
步骤7:在输出层的后方设有一个镜像层,镜像层是以输出层为镜面对隐藏层和输入层的镜像;镜像层的最后一层的神经元个数与输入层的神经元个数相同,镜像层的倒数第二层的神经元个数与第一隐藏层的神经元个数相同。
所述汉明距离是指两个二进制序列中不同位的个数,即将两个二进制序列进行异或后的结果中1的个数。
在执行步骤7时,虽然镜像层的神经元个数与输入层和隐藏层相同,但是其连接权值不相同;图片从输入层输入,经过二进制瓶颈层之后,从镜像层恢复,中间在二进制瓶颈神经网络中引入了一定的误差,这就需要对二进制瓶颈神经网络进行权值训练,而权值训练的目的是使得上述误差最小化;所述二进制瓶颈神经网络中,二进制神经元的个数决定了该网络能够传递的最大信息量,是整个网络信息量传输的瓶颈,网络训练成功之后,若任意从输入层输入的图片都能在镜像层输出与其非常相似的图片,这说明中间的二进制神经元已经抓取到了该图片的特征。
本发明所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,解决了抽取图片的二进制特征向量的技术问题,本发明计算图像的特征二进制序列,不依赖于研究者的经验进行手工设计就能获得非常好的性能;本发明计算的图像特征二进制序列可用于快速计算图像的相似性,对于图片和视频的相似性检索有重要价值。
附图说明
图1是本发明的二进制瓶颈神经网络的示意图。
具体实施方式
如图1一种使用二进制瓶颈神经网络来抽取图片特征的方法,包括如下步骤:
步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;
步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;
对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;
步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;
步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:
式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率。
第1隐藏层,第2隐藏层以及更多的隐藏层的计算公式都是相同的。首先是把输入层的状态值作为x,使用该公式计算第1隐层的状态,然后再将第1隐层的状态作为x,使用相同的公式计算第2隐层的状态,其它隐层依次类推。
步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:
式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率;
神经网络在计算的过程中首先计算输出层的神经元激活概率值P,然后根据概率值P进行随机采样,从而最后得到输出神经元的激活状态;该神经网络将任意一个图片映射为一个固定长度的二进制序列码,即,图片的二进制特征向量;
步骤6:当需要比较图片N和图片M之间的相似度时,首先根据步骤1到步骤5的方法分别计算出图片N和图片M相应的二进制序列码,设定计算出的图片N的二进制序列码为BN,计算出的图片M的二进制序列码为BM
然后计算BN和BM之间的汉明距离H(BN,BM),汉明距离越小,图片N和图片M的相似程度越高;
步骤7:在输出层的后方设有一个镜像层,镜像层是以输出层为镜面对隐藏层和输入层的镜像;镜像层的最后一层的神经元个数与输入层的神经元个数相同,镜像层的倒数第二层的神经元个数与第一隐藏层的神经元个数相同,其它依次类推。
所述汉明距离是指两个二进制序列中不同位的个数,即将两个二进制序列进行异或后的结果中1的个数。
在执行步骤7时,虽然镜像层的神经元个数与输入层和隐藏层相同,但是其连接权值不相同;图片从输入层输入,经过二进制瓶颈层之后,从镜像层恢复,中间在二进制瓶颈神经网络中引入了一定的误差,这就需要对二进制瓶颈神经网络进行权值训练,而权值训练的目的是使得上述误差最小化;所述二进制瓶颈神经网络中,二进制神经元的个数决定了该网络能够传递的最大信息量,是整个网络信息量传输的瓶颈,网络训练成功之后,若任意从输入层输入的图片都能在镜像层输出与其非常相似的图片,这说明中间的二进制神经元已经抓取到了该图片的特征。
输入层和隐藏层可以看做是一个图像的有损编码器,二进制神经元可以看做是图像的编码,镜像层可以看做是一个解码器。
该神经网络训练的目的是网络的权值使得在整个训练集合上从镜像层的最后一层神经元输出的图像与输入图像的差距尽量小。即图像从输入层输入,从镜像层输出,中间传输的神经网络引入了一定的误差,而权值训练的目的是使得这种误差最小化。
本发明所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,解决了抽取图片的二进制特征向量的技术问题,本发明计算图像的特征二进制序列,不依赖于研究者的经验进行手工设计就能获得非常好的性能;本发明计算的图像特征二进制序列可用于快速计算图像的相似性,对于图片和视频的相似性检索有重要价值。

Claims (3)

1.一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:包括如下步骤:
步骤1:建立一个二进制瓶颈神经网络,该二进制瓶颈神经网络包括输入层、隐藏层、输出层和镜像层;所述隐藏层包括第一隐藏层、第二隐藏层和第三隐藏层;
步骤2:通过摄像头获取图片后,将图片进行统一处理,使图片变为适合在二进制瓶颈神经网络中处理的分辨率尺寸大小,所述统一处理包括放大处理和缩小处理;
对8bit编码格式的图片进行统一处理时,由于所述8bit编码格式的图片的像素值的范围是0到255,所以处理时将所述8bit编码格式的图片中的所有的像素值均除以255,使其归一化到0到1的范围内;
步骤3:将经过统一处理的图片输入到所述输入层,经过统一处理的图片的像素值作为输入层的状态值;
步骤4:隐藏层获取输入层的状态值,并通过以下公式1进行计算:
<mrow> <mi>y</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mi>W</mi> <mi>x</mi> <mo>-</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
式中,向量x表示输入层的状态值,W表示从输入层到隐藏层的权值矩阵,b表示隐藏层的偏置值,y表示隐藏层的状态值;
隐藏层可以有许多,每一个隐藏层均将近邻的前一个隐藏层作为自身的输入层,并通过公式1来获取输入层的状态值;
步骤5:将隐藏层的状态值输入到输出层,并计算输出层的神经元激活概率,其计算公式2如下:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>O</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mrow> <mo>&amp;lsqb;</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mrow> <mo>-</mo> <mi>W</mi> <mi>j</mi> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&amp;rsqb;</mo> </mrow> <mi>i</mi> </msub> <mo>;</mo> </mrow>
式中,向量j表示第三隐藏层的状态值,k表示输出层的偏置值,下标i表示输出层的第i个元素,P表示输出层的第i个元素激活的概率,P(Oi=1)表示Oi=1的概率,Oi只有两个取值,即1或0,取1表示激活,取0表示非激活,公式2给出了输出层的第i个神经元激活的概率;
神经网络在计算的过程中首先计算输出层的神经元激活概率值P,然后根据概率值P进行随机采样,从而最后得到输出神经元的激活状态;该神经网络将任意一个图片映射为一个固定长度的二进制序列码,即,图片的二进制特征向量;
步骤6:当需要比较图片N和图片M之间的相似度时,首先根据步骤1到步骤5的方法分别计算出图片N和图片M相应的二进制序列码,设定计算出的图片N的二进制序列码为BN,计算出的图片M的二进制序列码为BM
然后计算BN和BM之间的汉明距离H(BN,BM),汉明距离越小,图片N和图片M的相似程度越高;
步骤7:在输出层的后方设有一个镜像层,镜像层是以输出层为镜面对隐藏层和输入层的镜像;镜像层的最后一层的神经元个数与输入层的神经元个数相同,镜像层的倒数第二层的神经元个数与第一隐藏层的神经元个数相同。
2.如权利要求1所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:所述汉明距离是指两个二进制序列中不同位的个数,即将两个二进制序列进行异或后的结果中1的个数。
3.如权利要求1所述的一种使用二进制瓶颈神经网络来抽取图片特征的方法,其特征在于:在执行步骤7时,虽然镜像层的神经元个数与输入层和隐藏层相同,但是其连接权值不相同;图片从输入层输入,经过二进制瓶颈层之后,从镜像层恢复,中间在二进制瓶颈神经网络中引入了一定的误差,这就需要对二进制瓶颈神经网络进行权值训练,而权值训练的目的是使得上述误差最小化;所述二进制瓶颈神经网络中,二进制神经元的个数决定了该网络能够传递的最大信息量,是整个网络信息量传输的瓶颈,网络训练成功之后,若任意从输入层输入的图片都能在镜像层输出与其非常相似的图片,这说明中间的二进制神经元已经抓取到了该图片的特征。
CN201710568350.1A 2017-07-13 2017-07-13 一种使用二进制瓶颈神经网络来抽取图片特征的方法 Active CN107463932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710568350.1A CN107463932B (zh) 2017-07-13 2017-07-13 一种使用二进制瓶颈神经网络来抽取图片特征的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710568350.1A CN107463932B (zh) 2017-07-13 2017-07-13 一种使用二进制瓶颈神经网络来抽取图片特征的方法

Publications (2)

Publication Number Publication Date
CN107463932A true CN107463932A (zh) 2017-12-12
CN107463932B CN107463932B (zh) 2020-07-10

Family

ID=60544162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710568350.1A Active CN107463932B (zh) 2017-07-13 2017-07-13 一种使用二进制瓶颈神经网络来抽取图片特征的方法

Country Status (1)

Country Link
CN (1) CN107463932B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299306A (zh) * 2018-12-14 2019-02-01 央视国际网络无锡有限公司 图像检索方法及装置
CN111709913A (zh) * 2020-05-21 2020-09-25 四川虹美智能科技有限公司 冰箱内变质食品检测方法、装置及***
CN113554145A (zh) * 2020-04-26 2021-10-26 伊姆西Ip控股有限责任公司 确定神经网络的输出的方法、电子设备和计算机程序产品
US11270197B2 (en) 2019-03-12 2022-03-08 Nvidia Corp. Efficient neural network accelerator dataflows
US11769040B2 (en) 2018-09-10 2023-09-26 Nvidia Corp. Scalable multi-die deep learning system
US11966835B2 (en) * 2018-06-05 2024-04-23 Nvidia Corp. Deep neural network accelerator with fine-grained parallelism discovery

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795344A (zh) * 2010-03-02 2010-08-04 北京大学 数字全息图像压缩、解码方法及***、传输方法及***
CN104732243A (zh) * 2015-04-09 2015-06-24 西安电子科技大学 基于cnn的sar目标识别方法
CN105631296A (zh) * 2015-12-30 2016-06-01 北京工业大学 一种基于cnn特征提取器的安全人脸认证***设计方法
CN106251292A (zh) * 2016-08-09 2016-12-21 央视国际网络无锡有限公司 一种图片分辨率提升方法
CN106909924A (zh) * 2017-02-18 2017-06-30 北京工业大学 一种基于深度显著性的遥感影像快速检索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795344A (zh) * 2010-03-02 2010-08-04 北京大学 数字全息图像压缩、解码方法及***、传输方法及***
CN104732243A (zh) * 2015-04-09 2015-06-24 西安电子科技大学 基于cnn的sar目标识别方法
CN105631296A (zh) * 2015-12-30 2016-06-01 北京工业大学 一种基于cnn特征提取器的安全人脸认证***设计方法
CN106251292A (zh) * 2016-08-09 2016-12-21 央视国际网络无锡有限公司 一种图片分辨率提升方法
CN106909924A (zh) * 2017-02-18 2017-06-30 北京工业大学 一种基于深度显著性的遥感影像快速检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XICHUAN ZHOU等: ""Deep Adaptive Network: An Efficient Deep Neural Network with Sparse Binary Connections"", 《网页在线公开:HTTPS://ARXIV.ORG/ABS/1604.06154》 *
王仲宇等: ""ANN构造设计中基于GA优选神经元激活函数类型"", 《计算机工程与应用》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11966835B2 (en) * 2018-06-05 2024-04-23 Nvidia Corp. Deep neural network accelerator with fine-grained parallelism discovery
US11769040B2 (en) 2018-09-10 2023-09-26 Nvidia Corp. Scalable multi-die deep learning system
CN109299306A (zh) * 2018-12-14 2019-02-01 央视国际网络无锡有限公司 图像检索方法及装置
CN109299306B (zh) * 2018-12-14 2021-09-07 央视国际网络无锡有限公司 图像检索方法及装置
US11270197B2 (en) 2019-03-12 2022-03-08 Nvidia Corp. Efficient neural network accelerator dataflows
CN113554145A (zh) * 2020-04-26 2021-10-26 伊姆西Ip控股有限责任公司 确定神经网络的输出的方法、电子设备和计算机程序产品
CN113554145B (zh) * 2020-04-26 2024-03-29 伊姆西Ip控股有限责任公司 确定神经网络的输出的方法、电子设备和计算机程序产品
CN111709913A (zh) * 2020-05-21 2020-09-25 四川虹美智能科技有限公司 冰箱内变质食品检测方法、装置及***
CN111709913B (zh) * 2020-05-21 2023-04-18 四川虹美智能科技有限公司 冰箱内变质食品检测方法、装置及***

Also Published As

Publication number Publication date
CN107463932B (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN107463932A (zh) 一种使用二进制瓶颈神经网络来抽取图片特征的方法
Anwar et al. Image colorization: A survey and dataset
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN109583340B (zh) 一种基于深度学习的视频目标检测方法
CN110245655B (zh) 一种基于轻量级图像金字塔网络的单阶段物体检测方法
CN110136062B (zh) 一种联合语义分割的超分辨率重建方法
CN111340122A (zh) 一种多模态特征融合的文本引导图像修复方法
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN106650615B (zh) 一种图像处理方法及终端
CN110929735B (zh) 一种基于多尺度特征注意机制的快速显著性检测方法
CN116052218B (zh) 一种行人重识别方法
CN110751271B (zh) 一种基于深度神经网络的图像溯源特征表征方法
Salem et al. Semantic image inpainting using self-learning encoder-decoder and adversarial loss
CN106355210A (zh) 基于深度神经元响应模式的绝缘子红外图像特征表达方法
CN116977674A (zh) 图像匹配方法、相关设备、存储介质及程序产品
Zhang et al. FCHP: Exploring the discriminative feature and feature correlation of feature maps for hierarchical DNN pruning and compression
CN111353583A (zh) 基于群卷积特征拓扑空间的深度学习网络及其训练方法
CN112802048B (zh) 具有不对称结构的图层生成对抗网络生成方法及装置
Li et al. Fire flame image detection based on transfer learning
CN111079585B (zh) 图像增强结合伪孪生卷积神经网络的行人再识别方法
CN116137023B (zh) 基于背景建模和细节增强的低照度图像增强方法
CN110110651B (zh) 基于时空重要性和3d cnn的视频中行为识别方法
CN116091844A (zh) 一种基于边缘计算的图像数据处理方法及***
CN114120076B (zh) 基于步态运动估计的跨视角视频步态识别方法
CN113628107B (zh) 人脸图像超分辨率方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant