CN104067314A - 人形图像分割方法 - Google Patents

人形图像分割方法 Download PDF

Info

Publication number
CN104067314A
CN104067314A CN201480000254.1A CN201480000254A CN104067314A CN 104067314 A CN104067314 A CN 104067314A CN 201480000254 A CN201480000254 A CN 201480000254A CN 104067314 A CN104067314 A CN 104067314A
Authority
CN
China
Prior art keywords
humanoid
image
pixel
human
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480000254.1A
Other languages
English (en)
Other versions
CN104067314B (zh
Inventor
谭铁牛
黄永祯
王亮
吴子丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Watrix Technology Beijing Co Ltd
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Publication of CN104067314A publication Critical patent/CN104067314A/zh
Application granted granted Critical
Publication of CN104067314B publication Critical patent/CN104067314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种人形图像分割方法,方法包括:对训练人形图像的所有第一像素点,提取多尺度上下文信息;将所有第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;采用反向传播算法来训练神经网络群,得到人形图像分割训练模型数据;对测试人形图像的所有第二像素点,提取多尺度上下文信息;每一个第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,如果第一概率大于第二概率,则第二像素点属于人形区域内,反之则第二像素点属于人形区域外。本发明人形图像分割方法,图像分割速度快,精确度高。

Description

人形图像分割方法
技术领域
本发明涉及模式识别领域,尤其涉及一种基于多尺度上下文深度学习的人形图像分割方法。
背景技术
在图像目标分割方法中,现有的分割方法是建立每一个像素点与其临近像素点的关系,并采用图模型来建模该关系。当邻近像素点个数太少时(例如基于图模型的方法考虑邻近几个或十几个像素点),则无法形成有语义的分割;而当考虑的邻近像素点个数较多时,计算复杂度非常高,而且很可能模型难以收敛。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种人形图像分割方法,采用人形区域内像素点的多尺度上下文信息来表达人形目标;通过多通道深度学习网络来描述人形局部区域的不同尺度上下文信息。
为实现上述目的,本发明提供了一种人形图像分割方法,所述方法包括:
步骤S1,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
步骤S2,将所有所述第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
步骤S3,采用反向传播算法来训练所述神经网络群,得到人形图像分割训练模型数据;
步骤S4,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
步骤S5,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
进一步的,所述步骤S1具体包括:对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
进一步的,所述步骤S2中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
进一步的,所述步骤S4具体包括:对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块。
本发明人形图像分割方法,图像分割速度快,精确度高。
附图说明
图1为本发明人形图像分割方法的流程图;
图2为本发明人形图像分割方法的示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
深度学习理论是在语音识别、图像目标分类与检测等领域都取得了非常好的结果。并且基于该理论的技术很容易被扩展成不同类型的应用。
一种基于多尺度上下文深度学习的人形图像分割方法采用深度学习技术来描述每一个像素点与周围大范围像素点(可以超过一万个像素点)的关系,并且采用卷积神经网络来建模这些关系,取得了非常好的人形图像分割结果。
图1为本发明人形图像分割方法的流程图,如图所示,本发明具体包括如下步骤:
步骤101,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
具体的,对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
步骤102,将所有第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
因为第一像素点可能有多个,而每一个第一像素点提取的图像块的尺度也会不同,在将图像块送入卷积神经网络的时候,因为每一个通道对应一个尺度的图像块,所以每一个通道对应的图像块的尺度也不同,而进入该通道的图像块的尺度是相同的。
步骤102中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
例如,每一个通道的深度神经网络的参数配置为:第一层有48个5×5的卷积子,步长为1,带有3×3步长为2的空间聚集层;第二层有128个5×5的卷积子,步长为1,带有3×3步长为2的空间聚集层;第三层有192个卷积子,步长为1;第四层有192个卷积子,步长为1;第五层有128个卷积子,步长为1,带有3×3步长为2的空间聚集层。全连接层的参数配置为:第六层有1024个节点;第七层有1024个节点;第八层中有两个节点第一节点和第二节点,分别对应人形区域内和人形区域外。
步骤103,采用反向传播(back-propagation,BP)算法来训练所述神经网络群,得到人形图像分割训练模型数据;
该BP算法主要用于多层模型的训练,其主体是激励传播以及权重更新两个环节的反复迭代,直至达到收敛条件时停止。在激励传播阶段,先将训练样本送入网络获得激励响应,然后将响应与训练样本对应的目标输出求差,从而获得输出层与监督层的误差。在权重更新阶段,先将已知误差与本层响应对前一层响应的函数的导数相乘,从而获得两层之间权重矩阵的梯度,然后沿这个梯度的反方向以某个比例调整权重矩阵。随后,将该梯度当作前一层的误差从而计算前一层的权重矩阵。以此类推完成对整个模型的更新。
参见图2所示,为本发明人形图像分割方法的示意图,步骤101、102和103为训练阶段,首先需要有一定量(比如5000张图像)的样本标注用于训练模型。在本实施例中,样本指的是对行人区域的每一个像素点标注为1,对其他区域标注为0。
具体的,对5000张图像的每一个像素点提取三个尺度(比如224*224,112*112,56*56)上下文信息,即以该像素点为中心提取三个尺度的图像块。送入网络之前,先将这些图像块缩放至56×56的大小。所有像素点的相同尺度图像块送入同一个卷积神经网络,形成三通道的卷积神经网络群。所有通道在全连接层融合在一起。在神经网络群的最后一层(输出层),行人区域的像素点对应一个节点即第一节点,行人背景区域的像素点对应另一个节点即第二节点。
步骤104,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
具体的,对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块
步骤105,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
对测试图片的所有第二像素点判定完后,即完成人形图像分割。
步骤104和105为测试阶段,将任何一张带有行人的图片进行行人区域分割,具体的,输入一张测试图像,对其每一个像素点提取三个尺度(224*224,112*112,56*56)上下文信息,即以该像素点为中心提取三个尺度的图像块。送入网络之前,先将这些图像块缩放至56×56的大小。每一个像素点的不同尺度图像块送入与训练好的模型中相对应的神经网络通道,所有通道在全连接层融合在一起,在全连接层的最后一层两个节点上会分别输出一个值,表示该像素点属于行人和背景的概率。如果属于行人的概率大于属于背景的概率,则判定该像素点属于行人,反之则判定该像素点属于背景。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种人形图像分割方法,其特征在于,所述方法包括:
步骤S1,对训练人形图像的所有第一像素点,提取多尺度上下文信息;
步骤S2,将所有所述第一像素点的所有尺度的图像块送入同一个卷积神经网络,形成多通道的卷积神经网络群,每一个通道对应一个尺度的图像块;
步骤S3,采用反向传播算法来训练所述神经网络群,得到人形图像分割训练模型数据;
步骤S4,对测试人形图像的所有第二像素点,提取多尺度上下文信息;
步骤S5,每一个所述第二像素点的不同尺度的图像块送入与人形图像分割训练模型相对应的神经网络通道,所有所述神经网通道在全连接层融合在一起,在全连接层的最后一层的第一节点输出第一值,第二节点输出第二值,所述第一值表示所述第二像素点属于人形区域内的第一概率,所述第二值表示所述第二像素点属于人形区域外的概率;如果所述第一概率大于所述第二概率,则所述第二像素点属于人形区域内,反之则所述第二像素点属于人形区域外。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:对训练人形图像的人形区域内和区域外的所有第一像素点,以所述第一像素点为中心提取不同尺度的图像块。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2中所述多通道的卷积神经网络群在全连接层融合在一起;所述全连接层的最后一层为输出层,并包括第一节点和第二节点,所有人形区域内的像素点的输出对应所述第一节点,所有人形区域外的像素点的输出对应所述第二节点。
4.根据权利要求1所述的方法,其特征在于,所述步骤S4具体包括:对测试人形图像的所有第二像素点,以所述像第二素点为中心提取不同尺度的图像块。
CN201480000254.1A 2014-05-23 2014-05-23 人形图像分割方法 Active CN104067314B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/078282 WO2015176305A1 (zh) 2014-05-23 2014-05-23 人形图像分割方法

Publications (2)

Publication Number Publication Date
CN104067314A true CN104067314A (zh) 2014-09-24
CN104067314B CN104067314B (zh) 2017-03-08

Family

ID=51553777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480000254.1A Active CN104067314B (zh) 2014-05-23 2014-05-23 人形图像分割方法

Country Status (3)

Country Link
US (1) US10096121B2 (zh)
CN (1) CN104067314B (zh)
WO (1) WO2015176305A1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176305A1 (zh) * 2014-05-23 2015-11-26 中国科学院自动化研究所 人形图像分割方法
CN105551036A (zh) * 2015-12-10 2016-05-04 中国科学院深圳先进技术研究院 一种深度学习网络的训练方法和装置
WO2016090520A1 (en) * 2014-12-10 2016-06-16 Xiaogang Wang A method and a system for image classification
CN105760835A (zh) * 2016-02-17 2016-07-13 天津中科智能识别产业技术研究院有限公司 一种基于深度学习的步态分割与步态识别一体化方法
CN105787482A (zh) * 2016-02-26 2016-07-20 华北电力大学 一种基于深度卷积神经网络的特定目标轮廓图像分割方法
CN106372597A (zh) * 2016-08-31 2017-02-01 李涛 基于自适应上下文信息的cnn交通检测方法
CN106548127A (zh) * 2015-09-18 2017-03-29 松下电器(美国)知识产权公司 图像识别方法
CN106663186A (zh) * 2014-07-28 2017-05-10 北京市商汤科技开发有限公司 用于脸部识别的方法和***
CN106780512A (zh) * 2016-11-30 2017-05-31 厦门美图之家科技有限公司 分割图像的方法、应用及计算设备
CN107016405A (zh) * 2017-02-24 2017-08-04 中国科学院合肥物质科学研究院 一种基于分级预测卷积神经网络的害虫图像分类方法
CN107392933A (zh) * 2017-07-12 2017-11-24 维沃移动通信有限公司 一种图像分割的方法及移动终端
WO2018036293A1 (zh) * 2016-08-26 2018-03-01 杭州海康威视数字技术股份有限公司 图像分割方法、装置及全卷积网络***
CN108198192A (zh) * 2018-01-15 2018-06-22 任俊芬 一种基于深度学习的高精度快速人体分割方法
CN108198184A (zh) * 2018-01-09 2018-06-22 北京理工大学 造影图像中血管分割的方法和***
CN108694347A (zh) * 2017-04-06 2018-10-23 北京旷视科技有限公司 图像处理方法和装置
CN108932943A (zh) * 2018-07-12 2018-12-04 广州视源电子科技股份有限公司 命令词语音检测方法、装置、设备和存储介质
CN109165644A (zh) * 2018-07-13 2019-01-08 北京市商汤科技开发有限公司 目标检测方法和装置、电子设备、存储介质、程序产品
CN109886964A (zh) * 2019-03-29 2019-06-14 北京百度网讯科技有限公司 电路板缺陷检测方法、装置及设备
CN110895814A (zh) * 2019-11-30 2020-03-20 南京工业大学 一种基于上下文编码网络的航空发动机孔探图像损伤智能分割方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200005151A1 (en) * 2016-12-30 2020-01-02 Nokia Technologies Oy Artificial neural network
CN107657259A (zh) * 2017-09-30 2018-02-02 平安科技(深圳)有限公司 图像篡改检测方法、电子装置及可读存储介质
CN107680088A (zh) * 2017-09-30 2018-02-09 百度在线网络技术(北京)有限公司 用于分析医学影像的方法和装置
CN108875900B (zh) * 2017-11-02 2022-05-24 北京旷视科技有限公司 视频图像处理方法和装置、神经网络训练方法、存储介质
CN107944399A (zh) * 2017-11-28 2018-04-20 广州大学 一种基于卷积神经网络目标中心模型的行人重识别方法
CN110838122B (zh) * 2018-08-16 2022-06-14 北京大学 点云的分割方法、装置及计算机存储介质
CN109447992B (zh) * 2018-10-23 2022-04-01 中国银行股份有限公司 一种图像分割方法及装置
US11210559B1 (en) * 2018-10-23 2021-12-28 Hrl Laboratories, Llc Artificial neural networks having attention-based selective plasticity and methods of training the same
CN109375186B (zh) * 2018-11-22 2022-05-31 中国人民解放军海军航空大学 基于深度残差多尺度一维卷积神经网络的雷达目标识别方法
CN110148148A (zh) * 2019-03-01 2019-08-20 北京纵目安驰智能科技有限公司 一种基于目标检测的下边缘检测模型的训练方法、模型和存储介质
CN111932486A (zh) * 2019-05-13 2020-11-13 四川大学 一种基于3d卷积神经网络的脑胶质瘤分割方法
CN110188732B (zh) * 2019-06-07 2022-04-05 吉林大学 一种基于卷积神经网络的静态手语识别方法
WO2021031066A1 (zh) * 2019-08-19 2021-02-25 中国科学院深圳先进技术研究院 一种软骨图像分割方法、装置、可读存储介质及终端设备
CN110647889B (zh) * 2019-08-26 2022-02-08 中国科学院深圳先进技术研究院 医学图像识别方法、医学图像识别装置、终端设备及介质
CN111401247B (zh) * 2020-03-17 2023-07-28 杭州小影创新科技股份有限公司 一种基于级联卷积神经网络的人像分割方法
CN112434514B (zh) * 2020-11-25 2022-06-21 重庆邮电大学 基于多粒度多通道的神经网络的语义匹配方法、装置及计算机设备
EP4099142A4 (en) 2021-04-19 2023-07-05 Samsung Electronics Co., Ltd. ELECTRONIC DEVICE AND METHOD OF OPERATION
WO2022235789A1 (en) 2021-05-07 2022-11-10 Hrl Laboratories, Llc Neuromorphic memory circuit and method of neurogenesis for an artificial neural network
CN114916928B (zh) * 2022-05-12 2023-08-04 电子科技大学 一种人体姿态多通道卷积神经网络检测方法
CN115468541B (zh) * 2022-11-01 2023-04-25 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) 一种岩溶塌陷四维监测的信息***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161912A1 (en) * 2007-12-21 2009-06-25 Raviv Yatom method for object detection
CN101673340A (zh) * 2009-08-13 2010-03-17 重庆大学 综合多方向多尺度与bp神经网络的人耳识别方法
CN102855490A (zh) * 2012-07-23 2013-01-02 黑龙江工程学院 高分辨率遥感影像面向对象神经网络分类方法
CN102945373A (zh) * 2012-10-24 2013-02-27 中国科学院自动化研究所 基于上下文的局部空间信息建模方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5058179A (en) * 1990-01-31 1991-10-15 At&T Bell Laboratories Hierarchical constrained automatic learning network for character recognition
US7088846B2 (en) * 2003-11-17 2006-08-08 Vidient Systems, Inc. Video surveillance system that detects predefined behaviors based on predetermined patterns of movement through zones
CN102682297B (zh) * 2012-05-07 2014-05-14 中北大学 模拟视觉细胞感受野特性的pcnn人脸图像分割方法
KR101724658B1 (ko) * 2012-12-21 2017-04-10 한국전자통신연구원 사람 검출 장치 및 방법
CN106462549B (zh) * 2014-04-09 2020-02-21 尹度普有限公司 使用从显微变化中进行的机器学习来鉴定实体对象
EP3146463B1 (en) * 2014-05-23 2020-05-13 Ventana Medical Systems, Inc. Systems and methods for detection of biological structures and/or patterns in images
US10096121B2 (en) * 2014-05-23 2018-10-09 Watrix Technology Human-shape image segmentation method
US9928410B2 (en) * 2014-11-24 2018-03-27 Samsung Electronics Co., Ltd. Method and apparatus for recognizing object, and method and apparatus for training recognizer
US9892344B1 (en) * 2015-11-30 2018-02-13 A9.Com, Inc. Activation layers for deep learning networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161912A1 (en) * 2007-12-21 2009-06-25 Raviv Yatom method for object detection
CN101673340A (zh) * 2009-08-13 2010-03-17 重庆大学 综合多方向多尺度与bp神经网络的人耳识别方法
CN102855490A (zh) * 2012-07-23 2013-01-02 黑龙江工程学院 高分辨率遥感影像面向对象神经网络分类方法
CN102945373A (zh) * 2012-10-24 2013-02-27 中国科学院自动化研究所 基于上下文的局部空间信息建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LIANG WANG ET AL.: "Silhouette Analysis-Based Gait Recognition for Human Identification", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
张忠波 等: "基于局部特征分析与最优化匹配的人脸识别算法", 《吉林大学学报(理学版)》 *

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176305A1 (zh) * 2014-05-23 2015-11-26 中国科学院自动化研究所 人形图像分割方法
US10096121B2 (en) 2014-05-23 2018-10-09 Watrix Technology Human-shape image segmentation method
CN106663186B (zh) * 2014-07-28 2018-08-21 北京市商汤科技开发有限公司 用于脸部识别的方法和***
CN106663186A (zh) * 2014-07-28 2017-05-10 北京市商汤科技开发有限公司 用于脸部识别的方法和***
WO2016090520A1 (en) * 2014-12-10 2016-06-16 Xiaogang Wang A method and a system for image classification
CN106548127B (zh) * 2015-09-18 2022-11-04 松下电器(美国)知识产权公司 图像识别方法
CN106548127A (zh) * 2015-09-18 2017-03-29 松下电器(美国)知识产权公司 图像识别方法
CN105551036A (zh) * 2015-12-10 2016-05-04 中国科学院深圳先进技术研究院 一种深度学习网络的训练方法和装置
CN105760835B (zh) * 2016-02-17 2018-03-06 银河水滴科技(北京)有限公司 一种基于深度学习的步态分割与步态识别一体化方法
CN105760835A (zh) * 2016-02-17 2016-07-13 天津中科智能识别产业技术研究院有限公司 一种基于深度学习的步态分割与步态识别一体化方法
CN105787482A (zh) * 2016-02-26 2016-07-20 华北电力大学 一种基于深度卷积神经网络的特定目标轮廓图像分割方法
US11151723B2 (en) 2016-08-26 2021-10-19 Hangzhou Hikvision Digital Technology Co., Ltd. Image segmentation method, apparatus, and fully convolutional network system
WO2018036293A1 (zh) * 2016-08-26 2018-03-01 杭州海康威视数字技术股份有限公司 图像分割方法、装置及全卷积网络***
CN107784654A (zh) * 2016-08-26 2018-03-09 杭州海康威视数字技术股份有限公司 图像分割方法、装置及全卷积网络***
CN107784654B (zh) * 2016-08-26 2020-09-25 杭州海康威视数字技术股份有限公司 图像分割方法、装置及全卷积网络***
CN106372597A (zh) * 2016-08-31 2017-02-01 李涛 基于自适应上下文信息的cnn交通检测方法
CN106372597B (zh) * 2016-08-31 2019-09-13 郑州禅图智能科技有限公司 基于自适应上下文信息的cnn交通检测方法
CN106780512A (zh) * 2016-11-30 2017-05-31 厦门美图之家科技有限公司 分割图像的方法、应用及计算设备
CN106780512B (zh) * 2016-11-30 2020-01-17 厦门美图之家科技有限公司 分割图像的方法、应用及计算设备
CN107016405A (zh) * 2017-02-24 2017-08-04 中国科学院合肥物质科学研究院 一种基于分级预测卷积神经网络的害虫图像分类方法
CN107016405B (zh) * 2017-02-24 2019-08-30 中国科学院合肥物质科学研究院 一种基于分级预测卷积神经网络的害虫图像分类方法
CN108694347B (zh) * 2017-04-06 2022-07-12 北京旷视科技有限公司 图像处理方法和装置
CN108694347A (zh) * 2017-04-06 2018-10-23 北京旷视科技有限公司 图像处理方法和装置
CN107392933B (zh) * 2017-07-12 2020-02-21 维沃移动通信有限公司 一种图像分割的方法及移动终端
CN107392933A (zh) * 2017-07-12 2017-11-24 维沃移动通信有限公司 一种图像分割的方法及移动终端
CN108198184B (zh) * 2018-01-09 2020-05-05 北京理工大学 造影图像中血管分割的方法和***
CN108198184A (zh) * 2018-01-09 2018-06-22 北京理工大学 造影图像中血管分割的方法和***
CN108198192A (zh) * 2018-01-15 2018-06-22 任俊芬 一种基于深度学习的高精度快速人体分割方法
CN108932943A (zh) * 2018-07-12 2018-12-04 广州视源电子科技股份有限公司 命令词语音检测方法、装置、设备和存储介质
CN109165644A (zh) * 2018-07-13 2019-01-08 北京市商汤科技开发有限公司 目标检测方法和装置、电子设备、存储介质、程序产品
CN109886964A (zh) * 2019-03-29 2019-06-14 北京百度网讯科技有限公司 电路板缺陷检测方法、装置及设备
CN110895814A (zh) * 2019-11-30 2020-03-20 南京工业大学 一种基于上下文编码网络的航空发动机孔探图像损伤智能分割方法

Also Published As

Publication number Publication date
US10096121B2 (en) 2018-10-09
US20170200274A1 (en) 2017-07-13
WO2015176305A1 (zh) 2015-11-26
CN104067314B (zh) 2017-03-08

Similar Documents

Publication Publication Date Title
CN104067314A (zh) 人形图像分割方法
CN105760835B (zh) 一种基于深度学习的步态分割与步态识别一体化方法
CN108776772A (zh) 一种跨时间建筑物变化检测建模方法以及检测装置、方法及存储介质
CN106096561A (zh) 基于图像块深度学习特征的红外行人检测方法
CN106682696A (zh) 基于在线示例分类器精化的多示例检测网络及其训练方法
CN107862261A (zh) 基于多尺度卷积神经网络的图像人群计数方法
CN107392019A (zh) 一种恶意代码家族的训练和检测方法及装置
CN105787482A (zh) 一种基于深度卷积神经网络的特定目标轮廓图像分割方法
He et al. Simultaneously simulate vertical and horizontal expansions of a future urban landscape: A case study in Wuhan, Central China
CN104317894B (zh) 样本标注的确定方法和装置
CN106909886A (zh) 一种基于深度学习的高精度交通标志检测方法及***
CN109325385A (zh) 目标检测和区域分割方法、装置和计算机可读存储介质
KR20180038169A (ko) 딥 러닝 기반의 데이터특징을 이용한 도시영상의 안전도 분류방법
CN106533742A (zh) 基于时间序列模式表征的加权有向复杂网络建网方法
CN109886946A (zh) 基于深度学习的早期老年性黄斑病变弱监督分类方法
CN107392252A (zh) 计算机深度学习图像特征并量化感知度的方法
CN104598920A (zh) 基于Gist特征与极限学习机的场景分类方法
CN105814582A (zh) 用于识别人脸的方法和***
CN114428937A (zh) 一种基于时空图神经网络的时间序列数据预测方法
CN104268657A (zh) 基于遥感的流域水生态风险预警和判别方法
Comber et al. Comparing expert and non-expert conceptualisations of the land: an analysis of crowdsourced land cover data
CN105718959A (zh) 一种基于自编码的物体识别方法
CN110738702B (zh) 一种三维超声图像的处理方法、装置、设备及存储介质
CN115937758A (zh) 一种基于多尺度动态图卷积的弱监督人群计数方法
CN104834990A (zh) 旅客信息化编码的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160908

Address after: 100090 Beijing city Haidian District Zhongguancun south a No. 2 B District three floor Horse International Hotel

Applicant after: Galaxy drop Technology (Beijing) Co., Ltd.

Address before: Haidian District, Beijing, China Zhongguancun East Road, No. 95

Applicant before: Institute of Automation, Chinese Academy of Sciences

C14 Grant of patent or utility model
GR01 Patent grant