CN108875592A - 一种基于注意力的卷积神经网络优化方法 - Google Patents

一种基于注意力的卷积神经网络优化方法 Download PDF

Info

Publication number
CN108875592A
CN108875592A CN201810519139.5A CN201810519139A CN108875592A CN 108875592 A CN108875592 A CN 108875592A CN 201810519139 A CN201810519139 A CN 201810519139A CN 108875592 A CN108875592 A CN 108875592A
Authority
CN
China
Prior art keywords
data
attention
model
feature
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810519139.5A
Other languages
English (en)
Inventor
王红滨
王勇军
何鸣
王念滨
周连科
陈田田
秦帅
赵昱杰
李秀明
薛冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Publication of CN108875592A publication Critical patent/CN108875592A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的是一种基于注意力模型的卷积神经网络优化方法。首先对水下目标的噪声数据进行分段,针对每段噪声数据提取其MFCC,其目的是将目标噪声数据变成定长的矢量化数据。然后,将得到的定长的矢量化数据按实验过程中水听器的排布位置以及其时序关系进行拼接,形成一个完整的时段水听阵特征,继而再将形成的水听阵特征转成对应的图片以作为输入数据集输入到训练网络中。本发明通过试验对模型在使用情况的结果分析以及对模型进行修改与优化,深度学习对水下目标识别识别率的得到10%‑15%的提升。

Description

一种基于注意力的卷积神经网络优化方法
技术领域
本发明涉及的是一种水下目标识别方法。
背景技术
水声信号处理和声纳技术是一门发展迅速、需求推动力强大、应用前景异常广阔的学科,是现代声纳***与水声对抗的一个重要的组成部分,一直以来受到许多学者、工程技术人员的极大关注。各种水下目标都具有其自身特有的噪声特性,可用于目标识别、分类、状态监测等等应用领域。由于海洋环境的复杂性和水声信号通道的特殊性,要从目标噪声信号中抽取一种既能反映目标本质特征又能满足水下远距离探测要求的有效特征表示,一直是这一领域的难题。
传统的水下目标识别解决方案多从水下目标的低频信息入手,基于目标的DEMON与LOFAR 谱进行分析得出目标的类属。
发明内容
本发明的目的在于提供一种可以快速的对模型进行降维操作从而降低过拟合风险的基于注意力模型的卷积神经网络优化方法。
本发明的目的是这样实现的:
(1)噪声数据的切分
所述噪声数据的切分是对水下目标的噪声数据以100ms为单位进行分段;
(2)数据特征的提取
所述数据特征的提取是针对每段噪声数据提取其MFCC,MFCC的提取过程如公式为:
式中,f为目标噪声频率,mel(f)为所示目标噪声提取的梅尔倒谱系数;
(3)多路数据拼接
将水下目标噪声数据分段并进行数据特征的提取后,结合水听器的组阵位置,组成相应的向量矩阵,同时,不同的时序数据组成不同批次的数据,每段噪声数据通过上一步得到的 MFCC按多路水听器的排放位置以及每段噪声数据的时序关系进行拼接,形成深度学习模型输入数据集;
(4)基于注意力模型加速池化操作
使用卷积模型处理水下目标噪声数据,在卷积结构的处理方法中注意力被定义为相应卷积层中卷积操作后的特征图,通过主成分分析的方法确定特征图的降维方向,在提取卷积核的特征的基础上进行池化;
(6)注意力加权连接
利用卷积核特征将卷积神经网络提取的特征,即最后一层结果,基于注意力模型进行加权处理。
在卷积神经网络中通过卷积操作获得特征之后,会利用这些特征去做分类。理论上讲,可以直接使用所有提取得到的特征去训练分类器,但如果直接训练的话会面临极大的计算量挑战。研究人员从生物学得到的启发,利用人类在图像识别与分类时具有的“静态性”的属性,对不同位置的特征进行聚合统计,这些概要统计特征不仅具有较低的维度,同时还会防止过拟合。但是传统的池化策略的问题是所有池化策略都是固定的,即池化操作在参与模型训练时只是单纯的粗暴地对上一层卷积结果进行降维。本发明提出了一种结合卷积神经网络和注意力模型的池化与拼接结构,分为层间注意力池化模型与面向全连接层的特征拼接的注意力拼接模型。可以快速的对模型进行降维操作从而降低模型的过拟合风险。
本发明提出了一种结合卷积神经网络和注意力模型的池化与拼接结构,分为层间注意力池化模型与面向全连接层的特征拼接的注意力拼接模型。层间注意力池化模型在进行池化操作时充分考虑当前卷积核的特点,依照卷积核与特征图的数据特性进行有效池化,此池化操作不仅可以较大幅度的提高池化的尺度,从而对特征图进行快速降维,还可以防止在较小的数据集上使用深度学习模型易引发的过拟合现象。同时,以卷积核与特征图的数据特性作为注意力的池化操作进行的可以在快速降维的过程中保持图像的特征不丢失。
传统的水下目标识别解决方案多从水下目标的低频信息入手,基于目标的DEMON与LOFAR 谱进行分析得出目标的类属。本发明利用注意力模型对卷积神经网络模型的池化层进行优化,利用卷积神经网络对水下目标的声频信息进行分析识别,利用声音特征提取方法作为模型学习输入数据的矢量化方法,将生成的声频数据的矢量化信息处理成声频信息的热力图作为模型训练的输入数据。通过试验对模型在使用情况的结果分析以及对模型进行修改与优化,深度学习对水下目标识别识别率的得到10%-15%的提升。
本发明使用MFCC矢量拼接多路水听器输入的方法与单纯使用MFCC与其它分类器在的分类结果的对比结果。其中使用MFCC矢量拼接方法融合多路水听器的方法明显高于单纯使用 MFCC对声音进行描述的方法。相比最低的识别准确率,本发明所用接合MFCC矢量拼接的方法要比传统方法的准确率提高近16.1%。
附图说明
图1是基于注意力模型的卷积神经网络应用框架;
图2是基于注意力模型的层间池化操作;
图3是基于注意力模型的全连接层操作;
图4是基于注意力模型的卷积神经网络结构;
图5是基于注意力模型的卷积核大小结果对比;
图6是数据集预处理过程;
图7是数据集提取结果示例。
具体实施方式
下面举例对本发明做更详细的描述。
首先对训练数据集进行预处理。与以往直接使用Mel-Frequency对噪声数据做特征提取不同,本发明首先对水下目标的噪声数据以100ms为单位进行分段,针对每段噪声数据提取其MFCC,其目的是将目标噪声数据变成定长的矢量化数据。然后,将得到的定长的矢量化数据按实验过程中水听器的排布位置以及其时序关系进行拼接,形成一个完整的时段水听阵特征,继而再将形成的水听阵特征转成对应的图片以作为输入数据集输入到训练网络中。
(1)噪声数据的切分
从实验环境得到的噪声数据为安放在不同位置不同角度的多路水听器组阵后所测量的水中目标噪声,以16路水听阵为例,单路水听器测量时间6min,频带25.6kHz,采样率为65536Hz,采集的所有信号均为电压值。由于单个水听器的数据不适合卷积神经网络直接进行处理,同时考虑到卷积网络的结构特性,本发明将多组水听器所获取的噪声数据进行有针对的处理。本发明考虑了水听器获取数据的位置关系与数据本身的时序关系,首先对数据进行分切,然后按位置与时序关系进行集成。分切单位要充分考虑水听器特性。下文分切单位定为100ms,从而形成卷积结构的水下目标识别的输入数据集。
(2)数据特征的提取(以MFCC为例)
本发明使用可以融合多种噪声特征提取方法,如LPCC、PLP等等,下文以MFCC为例,MFCC 的提取过程如公式(4)所示,在具体使用本方法时,要考虑所采用的水下噪声采集设备的采集特性来设定参数。本例中将每段噪声分512帧,利用31个三角滤波器。本发明在提取一阶 MFCC(16个滤波器)的同时,考虑到MFCC只能得到噪声的静态特性无法得到噪声数据的动态特征,在提取一阶MFCC结果的同时又提取目标噪声的一阶差分MFCC(15个一阶差分),一阶差分MFCC作为目标噪声的动态特征,使得本发明可以更加细腻的提取水下目标噪声数据的特征。最后通过将所有特征线性结合,从而为每段分切后的噪声数据得到一个128×1维的特征向量。
式中,f为目标噪声频率,mel(f)为所示目标噪声提取的梅尔倒谱系数。
(3)多路数据拼接
数据拼接是本发明结合实际实验的重要过程,实际上数据拼接就是一个将水听器位置与目标噪声时序关系结合的过程。将水下目标噪声数据分段后按具体的特征提取方法后,结合具体水听器的组阵位置,组成相应的向量矩阵,同时,不同的时序数据组成不同批次的数据,如第一组100ms的所有水听器的数据组成一个批次(Batch)数据,第二组100ms的所有水听器数据组成另一个Batch的数据。每段噪声数据通过上一步的将得到的MFCC按多路水听器的排放位置以及每段噪声数据的时序关系进行拼接,从而形成深度学习模型输入数据集。
(4)基于注意力模型加速池化操作
本发明使用注意力模型来加速池化操作的降维过程。注意力机制是一个将编码器-解码器结构从固定长度的内部表征中解放出来的方法。本发明定义的注意力操作指得是通过在当前操作中要保持模型在之前步骤中的操作趋势。本发明使用卷积模型处理水下目标噪声数据,在卷积结构的处理方法中注意力被定义为相应卷积层中卷积操作后的特征图,通过主成分分析的方法确定特征图的降维方向,从而为相邻的池化操作提供有效的指导。本发明在进行池化时充分考虑上一层卷积核的作用,在提取卷积核的特征的基础上进行池化。
(5)注意力加权连接
本发明利用卷积核特征将卷积神经网络提取的特征,即最后一层结果。卷积神经网络的全连接层在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。卷积层模仿人的视觉通路提取特征,全连接层一般负责分类或者回归,由于全连接层会丢失一些特征位置信息。全连接的核心操作就是矩阵向量乘积,本质就是由一个特征空间线性变换到另一个特征空间。目标空间的任一维都认为会受到源空间的每一维的影响。本发明利用卷积核特征将卷积神经网络提取的特征,即最后一层结果,基于注意力模型进行加权处理,从而既考虑卷积处理的特点又保留了特征的位置信息。
本发明的主要特点和内容如下:
(1)基于注意力模型加速池化操作
Encoder-Decoder结构在多个领域展现出先进水平,但这种结构将输入序列表示为固定长度的内部表示。限制了输入序列的长度,也导致模型对特别长的输入序列的性能变差。利用注意力模型可以将关注点从前n个固定序列中解放出来,从而做到关注到想要关注的n个前序序列。注意力机制是一个将编码器-解码器结构从固定长度的内部表征中解放出来的方法。通过保持模型对输入序列处理过程中每一步的中间输出结果,训练模型学习如何选择性地关注输入,并将其与输出序列中的项联系起来。人们在进行观察图像的时候,其实并不是一次就把整幅图像的每个位置像素都看过,大多是根据需求将注意力集中到图像的特定部分。而且人类会根据之前观察的图像学习到未来要观察图像注意力应该集中的位置,本发明使用注意力模型来加速池化操作的降维过程。
(2)全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由1×1卷积操作实现以达到快速计算结果,同时,1×1卷积核可以起到一个跨通道聚合的作用,所以进一步可以起到降维(或者升维)的作用,起到减少参数的目的。卷积层模仿人的视觉通路提取特征,全连接层一般负责分类或者回归,由于全连接层会丢失一些特征位置信息。
全连接的核心操作就是矩阵向量乘积,本质就是由一个特征空间线性变换到另一个特征空间。目标空间的任一维都认为会受到源空间的每一维的影响。本发明利用卷积核特征将卷积神经网络提取的特征,即最后一层结果,基于注意力模型进行加权处理,从而既考虑卷积处理的特点又保留了特征的位置信息。
针对基于注意力模型加速池化操作,其计算方法如下。
模型使用AoCL表示,其计算方法如公式(1)所示
式中,Li表示第L层第i个池化结果,eigVector(ki)表示第ki个卷积核所提取的特征向量, Area(ki)表示第ki个卷积核所覆盖的区域。
IoCi代表了基于卷积核影响的注意力模型,则其计算方法如公式(2)所示。
式中,wi为一个权重矩阵,其记录每一维特征在整个特征图中的比重,为全连接层之前模型处理结果,m为卷积核的个数。
wi的计算以多层感知器模型计算得到,其方法如公式(3)所示。
wi=f(ki,yi) (4)
式中,f(·)表示一个前馈神经网络。前馈神经网络以卷积核为输入,以ki代表其所对应的卷积核,yi表示此特征所对应的标签。

Claims (1)

1.一种基于注意力模型的卷积神经网络优化方法,其特征是:
(1)噪声数据的切分
所述噪声数据的切分是对水下目标的噪声数据以100ms为单位进行分段;
(2)数据特征的提取
所述数据特征的提取是针对每段噪声数据提取其MFCC,MFCC的提取过程如公式为:
式中,f为目标噪声频率,mel(f)为所示目标噪声提取的梅尔倒谱系数;
(3)多路数据拼接
将水下目标噪声数据分段并进行数据特征的提取后,结合水听器的组阵位置,组成相应的向量矩阵,同时,不同的时序数据组成不同批次的数据,每段噪声数据通过上一步得到的MFCC按多路水听器的排放位置以及每段噪声数据的时序关系进行拼接,形成深度学习模型输入数据集;
(4)基于注意力模型加速池化操作
使用卷积模型处理水下目标噪声数据,在卷积结构的处理方法中注意力被定义为相应卷积层中卷积操作后的特征图,通过主成分分析的方法确定特征图的降维方向,在提取卷积核的特征的基础上进行池化;
(6)注意力加权连接
利用卷积核特征将卷积神经网络提取的特征,即最后一层结果,基于注意力模型进行加权处理。
CN201810519139.5A 2018-04-13 2018-05-28 一种基于注意力的卷积神经网络优化方法 Pending CN108875592A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810330123X 2018-04-13
CN201810330123 2018-04-13

Publications (1)

Publication Number Publication Date
CN108875592A true CN108875592A (zh) 2018-11-23

Family

ID=64335012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810519139.5A Pending CN108875592A (zh) 2018-04-13 2018-05-28 一种基于注意力的卷积神经网络优化方法

Country Status (1)

Country Link
CN (1) CN108875592A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299396A (zh) * 2018-11-28 2019-02-01 东北师范大学 融合注意力模型的卷积神经网络协同过滤推荐方法及***
CN109344920A (zh) * 2018-12-14 2019-02-15 汇纳科技股份有限公司 顾客属性预测方法、存储介质、***及设备
CN109376804A (zh) * 2018-12-19 2019-02-22 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN109902399A (zh) * 2019-03-01 2019-06-18 哈尔滨理工大学 一种基于att-cnn的变工况下滚动轴承故障识别方法
CN110110796A (zh) * 2019-05-13 2019-08-09 哈尔滨工程大学 一种基于深度学习的海上船舶时序数据的分析方法
CN110222574A (zh) * 2019-05-07 2019-09-10 杭州智尚云科信息技术有限公司 基于结构化双流卷积神经网络的生产操作行为识别方法、装置、设备、***及存储介质
CN110490892A (zh) * 2019-07-03 2019-11-22 中山大学 一种基于USFaster R-CNN的甲状腺超声图像结节自动定位识别方法
CN111401548A (zh) * 2020-03-03 2020-07-10 西北工业大学 一种基于深度学习的Lofar线谱检测方法
CN111652041A (zh) * 2020-04-14 2020-09-11 河北地质大学 基于深度子空间聚类的高光谱波段选择方法、设备和装置
CN113222899A (zh) * 2021-04-15 2021-08-06 浙江大学 一种基于深度学习通过ct的检测分割分类肝脏肿瘤的方法
CN113888430A (zh) * 2021-09-30 2022-01-04 北京达佳互联信息技术有限公司 图像处理方法和装置以及模型训练方法和装置
US11681914B2 (en) 2020-05-08 2023-06-20 International Business Machines Corporation Determining multivariate time series data dependencies

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682574A (zh) * 2016-11-18 2017-05-17 哈尔滨工程大学 一维深度卷积网络的水下多目标识别方法
CN107180247A (zh) * 2017-05-19 2017-09-19 中国人民解放军国防科学技术大学 基于选择性注意力卷积神经网络的关系分类器及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682574A (zh) * 2016-11-18 2017-05-17 哈尔滨工程大学 一维深度卷积网络的水下多目标识别方法
CN107180247A (zh) * 2017-05-19 2017-09-19 中国人民解放军国防科学技术大学 基于选择性注意力卷积神经网络的关系分类器及其方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MD. MONIRUZZAMAN等: "Deep Learning on Underwater Marine Object Detection: A Survey", 《ADVANCED CONCEPTS FOR INTELLIGENT VISION SYSTEMS》 *
梁斌等: "基于多注意力卷积神经网络的特定目标情感分析", 《计算机研究与发展》 *
王念滨等: "基于卷积神经网络的水下目标特征提取方法", 《***工程与电子技术》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299396B (zh) * 2018-11-28 2020-11-06 东北师范大学 融合注意力模型的卷积神经网络协同过滤推荐方法及***
CN109299396A (zh) * 2018-11-28 2019-02-01 东北师范大学 融合注意力模型的卷积神经网络协同过滤推荐方法及***
CN109344920A (zh) * 2018-12-14 2019-02-15 汇纳科技股份有限公司 顾客属性预测方法、存储介质、***及设备
CN109344920B (zh) * 2018-12-14 2021-02-02 汇纳科技股份有限公司 顾客属性预测方法、存储介质、***及设备
CN109376804A (zh) * 2018-12-19 2019-02-22 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN109376804B (zh) * 2018-12-19 2020-10-30 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN109902399A (zh) * 2019-03-01 2019-06-18 哈尔滨理工大学 一种基于att-cnn的变工况下滚动轴承故障识别方法
CN109902399B (zh) * 2019-03-01 2022-07-19 哈尔滨理工大学 一种基于att-cnn的变工况下滚动轴承故障识别方法
CN110222574A (zh) * 2019-05-07 2019-09-10 杭州智尚云科信息技术有限公司 基于结构化双流卷积神经网络的生产操作行为识别方法、装置、设备、***及存储介质
CN110222574B (zh) * 2019-05-07 2021-06-29 杭州智尚云科信息技术有限公司 基于结构化双流卷积神经网络的生产操作行为识别方法、装置、设备、***及存储介质
CN110110796A (zh) * 2019-05-13 2019-08-09 哈尔滨工程大学 一种基于深度学习的海上船舶时序数据的分析方法
CN110110796B (zh) * 2019-05-13 2020-12-18 哈尔滨工程大学 一种基于深度学习的海上船舶时序数据的分析方法
CN110490892A (zh) * 2019-07-03 2019-11-22 中山大学 一种基于USFaster R-CNN的甲状腺超声图像结节自动定位识别方法
CN111401548A (zh) * 2020-03-03 2020-07-10 西北工业大学 一种基于深度学习的Lofar线谱检测方法
CN111401548B (zh) * 2020-03-03 2022-03-22 西北工业大学 一种基于深度学习的Lofar线谱检测方法
CN111652041A (zh) * 2020-04-14 2020-09-11 河北地质大学 基于深度子空间聚类的高光谱波段选择方法、设备和装置
US11681914B2 (en) 2020-05-08 2023-06-20 International Business Machines Corporation Determining multivariate time series data dependencies
CN113222899A (zh) * 2021-04-15 2021-08-06 浙江大学 一种基于深度学习通过ct的检测分割分类肝脏肿瘤的方法
CN113888430A (zh) * 2021-09-30 2022-01-04 北京达佳互联信息技术有限公司 图像处理方法和装置以及模型训练方法和装置

Similar Documents

Publication Publication Date Title
CN108875592A (zh) 一种基于注意力的卷积神经网络优化方法
Doan et al. Underwater acoustic target classification based on dense convolutional neural network
CN110807365B (zh) 一种基于gru与一维cnn神经网络融合的水下目标识别方法
Mielke et al. A method for automated individual, species and call type recognition in free-ranging animals
CN109473120A (zh) 一种基于卷积神经网络的异常声音信号识别方法
CN109493874A (zh) 一种基于卷积神经网络的生猪咳嗽声音识别方法
CN109800700A (zh) 一种基于深度学习的水下声信号目标分类识别方法
CN110148408A (zh) 一种基于深度残差的中文语音识别方法
CN110111797A (zh) 基于高斯超矢量和深度神经网络的说话人识别方法
JP2016502140A (ja) 音/母音/音節境界検出のための聴覚的注意合図と音素事後確率スコアの組み合わせ
CN109637522A (zh) 一种基于语谱图提取深度空间注意特征的语音情感识别方法
CN108520753A (zh) 基于卷积双向长短时记忆网络的语音测谎方法
CN111583964A (zh) 一种基于多模深度特征学习的自然语音情感识别方法
Wei et al. A method of underwater acoustic signal classification based on deep neural network
CN109559755A (zh) 一种基于dnn噪声分类的语音增强方法
Ibrahim et al. Transfer learning for efficient classification of grouper sound
CN110287770A (zh) 一种基于卷积神经网络的水中个体目标匹配识别方法
CN115294994A (zh) 一种真实环境中的鸟类鸣声自动识别***
Schröter et al. Segmentation, classification, and visualization of orca calls using deep learning
Yang et al. Classification of odontocete echolocation clicks using convolutional neural network
CN117275510A (zh) 一种基于多梯度流网络的小样本水声目标识别方法及***
Mohebbi-Kalkhoran et al. Classifying humpback whale calls to song and non-song vocalizations using bag of words descriptor on acoustic data
Oswald et al. Detection and classification methods for animal sounds
Buchanan et al. Deep convolutional neural networks for detecting dolphin echolocation clicks
Xiao et al. AMResNet: An automatic recognition model of bird sounds in real environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination