CN109886214A - 一种基于图像处理的鸟鸣声特征强化方法 - Google Patents

一种基于图像处理的鸟鸣声特征强化方法 Download PDF

Info

Publication number
CN109886214A
CN109886214A CN201910139801.9A CN201910139801A CN109886214A CN 109886214 A CN109886214 A CN 109886214A CN 201910139801 A CN201910139801 A CN 201910139801A CN 109886214 A CN109886214 A CN 109886214A
Authority
CN
China
Prior art keywords
spectrogram
chirm
image
noise
birds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910139801.9A
Other languages
English (en)
Inventor
杨春勇
祁宏达
侯金
陈少平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South Central Minzu University
Original Assignee
South Central University for Nationalities
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South Central University for Nationalities filed Critical South Central University for Nationalities
Priority to CN201910139801.9A priority Critical patent/CN109886214A/zh
Publication of CN109886214A publication Critical patent/CN109886214A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像处理的鸟鸣声特征强化方法,涉及图像处理、深度学习和鸟类识别技术。本方法是:①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;②对频谱图进行信噪分离,得到信号谱图和噪声谱图;③对所有频谱图进行分块;④对分块后的信号谱图进行数据增强:⑤通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像;⑥通过迁移学习方式,得到识别结果。本发明的有益效果是:①用于高效地进行鸟类自动识别;②通过将一维时域的鸟鸣声信号转换为二维时频域的生物频谱信息;③图像处理包括:鸟鸣声信噪分离、特异性数据增强和视觉感知力增强,为深度学习在鸟类自动识别领域的探索更进一步。

Description

一种基于图像处理的鸟鸣声特征强化方法
技术领域
本发明涉及图像处理、深度学习和鸟类识别技术领域 ,特别是涉及一种基于图像处理的鸟鸣声特征强化方法。
背景技术
生物多样性是人类赖以生存的条件,是社会可持续发展的战略资源,是生态安全和粮食安全的重要保障。由于分布范围广、研究资料齐全和对环境的敏感性,鸟类是生物多样性的重要指示类群。掌握鸟类种群现状及其动态变化信息,对保护和评估生态***都具有重要意义。鸟类鸣声多种多样,包含了重要的行为意义、物种特异性和丰富的生物学信息,同时也是对其进行物种识别的主要手段。鸟鸣声的分类学意义,目前已成为鸟声研究与鸟类***分类学研究交叉的热点。
生物频谱作为声景观生态学理论分析的重要组成部分,是监测、研究和分析生态***多样性的重要途径。利用适当的方法对其进行分析能够充分展现声音的时频特性,从而有效地识别出生物的差异性。鸟鸣声谱图作为研究鸟的物种属性的重要途径,其频谱分析对鸟类多样性监测至关重要。
深度学习是目前机器学习学科发展最蓬勃的分支,也是整个人工智能领域中应用前景最为广阔的技术。随着深度学习在计算机视觉领域的不断突破,运用其处理图像识别任务已成为一种高效且专业的技术。在该技术背景的支持下,本发明结合鸟鸣声特性,对鸟鸣声谱图进行了针对性的处理。
发明内容
本发明旨在提供一种基于图像处理的鸟鸣声特征强化方法,以解决现有技术在识别过程中的鸣声特征不突出、噪声干扰严重和生物频谱信息不全面的问题。
为实现上述目的,本发明的技术方案为:
具体地说,一种基于图像处理的鸟鸣声特征强化方法包括以下步骤:
①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;
②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;
③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;
④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:
⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;
⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。
相较于现有技术,本发明的有益效果是:
①针对自然复杂声学环境下基于鸟鸣声的物种分类问题,提出一种基于图像处理的鸟鸣声特征强化方法;缓解了鸟鸣声在识别过程中的背景噪声高、鸣声特征不突出、鸣声数据不平衡和生物频谱信息不全面等问题,用于高效地进行鸟类自动识别;
②通过将一维时域的鸟鸣声信号转换为二维时频域的生物频谱信息,再灵活运用一系列图像处理的方法突显频谱图中的鸟鸣声特征,增强生物频谱信息的可视化呈现,并能通过深度学习的方法得以验证;
③图像处理包括:鸟鸣声信噪分离、特异性数据增强和视觉感知力增强;本发明区别于一般可视化任务的图像分类方法,始终围绕各个识别环节中鸟鸣声特征的呈现,做出针对性强的图像处理策略,为深度学习在鸟类自动识别领域的探索更进一步。
附图说明
图1为本方法的流程图。
具体实施方式
一、方法
1、鸟鸣声信噪分离
步骤②对频谱图进行信噪分离,得到信号谱图和噪声谱图;
信号谱图的分离方法为:设定一个阈值N,如果频谱图中某个像素值高于相应行及其相应列的中值的N倍,则将其置为1,否则置为0;
噪声谱图的分离方法为:设定一个阈值n(n<N),如果某个像素值高于相应行及其相应列的中值的n倍,则将其置为0,否则置为1。
2、特异性数据增强
步骤④对分块后的信号谱图进行数据增强,包括频域变换、噪声添加和同类样本混合;
A、频域变换
a、对原始鸟鸣声音频的音高进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
b、对原始鸟鸣声音频的音量进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
B、噪声添加
a、将随机高斯噪声添加到步骤②中的信号谱图,并重新标准化得到的图像;
b、将步骤②中的噪声部分随机添加到步骤②中的信号谱图,作为训练样本;
C、同类样本混合
对同一种鸟的不同音频信噪分离后的信号谱图进行随机混合。
3、视觉感知力增强
为进一步增强灰度图像的视觉感知力,同时考虑到迁移学习对模型输入前数据维度的限定,通过Jet映射进行伪彩色处理,增加不同强度区域之间的对比度以提高识别性能。不同区域分别映射成红、绿、蓝三个单色图像,并对应高、中、和低功率频谱信息,红色表示最高能量的声音特性,近似为鸣唱/鸣叫特性。
根据上述鸟鸣声频谱图的图像处理方法,选取混合模型SE-ResNeXt-50进行迁移学习可以从大量鸟鸣声谱图中得到精确高效的识别结果。
二、实施例
本方法是将一维时域的鸟鸣声信号转换为二维时频域的生物频谱信息,再灵活运用一系列图像处理的方法突显频谱图中的鸟鸣声特征,相较于一般通用的图像识别方法,本发明更具针对性和识别高效性。
实验数据来源于Xeno-Canto数据库,该数据库大多数音频文件采样率为44.1kHz,16bit,单声道,也作为前期数据格式的统一标准。
①对已知的鸟鸣声数据集进行预处理,重采样为44.1kHz采样率,使用具有汉宁窗函数的短时傅里叶变换(STFT)计算鸟鸣声的频谱图,并对频谱图进行最大值归一化,使频谱信息的动态范围映射到[0,1]范围内,然后将频谱图处理为灰度图像。
②对频谱图进行信噪分离:信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分;大多数的鸟鸣声音频中,前景鸟鸣声信号的幅度高于背景噪声;我们利用这一规律降低背景噪声以分离出信号谱图:设定一个阈值N,如果频谱图中某个像素值高于相应行及其相应列的中值的N倍,则将其置为1,否则置为0。这种做法近似凸显了频谱图中所有重要的鸟鸣声信号,因为高振幅通常对应于鸟类的鸣唱或鸣叫;同时不同频率区域中的噪声水平得到补偿和缩减,由不可控因素的背景噪声所造成的宽带失真被衰减;
对于该步骤产生的背景噪声,应用二进制腐蚀和膨胀滤波器来消除噪声和连接段,或结合部分图像形态学处理的手段;
对于噪声谱图的分离,我们遵循相似的步骤:设定一个阈值n(n<N),如果某个像素值高于相应行及其相应列的中值的n倍,则将其置为0,否则置为1;与信号谱图的分离步骤之所以采用不同的阈值,是因为阈值N已经是为了凸显信号部分适当做出的过量选择,我们希望为此提供一个安全的缓减余地,处在该缓冲区的信号既不具备清晰的鸣声特征,也不影响后续用于进行数据增强的噪声部分的信息量;
综上,未被选为信号或噪声谱图的所有内容几乎不向后续的神经网络提供任何有效信息。
③对信噪分离后的信号谱图和噪声谱图进行分块,考虑到后续迁移学习用到的神经网络模型,将每一块裁剪到299×299像素;
④对分块后的灰度谱图进行数据增强,数据增强技术能够缓解数据集中普遍存在的部分鸟鸣声数据稀少和不同鸟类之间出现数据严重失衡的情况;而且通过丰富训练数据集,能够减轻模型训练过程中的过拟合,增强模型的泛化能力;不同于普通图像的常用数据增强手段,针对鸟鸣声的频谱图的时频特性,本发明采用如下技术进行数据增强:
(1)频域变换:包括对输入的原始鸟鸣声音频的音高和音量进行随机改变,变动幅度不超过5%;
(2)噪声添加:噪声包括噪声样本和随机高斯噪声;在步骤②的时候,鸟鸣声被分成信号谱图和噪声谱图,可以随机选择噪声部分的样本,将其添加到信号谱图的训练样本中,该步骤能改善分类结果并加快整个训练过程;随机高斯噪声同样也能帮助神经网络凸显图像特征,该步骤能还原真实情况下的背景噪声,有助于帮助模型学习噪声的特性,甚至能够抵抗现实中的噪声源;
(3)同类样本混合:自然环境下,经常会出现多只鸟同时鸣唱/鸣叫,为模拟这一真实情况,添加同一种鸟不同音频的频谱图,并随机组合;该步骤不会影响样本标签的分布,并且能够提高模型的收敛速度,增加识别精确度。
⑤为进一步增强信号部分灰度图像的视觉感知力,增加不同强度区域之间的对比度以提高识别性能,通过Jet映射对其进行伪彩色处理。即量化频谱图的动态范围到不同区域,不同区域分别映射成红、绿、蓝三个单色图像,并对应高、中、和低功率频谱信息,红色表示最高能量的声音特性,即鸣唱/鸣叫特性;这一步骤的另一主要目的是转换灰度频谱图为三通道RGB图像,以作为后续神经网络的输入。最后将得到的三通道RGB子图像分为训练集和测试集,训练集和测试集的比例为4:1;
⑥以上为基于图像处理的鸟鸣声识别方法的主要内容,为体现出和现有技术特别是常规图像分类方法的优异性,本发明不对后续的神经网络做过多处理,采取视觉任务中常见的迁移学习方法;选用2017ILSVR竞赛中取得冠军的图像识别结构Squeeze-and-Excitation Networks(SENeT),它通过对特征通道间的相关性进行建模,强化重要通道的特征,弱化非重要通道的特征,本发明认为这一思路吻合处理带噪鸟鸣声数据时的“突显鸟鸣声,抑制噪声”想法;
因此,最终选择混合模型SE-ResNeXt-50,对其进行微调,冻结神经网络的前几层权重,并结合需要识别鸟类的种数重新定义全连接层,得到预训练模型。通过将用于测试的80%的三通道RGB子图像输入到预训练模型中进行训练,保留神经网络参数得到识别模型,再将剩余的20%的三通道RGB子图像用于预测模型准确率,得到识别结果。
以上所述,仅为本发明较佳的具体实施方式,并非对本发明做任何形式上的限制,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作出的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (3)

1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:
①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;
②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;
③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;
④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:
⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;
⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。
2.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤②:
信号谱图的分离方法为:设定一个阈值N,如果频谱图中某个像素值高于相应行及其相应列的中值的N倍,则将其置为1,否则置为0;
噪声谱图的分离方法为:设定一个阈值n(n<N),如果某个像素值高于相应行及其相应列的中值的n倍,则将其置为0,否则置为1。
3.按权利要求1所述的鸟鸣声特征强化方法,其特征在于步骤④:
包括频域变换、噪声添加和同类样本混合;
A、频域变换
a、对原始鸟鸣声音频的音高进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
b、对原始鸟鸣声音频的音量进行随机改变,变动幅度不宜超过5%,然后重复步骤①②③;
B、噪声添加
a、将随机高斯噪声添加到步骤②中的信号谱图,并重新标准化得到的图像;
b、将步骤②中的噪声部分随机添加到步骤②中的信号谱图,作为训练样本;
C、同类样本混合
对同一种鸟的不同音频信噪分离后的信号谱图进行随机混合。
CN201910139801.9A 2019-02-26 2019-02-26 一种基于图像处理的鸟鸣声特征强化方法 Withdrawn CN109886214A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910139801.9A CN109886214A (zh) 2019-02-26 2019-02-26 一种基于图像处理的鸟鸣声特征强化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910139801.9A CN109886214A (zh) 2019-02-26 2019-02-26 一种基于图像处理的鸟鸣声特征强化方法

Publications (1)

Publication Number Publication Date
CN109886214A true CN109886214A (zh) 2019-06-14

Family

ID=66929354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910139801.9A Withdrawn CN109886214A (zh) 2019-02-26 2019-02-26 一种基于图像处理的鸟鸣声特征强化方法

Country Status (1)

Country Link
CN (1) CN109886214A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127360A (zh) * 2019-12-20 2020-05-08 东南大学 一种基于自动编码器的灰度图像迁移学习方法
CN111178699A (zh) * 2019-12-15 2020-05-19 贵州电网有限责任公司 一种调度操作票智能校核***构建方法
CN111449644A (zh) * 2020-03-19 2020-07-28 复旦大学 一种基于时频变换和数据增强技术的生物电信号分类方法
CN112560673A (zh) * 2020-12-15 2021-03-26 北京天泽智云科技有限公司 一种基于图像识别的雷声检测方法及***
CN112617789A (zh) * 2020-07-28 2021-04-09 上海大学 激光散斑血流成像方法及***
WO2021195967A1 (zh) * 2020-03-31 2021-10-07 深圳市大疆创新科技有限公司 一种图像处理方法、设备、控制终端及可移动平台
CN113591561A (zh) * 2021-06-18 2021-11-02 新绎健康科技有限公司 一种基于声谱图进行身份识别的方法及***
CN113643194A (zh) * 2021-06-25 2021-11-12 陕西西宇无损检测有限公司 高灰阶焊缝底片图像伪彩色显示方法
CN113889124A (zh) * 2021-11-08 2022-01-04 国网山东省电力公司乳山市供电公司 一种基于语音识别的输电线路防鸟平台
CN113900147A (zh) * 2020-07-06 2022-01-07 中国石油天然气股份有限公司 沙丘鸣震压制方法及***
CN117727309A (zh) * 2024-02-18 2024-03-19 百鸟数据科技(北京)有限责任公司 基于tdnn结构的鸟鸣物种自动识别方法
CN117727332A (zh) * 2024-02-18 2024-03-19 百鸟数据科技(北京)有限责任公司 基于语谱特征分析的生态种群评估方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624652A (zh) * 2011-01-27 2012-08-01 日电(中国)有限公司 Ldpc解码方法和装置及接收终端
CN103474072A (zh) * 2013-10-11 2013-12-25 福州大学 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法
CN104658538A (zh) * 2013-11-18 2015-05-27 中国计量学院 一种基于鸟鸣声的移动式鸟类识别方法
US9367887B1 (en) * 2013-09-05 2016-06-14 Google Inc. Multi-channel audio video fingerprinting
US20170142515A1 (en) * 2015-09-21 2017-05-18 Northeastern Univerisity Systems and methods for monitoring and classifying marine animals based on acoustic signals
CN108898164A (zh) * 2018-06-11 2018-11-27 南京理工大学 一种基于特征融合的鸟鸣自动识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624652A (zh) * 2011-01-27 2012-08-01 日电(中国)有限公司 Ldpc解码方法和装置及接收终端
US9367887B1 (en) * 2013-09-05 2016-06-14 Google Inc. Multi-channel audio video fingerprinting
CN103474072A (zh) * 2013-10-11 2013-12-25 福州大学 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法
CN104658538A (zh) * 2013-11-18 2015-05-27 中国计量学院 一种基于鸟鸣声的移动式鸟类识别方法
US20170142515A1 (en) * 2015-09-21 2017-05-18 Northeastern Univerisity Systems and methods for monitoring and classifying marine animals based on acoustic signals
CN108898164A (zh) * 2018-06-11 2018-11-27 南京理工大学 一种基于特征融合的鸟鸣自动识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GUIFENG93: "数据增强 总结", 《HTTPS://BLOG.CSDN.NET/GUIFENG93/ARTICLE/DETAILS/87625745》 *
HONGYI ZHANG 等: "mixup: BEYOND EMPIRICAL RISK MINIMIZATION", 《ICLR 2018》 *
MARIO LASSECK: "Audio-based Bird Species Identification with Deep Convolutional Neural Networks", 《HTTPS://WWW.RESEARCHGATE.NET/PUBLICATION/338422871》 *
谢将剑 等: "基于Chirplet语图特征和深度学习的鸟类物种识别方法", 《北京林业大学学报》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111178699A (zh) * 2019-12-15 2020-05-19 贵州电网有限责任公司 一种调度操作票智能校核***构建方法
CN111127360A (zh) * 2019-12-20 2020-05-08 东南大学 一种基于自动编码器的灰度图像迁移学习方法
CN111127360B (zh) * 2019-12-20 2023-08-29 东南大学 一种基于自动编码器的灰度图像迁移学习方法
CN111449644A (zh) * 2020-03-19 2020-07-28 复旦大学 一种基于时频变换和数据增强技术的生物电信号分类方法
WO2021195967A1 (zh) * 2020-03-31 2021-10-07 深圳市大疆创新科技有限公司 一种图像处理方法、设备、控制终端及可移动平台
CN113900147B (zh) * 2020-07-06 2024-05-28 中国石油天然气股份有限公司 沙丘鸣震压制方法及***
CN113900147A (zh) * 2020-07-06 2022-01-07 中国石油天然气股份有限公司 沙丘鸣震压制方法及***
CN112617789A (zh) * 2020-07-28 2021-04-09 上海大学 激光散斑血流成像方法及***
CN112560673A (zh) * 2020-12-15 2021-03-26 北京天泽智云科技有限公司 一种基于图像识别的雷声检测方法及***
CN113591561A (zh) * 2021-06-18 2021-11-02 新绎健康科技有限公司 一种基于声谱图进行身份识别的方法及***
CN113643194A (zh) * 2021-06-25 2021-11-12 陕西西宇无损检测有限公司 高灰阶焊缝底片图像伪彩色显示方法
CN113889124A (zh) * 2021-11-08 2022-01-04 国网山东省电力公司乳山市供电公司 一种基于语音识别的输电线路防鸟平台
CN117727332A (zh) * 2024-02-18 2024-03-19 百鸟数据科技(北京)有限责任公司 基于语谱特征分析的生态种群评估方法
CN117727309B (zh) * 2024-02-18 2024-04-26 百鸟数据科技(北京)有限责任公司 基于tdnn结构的鸟鸣物种自动识别方法
CN117727332B (zh) * 2024-02-18 2024-04-26 百鸟数据科技(北京)有限责任公司 基于语谱特征分析的生态种群评估方法
CN117727309A (zh) * 2024-02-18 2024-03-19 百鸟数据科技(北京)有限责任公司 基于tdnn结构的鸟鸣物种自动识别方法

Similar Documents

Publication Publication Date Title
CN109886214A (zh) 一种基于图像处理的鸟鸣声特征强化方法
US20200159490A1 (en) Method, system and artificial neural network
CN105023573B (zh) 使用听觉注意力线索的语音音节/元音/音素边界检测
CN105488466B (zh) 一种深层神经网络和水声目标声纹特征提取方法
CN110136731A (zh) 空洞因果卷积生成对抗网络端到端骨导语音盲增强方法
CN101819638B (zh) 色情检测模型建立方法和色情检测方法
Zacharakis et al. An interlanguage unification of musical timbre: Bridging semantic, perceptual, and acoustic dimensions
CN107609488A (zh) 一种基于深度卷积网络的舰船噪声识别分类方法
CN109524020A (zh) 一种语音增强处理方法
CN109065072A (zh) 一种基于深度神经网络的语音质量客观评价方法
CN106469560A (zh) 一种基于无监督域适应的语音情感识别方法
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
NO20015723D0 (no) Forbedring av kunnskapsoppdagelse fra multiple datasett ved å bruke flere stötte-vektormaskiner
Kadandale et al. Multi-channel u-net for music source separation
CN110288568A (zh) 眼底图像处理方法、装置、设备和存储介质
CN110163855B (zh) 一种基于多路深度卷积神经网络的彩色图像质量评价方法
CN113111786A (zh) 基于小样本训练图卷积网络的水下目标识别方法
CN111667805B (zh) 一种伴奏音乐的提取方法、装置、设备和介质
Reghunath et al. Transformer-based ensemble method for multiple predominant instruments recognition in polyphonic music
CN112365344B (zh) 一种业务规则自动生成方法和***
Liu et al. Research on the Correlation Between the Timbre Attributes of Musical Sound and Visual Color
CN115472179A (zh) 面向数字音频删除和***篡改操作自动检测方法及***
Liu et al. Sound Transformation: Applying Image Neural Style Transfer Networks to Audio Spectograms
CN115910091A (zh) 引入基频线索的生成式语音分离方法和装置
Hamadicharef et al. Intelligent and perceptual-based approach to musical instruments sound design

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190614