CN111414832B - 一种基于鲸豚类低频水声信号的实时在线识别分类*** - Google Patents

一种基于鲸豚类低频水声信号的实时在线识别分类*** Download PDF

Info

Publication number
CN111414832B
CN111414832B CN202010180238.2A CN202010180238A CN111414832B CN 111414832 B CN111414832 B CN 111414832B CN 202010180238 A CN202010180238 A CN 202010180238A CN 111414832 B CN111414832 B CN 111414832B
Authority
CN
China
Prior art keywords
frequency
fundamental frequency
signal
time
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010180238.2A
Other languages
English (en)
Other versions
CN111414832A (zh
Inventor
王志陶
王克雄
王丁
段鹏翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Hydrobiology of CAS
Original Assignee
Institute of Hydrobiology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Hydrobiology of CAS filed Critical Institute of Hydrobiology of CAS
Priority to CN202010180238.2A priority Critical patent/CN111414832B/zh
Publication of CN111414832A publication Critical patent/CN111414832A/zh
Application granted granted Critical
Publication of CN111414832B publication Critical patent/CN111414832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

本发明公开了一种基于鲸豚类低频水声信号的实时在线识别分类***,包括信号采集、微处理器、无线传输、终端显示模块。本发明将水声信号通过降脉冲干扰权重函数、信号三维声谱图转换、频率和时间维度迭代降噪、三维声谱图阈值过滤、基频轮廓构建、基频抗混叠处理、谐波信号提取得到独立三维水声时频域信号的基频以及谐波信号;通过参数提取并结合信号分类模型得到各个三维时频域信号基频的频率、定量、时间参数和对应的声谱类型及谐波的谐波参数。通过三类参数获取方式构建鲸豚类型比对数据集,将确定声谱类型后的三维水声时频域信号的基频和谐波参数和比对数据集在相应声谱类型的基频和谐波参数的分布范围进行比对,识别目标鲸豚类型。

Description

一种基于鲸豚类低频水声信号的实时在线识别分类***
技术领域
本发明涉及野生动物保护技术领域,具体是一种基于鲸豚类低频水声信号的实时在线识别分类***。
背景技术
在我国,所有的齿鲸类的保护等级都不低于国家二级。同时大多数鲸类都分布在淡水河流生态***或者河口及海洋近岸浅水区域。例如我国的国家二级保护动物-长江江豚仅生活在长江中下游干流和鄱阳湖以及洞庭湖中,我国的国家一级保护动物-中华白海豚在我国仅分布在河口和近岸水域。而这些淡水水域和海洋近岸水域的人类活动,例如渔业活动、航运交通和涉水工程都非常活跃,相关活动对鲸类的威胁不容乐观。
鲸类在长期的进化过程中发展并完善了自身的声呐***。鲸类的声呐信号可分为用于探测用的高频回声定位信号以及主要是用于个体间交流和情感表达的通讯信号。鲸类的高频声呐信号的峰值频率通常会超过100kHz,同时声呐信号自身的指向性较强,具体而言,其主轴上记录的声呐信号通常比非主轴上记录到的声信号要高几十分贝。同时高频声呐信号在水体传播过程中所面临的声学衰减是非常严重的,研究人员对高频声呐信号的监测距离通常在几十米到几百米之间。与之相反,低频通讯信号的频率通常在几十赫兹到几十千赫兹之间,此外,通讯信号的指向性较低,同时通讯信号在水体中传播所遭受的声学衰减较低,研究人员对鲸类低频通讯信号的监测范围通常能达到数千米,甚至能在几十千米外的水体接收到须鲸的通讯信号。此外由于高频声呐信号的高频特征,相应的对用来对其进行有效监测的声学录音设备的性能,例如监测仪器的数据处理模块、模数转换性能、采样率以及内存都要求较高,而在低频通讯信号的监测中,对声学设备在相关性能上的要求没有这么高。可见,相比较于鲸类的高频声呐信号而言,鲸类的低频通讯信号更适合用于对鲸类在特定水域的栖息地活动规律进行监测。
然而基于传统的声学监测手段获得的鲸类监测结果在时间上都存在或多或少的滞后性,例如野外长期定点声学监测,通常会将自容式的声学记录仪布设在野外进行持续监测,经过一段时间后,再将录音设备回收并将数据导入电脑,然后对下载后的声学数据进行分析并获得鲸类的声呐活动规律,即便是短期移动声学考察,通常也存在信号记录和信号分析相独立的情况,即信号分析通常会在野外信号记录结束并将数据带回实验室后才进行。此外鲸类通讯信号的传统监测方法是通过人工监听声音文件或者目视检查声音信号的声谱图进行手动识别。而对于大数据,尤其是对于那种持续不间断的监测模式而言,信号的人工挑选就变得不契实际。研发高效的鲸类通讯信号自动识别算法并实现对鲸类声呐信号进行自动识别的需求就变得十分迫切。
绝大多数鲸类物种的保护程度都不容乐观,如何及时有效的对这些鲸类物种进行实时监测并根据回传的实时预警信息对相应水域的人类活动的范围和程度做出及时的调整来降低人类活动对鲸类的潜在影响就变得十分重要。
发明内容
本发明的目的在于提供一种基于鲸豚类低频水声信号的实时在线识别分类***,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
本发明装置的技术方案为一种基于鲸豚类低频水声信号的实时在线识别分类装置,其特征在于,包括:水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块、终端显示模块;
所述的水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块通过有线方式依次串联连接;所述无线传输模块与所述终端显示模块通过无线方式连接;
所述水听器用于采集水声信号;所述滤波器用于对水声信号进行滤波得到滤波后水声信号;所述放大器用于对滤波后水声信号进行放大得到放大后水声信号;所述信号采集卡用于对放大后水声信号进行模数转换采样得到水声数字信号,并将水声数字信号传输至所述微处理器;所述微处理器根据水声数字信号,通过所述基于鲸豚类低频通讯信号的实时在线监测预警方法得到鲸豚监测结果,将鲸豚监测结果通过所述无线传输模块无线传输至所述终端显示模块进行显示;
所述终端显示模块包括移动客户端和实验室客户端;
所述移动客户端可以通过安装开发的鲸类实时在线监测***APP,获得目标鲸类的实时监测信息并实现实时预警功能;
所述实验室客户端可以供专业机构的科研人员进行鲸类通讯信号的深度分析和相关研究和保护工作。
本发明方法的技术方案为一种基于鲸豚类低频水声信号的实时在线识别分类方法,具体包括以下步骤:
步骤1:将水声数字信号通过降脉冲干扰权重函数进行降噪得到降噪后水声数字信号,通过信号声谱图转换得到水声三维时频域信号,通过频率维度迭代降噪、时间维度迭代降噪得到降噪后水声时频域信号,通过声谱图阈值过滤得到过滤后的水声时频域信号,通过基频轮廓构建、基频抗混叠处理、谐波信号提取实现独立频谱提取,得到经抗混叠处理后三维水声时频域信号的基频以及基频所对应的谐波信号;
步骤2:三维水声时频域信号经抗混叠处理后的基频通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数,进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型;
步骤3:通过第一参数获取方式、第二参数获取方式、第三参数获取方式构建鲸豚类型比对数据集,根据鲸豚类型比对数据集分别构建基频的频率参数分布范围、基频的定量参数分布范围、基频的时间参数分布范围、基频所对应的谐波信号的谐波参数分布范围,结合三维水声时频域信号经抗混叠处理后的基频的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数、声谱类型,识别目标鲸豚类型;
作为优选,步骤1中所述水声数字信号为:
Sig(j,i)j∈[1,M],i∈[1,N]
N=fs×t
其中,M为采样周期的数量,N为采样周期内采样点的数量,Sig(j,i)为第j个采样周期内第i个水声数字信号采样值,fs为信号的采样率,t为采用周期的时长;
步骤1所述通过降脉冲干扰权重函数为:
W(j,i)=1+[(Sig(j,i)-media(Sig(j.))/(QR(Sig(j.))×θ)]6(i∈[1,N])
media(Sig(j.)=P[Sig(j.),50]
QR(Sig(j.)=(P[Sig(j.),75]-P[Sig(j.),25])/2
Sigw(j,i)=Sig(j,i)/W(j,i)
其中,W(j,i)为第j个采样周期内第i个水声数字信号采样值的权重值,Sig(j.)为第j个采样周期内的所有的信号,media(Sig(j.))为Sig(j.)的中位数,P[Sig(j.),50]为将
Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第N/2+1个点的值,如果信号的长度N为偶数,那么就是排序后的第N/2和N/2+1个点的平均值,QR(Sig(j.))为Sig(j.)的四分位数间距,θ为设点的阈值,N为采样周期内采样点的数量,P[Sig(j.),25]为将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.25N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.25N和0.25N+1个点的平均值,P[Sig(j.),75]为所将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在75%的位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.75N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.75N和0.75N+1个点的平均值,Sigw(j,i)为第j个采样周期内第i个水声数字信号采样值经权重处理后结果,P代表信号的排序的百分位置;
步骤1所述通过信号三维声谱图转换得到水声时频域信号为:
步骤1降噪后水声数字信号通过傅里叶窗函数变换得到水声频域信号:
Figure GDA0002501633600000031
S0(j,p,q)=S0[j(p),q,Fsigw[j(p),q]]
Δf=Δq=fs/nfft
Δt=Δj(p)=nfft×K×(1-r)/fs
其中,j(p)为第j个采样周期中的第p个傅里叶窗变换,同时,它还是三维时频域信号的时间维度参数,q为三维时频域信号的频率维度参数,Fsigw[j(p),q]为Sigw(j(p),i(s))经过傅里叶变换后的结果,即时间和频率分别在j(p)和q的傅里叶变换结果,i′代表第j个采样周期中的第p个傅里叶窗变换中的第i′个点,K表示每次进行傅里叶窗转换的信号总点数,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,S0为通过傅里叶窗函数变换得到的三维水声时频域信号,它包括时间维度j(p),频率维度q和在该时间维度和频率维度下的傅里叶转换结果Fsigw[j(p),q],fs为信号的采样频率,nfft为傅里叶窗函数的长度,Δf为时频域信号的频率分辨率,Δt为时频域信号的时间分辨率,N为每个采样周期内采样点的数量,Δq表示参数q的变化率,Δj(p)表示参数j(p)的变化率;
步骤1所述频率维度迭代降噪的模型为:
Figure GDA0002501633600000041
Figure GDA0002501633600000042
Figure GDA0002501633600000043
S1(j,p,q)=S1[j(p),q,log P sigw l[j(p),q]]
其中,logPsigw[j(p),q]为傅里叶转换结果(Fsigw[j(p),q])经对数转换后的能量水平,logPsigw1[j(p),q]代表经过频率维度降噪后的能量水平信号,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,nfft为傅里叶窗函数的长度,S1(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过频率维度降噪后的能量水平信号即log P sigw1[j(p),q];
步骤1所述时间维度迭代降噪的模型为:
Figure GDA0002501633600000044
S2(j,p,q)=S2[j(p),q,log P sigw2[j(p),q]]
其中,logPsigw2[j(p),q]代表经过时间维度降噪处理后的水声时频域信号的能量分布信号,φ代表时间维度降噪函数的降噪系数,通常取值为0.05,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,nfft为傅里叶窗函数的长度,S2(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过时间维度降噪处理后的水声时频域信号的能量分布信号即log P sigw1[j(p),q];
步骤1所述通过声谱图阈值过滤得到水声时频域信号:
Figure GDA0002501633600000045
S3(j,p,q)=S3[j(p),q,log P sigw3[j(p),q]]
其中,logPsigw3[j(p),q]为经过阈值过滤后的水声时频域信号的能量分布信号,α为设定的时频域信号的能量阈值,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,S3(j,p,q)为经过声谱图阈值过滤得到三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过阈值过滤后的水声时频域信号的能量分布信号即log P sigw1[j(p),q];
步骤1所述基频轮廓为:
C[j(k′),j(k′)(m)]=S3[j(p),q,logPsigw3[j(p),q]](k′∈[1,N′],j(k′)∈[j(p),j(p)+N′(j(k′)))],j(k′)(m)∈[1,N′(j(k′))])
C3≥a
ΔC2≤Δq
其中,j(k′)代表第j个采样周期中的第k′个基频的频谱,j(k′)(m)代表第j个采样周期中的第k′个基频的频谱的第m个点,C[j(k′),j(k′)(m)]代表三维水声时频域信号在第j个采样周期中的第k′个基频的频谱的第m个点,N′表示三维水声时频域信号在第j个采样周期中的所有的基频频谱的条数,j(p)表示第j个采样周期中的第p个傅里叶窗变换,N′(j(k′))表示第j个采样周期中的第k′个基频的频谱中所包含的位点数的最大位点数目,C3表示三维水声时频域信号的第三维度的值,即三维水声时频域信号的能量值,C2表示三维水声时频域信号的第二维度的值,即频率维度值,ΔC2代表三维水声时频域信号的频率变化率,α为设定的时频域信号的能量阈值;
步骤1所述基频的抗混叠处理是对声谱轮廓线发生交叉或者重叠情况进行的处理,具体为:
C1[j(k″),j(k″)(n′)]=C[j(k′),j(k′)(m)](n′∈[1,N″(j(k″))])
Figure GDA0002501633600000051
Figure GDA0002501633600000052
Tan(y1)≈Tan(y2)
其中,j(k″)代表第j个采样周期中的第k″个基频的频谱,j(k″)(n′)代表第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,C1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数,C1,1表示抗混叠处理的基频的三维水声时频域信号的第一维度的值,即三维水声时频域信号的时间维度值,C1,2表示抗混叠处理的基频的三维水声时频域信号的第二维度的值,即频率维度值,Y代表基频的分支结构位点,Tan(y1)、Tan(y2)分别代表分支结构左侧斜率角和分支结构右侧斜率角;
步骤1所述谐波信号提取是对基频的整数倍频率位点的信号进行提取,具体定义为:
HC[j(k″′),j(k″′)(o),l]=[S3[C1,1[j(k″),j(k")(n′)],C1,2[j(k″),j(k″)(n′]×l,log P sigw3[C1,1[j(k″),j(k″)(n′)],C1,2[j(k″),j(k″)(n′)]]×l],l](l∈[2,L],o∈[1,O(j(k″′))])
其中,C1,1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第一维度上的信息,即时间维度信息,C1,2[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第二维度上的信息,即频率维度信息,L代表最大的谐波数,O代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱的第l个谐波的最大点数;
HC[j(k″′),j(k″′)(o),l]代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的l阶谐波信号的第o个位点的信号,HC[j(k″′),j(k″′)(o),l]为4维信号,包括时间维度,频率维度,能量维度和阶维度;
作为优选,步骤2所述三维水声时频域信号经抗混叠处理后的频谱为:步骤1所述第j个采样周期中的第k″个基频经抗混叠处理后的频谱
C1[j(k″),j(k″)(n′)](n′∈[1,N″(j(k″))]);
步骤2所述三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号为:步骤1所述三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的谐波信号HC[j(k″′),j(k″′)(o),l],l∈[2,L];
步骤2所述通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号的谐波参数的具体方法为:
步骤2所述频率参数包括:开始频率,信号在0.25持续时间点的基频频率,信号在0.5持续时间点的基频频率,信号在0.75持续时间点的基频频率,结束频率,最小频率,最大频率,频率变动范围、平均频率;
所述开始频率为三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点的第二维度值,即频率维度C1,2[j(k″),1];
所述信号在0.25持续时间点的基频频率为C1,2[j(k″),0.25×N″(j(k″))],信号在0.5持续时间点的基频频率为C1,2[j(k″),0.5×N″(j(k″))],N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数;
所述信号在0.75持续时间点的基频频率为C1,2[j(k″),0.75×N″(j(k″))];
所述结束频率为C1,2[j(k″),end];
所述最小频率为min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述最大频率为max(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述频率变动范围为max(C1,2[j(k″),u′])-min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述平均频率为:
[C1,2[j(k″),1]+C1,2[j(k″),end]+min(C1,2[j(k″),u′])+max(C1,2[j(k″),u′])]/4(u′∈[1,N″(j(k″))]))
步骤2所述定量参数包括:频谱基频的开始扫向,结束扫向,声谱图基频的拐点数,声谱图基频的断裂点数,声谱图基频的梯级结构数;
所述频谱基频的开始扫向为:
C1,2[j(k″),2]/C1,2[j(k″),1],其中C1,2[j(k″),1]和C1,2[j(k″),2]分别代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点和第2点的第二维度值,即频率维度;
所述结束扫向为:
C1,2[j(k″),end]/C1,2[j(k″),end-1];
所述声谱图基频的拐点为频率变化率从正值变为负值或者从负值变为正值的零界点:
Figure GDA0002501633600000071
Figure GDA0002501633600000072
Figure GDA0002501633600000073
为声谱图基频C1[j(k″)]的拐点数,i′为声谱图基频的拐点所在的坐标位置。
所述声谱图基频的梯级结构指的是连续声谱图中频率骤变的区域,这些区域的频率变动范围要大于500Hz:
Figure GDA0002501633600000074
C1,2[j(k″),i″+1]-C1,2[j(k″),i″]≥500
其中,
Figure GDA0002501633600000075
代表声谱图基频C1[j(k″)]的梯级结构数,i″代表声谱图基频的梯级结构的所在的坐标位置;
所述声谱图基频的断裂点数指的是声谱图中频率不连续的区域的总数:
Figure GDA0002501633600000076
C1,2[j(k″),i″′]=0
其中,
Figure GDA0002501633600000077
代表声谱图基频C1[j(k″)]的断裂点数,i″′代表声谱图基频的断裂点所在的坐标位置;
步骤2所述时间参数包括:持续时间,定义为:
Figure GDA0002501633600000078
其中,dt为时间间隔;
步骤2所述谐波参数包括:最大谐波数、最大谐波频率;
所述最大谐波数为max(HC1,4[j(k″′),j(k″′)(o),l]),其中HC1,4[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第四维度,即阶维度;
所述最大谐波频率为max(HC1,2[j(k″′),j(k″′)(o),l])其中HC1,2[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第二维度,即频率维度;;
步骤2所述进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型,具体为:
所述时频域模型分为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
所述平滑型的判断方法为:
在整个通讯信号的持续时间中,有超过90%的持续时间跨度内,频率的变动幅度小于1kHz;
FC1[j(k″1),j(k″1)(n′1)]=C1[j(k″),j(k″)(n′)](n′1∈[1,N″1(j(k″1))])
Figure GDA0002501633600000081
其中FC1[j(k″1),j(k″1)(n′1)]代表平滑型三维水声时频域信号在第j个采样周期中第k″1个基频经抗混叠处理后的频谱的第n′1个点,N″1(j(k″1))代表平滑型三维水声时频域信号在第j个采样周期的第k″1个基频经抗混叠处理后的频谱的位点数的总数,FC1,2[j(k″1),j(k″1)(n′1)]表示平滑型三维水声时频域信号在第j个采样周期第k″1个基频经抗混叠处理后的频谱的第n′1个点的第二维度值,即频率值;
所述下扫型的判断方法为:
通讯信号的频率变动趋势主要为下降,即使有频率上升的部分,其频率变动范围也小于1kHz;
DC1[j(k″2),j(k″2)(n′2)]=C1[j(k″),j(k″)(n′)](n′2∈[1,N″2(j(k″2))])
DC1,2[j(k″2),j(k″1)(n″′2)]-DC1,2[j(k″2),j(k″2)(n″′2-1)]>0(n″′2∈[2,N″′2])
max(DC1,2[j(k″2),j(k″2)(n″′2)])-min(DC1,2[j(k″2),j(k″2)(n″′2)])≤1000(n″′2∈[1,N″′2])
其中DC1[j(k″2),j(k″2)(n′2)]代表下扫型三维水声时频域信号在第j个采样周期中第k″2个基频经抗混叠处理后的频谱的第n′2个点,N″2(j(k″2))代表下扫型三维水声时频域信号在第j个采样周期的第k″2个基频经抗混叠处理后的频谱的位点数的总数,DC1,2[j(k″2),j(k″2)(n″′2)]表示下扫型三维水声时频域信号在第j个采样周期第k″2个基频经抗混叠处理后的频谱的第n″′2个点的第二维度值,即频率值,N″′2代表第j个采样周期中的第k″1个下扫型信号DC1,2[j(k″1)]中频率递增的点的总数。
所述上扫型的判断方法为:
通讯信号的频率变动趋势主要为上升,即使有频率下降的部分,其频率变动范围也小于1kHz;
UC1[j(k″3),j(k″3)(n′3)]=C1[j(k″),j(k″)(n′)](n′3∈[1,N″3(j(k″3))])
UC1,2[j(k″3),j(k″3)(n″′3)]-UC1,2[j(k″3),j(k″3)(n″′3-1)]<0(n″′3∈[2,N″′3])
max(UC1,2[j(k″3),j(k″3)(n″′3)])-min(UC1,2[j(k″3),j(k″3)(n″′3)])≤1000(n″′3∈[1,N″′3])
其中UC1[j(k″3),j(k″3)(n′3)]代表上扫型三维水声时频域信号在第j个采样周期中第k″3个基频经抗混叠处理后的频谱的第n′3个点,N″3(j(k″3))代表上扫型三维水声时频域信号在第j个采样周期的第k″3个基频经抗混叠处理后的频谱的位点数的总数,UC1,2[j(k″3),j(k″3)(n″′3)]表示上扫型三维水声时频域信号在第j个采样周期第k″3个基频经抗混叠处理后的频谱的第n″′3个点的第二维度值,即频率值,N″′3代表第j个采样周期中的第k″3个上扫型信号UC1[j(k″3)]中频率递增的点的总数。
所述U-型的判断方法为:
通讯信号的频率变动情况为开始主要是下降,之后主要为上升,同时各且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConcC1[j(k″4),j(k″4)(n′4)]=C1[j(k″),j(k″)(n′)](n′4∈[1,N″4(j(k″4))])
Figure GDA0002501633600000091
Figure GDA0002501633600000092
Figure GDA0002501633600000093
其中ConcC1[j(k″4),j(k″4)(n′4)]代表U-型三维水声时频域信号在第j个采样周期中第k″4个基频经抗混叠处理后的频谱的第n′4个点,N″4(j(k″4))代表U-型三维水声时频域信号在第j个采样周期的第k″4个基频经抗混叠处理后的频谱的位点数的总数,ConcC1,2[j(k″4),j(k″4)(n″′4)]表示U-型三维水声时频域信号在第j个采样周期第k″4个基频经抗混叠处理后的频谱的第n″′4个点的第二维度值,即频率值,N″4(j(k″4))代表ConcC1[j(k″4)]中频率递增的点的总数。
Figure GDA0002501633600000094
代表ConcC1[j(k″4)]的拐点位置,
Figure GDA0002501633600000095
代表第j个采样周期中的第j(k″4)个U-型信号ConcC1[j(k″4)]的拐点总数;
所述凸型的判断方法为:
通讯信号哨叫声的频率变动情况为开始主要是上升之后主要为下降,同时各有且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConvC1[j(k″5),j(k″5)(n′5)]=C1[j(k″),j(k″)(n′)](n′5∈[1,N″5(j(k″5))])
Figure GDA0002501633600000101
Figure GDA0002501633600000102
Figure GDA0002501633600000103
其中ConvC1[j(k″5),j(k″5)(n′5)]代表凸型三维水声时频域信号在第j个采样周期中第k″5个基频经抗混叠处理后的频谱的第n′5个点,N″5(j(k″5))代表凸型三维水声时频域信号在第j个采样周期的第k″5个基频经抗混叠处理后的频谱的位点数的总数,ConvC1,2[j(k″5),j(k″5)(n″′5)]表示凸型三维水声时频域信号在第j个采样周期第k″5个基频经抗混叠处理后的频谱的第n″′5个点的第二维度值,即频率值,N″5(j(k″5))代表ConvC1[j(k″5)]中频率递增的点的总数。
Figure GDA0002501633600000104
代表ConvC1[j(k″5)]的拐点位置,
Figure GDA0002501633600000105
代表第j个采用周期中的第k″5个凸型信号ConvC1[j(k″5)]的拐点总数。
所述弦型的判断方法为:
通讯信号的频率变动趋势为先上升然后下降或者先下降然后上升循环往复,同时至少有两个拐点。
SC1[j(k″6),j(k″6)(n′6)]=C1[j(k″),j(k″)(n′)](n′6∈[1,N″6(j(k″6))])
Figure GDA0002501633600000106
其中SC1[j(k″6),j(k″6)(n′6)]代表弦型三维水声时频域信号在第j个采样周期中第k″6个基频经抗混叠处理后的频谱的第n′6个点,N″6(j(k″6))代表弦型三维水声时频域信号在第j个采样周期的第k″6个基频经抗混叠处理后的频谱的位点数的总数,
Figure GDA0002501633600000107
代表第j个采用周期中的第k″6个弦型信号
Figure GDA0002501633600000108
的拐点总数;
将经抗混叠处理的三维水声时频域信号基频,依次通过所述平滑型的判断方法、所述下扫型的判断方法、所述上扫型的判断方法、所述U-型的判断方法、所述凸型的判断方法、所述弦型的判断方法,判断经抗混叠处理的三维水声时频域信号基频所对应的时频域模型,作为声谱类型;
作为优选,步骤3所述第一参数获取方式为:通过文献检索已经发表的文献资料中获得第一鲸豚类型比对数据集,定义为:
RSig1,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig1,x,y,z为第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig1,x,y,1=(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)
其中,(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig1,x,y,2=(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)
其中,(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig1,x,y,3=RSig1,x,y,3,1
其中,RSig1,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig1,x,y,4=(RSig1,x,y,4,1,RSig1,x,y,4,2)
其中,(RSig1,x,y,4,1,RSig1,x,y,4,2)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第二参数获取方式为:从可供开放获取的鲸类声音库中获得多个声信号的原始音频文件,多个原始音频文件信号参照步骤1提取原始音频文件信号基频以及基频对应的谐波信号,并参照步骤2获得原始音频文件信号基频的频率参数、定量参数、时间参数、原始音频文件信号基频对应的谐波信号的谐波参数、原始音频文件信号声谱类型,构建第二鲸豚类型比对数据集,定义为:
RSig2,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig2,x,y,z为第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig2,x,y,1=(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)
其中,(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig2,x,y,2=(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)
其中,(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig2,x,y,3=RSig2,x,y,3,1
其中RSig2,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig2,x,y,4=(RSig2,x,y,4,1,RSig2,x,y,4,2)
其中,(RSig2,x,y,4,1,RSig2,x,y,4,2)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第三参数获取方式为:通过现场录音方式获得音频信号,参照步骤1提取音频信号基频以及基频对应的谐波信号,并参照步骤2获得音频信号基频的频率参数、定量参数、时间参数、音频信号基频对应的谐波信号的谐波参数音频信号声谱类型,构建第三鲸豚类型比对数据集,定义为:
RSig3,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig3,x,y,z为第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig3,x,y,1=(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)
其中,(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig3,x,y,2=(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)
其中,(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig3,x,y,3=RSig3,x,y,3,1
其中RSig3,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig3,x,y,4=(RSig3,x,y,4,1,RSig3,x,y,4,2)
其中,(RSig3,x,y,4,1,RSig3,x,y,4,2)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述鲸豚类型比对数据集为:
RSigID,x,y,z
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSigID,x,y,z为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、
基频的时间参数、基频所对应的谐波信号的谐波参数,
步骤3所述鲸豚类型比对数据集的统计分布参数为:
SrsigID,x,y,z,p
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4],p∈[1,4]
其中,SrsigID,x,y,z,p为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数的第p种统计变量的结果,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数,p∈[1,4]表示统计分布参数依次为平均值(mean)、方差(SD)、中位数(media)和四分位间距(QD);
SrsigID,x,y,z,p=(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)
其中,(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)依次表示第ID种参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数的平均值、方差、中位数和四分位间距;
对于任意一个含有数据总数为
Figure GDA0002501633600000131
的数据集
Figure GDA0002501633600000132
而言,其平均值
Figure GDA0002501633600000133
方差
Figure GDA0002501633600000134
中位数
Figure GDA0002501633600000135
和四分位间距
Figure GDA0002501633600000136
为:
Figure GDA0002501633600000137
Figure GDA0002501633600000138
Figure GDA0002501633600000139
Figure GDA00025016336000001310
其中.
Figure GDA00025016336000001311
为将
Figure GDA00025016336000001312
内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,
Figure GDA00025016336000001313
为将
Figure GDA00025016336000001314
内的所有信号按照由小到大的顺序排列后,排序在75%位点上的信号值,
Figure GDA00025016336000001315
为将
Figure GDA00025016336000001316
内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值;
步骤3所述识别目标鲸豚类型,具体方法为:
若符合分布范围判别模型即:
Figure GDA0002501633600000141
Figure GDA0002501633600000142
Figure GDA0002501633600000143
则判断对应的鲸豚物种类型为x,即水声数字信号的鲸豚物种类型监测结果。
其中,DresultU,P(U∈[1,6],P∈[1,17])表示第U种基频声谱类型下第P种参数;
U∈[1,6]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的声谱类型依次为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
其中,P∈[1,9]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的频率参数,依次为:开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
P∈[10,14]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的定量参数,依次为:开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
P=15表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的持续时间;
P∈[16,17]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的谐波信号的谐波参数,依次为:最大谐波数、最大谐波频率。
与现有技术相比,本发明的有益效果是:
本发明通过开发并集成鲸类低频水声通讯信号自动识别和提取模块,实现对鲸类低频通讯信号进行高效能地自动识别和提取,提高了监测结果的可靠性和稳定性,降低了通过人工挑选的主观性。通过通讯信号参数提取和信号分类模块并和构建的鲸豚类型比对数据集进行比对实现对监测到的鲸豚声音类型进行物种归宿鉴定。通过结合无线传输模块实现在终端对鲸豚类的声呐信号及鲸豚类物种鉴定结果进行24/7的全天候实时在线监测,实现了鲸类的声学监测从传统的“录音回放”模式转变为“现场直播”模式,为实时监测鲸类在目标水域的活动以及通过实时调控相应水域的人类活动来及时降低人类活动对动物的影响并开展更有效的鲸豚类保护和制定有效的鲸类保护措施提供时效性更强的基础资料。
附图说明
图1:本发明***框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明装置的技术方案为一种基于鲸豚类低频水声信号的实时在线识别分类装置,其特征在于,包括:水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块、终端显示模块;
所述的水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块通过有线方式依次串联连接;所述无线传输模块与所述终端显示模块通过无线方式连接;
所述水听器用于采集水声信号;所述滤波器用于对水声信号进行滤波得到滤波后水声信号;所述放大器用于对滤波后水声信号进行放大得到放大后水声信号;所述信号采集卡用于对放大后水声信号进行模数转换采样得到水声数字信号,并将水声数字信号传输至所述微处理器;所述微处理器根据水声数字信号,通过所述基于鲸豚类低频通讯信号的实时在线监测预警方法得到鲸豚监测结果,将鲸豚监测结果通过所述无线传输模块无线传输至所述终端显示模块进行显示;
所述终端显示模块包括移动客户端和实验室客户端;
所述移动客户端可以通过安装开发的鲸类实时在线监测***APP,获得目标鲸类的实时监测信息并实现实时预警功能;
所述实验室客户端可以供专业机构的科研人员进行鲸类通讯信号的深度分析和相关研究和保护工作。
所述水听器型号为;所述滤波器型号为;所述放大器型号为;所述信号采集卡型号为;所述微处理器型号为;所述无线传输模块型号为;所述终端显示模块型号为;
本发明具体实施方式包括以下步骤:
步骤1:将水声数字信号通过降脉冲干扰权重函数进行降噪得到降噪后水声数字信号,通过信号声谱图转换得到水声三维时频域信号,通过频率维度迭代降噪、时间维度迭代降噪得到降噪后水声时频域信号,通过声谱图阈值过滤得到过滤后的水声时频域信号,通过基频轮廓构建、基频抗混叠处理、谐波信号提取实现独立频谱提取,得到经抗混叠处理后三维水声时频域信号的基频以及基频所对应的谐波信号;
步骤1中所述水声数字信号为:
Sig(j,i)j∈[1,M],i∈[1,N]
N=fs×t
其中,M为采样周期的数量,例如可定义为8640(8640=24小时/天x60分钟/小时x60秒/分钟/10秒钟/采样周期),N为采样周期内采样点的数量,960000(采样率x采用周期时长=96000x10秒),Sig(j,i)为第j个采样周期内第i个水声数字信号采样值,fs为信号的采样率,例如96kHz,t为采用周期的时长,例如10秒钟;
步骤1所述通过降脉冲干扰权重函数为:
W(j,i)=1+[(Sig(j,i)-media(Sig(j.))/(QR(Sig(j.))×θ)]6(i∈[1,N])
media(Sig(j.)=P[Sig(j.),50]
QR(Sig(j.)=(P[Sig(j.),75]-P[Sig(j.),25])/2
Sigw(j,i)=Sig(j,i)/W(j,i)
其中,W(j,i)为第j个采样周期内第i个水声数字信号采样值的权重值,Sig(j.)为第j个采样周期内的所有的信号,media(Sig(j.))为Sig(j.)的中位数,P[Sig(j.),50]为将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第N/2+1个点的值,如果信号的长度N为偶数,那么就是排序后的第N/2和N/2+1个点的平均值,QR(Sig(j.))为Sig(j.)的四分位数间距,θ为设点的阈值,例如可以去信噪比为10分贝,N为采样周期内采样点的数量,P[Sig(j.),25]为将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.25N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.25N和0.25N+1个点的平均值,P[Sig(j.),75]为所将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在75%的位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.75N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.75N和0.75N+1个点的平均值,Sigw(j,i)为第j个采样周期内第i个水声数字信号采样值经权重处理后结果,P代表信号的排序的百分位置;
所述降脉冲干扰权重函数用于降低脉冲类信号对后续鲸类通讯信号的识别过程中的干扰,对于高能量的脉冲信号,W(j,i)的取值非常大,Sig(j,i)的能量值得到极大的衰减,脉冲信号的声强得到弱化处理;对于那些能量不强的信号,W(j,i)的取值接近1,权重函数对原始信号的衰减效果可忽略不计;
步骤1所述通过信号三维声谱图转换得到水声时频域信号为:
步骤1降噪后水声数字信号通过傅里叶窗函数变换得到水声频域信号:
Figure GDA0002501633600000161
S0(j,p,q)=S0[j(p),q,Fsigw[j(p),q]]
Δf=Δq=fs/nfft
Δt=Δj(p)=nfft×K×(1-r)/fs
其中,j(p)为第j个采样周期中的第p个傅里叶窗变换,同时,它还是三维时频域信号的时间维度参数,q为三维时频域信号的频率维度参数,Fsigw[j(p),q]为Sigw(j(p),i(s))经过傅里叶变换后的结果,即时间和频率分别在j(p)和q的傅里叶变换结果,i′代表第j个采样周期中的第p个傅里叶窗变换中的第i′个点,K表示每次进行傅里叶窗转换的信号总点数,例如取1024,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,通常可以取50%,S0为通过傅里叶窗函数变换得到的三维水声时频域信号,它包括时间维度j(p),频率维度q和在该时间维度和频率维度下的傅里叶转换结果Fsigw[j(p),q],fs为信号的采样频率,nfft为傅里叶窗函数的长度,Δf为时频域信号的频率分辨率,这里为94Hz,Δt为时频域信号的时间分辨率,这里为5ms,N为每个采样周期内采样点的数量,Δq表示参数q的变化率,Δj(p)表示参数j(p)的变化率;
所述频率维度迭代降噪是对同一傅里叶窗函数转换后的信号能量在不同频率区间下的能量进行降噪,频率维度降噪对脉冲类信号有进一步滤除的作用,同时为后续更好地提取通讯信号做准备;
步骤1所述频率维度迭代降噪的模型为:
Figure GDA0002501633600000171
Figure GDA0002501633600000172
Figure GDA0002501633600000173
S1(j,p,q)=S1[j(p),q,log P sigw1[j(p),q]]
其中,logPsigw[j(p),q]为傅里叶转换结果(Fsigw[j(p),q])经对数转换后的能量水平,logPsigw1[j(p),q]代表经过频率维度降噪后的能量水平信号,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,nfft为傅里叶窗函数的长度,S1(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括时间维度信号即j(p)、频率维度信号即q以及能量水平维度,即j(p)和q对应的经过频率维度降噪后的能量水平信号即log P sigw1[j(p),q];
所述时间维度滑动降噪是对经不同的傅里叶窗函数转换后信号在同一频率区间下的能量进行降噪,时间维度的降噪对持续存在的恒定背景噪音,例如录音设备的电子噪音的降噪效果明显;
步骤1所述时间维度迭代降噪的模型为:
Figure GDA0002501633600000174
S2(j,p,q)=S2[j(p),q,log P sigw2[j(p),q]]
其中,logPsigw2[j(p),q]代表经过时间维度降噪处理后的水声时频域信号的能量分布信号,φ代表时间维度降噪函数的降噪系数,通常取值为0.05,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,例如50%,nfft为傅里叶窗函数的长度,S2(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q和能量水平维度,即j(p)和q对应的经过时间维度降噪处理后的水声时频域信号的能量分布信号即log P sigw1[j(p),q];
时间维度的降噪对持续存在的恒定背景噪音,例如录音设备的电子噪音等的降噪效果明显。
步骤1所述通过声谱图阈值过滤得到水声时频域信号:
Figure GDA0002501633600000181
S3(j,p,q)=S3[j(p),q,log P sigw3[j(p),q]]
其中,logPsigw3[j(p),q]为经过阈值过滤后的水声时频域信号的能量分布信号,α为设定的时频域信号的能量阈值,例如取信噪比为10dB,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,S3(j,p,q)为经过声谱图阈值过滤得到三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q及能量水平维度,即j(p)和q对应的经过阈值过滤后的水声时频域信号的能量分布信号即log P sigw1[j(p),q];
步骤1所述频谱提取包括:基频轮廓的构建、基频抗混叠处理以及谐波信号提取;
对时间上相邻和空间上相邻的时频域信号点进行连接,同时将空间声相关的信号进行归并来构建信号的声谱轮廓。主要包括信号的基频轮廓的构建、基频抗混叠处理以及谐波信号提取三步来实现。
步骤1所述基频轮廓为:
C[j(k′),j(k′)(m)]=S3[j(p),q,logPsigw3[j(p),q]](k′∈[1,N′],j(k′)∈[j(p),j(p)+N′(j(k′)))],j(k′)(m)∈[1,N′(j(k′))])
C3≥a
ΔC2≤Δq
其中,j(k′)代表第j个采样周期中的第k′个基频的频谱,j(k′)(m)代表第j个采样周期中的第k′个基频的频谱的第m个点,C[j(k′),j(k′)(m)]代表三维水声时频域信号在第j个采样周期中的第k′个基频的频谱的第m个点,N′表示三维水声时频域信号在第j个采样周期中的所有的基频频谱的条数,j(p)表示第j个采样周期中的第p个傅里叶窗变换,N′(j(k′))表示第j个采样周期中的第k′个基频的频谱中所包含的位点数的最大位点数目,C3表示三维水声时频域信号的第三维度的值,即三维水声时频域信号的能量值,C2表示三维水声时频域信号的第二维度的值,即频率维度值,ΔC2代表三维水声时频域信号的频率变化率,α为设定的时频域信号的能量阈值,例如可以取信噪比为10dB;
步骤1所述基频的抗混叠处理是对声谱轮廓线发生交叉或者重叠情况进行的处理,具体为:
C1[j(k″),j(k″)(n′)]=C[j(k′),j(k′)(m)](n′∈[1,N″(j(k″))])
Figure GDA0002501633600000191
Figure GDA0002501633600000192
Tan(y1)≈Tan(y2)
其中,j(k″)代表第j个采样周期中的第k″个基频的频谱,j(k″)(n′)代表第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,C1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数,C1,1表示抗混叠处理的基频的三维水声时频域信号的第一维度的值,即三维水声时频域信号的时间维度值,C1,2表示抗混叠处理的基频的三维水声时频域信号的第二维度的值,即频率维度值,Y代表基频的分支结构位点,Tan(y1)、Tan(y2)分别代表分支结构左侧斜率角和分支结构右侧斜率角;
步骤1所述谐波信号提取是对基频的整数倍频率位点的信号进行提取,具体定义为:
HC[j(k″′),j(k″′)(o),l]=[S3[C1,1[j(k′),j(k″)(n′)],C1,2[j(k″),j(k″)(n′)]×l,logPsigw3[C1,1[j(k″),j(k)″(n′)],C1,2[j(k″),j(k)″(n′)]]×l],l](l∈[2,L],o∈[1,O(j(k″′))])
其中,C1,1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第一维度上的信息,即时间维度信息,C1,2[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第二维度上的信息,即频率维度信息,L代表最大的谐波数,例如20,O代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱的第l个谐波的最大点数;
HC[j(k″′),j(k″′)(o),l]代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的l阶谐波信号,HC[j(k″′),j(k″′)(o),l]为4维信号,包括时间维度,频率维度,能量维度和阶维度;
步骤2:三维水声时频域信号经抗混叠处理后的基频通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数,进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型;
步骤2所述三维水声时频域信号经抗混叠处理后的频谱为:步骤1所述第j个采样周期中的第k″个基频经抗混叠处理后的频谱C1[j(k″),j(k″)(n′)](n′∈[1,N″(j(k″))]);
步骤2所述三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号为:步骤1所述三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的谐波信号HC[j(k″′),j(k″′)(o),l],l∈[2,L];
步骤2所述通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号的谐波参数的具体方法为:
步骤2所述频率参数包括:开始频率,信号在0.25持续时间点的基频频率,信号在0.5持续时间点的基频频率,信号在0.75持续时间点的基频频率,结束频率,最小频率,最大频率,频率变动范围、平均频率;
所述开始频率为三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点的第二维度值,即频率维度C1,2[j(k″),1];
所述信号在0.25持续时间点的基频频率为C1,2[j(k″),0.25×N″(j(k″))],N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数。
所述信号在0.5持续时间点的基频频率为C1,2[j(k″),0.5×N″(j(k″))];
所述信号在0.75持续时间点的基频频率为C1,2[j(k″),0.75×N″(j(k″))];
所述结束频率为C1,2[j(k″),end];
所述最小频率为min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述最大频率为max(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述频率变动范围为max(C1,2[j(k″),u′])-min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述平均频率为
[C1,2[j(k″),1]+C1,2[j(k″),end]+min(C1,2[j(k″),u′])+max(C1,2[j(k″),u′])]/4(u′∈[j,N″(j(k″))]))
步骤2所述定量参数包括:频谱基频的开始扫向,结束扫向,声谱图基频的拐点数,声谱图基频的断裂点数,声谱图基频的梯级结构数;
所述频谱基频的开始扫向为:
C1,2[j(k″),2]/C1,2[j(k″),1],其中C1,2[j(k″),2]和C1,2[j(k″),1]分别代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点和第2点的第二维度值,即频率维度;
所述结束扫向为:
C1,2[j(k″),end]/C1,2[j(k″),end-1];
所述声谱图基频的拐点为频率变化率从正值变为负值或者从负值变为正值的零界点:
Figure GDA0002501633600000211
Figure GDA0002501633600000212
Figure GDA0002501633600000213
为声谱图基频C1[j(k″)]的拐点数,i′为声谱图基频的拐点所在的坐标位置。
所述声谱图基频的梯级结构指的是连续声谱图中频率骤变的区域,这些区域的频率变动范围要大于500Hz:
Figure GDA0002501633600000214
C1,2[j(k″),i″+1]-C1,2[j(k″),i″]≥500
其中,
Figure GDA0002501633600000215
代表声谱图基频C1[j(k″)]的梯级结构数,i″代表声谱图基频的梯级结构的所在的坐标位置;
所述声谱图基频的断裂点数指的是声谱图中频率不连续的区域的总数:
Figure GDA0002501633600000216
C1,2[j(k″),i″′]=0
其中,
Figure GDA0002501633600000217
代表声谱图基频C1[j(k″)]的断裂点数,i″′代表声谱图基频的断裂点所在的坐标位置;
步骤2所述时间参数包括:持续时间,定义为:
Figure GDA0002501633600000218
其中,dt为时间间隔;
步骤2所述谐波参数包括:最大谐波数、最大谐波频率;
所述最大谐波数为max(HC1,4[j(k″′),j(k″′)(o),l]),其中HC1,4[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第四维度,即阶维度;
所述最大谐波频率为max(HC1,2[j(k″′),j(k″′)(o),l])其中HC1,2[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第二维度,即频率维度;;
步骤2所述进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型,具体为:
所述时频域模型分为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
所述平滑型的判断方法为:
在整个通讯信号的持续时间中,有超过90%的持续时间跨度内,频率的变动幅度小于1kHz;
FC1[j(k″1),j(k″1)(n′1)]=C1[j(k″),j(k″)(n′)](n′1∈[1,N″1(j(k″1))])
Figure GDA0002501633600000219
其中FC1[j(k″1),j(k″1)(n′1)]代表平滑型三维水声时频域信号在第j个采样周期中第k″1个基频经抗混叠处理后的频谱的第n′1个点,N″1(j(k″1))代表平滑型三维水声时频域信号在第j个采样周期的第k″1个基频经抗混叠处理后的频谱的位点数的总数,FC1,2[j(k″1),j(k″1)(n′1)]表示平滑型三维水声时频域信号在第j个采样周期第k″1个基频经抗混叠处理后的频谱的第n′1个点的第二维度值,即频率值;
所述下扫型的判断方法为:
通讯信号的频率变动趋势主要为下降,即使有频率上升的部分,其频率变动范围也小于1kHz;
DC1[j(k″2),j(k″2)(n′2)]=C1[j(k″),j(k″)(n′)](n′2∈[1,N″2(j(k″2))])
DC1,2[j(k″2),j(k″1)(n″′2)]-DC1,2[j(k″2),j(k″2)(n″′2-1)]>0(n″′2∈[2,N″′2])
max(DC1,2[j(k″2),j(k″2)(n″′2)])-min(DC1,2[j(k″2),j(k″2)(n″′2)])≤1000(n″′2∈[1,N″′2])
其中DC1[j(k″2),j(k″2)(n′2)]代表下扫型三维水声时频域信号在第j个采样周期中第k″2个基频经抗混叠处理后的频谱的第n′2个点,N″2(j(k″2))代表下扫型三维水声时频域信号在第j个采样周期的第k″2个基频经抗混叠处理后的频谱的位点数的总数,DC1,2[j(k″2),j(k″2)(n″′2)]表示下扫型三维水声时频域信号在第j个采样周期第k″2个基频经抗混叠处理后的频谱的第n″′2个点的第二维度值,即频率值,N″′2代表第j个采样周期中的第k″1个下扫型信号DC1,2[j(k″1)]中频率递增的点的总数。
所述上扫型的判断方法为:
通讯信号的频率变动趋势主要为上升,即使有频率下降的部分,其频率变动范围也小于1kHz;
UC1[j(k″3),j(k″3)(n′3)]=C1[j(k″),j(k″)(n′)](n′3∈[1,N″3(j(k″3))])
UC1,2[j(k″3),j(k″3)(n″′3)]-UC1,2[j(k″3),j(k″3)(n″′3-1)]<0(n″′3∈[2,N″′3])
max(UC1,2[j(k″3),j(k″3)(n″′3)])-min(UC1,2[j(k″3),j(k″3)(n″′3)])≤1000(n″′3∈[1,N″′3])
其中UC1[j(k″3),j(k″3)(n′3)]代表上扫型三维水声时频域信号在第j个采样周期中第k″3个基频经抗混叠处理后的频谱的第n′3个点,N″3(j(k″3))代表上扫型三维水声时频域信号在第j个采样周期的第k″3个基频经抗混叠处理后的频谱的位点数的总数,UC1,2[j(k″3),j(k″3)(n″′3)]表示上扫型三维水声时频域信号在第j个采样周期第k″3个基频经抗混叠处理后的频谱的第n″′3个点的第二维度值,即频率值,N″′3代表第j个采样周期中的第k″3个上扫型信号UC1[j(k″3)]中频率递增的点的总数。
所述U-型的判断方法为:
通讯信号的频率变动情况为开始主要是下降,之后主要为上升,同时各且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConcC1[j(k″4),j(k″4)(n′4)]=C1[j(k″),j(k″)(n′)](n′4∈[1,N″4(j(k″4))])
Figure GDA0002501633600000231
Figure GDA0002501633600000232
Figure GDA0002501633600000233
其中ConcC1[j(k″4),j(k″4)(n′4)]代表U-型三维水声时频域信号在第j个采样周期中第k″4个基频经抗混叠处理后的频谱的第n′4个点,N″4(j(k″4))代表U-型三维水声时频域信号在第j个采样周期的第k″4个基频经抗混叠处理后的频谱的位点数的总数,ConcC1,2[j(k″4),j(k″4)(n″′4)]表示U-型三维水声时频域信号在第j个采样周期第k″4个基频经抗混叠处理后的频谱的第n″′4个点的第二维度值,即频率值,N″4(j(k″4))代表ConcC1[j(k″4)]中频率递增的点的总数。
Figure GDA0002501633600000234
代表ConcC1[j(k″4)]的拐点位置,
Figure GDA0002501633600000235
代表第j个采样周期中的第j(k″4)个U-型信号ConcC1[j(k″4)]的拐点总数;
所述凸型的判断方法为:
通讯信号哨叫声的频率变动情况为开始主要是上升之后主要为下降,同时各有且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConvC1[j(k″5),j(k″5)(n′5)]=C1[j(k″),j(k″)(n′)](n′5∈[1,N″5(j(k″5))])
Figure GDA0002501633600000236
Figure GDA0002501633600000237
Figure GDA0002501633600000238
其中ConvC1[j(k″5),j(k″5)(n′5)]代表凸型三维水声时频域信号在第j个采样周期中第k″5个基频经抗混叠处理后的频谱的第n′5个点,N″5(j(k″5))代表凸型三维水声时频域信号在第j个采样周期的第k″5个基频经抗混叠处理后的频谱的位点数的总数,ConvC1,2[j(k″5),j(k″5)(n″′5)]表示凸型三维水声时频域信号在第j个采样周期第k″5个基频经抗混叠处理后的频谱的第n″′5个点的第二维度值,即频率值,N″5(j(k″5))代表ConvC1[j(k″5)]中频率递增的点的总数。
Figure GDA0002501633600000239
代表ConvC1[j(k″5)]的拐点位置,
Figure GDA00025016336000002310
代表第j个采用周期中的第k″5个凸型信号ConvC1[j(k″5)]的拐点总数。
所述弦型的判断方法为:
通讯信号的频率变动趋势为先上升然后下降或者先下降然后上升循环往复,同时至少有两个拐点。
SC1[j(k″6),j(k″6)(n′6)]=C1[j(k″),j(k″)(n′)](n′6∈[1,N″6(j(k″6))])
Figure GDA00025016336000002311
其中SC1[j(k″6),j(k″6)(n′6)]代表弦型三维水声时频域信号在第j个采样周期中第k″6个基频经抗混叠处理后的频谱的第n′6个点,N″6(j(k″6))代表弦型三维水声时频域信号在第j个采样周期的第k″6个基频经抗混叠处理后的频谱的位点数的总数,
Figure GDA0002501633600000241
代表第j个采用周期中的第k″6个弦型信号SC1[j(k″6)]的拐点总数;
将经抗混叠处理的三维水声时频域信号基频,依次通过所述平滑型的判断方法、所述下扫型的判断方法、所述上扫型的判断方法、所述U-型的判断方法、所述凸型的判断方法、所述弦型的判断方法,判断经抗混叠处理的三维水声时频域信号基频所对应的时频域模型,作为声谱类型;
步骤3:通过第一参数获取方式、第二参数获取方式、第三参数获取方式构建鲸豚类型比对数据集,根据鲸豚类型比对数据集分别构建基频的频率参数分布范围、基频的定量参数分布范围、基频的时间参数分布范围、基频所对应的谐波信号的谐波参数分布范围,结合三维水声时频域信号经抗混叠处理后的基频的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数、声谱类型,识别目标鲸豚类型;
步骤3所述第一参数获取方式为:通过文献检索已经发表的文献资料中获得第一鲸豚类型比对数据集,定义为:
RSig1,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig1,x,y,z为第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig1,x,y,1=(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)
其中,(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig1,x,y,2=(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)
其中,(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
所述时间参数为:RSig1,x,y,3=RSig1,x,y,3,1
其中,RSig1,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;所述基频所对应的谐波信号的谐波参数RSig1,x,y,4=(RSig1,x,y,4,1,RSig1,x,y,4,2)
其中,(RSig1,x,y,4,1,RSig1,x,y,4,2)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第二参数获取方式为:从可供开放获取的鲸类声音库中获得多个声信号的原始音频文件,多个原始音频文件信号参照步骤1提取原始音频文件信号基频以及基频对应的谐波信号,并参照步骤2获得原始音频文件信号基频的频率参数、定量参数、时间参数、原始音频文件信号基频对应的谐波信号的谐波参数、原始音频文件信号声谱类型,构建第二鲸豚类型比对数据集,定义为:
RSig2,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig2,x,y,z为第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig2,x,y,1=(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)
其中,(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig2,x,y,2=(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)
其中,(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig2,x,y,3=RSig2,x,y,3,1
其中RSig2,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig2,x,y,4=(RSig2,x,y,4,1,RSig2,x,y,4,2)
其中,(RSig2,x,y,4,1,RSig2,x,y,4,2)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第三参数获取方式为:通过现场录音方式获得音频信号,参照步骤1提取音频信号基频以及基频对应的谐波信号,并参照步骤2获得音频信号基频的频率参数、定量参数、时间参数、音频信号基频对应的谐波信号的谐波参数音频信号声谱类型,构建第三鲸豚类型比对数据集,定义为:
RSig3,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig3,x,y,z为第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig3,x,y,1=(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)
其中,(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig3,x,y,2=(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)
其中,(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig3,x,y,3=RSig3,x,y,3,1
其中RSig3,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig3,x,y,4=(RSig3,x,y,4,1,RSig3,x,y,4,2)
其中,(RSig3,x,y,4,1,RSig3,x,y,4,2)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述鲸豚类型比对数据集为:
RSigID,x,y,z
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSigID,x,y,z为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数,
步骤3所述鲸豚类型比对数据集的统计分布参数为:
SrsigID,x,y,z,p
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4],p∈[1,4]
其中,SrsigID,x,y,z,p为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数的第p种统计变量的结果,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数,p∈[1,4]表示统计分布参数依次为平均值(mean)、方差(SD)、中位数(media)和四分位间距(QD);
SrsigID,x,y,z,p=(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)
其中,(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)依次表示第ID种参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数的平均值、方差、中位数和四分位间距;
对于任意一个含有数据总数为
Figure GDA0002501633600000271
的数据集
Figure GDA0002501633600000272
而言,其平均值
Figure GDA0002501633600000273
方差
Figure GDA0002501633600000274
中位数
Figure GDA0002501633600000275
和四分位间距
Figure GDA0002501633600000276
为:
Figure GDA0002501633600000277
Figure GDA0002501633600000278
Figure GDA0002501633600000279
Figure GDA00025016336000002710
其中.
Figure GDA00025016336000002711
为将
Figure GDA00025016336000002712
内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,
Figure GDA00025016336000002713
为将
Figure GDA00025016336000002714
内的所有信号按照由小到大的顺序排列后,排序在75%位点上的信号值,
Figure GDA00025016336000002715
为将
Figure GDA00025016336000002716
内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值;
步骤3所述识别目标鲸豚类型,具体方法为:
Figure GDA00025016336000002717
Figure GDA00025016336000002718
Figure GDA0002501633600000281
其中,DresultU,P(U∈[1,6],P∈[1,17])表示第U种基频声谱类型下第P种参数;
U∈[1,6]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的声谱类型依次为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
P∈[1,9]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的频率参数,依次为:开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
P∈[10,14]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的定量参数,依次为:开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
P=15表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的持续时间;
P∈[16,17]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的谐波信号的谐波参数,依次为:最大谐波数、最大谐波频率;
若符合分布范围判别模型,则判断对应的鲸豚类型为x,即水声数字信号的鲸豚类型监测结果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (4)

1.一种基于鲸豚类低频水声信号的实时在线识别分类方法,其特征在于,包括以下步骤:
步骤1:将水声数字信号通过降脉冲干扰权重函数进行降噪得到降噪后水声数字信号,通过信号声谱图转换得到水声三维时频域信号,通过频率维度迭代降噪、时间维度迭代降噪得到降噪后水声时频域信号,通过声谱图阈值过滤得到过滤后的水声时频域信号,通过基频轮廓构建、基频抗混叠处理、谐波信号提取实现独立频谱提取,得到经抗混叠处理后三维水声时频域信号的基频以及基频所对应的谐波信号;
步骤2:三维水声时频域信号经抗混叠处理后的基频通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数,进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型;
步骤3:通过第一参数获取方式、第二参数获取方式、第三参数获取方式构建鲸豚类型比对数据集,根据鲸豚类型比对数据集分别构建基频的频率参数分布范围、基频的定量参数分布范围、基频的时间参数分布范围、基频所对应的谐波信号的谐波参数分布范围,结合三维水声时频域信号经抗混叠处理后的基频的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的基频所对应的谐波信号的谐波参数、声谱类型,识别目标鲸豚类型;
步骤3所述第一参数获取方式为:通过文献检索已经发表的文献资料中获得第一鲸豚类型比对数据集,定义为:
RSig1,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig1,x,y,z为第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig1,x,y,1=(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)
其中,(RSig1,x,y,1,1,RSig1,x,y,1,2,...,RSig1,x,y,1,9)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig1,x,y,2=(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)
其中,(RSig1,x,y,2,1,RSig1,x,y,2,2,...,RSig1,x,y,2,5)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig1,x,y,3=RSig1,x,y,3,1
其中,RSig1,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig1,x,y,4=(RSig1,x,y,4,1,RSig1,x,y,4,2)
其中,(RSig1,x,y,4,1,RSig1,x,y,4,2)依次表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第二参数获取方式为:从可供开放获取的鲸类声音库中获得多个声信号的原始音频文件,多个原始音频文件信号参照步骤1提取原始音频文件信号基频以及基频对应的谐波信号,并参照步骤2获得原始音频文件信号基频的频率参数、定量参数、时间参数、原始音频文件信号基频对应的谐波信号的谐波参数、原始音频文件信号声谱类型,构建第二鲸豚类型比对数据集,定义为:
RSig2,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig2,x,y,z为第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig2,x,y,1=(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)
其中,(RSig2,x,y,1,1,RSig2,x,y,1,2,...,RSig2,x,y,1,9)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig2,x,y,2=(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)
其中,(RSig2,x,y,2,1,RSig2,x,y,2,2,...,RSig2,x,y,2,5)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig2,x,y,3=RSig2,x,y,3,1
其中RSig2,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig2,x,y,4=(RSig2,x,y,4,1,RSig2,x,y,4,2)
其中,(RSig2,x,y,4,1,RSig2,x,y,4,2)依次表示第二参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述第三参数获取方式为:通过现场录音方式获得音频信号,参照步骤1提取音频信号基频以及基频对应的谐波信号,并参照步骤2获得音频信号基频的频率参数、定量参数、时间参数、音频信号基频对应的谐波信号的谐波参数音频信号声谱类型,构建第三鲸豚类型比对数据集,定义为:
RSig3,x,y,z
x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSig3,x,y,z为第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数;
RSig3,x,y,1=(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)
其中,(RSig3,x,y,1,1,RSig3,x,y,1,2,...,RSig3,x,y,1,9)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第1种基频的频率参数中开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
RSig3,x,y,2=(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)
其中,(RSig3,x,y,2,1,RSig3,x,y,2,2,...,RSig3,x,y,2,5)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第2种基频的定量参数中频谱基频的开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
RSig3,x,y,3=RSig3,x,y,3,1
其中RSig3,x,y,3,1表示第一参数获取方式中第x种鲸豚类型下第y种声谱类型的第3种基频的时间参数中基频的持续时间;
RSig3,x,y,4=(RSig3,x,y,4,1,RSig3,x,y,4,2)
其中,(RSig3,x,y,4,1,RSig3,x,y,4,2)依次表示第三参数获取方式中第x种鲸豚类型下第y种声谱类型的第4种基频的基频所对应的谐波信号的谐波参数中最大谐波数、最大谐波频率;
步骤3所述鲸豚类型比对数据集为:
RSigID,x,y,z
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4]
其中,RSigID,x,y,z为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数,
步骤3所述鲸豚类型比对数据集的统计分布参数为:
SrsigID,x,y,z,p
ID∈[1,3],x∈[1,K],y∈[1,6],z∈[1,4],p∈[1,4]
其中,SrsigID,x,y,z,p为第ID参数获取方式中第x种鲸豚类型下第y种声谱类型第z种基频参数的第p种统计变量的结果,K为鲸豚类型的数量,y∈[1,6]表示基频声谱类型依次为平滑型、下扫型、上扫型、U-型、凸型、弦型,z∈[1,4]表示基频参数类型依次为基频的频率参数、基频的定量参数、基频的时间参数、基频所对应的谐波信号的谐波参数,p∈[1,4]表示统计分布参数依次为平均值(mean)、方差(SD)、中位数(media)和四分位间距(QD);
SrsigID,x,y,z,p=(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)
其中,(SrsigID,x,y,z,1,SrsigID,x,y,z,2,...,SrsigID,x,y,z,4)依次表示第ID种参数获取方式中第x种鲸豚类型下第y种声谱类型的第z种基频参数的平均值、方差、中位数和四分位间距;
对于任意一个含有数据总数为
Figure FDA0003032173730000041
的数据集
Figure FDA0003032173730000042
而言,其平均值
Figure FDA0003032173730000043
方差
Figure FDA0003032173730000044
中位数
Figure FDA0003032173730000045
和四分位间距
Figure FDA0003032173730000046
为:
Figure FDA0003032173730000047
Figure FDA0003032173730000048
Figure FDA0003032173730000049
Figure FDA00030321737300000410
其中.
Figure FDA00030321737300000411
为将
Figure FDA00030321737300000412
内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,
Figure FDA00030321737300000413
为将
Figure FDA00030321737300000414
内的所有信号按照由小到大的顺序排列后,排序在75%位点上的信号值,
Figure FDA00030321737300000415
为将
Figure FDA00030321737300000416
内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值;
步骤3所述识别目标鲸豚类型,具体方法为:
若符合分布范围判别模型即:
Figure FDA00030321737300000417
Figure FDA00030321737300000418
Figure FDA0003032173730000051
则判断对应的鲸豚物种类型为x,即水声数字信号的鲸豚物种类型监测结果;
其中,DresultU,P(U∈[1,6],P∈[1,17])表示第U种基频声谱类型下第P种参数;
U∈[1,6]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的声谱类型依次为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
其中,P∈[1,9]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的频率参数,依次为:开始频率、信号在0.25持续时间点的基频频率、信号在0.5持续时间点的基频频率、信号在0.75持续时间点的基频频率、结束频率、最小频率、最大频率、频率变动范围、平均频率;
P∈[10,14]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的定量参数,依次为:开始扫向、结束扫向、声谱图基频的拐点数、声谱图基频的断裂点数、声谱图基频的梯级结构数;
P=15表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的持续时间;P∈[16,17]表示步骤2中所述三维水声时频域信号经抗混叠处理后的基频的谐波信号的谐波参数,依次为:最大谐波数、最大谐波频率。
2.根据权利要求1所述的基于鲸豚类低频水声信号的实时在线识别分类方法,其特征在于:步骤1中所述水声数字信号为:
Sig(j,i)j∈[1,M],i∈[1,N]
N=fs×t
其中,M为采样周期的数量,N为采样周期内采样点的数量,Sig(j,i)为第j个采样周期内第i个水声数字信号采样值,fs为信号的采样率,t为采用周期的时长;
步骤1所述通过降脉冲干扰权重函数为:
W(j,i)=1+[(Sig(j,i)-media(Sig(j.))/(QR(Sig(j.))×θ)]6(i∈[1,N])
media(Sig(j.)=P[Sig(j.),50]
QR(Sig(j.)=(P[Sig(j.),75]-P[Sig(j.),25])/2
Sigw(j,i)=Sig(j,i)/W(j,i)
其中,W(j,i)为第j个采样周期内第i个水声数字信号采样值的权重值,Sig(j.)为第j个采样周期内的所有的信号,media(Sig(j.))为Sig(j.)的中位数,P[Sig(j.),50]为将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在50%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第N/2+1个点的值,如果信号的长度N为偶数,那么就是排序后的第N/2和N/2+1个点的平均值,QR(Sig(j.))为Sig(j.)的四分位数间距,θ为设点的阈值,N为采样周期内采样点的数量,P[Sig(j.),25]为将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在25%位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.25N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.25N和0.25N+1个点的平均值,P[Sig(j.),75]为所将Sig(j.)内的所有信号按照由小到大的顺序排列后,排序在75%的位点上的信号值,如果信号的长度N为基数,那么就是排序后的第0.75N+1个点的值,如果信号的长度N为偶数,那么就是排序后的第0.75N和0.75N+1个点的平均值,Sigw(j,i)为第j个采样周期内第i个水声数字信号采样值经权重处理后结果,P代表信号的排序的百分位置;
步骤1所述通过信号三维声谱图转换得到水声时频域信号为:
步骤1降噪后水声数字信号通过傅里叶窗函数变换得到水声频域信号:
Figure FDA0003032173730000061
S0(j,p,q)=S0[j(p),q,Fsigw[j(p),q]]
Δf=Δq=fs/nfft
Δt=Δj(p)=nfft×K×(1-r)/fs
其中,j(p)为第j个采样周期中的第p个傅里叶窗变换,同时,它还是三维时频域信号的时间维度参数,q为三维时频域信号的频率维度参数,Fsigw[j(p),q]为Sigw(j(p),i(s))经过傅里叶变换后的结果,即时间和频率分别在j(p)和q的傅里叶变换结果,i′代表第j个采样周期中的第p个傅里叶窗变换中的第i′个点,K表示每次进行傅里叶窗转换的信号总点数,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,S0为通过傅里叶窗函数变换得到的三维水声时频域信号,它包括时间维度j(p),频率维度q和在该时间维度和频率维度下的傅里叶转换结果Fsigw[j(p),q],fs为信号的采样频率,nfft为傅里叶窗函数的长度,Δf为时频域信号的频率分辨率,Δt为时频域信号的时间分辨率,N为每个采样周期内采样点的数量,Δq表示参数q的变化率,Δj(p)表示参数j(p)的变化率;
步骤1所述频率维度迭代降噪的模型为:
Figure FDA0003032173730000071
Figure FDA0003032173730000072
Figure FDA0003032173730000073
S1(j,p,q)=S1[j(p),q,logPsigw1[j(p),q]]
其中,logPsigw[j(p),q]为傅里叶转换结果(Fsigw[j(p),q])经对数转换后的能量水平,logPsigw1[j(p),q]代表经过频率维度降噪后的能量水平信号,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,nfft为傅里叶窗函数的长度,S1(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过频率维度降噪后的能量水平信号即logPsigw1[j(p),q];
步骤1所述时间维度迭代降噪的模型为:
Figure FDA0003032173730000074
S2(j,p,q)=S2[j(p),q,logPsigw2[j(p),q]]
其中,logPsigw2[j(p),q]代表经过时间维度降噪处理后的水声时频域信号的能量分布信号,φ代表时间维度降噪函数的降噪系数,通常取值为0.05,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,K为每次进行傅里叶窗转换的信号长度,r为每两次相邻的傅里叶窗函数滑动转换时信号重叠部分所占的百分比,nfft为傅里叶窗函数的长度,S2(j,p,q)为经过频率维度迭代降噪的三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过时间维度降噪处理后的水声时频域信号的能量分布信号即logPsigw1[j(p),q];
步骤1所述通过声谱图阈值过滤得到水声时频域信号:
Figure FDA0003032173730000081
S3(j,p,q)=S3[j(p),q,logPsigw3[j(p),q]]
其中,logPsigw3[j(p),q]为经过阈值过滤后的水声时频域信号的能量分布信号,α为设定的时频域信号的能量阈值,j(p)为第j个采样周期中的第p个傅里叶窗变换,q为三维时频域信号的频率维度参数,S3(j,p,q)为经过声谱图阈值过滤得到三维水声时频域信号,包括:时间维度信号即j(p)、频率维度信号即q和能量水平参数即j(p)和q对应的经过阈值过滤后的水声时频域信号的能量分布信号即logPsigw1[j(p),q];
步骤1所述基频轮廓为:
C[j(k′),j(k′)(m)]=S3[j(p),q,logPsigw3[j(p),q]](k′∈[1,N′],j(k′)∈[j(p),j(p)+N′(j(k′)))],j(k′)(m)∈[1,N′(j(k′))])
C3≥a
ΔC2≤Δq
其中,j(k′)代表第j个采样周期中的第k′个基频的频谱,j(k′)(m)代表第j个采样周期中的第k′个基频的频谱的第m个点,C[j(k′),j(k′)(m)]代表三维水声时频域信号在第j个采样周期中的第k′个基频的频谱的第m个点,N′表示三维水声时频域信号在第j个采样周期中的所有的基频频谱的条数,j(p)表示第j个采样周期中的第p个傅里叶窗变换,N′(j(k′))表示第j个采样周期中的第k′个基频的频谱中所包含的位点数的最大位点数目,C3表示三维水声时频域信号的第三维度的值,即三维水声时频域信号的能量值,C2表示三维水声时频域信号的第二维度的值,即频率维度值,ΔC2代表三维水声时频域信号的频率变化率,α为设定的时频域信号的能量阈值;
步骤1所述基频的抗混叠处理是对声谱轮廓线发生交叉或者重叠情况进行的处理,具体为:
C1[j(k″),j(k″)(n′)]=C[j(k′),j(k′)(m)](n′∈[1,N″(j(k″))])
Figure FDA0003032173730000082
Figure FDA0003032173730000083
Tan(y1)≈Tan(y2)
其中,j(k″)代表第j个采样周期中的第k″个基频的频谱,j(k″)(n′)代表第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,C1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第n′个点,N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数,C1,1表示抗混叠处理的基频的三维水声时频域信号的第一维度的值,即三维水声时频域信号的时间维度值,C1,2表示抗混叠处理的基频的三维水声时频域信号的第二维度的值,即频率维度值,Y代表基频的分支结构位点,Tan(y1)、Tan(y2)分别代表分支结构左侧斜率角和分支结构右侧斜率角;
步骤1所述谐波信号提取是对基频的整数倍频率位点的信号进行提取,具体定义为:
Figure FDA0003032173730000091
其中,C1,1[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第一维度上的信息,即时间维度信息,C1,2[j(k″),j(k″)(n′)]代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第二维度上的信息,即频率维度信息,L代表最大的谐波数,O代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱的第l个谐波的最大点数;HC[j(k″′),j(k″′)(o),l]代表三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的l阶谐波信号的第o个位点的信号,HC[j(k″′),j(k″′)(o),l]为4维信号,包括时间维度,频率维度,能量维度和阶维度。
3.根据权利要求1所述的基于鲸豚类低频水声信号的实时在线识别分类方法,其特征在于:步骤2所述三维水声时频域信号经抗混叠处理后的频谱为:步骤1所述第j个采样周期中的第k″个基频经抗混叠处理后的频谱C1[j(k″),j(k″)(n′)](n′∈[1,N″(j(k″))]);
步骤2所述三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号为:步骤1所述三维水声时频域信号在第j个采样周期中的第k″′个基频经抗混叠处理后的频谱所对应的谐波信号HC[j(k″′),j(k″′)(o),l],l∈[2,L];
步骤2所述通过参数提取得到对应的频率参数、定量参数、时间参数、三维水声时频域信号经抗混叠处理后的频谱所对应的谐波信号的谐波参数的具体方法为:
步骤2所述频率参数包括:开始频率,信号在0.25持续时间点的基频频率,信号在0.5持续时间点的基频频率,信号在0.75持续时间点的基频频率,结束频率,最小频率,最大频率,频率变动范围、平均频率;
所述开始频率为三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点的第二维度值,即频率维度C1,2[j(k″),1];
所述信号在0.25持续时间点的基频频率为C1,2[j(k″),0.25×N″(j(k″))],信号在0.5持续时间点的基频频率为C1,2[j(k″),0.5×N″(j(k″))],N″(j(k″))表示第j个采样周期中的第k″个基频经抗混叠处理后的频谱中所包含的位点数的总数;
所述信号在0.75持续时间点的基频频率为C1,2[j(k″),0.75×N″(j(k″))];
所述结束频率为C1,2[j(k″),end];
所述最小频率为min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述最大频率为max(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述频率变动范围为max(C1,2[j(k″),u′])-min(C1,2[j(k″),u′](u′∈[1,N″(j(k″))]));
所述平均频率为:
Figure FDA0003032173730000108
步骤2所述定量参数包括:频谱基频的开始扫向,结束扫向,声谱图基频的拐点数,声谱图基频的断裂点数,声谱图基频的梯级结构数;
所述频谱基频的开始扫向为:
C1,2[j(k″),2]/C1,2[j(k″),1],其中C1,2[j(k″),1]和C1,2[j(k″),2]分别代表三维水声时频域信号在第j个采样周期中的第k″个基频经抗混叠处理后的频谱的第1个点和第2点的第二维度值,即频率维度;
所述结束扫向为:
C1,2[j(k″),end]/C1,2[j(k″),end-1];
所述声谱图基频的拐点为频率变化率从正值变为负值或者从负值变为正值的零界点:
Figure FDA0003032173730000101
Figure FDA0003032173730000102
Figure FDA0003032173730000103
为声谱图基频C1[j(k″)]的拐点数,i′为声谱图基频的拐点所在的坐标位置;
所述声谱图基频的梯级结构指的是连续声谱图中频率骤变的区域,这些区域的频率变动范围要大于500Hz:
Figure FDA0003032173730000104
C1,2[j(k″),i″+1]-C1,2[j(k″),i″]≥500
其中,
Figure FDA0003032173730000105
代表声谱图基频C1[j(k″)]的梯级结构数,i″代表声谱图基频的梯级结构的所在的坐标位置;
所述声谱图基频的断裂点数指的是声谱图中频率不连续的区域的总数:
Figure FDA0003032173730000106
C1,2[j(k″),i″′]=0
其中,
Figure FDA0003032173730000107
代表声谱图基频C1[j(k″)]的断裂点数,i″′代表声谱图基频的断裂点所在的坐标位置;
步骤2所述时间参数包括:持续时间,定义为:
Figure FDA0003032173730000111
其中,dt为时间间隔;
步骤2所述谐波参数包括:最大谐波数、最大谐波频率;
所述最大谐波数为max(HC1,4[j(k″′),j(k″′)(o),l]),其中HC1,4[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第四维度,即阶维度;
所述最大谐波频率为max(HC1,2[j(k″′),j(k″′)(o),l])其中HC1,2[j(k″′),j(k″′)(o),l]为HC[j(k″′),j(k″′)(o),l]的第二维度,即频率维度;
步骤2所述进一步结合时频域模型通过信号分类得到经抗混叠处理的三维水声时频域信号基频的声谱类型,具体为:
所述时频域模型分为:平滑型、下扫型、上扫型、U-型、凸型、弦型;
所述平滑型的判断方法为:
在整个通讯信号的持续时间中,有超过90%的持续时间跨度内,频率的变动幅度小于1kHz;
FC1[j(k″1),j(k″1)(n′1)]=C1[j(k″),j(k″)(n′)](n′1∈[1,N″1(j(k″1))])
Figure FDA0003032173730000112
其中FC1[j(k″1),j(k″1)(n′1)]代表平滑型三维水声时频域信号在第j个采样周期中第k″1个基频经抗混叠处理后的频谱的第n′1个点,N″1(j(k″1))代表平滑型三维水声时频域信号在第j个采样周期的第k″1个基频经抗混叠处理后的频谱的位点数的总数,FC1,2[j(k″1),j(k″1)(n′1)]表示平滑型三维水声时频域信号在第j个采样周期第k″1个基频经抗混叠处理后的频谱的第n′1个点的第二维度值,即频率值;
所述下扫型的判断方法为:
通讯信号的频率变动趋势主要为下降,即使有频率上升的部分,其频率变动范围也小于1kHz;
DC1[j(k″2),j(k″2)(n′2)]=C1[j(k″),j(k″)(n′)](n′2∈[1,N″2(j(k″2))])
DC1,2[j(k″2),j(k″1)(n″′2)]-DC1,2[j(k″2),j(k″2)(n″′2-1)]>0(n″′2∈[2,N″′2])
max(DC1,2[j(k″2),j(k″2)(n″′2)])-min(DC1,2[j(k″2),j(k″2)(n″′2)])≤1000(n″′2∈[1,N″′2])
其中DC1[j(k″2),j(k″2)(n′2)]代表下扫型三维水声时频域信号在第j个采样周期中第k″2个基频经抗混叠处理后的频谱的第n′2个点,N″2(j(k″2))代表下扫型三维水声时频域信号在第j个采样周期的第k″2个基频经抗混叠处理后的频谱的位点数的总数,DC1,2[j(k″2),j(k″2)(n″′2)]表示下扫型三维水声时频域信号在第j个采样周期第k″2个基频经抗混叠处理后的频谱的第n″′2个点的第二维度值,即频率值,N″′2代表第j个采样周期中的第k″1个下扫型信号DC1,2[j(k″1)]中频率递增的点的总数;
所述上扫型的判断方法为:
通讯信号的频率变动趋势主要为上升,即使有频率下降的部分,其频率变动范围也小于1kHz;
UC1[j(k″3),j(k″3)(n′3)]=C1[j(k″),j(k″)(n′)](n′3∈[1,N″3(j(k″3))])
UC1,2[j(k″3),j(k″3)(n″′3)]-UC1,2[j(k″3),j(k″3)(n″′3-1)]<0(n″′3∈[2,N″′3])
max(UC1,2[j(k″3),j(k″3)(n″′3)])-min(UC1,2[j(k″3),j(k″3)(n″′3)])≤1000(n″′3∈[1,N″′3])
其中UC1[j(k″3),j(k″3)(n′3)]代表上扫型三维水声时频域信号在第j个采样周期中第k″3个基频经抗混叠处理后的频谱的第n′3个点,N″3(j(k″3))代表上扫型三维水声时频域信号在第j个采样周期的第k″3个基频经抗混叠处理后的频谱的位点数的总数,UC1,2[j(k″3),j(k″3)(n″′3)]表示上扫型三维水声时频域信号在第j个采样周期第k″3个基频经抗混叠处理后的频谱的第n″′3个点的第二维度值,即频率值,N″′3代表第j个采样周期中的第k″3个上扫型信号UC1[j(k″3)]中频率递增的点的总数;
所述U-型的判断方法为:
通讯信号的频率变动情况为开始主要是下降,之后主要为上升,同时各且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConcC1[j(k″4),j(k″4)(n′4)]=C1[j(k″),j(k″)(n′)](n′4∈[1,N″4(j(k″4))])
Figure FDA0003032173730000121
Figure FDA0003032173730000122
Figure FDA0003032173730000123
其中ConcC1[j(k″4),j(k″4)(n′4)]代表U-型三维水声时频域信号在第j个采样周期中第k″4个基频经抗混叠处理后的频谱的第n′4个点,N″4(j(k″4))代表U-型三维水声时频域信号在第j个采样周期的第k″4个基频经抗混叠处理后的频谱的位点数的总数,ConcC1,2[j(k″4),j(k″4)(n″′4)]表示U-型三维水声时频域信号在第j个采样周期第k″4个基频经抗混叠处理后的频谱的第n″′4个点的第二维度值,即频率值,N″4(j(k″4))代表ConcC1[j(k″4)]中频率递增的点的总数,
Figure FDA0003032173730000124
代表ConcC1[j(k″4)]的拐点位置,
Figure FDA0003032173730000125
代表第j个采样周期中的第j(k″4)个U-型信号ConcC1[j(k″4)]的拐点总数;
所述凸型的判断方法为:
通讯信号哨叫声的频率变动情况为开始主要是上升之后主要为下降,同时各有且只有一个上升或下降枝的频率跨度超过1kHz,以及至少有一个拐点;
ConvC1[j(k″5),j(k″5)(n′5)]=C1[j(k″),j(k″)(n′)](n′5∈[1,N″5(j(k″5))])
Figure FDA0003032173730000131
Figure FDA0003032173730000132
Figure FDA0003032173730000133
其中ConvC1[j(k″5),j(k″5)(n′5)]代表凸型三维水声时频域信号在第j个采样周期中第k″5个基频经抗混叠处理后的频谱的第n′5个点,N″5(j(k″5))代表凸型三维水声时频域信号在第j个采样周期的第k″5个基频经抗混叠处理后的频谱的位点数的总数,ConvC1,2[j(k″5),j(k″5)(n″′5)]表示凸型三维水声时频域信号在第j个采样周期第k″5个基频经抗混叠处理后的频谱的第n″′5个点的第二维度值,即频率值,N″5(j(k″5))代表ConvC1[j(k″5)]中频率递增的点的总数,
Figure FDA0003032173730000134
代表ConvC1[j(k″5)]的拐点位置,
Figure FDA0003032173730000135
代表第j个采用周期中的第k″5个凸型信号ConvC1[j(k″5)]的拐点总数;
所述弦型的判断方法为:
通讯信号的频率变动趋势为先上升然后下降或者先下降然后上升循环往复,同时至少有两个拐点;
SC1[j(k″6),j(k″6)(n′6)]=C1[j(k″),j(k″)(n′)](n′6∈[1,N″6(j(k″6))])
Figure FDA0003032173730000136
其中SC1[j(k″6),j(k″6)(n′6)]代表弦型三维水声时频域信号在第j个采样周期中第k″6个基频经抗混叠处理后的频谱的第n′6个点,N″6(j(k″6))代表弦型三维水声时频域信号在第j个采样周期的第k″6个基频经抗混叠处理后的频谱的位点数的总数,
Figure FDA0003032173730000137
代表第j个采用周期中的第k″6个弦型信号SC1[j(k″6)]的拐点总数;
将经抗混叠处理的三维水声时频域信号基频,依次通过所述平滑型的判断方法、所述下扫型的判断方法、所述上扫型的判断方法、所述U-型的判断方法、所述凸型的判断方法、所述弦型的判断方法,判断经抗混叠处理的三维水声时频域信号基频所对应的时频域模型,作为声谱类型。
4.一种应用于如权利要求1-3任一项所述基于鲸豚类低频水声信号的实时在线识别分类方法的基于鲸豚类低频水声信号的实时在线识别分类装置,其特征在于,包括:
水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块、终端显示模块;
所述的水听器、滤波器、放大器、信号采集卡、微处理器、无线传输模块通过有线方式依次串联连接;所述无线传输模块与所述终端显示模块通过无线方式连接;
所述水听器用于采集水声信号;所述滤波器用于对水声信号进行滤波得到滤波后水声信号;所述放大器用于对滤波后水声信号进行放大得到放大后水声信号;所述信号采集卡用于对放大后水声信号进行模数转换采样得到水声数字信号,并将水声数字信号传输至所述微处理器;所述微处理器根据水声数字信号,通过所述基于鲸豚类低频通讯信号的实时在线监测预警方法得到鲸豚监测结果,将鲸豚监测结果通过所述无线传输模块无线传输至所述终端显示模块进行显示;
所述终端显示模块包括移动客户端和实验室客户端;
所述移动客户端可以通过安装开发的鲸类实时在线监测***APP,获得目标鲸类的实时监测信息并实现实时预警功能;
所述实验室客户端可以供专业机构的科研人员进行鲸类通讯信号的深度分析和相关研究和保护工作。
CN202010180238.2A 2020-03-16 2020-03-16 一种基于鲸豚类低频水声信号的实时在线识别分类*** Active CN111414832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010180238.2A CN111414832B (zh) 2020-03-16 2020-03-16 一种基于鲸豚类低频水声信号的实时在线识别分类***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010180238.2A CN111414832B (zh) 2020-03-16 2020-03-16 一种基于鲸豚类低频水声信号的实时在线识别分类***

Publications (2)

Publication Number Publication Date
CN111414832A CN111414832A (zh) 2020-07-14
CN111414832B true CN111414832B (zh) 2021-06-25

Family

ID=71493032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010180238.2A Active CN111414832B (zh) 2020-03-16 2020-03-16 一种基于鲸豚类低频水声信号的实时在线识别分类***

Country Status (1)

Country Link
CN (1) CN111414832B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112926409B (zh) * 2021-02-03 2022-09-02 自然资源部第一海洋研究所 一种水生动物调频类型信号时频特征的人工辅助提取方法
CN113030986B (zh) * 2021-03-09 2021-09-28 中国科学院水生生物研究所 一种不同鲸类种群间隔离程度的确定方法及***
CN113688276A (zh) * 2021-08-26 2021-11-23 厦门大学 一种齿鲸实时监测与判别方法及其***
CN117251717B (zh) * 2023-11-17 2024-02-09 成都立思方信息技术有限公司 多个不同信号同步信道化提取方法、装置、设备及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178261B1 (en) * 1997-08-05 2001-01-23 The Regents Of The University Of Michigan Method and system for extracting features in a pattern recognition system
CN102928844A (zh) * 2012-11-08 2013-02-13 中北大学 一种水下亚波长分辨率三维成像方法
CN103854646A (zh) * 2014-03-27 2014-06-11 成都康赛信息技术有限公司 一种实现数字音频自动分类的方法
CN107063263A (zh) * 2017-04-10 2017-08-18 中国水产科学研究院淡水渔业研究中心 一种跟踪鲸类动物的方法
CN107527625A (zh) * 2017-09-06 2017-12-29 哈尔滨工程大学 基于仿生听觉***中耳蜗模型的海豚哨声信号听觉特征提取方法
CN107731235A (zh) * 2017-09-30 2018-02-23 天津大学 抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法及装置
CN108680245A (zh) * 2018-04-27 2018-10-19 天津大学 鲸豚类Click类叫声与传统声呐信号分类方法及装置
CN108802735A (zh) * 2018-06-15 2018-11-13 华南理工大学 一种用于未知声速环境的水下目标定位及测速方法和装置
CN109765562A (zh) * 2018-12-10 2019-05-17 中国科学院声学研究所 一种三维前视声像声纳***和方法
CN109856639A (zh) * 2019-02-28 2019-06-07 安庆师范大学 基于物联网的长江江豚被动声呐定位和追踪***及方法
CN110211596A (zh) * 2019-05-29 2019-09-06 哈尔滨工程大学 一种基于Mel子带谱熵鲸目动物哨声信号检测方法
CN110460393A (zh) * 2019-06-28 2019-11-15 天津大学 利用鲸/海豚叫声脉冲数量差异进行编解码的通信方法
CN209946380U (zh) * 2019-05-08 2020-01-14 湖南省水产科学研究所 一种长江江豚实时监测装置
CN110827837A (zh) * 2019-10-18 2020-02-21 中山大学 一种基于深度学习的鲸鱼活动音频分类方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060241937A1 (en) * 2005-04-21 2006-10-26 Ma Changxue C Method and apparatus for automatically discriminating information bearing audio segments and background noise audio segments
US9208225B1 (en) * 2012-02-24 2015-12-08 Google Inc. Incentive-based check-in
US9280599B1 (en) * 2012-02-24 2016-03-08 Google Inc. Interface for real-time audio recognition
CN106503336B (zh) * 2016-10-21 2019-09-27 哈尔滨工程大学 一种海豚嘀嗒声信号建模与合成的方法
CN106952649A (zh) * 2017-05-14 2017-07-14 北京工业大学 基于卷积神经网络和频谱图的说话人识别方法
CN108055087B (zh) * 2017-12-30 2024-04-02 天津大学 利用长肢领航鲸叫声谐波数量进行编码的通信方法及装置
US11100918B2 (en) * 2018-08-27 2021-08-24 American Family Mutual Insurance Company, S.I. Event sensing system
CN109599120B (zh) * 2018-12-25 2021-12-07 哈尔滨工程大学 一种基于大规模养殖场厂哺乳动物异常声音监测方法
CN110764094A (zh) * 2019-10-25 2020-02-07 南京奥达升智能科技有限公司 一种水下三维可视化探测***及其探测方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6178261B1 (en) * 1997-08-05 2001-01-23 The Regents Of The University Of Michigan Method and system for extracting features in a pattern recognition system
CN102928844A (zh) * 2012-11-08 2013-02-13 中北大学 一种水下亚波长分辨率三维成像方法
CN103854646A (zh) * 2014-03-27 2014-06-11 成都康赛信息技术有限公司 一种实现数字音频自动分类的方法
CN107063263A (zh) * 2017-04-10 2017-08-18 中国水产科学研究院淡水渔业研究中心 一种跟踪鲸类动物的方法
CN107527625A (zh) * 2017-09-06 2017-12-29 哈尔滨工程大学 基于仿生听觉***中耳蜗模型的海豚哨声信号听觉特征提取方法
CN107731235A (zh) * 2017-09-30 2018-02-23 天津大学 抹香鲸与长鳍领航鲸叫声脉冲特征提取和分类方法及装置
CN108680245A (zh) * 2018-04-27 2018-10-19 天津大学 鲸豚类Click类叫声与传统声呐信号分类方法及装置
CN108802735A (zh) * 2018-06-15 2018-11-13 华南理工大学 一种用于未知声速环境的水下目标定位及测速方法和装置
CN109765562A (zh) * 2018-12-10 2019-05-17 中国科学院声学研究所 一种三维前视声像声纳***和方法
CN109856639A (zh) * 2019-02-28 2019-06-07 安庆师范大学 基于物联网的长江江豚被动声呐定位和追踪***及方法
CN209946380U (zh) * 2019-05-08 2020-01-14 湖南省水产科学研究所 一种长江江豚实时监测装置
CN110211596A (zh) * 2019-05-29 2019-09-06 哈尔滨工程大学 一种基于Mel子带谱熵鲸目动物哨声信号检测方法
CN110460393A (zh) * 2019-06-28 2019-11-15 天津大学 利用鲸/海豚叫声脉冲数量差异进行编解码的通信方法
CN110827837A (zh) * 2019-10-18 2020-02-21 中山大学 一种基于深度学习的鲸鱼活动音频分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Deep Machine Learning Techniques for the Detection and Classification of Sperm Whale Bioacoustics;Peter C. Bermant等;《nature research》;20190829;第1-10页 *
Dolphin whistle classification for determining group identities;S.Datta等;《Signal Processing》;20011217;第251–258页 *
一种宽吻海豚通讯信号自动分类的方法;杨武夷等;《声学学报》;20160315;第41卷(第2期);第181-188页 *
鲸豚类动物声信号的分析及识别;郭龙祥等;《声学技术》;20110615;第30卷(第3期);第64-66页 *

Also Published As

Publication number Publication date
CN111414832A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN111414832B (zh) 一种基于鲸豚类低频水声信号的实时在线识别分类***
González-Hernández et al. Marine mammal sound classification based on a parallel recognition model and octave analysis
CN113567969B (zh) 一种基于水下声信号的非法采砂船自动监控方法及***
WO2005024782B1 (en) Method and apparatus for automatically identifying animal species from their vocalizations
Lin et al. An automatic detection algorithm for extracting the representative frequency of cetacean tonal sounds
CN109741759B (zh) 一种面向特定鸟类物种的声学自动检测方法
Duan et al. Acoustic component detection for automatic species recognition in environmental monitoring
CN112068120A (zh) 基于二维傅里叶变换的微多普勒时频平面单兵小分队识别方法
CN111540368B (zh) 一种稳健的鸟声提取方法、装置及计算机可读存储介质
Wang et al. Convolutional neural network-based moving ground target classification using raw seismic waveforms as input
CN115578678A (zh) 一种鱼类摄食强度分类方法及***
CN115410711A (zh) 基于声音信号特征和随机森林的白羽肉鸡健康监测方法
Rademan et al. Soft-output signal detection for cetacean vocalizations using spectral entropy, k-means clustering and the continuous wavelet transform
Xie et al. Detecting frog calling activity based on acoustic event detection and multi-label learning
Berger et al. Bird audio detection-dcase 2018
Xie et al. Detection of anuran calling activity in long field recordings for bio-acoustic monitoring
CN117153168A (zh) 鲸类回声定位信号的检测与提取方法、***、设备及介质
Xie et al. Acoustic feature extraction using perceptual wavelet packet decomposition for frog call classification
Cosentino et al. Porpoise click classifier (PorCC): A high-accuracy classifier to study harbour porpoises (Phocoena phocoena) in the wild
Towsey et al. Technical Report: Acoustic analysis of the natural environment
Boucher et al. A fully automatic wildlife acoustic monitor and survey system
Wang et al. Applying machine learning method to identify indo-pacific humpback dolphin click signals
Sánchez-García et al. A novel image-processing based method for the automatic detection, extraction and characterization of marine mammal tonal calls
Jose et al. Real-time sound detection of rose-ringed parakeet using lstm network with mfcc and mel spectrogram
Wei et al. Recognition of behavior state of Penaeus vannamei based on passive acoustic technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant