TWI783215B

TWI783215B - 信號處理系統及其信號降噪的判定方法與信號補償方法

Info

Publication number: TWI783215B
Application number: TW109107165A
Authority: TW
Inventors: 卓卿安; 陳裕彥; 黃國庭
Original assignee: 緯創資通股份有限公司
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2022-11-11
Also published as: US11380346B2; TW202135520A; US20210280204A1; CN113362838B; CN113362838A

Abstract

一種信號降噪的判定方法，包含轉換該信號以產生時頻譜；決定時頻譜當中每一行之頻譜是否具急劇變化；及計數具急劇變化的行數目，並與預設值做比較。若具急劇變化的行數目大於預設值，表示信號經過降噪。

Description

信號處理系統及其信號降噪的判定方法與信號補償方法

本發明係有關信號處理，特別是關於一種信號降噪的判定方法與信號補償方法。

網路監視器(Internet protocol camera或IP cam)是數位攝影機的一種，藉由網際網路以傳送影像資料，可用於監視或其他應用。網路監視器除了傳送影像資料，也可同時傳送聲音資料。

網路監視器的聲音資料可用以提供額外的服務，例如用於偵測嬰兒的哭聲。在一應用例中，使用深層類神經網路(例如卷積神經網路(convolutional neural network, CNN))訓練一個聲音的模型(model)，據以後續進行聲音辨識。作為訓練用之資料集(dataset)，通常是未經過降噪(noise reduction)處理的。然而，當進行聲音辨識時，很多麥克風在擷取聲音時則會進行降噪。因此，使用這類麥克風的網路監視器，其聲音辨識率會有降低的現象。

因此亟需提出一種新穎的機制，用以避免傳統網路監視器的缺失，以提高聲音辨識率。

鑑於上述，本發明實施例的目的之一在於提出一種信號降噪的判定方法與信號補償方法，用以判定信號是否經過降噪處理，並根據判定結果對信號進行補償。

根據本發明實施例之信號降噪的判定方法，轉換信號以產生時頻譜。決定時頻譜當中每一行之頻譜是否具急劇變化。計數具急劇變化的行數目，並與預設值做比較。若具急劇變化的行數目大於預設值，表示信號經過降噪。

第一圖顯示本發明實施例之聲音補償方法100的流程圖，可適用於聲音辨識(recognition)的應用，例如深層類神經網路(deep neural network)的聲音辨識。第二圖顯示本發明實施例之聲音補償系統200的方塊圖。本實施例雖以聲音補償作為例示，然而本發明可普遍適用於其他種類(電子)信號(例如影像信號)的補償。

於步驟11，使用換能器(transducer)，將物理量(physical quantity)轉換為電子信號。在本實施例中，使用麥克風21，將聲波(sound wave)轉換為聲音信號。在一實施例中，麥克風21係設於網路監視器22，用以偵測嬰兒哭聲。如果已知麥克風21於接收聲音時會進行降噪(可為被動降噪或主動降噪)，則流程進入步驟17以進行信號補償，否則執行步驟12~16以進行信號降噪的判定。

於步驟12，使用記錄器(recorder)對信號進行取樣與類比至數位轉換，以利信號處理器25進行後續處理且能儲存於儲存裝置24。在本實施例中，聲音記錄器(sound recorder)23記錄麥克風21所轉換的聲音信號，亦即，對聲音信號進行取樣與類比至數位轉換。第三A圖例示聲音信號的強度(或振幅)時序圖，其縱軸代表信號強度，橫軸代表時間。

於步驟13，信號處理器25接收並處理聲音信號，以找出含有聲音的區段，並捨棄未含有聲音的區段。在本說明書中，含有聲音的區段係指該區段之聲音信號的強度大於預設強度。本實施例找出含有聲音的區段，有利後續判別麥克風21於接收聲音時是否進行降噪。

在一實施例中，於聲音信號的時序圖當中，每隔預設期間(例如100毫秒)取其平均強度，再與預設強度作比較，強度大於預設強度者判定為含有聲音的區段。第三B圖例示於聲音信號的時序圖當中，每隔預設期間取其平均強度。在本實施例中，信號強度的單位為全量程相對分貝(decibel relative to full scale, dBFS)，0代表最大強度。於第三B圖所例示時序圖當中，預設強度31為-35 dBFS，大約相當於一般的交談聲量。第三C圖顯示經與預設強度比較後所得到含有聲音的區段32。

於步驟14，信號處理器25轉換(含有聲音區段的)聲音信號以產生時頻譜(spectrogram)，在本實施例中為聲譜圖(sonograph)，其代表聲音信號的頻譜相對於時間的關係。第三D圖例示聲音信號的聲譜圖，其縱軸代表頻率，橫軸代表時間，每一點(pixel)的亮度則相應於能量強度的大小(例如，能量強度愈大則點愈亮)。在本實施例中，聲譜圖之時間的單位使用行(frame)，其根據信號的取樣頻率而得到。鑑於人耳對赫茲(Hz)頻率的感知並非呈線性關係，因此在本實施例中，頻率的單位係使用梅爾頻率(mel frequency)f_mel ，使得人耳對頻率的感知可呈線性關係。梅爾頻率f_mel 與赫茲(Hz)頻率f_Hz 的關係可表示為：f_mel =2595xlog₁₀ (1+f_Hz /700)。

於步驟15，信號處理器25決定聲譜圖當中每一行(frame)之頻譜是否具急劇變化(sharp change)，用以判別麥克風21於接收聲音時是否進行降噪。在本實施例中，每一行之頻譜若具有至少一信號斜率大於預設斜率值，則該行判定為具急劇變化。在另一實施例中，每一行之頻譜若具有至少二信號斜率大於預設斜率值，則該行判定為具急劇變化。概括而言，對於每一行之頻譜，若信號斜率大於預設斜率值的數目等於或大於預設閥值，則該行判定為具急劇變化。

第四圖顯示第一圖之步驟15的細部流程圖。於步驟151，根據目前行(frame)的頻譜，將能量強度予以排序。第五A圖例示目前行的頻譜，其縱軸代表能量強度，橫軸代表頻率。例如，將能量強度由小至大排序後可得到[-80,-80,-78.5,…,-21,-20,-16]。

接著，於步驟152，根據複數(例如排序後的前10%)最小能量強度，取其平均值作為波谷閥值51(第五A圖)；根據複數(例如排序後的後20%)最大能量強度，取其平均值作為波峰閥值52(第五A圖)。

於步驟153，根據波谷閥值51，於頻譜(如第五A圖所示)當中決定波谷點。如第五B圖所示局部放大頻譜，於波谷閥值51轉折處，最後一個小於波谷閥值51者為波谷點53。根據波峰閥值52，於頻譜當中決定波峰點。如第五C圖所示局部放大頻譜，於波峰閥值52轉折處，第一個大於波峰閥值52者為波峰點54。

於步驟154，將相鄰波谷點53與波峰點54配對。第五D圖例示波谷點53與波峰點54的配對55，其中波谷點53位波峰點54的左側。

於步驟155，決定每一配對55當中波谷點53與波峰點54連線的斜率。接著，於步驟156，決定目前行中斜率大於預設斜率值的配對55數目是否等於或大於預設閥值。如果步驟156的決定為肯定，則表示目前行具急劇變化(步驟157)，否則表示目前行不具急劇變化(步驟158)。第五E圖例示目前行存在有一配對55，其斜率大於預設斜率值(其相當於75度)。對於聲譜圖的每一行(或部分行)，重複執行上述步驟151至157。

回到第一圖，於步驟16，計數具急劇變化的行(frame)數目，並與預設值作比較。如果具急劇變化的行數目大於預設值(例如大於全部的二分之一)，表示麥克風21於接收聲音時確實進行降噪，則流程進入步驟17，用以對聲音信號進行補償。

於步驟17，使用合成器26將麥克風21所轉換的聲音信號與雜訊源27所提供的雜訊予以相加，以得到補償信號。在本實施例中，雜訊源27係提供加成性高斯白雜訊(additive white Gaussian noise, AWGN)，其能量密度在整個頻域內係均勻分布的。在本實施例中，根據信噪比(SNR)以決定所加入雜訊的比例。信噪比愈高，表示加入的雜訊能量愈低；反之，信噪比愈低，表示加入的雜訊能量愈高。

第六圖顯示第一圖之步驟17的細部流程圖。首先，於步驟171，根據補償前的聲譜圖(如第三D圖所例示)以得到補償前的相應能量直方圖。第七A圖例示補償前的能量直方圖，其橫軸代表能量強度，縱軸代表點(pixel)數。在一實施例中，根據聲譜圖，於每一個能量區間(例如5dB)，計數其相應點的數目，據以得到能量直方圖。於步驟172，根據加入雜訊後的聲譜圖，以得到相應的能量直方圖。

於步驟173，比較補償前之能量直方圖的標準差與加入雜訊後之能量直方圖的標準差。如果加入雜訊後的(第二)標準差相較於補償前的(第一)標準差之增加比例值(percentage increase)介於預設範圍(例如7-13%)內，則結束聲音信號的補償；否則，調整雜訊源27的雜訊(步驟174)，回到步驟172，重新得到相應能量直方圖及標準差。

第七B圖例示補償後的能量直方圖，其標準差為2515。相較於第七A圖所示補償前的能量直方圖(其標準差為2277)，補償後的標準差相較於補償前的標準差之增加比例值為10.4%，其介於預設範圍(7-13%)內。

以上所述僅為本發明之較佳實施例而已，並非用以限定本發明之申請專利範圍；凡其它未脫離發明所揭示之精神下所完成之等效改變或修飾，均應包含在下述之申請專利範圍內。

100:聲音補償方法 11:決定麥克風是否降噪 12:記錄聲音信號 13:找出含有聲音的區段 14:產生聲譜圖 15:決定聲譜圖每一行之頻譜是否具急劇變化 151:將目前行的能量強度予以排序 152:決定波谷閥值與波峰閥值 153:根據閥值以決定波谷點與波峰點 154:將相鄰波谷點與波峰點配對 155:決定配對的斜率 156:決定斜率大於預設斜率值的配對數目是否等於或大於預設閥值 157:具急劇變化 158:不具急劇變化 16:決定具急劇變化的行數是否大於預設值 17:對聲音信號進行補償 171:得到補償前的能量直方圖 172:得到加入雜訊後的能量直方圖 173:決定標準差增加比例值是否介於預設範圍 174:調整雜訊 200:聲音補償系統 21:麥克風 22:網路監視器 23:聲音記錄器 24:儲存裝置 25:信號處理器 26:合成器 27:雜訊源 31:預設強度 32:含有聲音的區段 51:波谷閥值 52:波峰閥值 53:波谷點 54:波峰點 55:配對

第一圖顯示本發明實施例之聲音補償方法的流程圖。第二圖顯示本發明實施例之聲音補償系統的方塊圖。第三A圖例示聲音信號的強度時序圖。第三B圖例示於聲音信號的時序圖當中，每隔預設期間取其平均強度。第三C圖顯示經與預設強度比較後所得到含有聲音的區段。第三D圖例示聲音信號的聲譜圖。第四圖顯示第一圖之步驟15的細部流程圖。第五A圖例示目前行的頻譜。第五B圖至第五C圖例示局部放大頻譜。第五D圖例示波谷點與波峰點的配對。第五E圖例示目前行存在有配對，其斜率大於預設斜率值。第六圖顯示第一圖之步驟17的細部流程圖。第七A圖例示補償前的能量直方圖。第七B圖例示補償後的能量直方圖。

100:聲音補償方法

11:決定麥克風是否降噪

12:記錄聲音信號

13:找出含有聲音的區段

14:產生聲譜圖

15:決定聲譜圖每一行之頻譜是否具急劇變化

16:決定具急劇變化的行數是否大於預設值

17:對聲音信號進行補償

Claims

一種信號降噪的判定方法，包含：(a)轉換該信號以產生一時頻譜；(b)決定該時頻譜當中每一行之頻譜是否具急劇變化；及(c)計數具急劇變化的行數目，並與一預設值做比較；其中若具急劇變化的行數目大於該預設值，表示該信號經過降噪；其中該步驟(b)包含：於該頻譜當中決定至少一波谷點及至少一波峰點；將相鄰的該波谷點與該波峰點配對；決定每一行中配對的斜率，若斜率大於一預設斜率值的配對數目等於或大於一預設閥值，則相應行之頻譜具急劇變化。
如請求項1之信號降噪的判定方法，更包含以下步驟：(d)對經過降噪之該信號進行補償。
如請求項2之信號降噪的判定方法，其中該步驟(d)包含：加入一雜訊至經過降噪之該信號。
如請求項3之信號降噪的判定方法，其中該雜訊包含加成性高斯白雜訊。
如請求項1之信號降噪的判定方法，其中該步驟(b)包含：根據一波谷閥值，於該頻譜當中決定該至少一波谷點，且根據一波峰閥值，於該頻譜當中決定該至少一波峰點。
如請求項5之信號降噪的判定方法，其中該步驟(b)更包含：根據該頻譜當中複數最小能量強度，取其平均值作為該波谷閥值，且根據該頻譜當中複數最大能量強度，取其平均值作為該波峰閥值。
如請求項1之信號降噪的判定方法，更包含：將一物理量轉換為該信號。
如請求項7之信號降噪的判定方法，更包含：處理該信號以找出含有該物理量的區段，並捨棄未含有該物理量的區段。
如請求項1之信號降噪的判定方法，其中該信號為聲音信號。
如請求項9之信號降噪的判定方法，其中該時頻譜的頻率單位為梅爾頻率。
一種信號補償方法，包含：根據補償前的該信號，以得到補償前的能量直方圖，其相應一第一標準差；根據加入雜訊的該信號，以得到加入雜訊的能量直方圖，其相應一第二標準差；比較該第二標準差與該第一標準差，以得到增加比例值；及若該增加比例值未介於一預設範圍，則調整加入的雜訊並得到一新的增加比例值，直到該新的增加比例值介於該預設範圍。
如請求項11之信號補償方法，其中該雜訊包含加成性高斯白雜訊。
如請求項11之信號補償方法，其中該信號為聲音信號。
一種信號處理系統，包含：一換能器，將一物理量轉換為該信號；一信號處理器，執行以下步驟：(a)轉換該信號以產生一時頻譜；(b)決定該時頻譜當中每一行之頻譜是否具急劇變化；及(c)計數具急劇變化的行數目，並與一預設值做比較，其中若具急劇變化的行數目大於該預設值，表示該信號經過降噪；一雜訊源，提供一雜訊；及一合成器，將該雜訊加入經過降噪的該信號，以得到一補償信號；其中該步驟(b)包含：於該頻譜當中決定至少一波谷點及至少一波峰點；將相鄰的該波谷點與該波峰點配對；決定每一行中配對的斜率，若斜率大於一預設斜率值的配對數目等於或大於一預設閥值，則相應行之頻譜具急劇變化。
如請求項14之信號處理系統，其中該雜訊包含加成性高斯白雜訊。
如請求項14之信號處理系統，更包含：一記錄器，對該信號進行取樣與類比至數位轉換，以記錄該信號；及一儲存裝置，用以儲存該記錄的信號。
如請求項14之信號處理系統，其中該信號為聲音信號。
如請求項17之信號處理系統，其中該時頻譜的頻率單位為梅爾頻率。