JP7304301B2 - 音響診断方法、音響診断システム、及び音響診断プログラム - Google Patents
音響診断方法、音響診断システム、及び音響診断プログラム Download PDFInfo
- Publication number
- JP7304301B2 JP7304301B2 JP2020017101A JP2020017101A JP7304301B2 JP 7304301 B2 JP7304301 B2 JP 7304301B2 JP 2020017101 A JP2020017101 A JP 2020017101A JP 2020017101 A JP2020017101 A JP 2020017101A JP 7304301 B2 JP7304301 B2 JP 7304301B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- spectrogram
- harmonic
- sudden
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
<実施形態1の音響診断システム1の状態推定モデルの学習時の構成>
図1は、実施形態1に係る音響診断システム1の状態推定モデルの学習時の構成を示すブロック図である。音響診断システム1は、状態推定モデルの学習時の構成として、入力音取得部11、前処理部12、調波音-突発音音源分離部13、ベクトル連結部14、状態推定モデル学習部15、及び状態推定モデルデータベース16を有する。
図2は、実施形態1に係る音響診断システム1の状態推定モデルの学習時の処理を示すフローチャートである。
図3は、実施形態1に係る音響診断システム1の状態推定実行時の構成を示すブロック図である。音響診断システム1は、状態推定実行時の構成として、入力音取得部11、前処理部12、調波音-突発音音源分離部13、ベクトル連結部14、状態推定モデルデータベース16、状態推定部21、及び状態推定結果出力部22を有する。
図4は、実施形態1に係る音響診断システム1の状態推定実行時の処理を示すフローチャートである。本処理において、ステップS11では、入力音取得部11は、マイクロホンを介して取得又は収録された、音響診断対象の設備の稼働音を含む診断用のアナログ入力音を、デジタル入力音(時間領域デジタル入力音)に変換する。
本実施形態によれば、機械等の人工の設備音は本質的に調波音成分と突発音成分のどちらかに属すると仮定できるため、調波音-突発音音源分離(HPSS)を利用することにより、対象音が複雑な場合であっても状態推定に効果的な特徴量を得ることができる。
<実施形態2の音響診断システム1Bの状態推定モデルの学習時の構成>
図5は、実施形態2に係る音響診断システム1Bの正常音モデルの学習時の構成を示すブロック図である。音響診断システム1Bは異常検知システムであり、実施形態1との違いは、音響診断により推定する設備の状態を正常か異常の二つに限定している点である。このため、音響診断システム1Bは、正常音モデルの学習時の構成として、音響診断システム1と比較して、状態推定モデル学習部15及び状態推定モデルデータベース16のそれぞれに代えて、正常音モデル学習部15B及び正常音モデルデータベース16Bを有する。
図6は、実施形態2に係る音響診断システム1Bの異常検知実行時の構成を示すブロック図である。音響診断システム1Bは、状態推定実行時の構成として、音響診断システム1と比較して、状態推定部21、状態推定結果出力部22、及び状態推定モデルデータベース16のそれぞれに代えて、異常検知部21B、異常度出力部22B、及び正常音モデルデータベース16Bを有する。
本実施形態によれば、診断対象音が正常音であるか異常音であるかを判別することができる。
<実施形態3の音響診断システム1Cの状態推定モデルの学習時の構成>
図7は、実施形態3に係る音響診断システム1Cの状態推定モデルの学習時の構成を示すブロック図である。本実施形態は、低頻度成分を雑音として除去することで状態推定精度を高めることを目的とする。音響診断システム1Cは、実施形態1と比較して、状態推定モデルの学習時の構成として、調波音-突発音音源分離部13の前段に最近傍フィルタリング部12Cを有し、低頻度な成分(音声、作業音、流水音などの突発的あるいは不規則な音)を不要な雑音として除去する点が異なる。
図8は、実施形態3に係る音響診断システム1Cの状態推定モデルの学習時の処理を示すフローチャートである。実施形態3に係る音響診断システム1Cの状態推定モデルの学習時の処理は、実施形態1に係る音響診断システム1の状態推定モデルの学習時の処理(図2)と比較して、次の点が異なる。
図9は、実施形態3に係る音響診断システム1Cの状態推定実行時の構成を示すブロック図である。音響診断システム1Cは、音響診断システム1と比較して、状態推定実行時の構成として、調波音-突発音音源分離部13の前段に最近傍フィルタリング部12Cを有する点が異なる。
図10は、実施形態3に係る音響診断システム1Cの状態推定実行時の処理を示すフローチャートである。実施形態3に係る音響診断システム1Cの状態推定実行時の処理は、実施形態1に係る音響診断システム1の状態推定実行時の処理(図4)と比較して、次の点が異なる。
本実施形態によれば、例えば診断対象の装置らしくない環境雑音と仮定できる低頻度の成分(音声、作業音、流水音など突発的あるいは不規則な音)を、HPSSの前段のNNフィルタで雑音除去することで、対象音の特徴量の複雑さを低減し、特徴量に基づく音響診断の精度を向上させることができる。
本実施形態では、複数チャンネルのマイクロホンを介して取得又は収録された音声データを利用し、歪みの無いフィルタリングにより状態推定精度を高める。実施形態3と比較して、本実施形態では、診断に用いるデータを単チャンネルから複数チャンネルに拡張し、無歪のフィルタリングを実現する点で異なる。
図11は、実施形態4に係る音響診断システム1Dの状態推定モデルの学習時の構成を示すブロック図である。
図12は、実施形態4に係る音響診断システム1Dの状態推定モデルの学習時の処理を示すフローチャートである。実施形態4に係る音響診断システム1Dの状態推定モデルの学習時の処理は、実施形態3に係る音響診断システム1Cの状態推定モデルの学習時の処理(図8)と比較して、次の点が異なる。
図13は、実施形態4に係る音響診断システム1Dの状態推定実行時の構成を示すブロック図である。音響診断システム1Dは、状態推定実行時の構成として、音響モデル学習時の構成と比較して、状態推定モデル学習部15及び状態推定モデルデータベース16のそれぞれに代えて、状態推定部21、状態推定結果出力部22、及び状態推定モデルデータベース16を有する。
図14は、実施形態4に係る音響診断システムの状態推定実行時の処理を示すフローチャートである。実施形態4に係る音響診断システム1Dの状態推定実行時の処理は、状態推定モデルの学習時の処理(図12)と比較して、ステップS18に代えてステップS21及びS22が実行される点が異なる。
本実施形態では、多チャンネルマイクロホンを用いて取得又は収録された音響診断対象の設備の稼働音を含む対象音を高頻度成分と低頻度成分とに分離し、高頻度成分をH成分(調波音成分)とP成分(突発音成分)に分離する。H成分のステアリングベクトルを生成し、P成分及び低頻度成分を用いてH成分に対する雑音の空間共分散行列を求める。また、P成分のステアリングベクトルを生成し、H成分及び低頻度成分を用いてP成分に対する雑音の空間共分散行列を求める。そして、これらのステアリングベクトル及び空間共分散行列を用いて対象音を強調するフィルタを生成し、フィルタリングすることで、異常検知の精度を高めることができる。
本実施形態では、HPSSによって入力音が音源分離された調波音及び突発音の何れか一方を強調するフィルタを計算し、多チャンネルの対象音に対し、調波音及び突発音の何れか一方からステアリングベクトルを生成し、他方から空間共分散行列を生成し、調波音及び突発音の何れか一方を強調するフィルタリングを行って、状態推定精度を高める。
図15は、実施形態5に係る音響診断システム1Eの状態推定モデルの学習時の構成を示すブロック図である。
図16は、実施形態5に係る音響診断システム1Eの状態推定実行時の構成を示すブロック図である。音響診断システム1Eは、状態推定実行時の構成として、音響モデル学習時の構成と比較して、状態推定モデル学習部15及び状態推定モデルデータベース16に代えて、状態推定部21、状態推定結果出力部22、及び状態推定モデルデータベース16を有する。
本実施形態では、対象音と周辺雑音がそれぞれ調波音成分と突発音成分に分離される場合、調波音成分を用いて対象音のステアリングベクトルを生成し、突発音成分を用いて雑音の空間共分散行列を求めることができる。それらを用いて対象音を強調するフィルタを生成し、フィルタリングすることで異常検知の精度を高めることができる。
図17は、音響診断システム1,1B,1C,1D,1Eを実現するコンピュータ5000のハードウェア構成を示す図である。
Claims (12)
- 音響診断システムが実行する音響診断方法であって、
診断対象設備の稼働音を含む入力音を取得する入力音取得工程と、
前記入力音のスペクトログラムを計算する前処理工程と、
前記スペクトログラムを、調波音-突発音音源分離により、調波音スペクトログラム及び突発音スペクトログラムへ分離する音源分離工程と、
前記調波音スペクトログラム及び前記突発音スペクトログラムを連結した特徴量ベクトルを生成する特徴量ベクトル生成工程と、
前記特徴量ベクトルと学習モデルに基づいて前記診断対象設備の状態を推定する状態推定工程と
を含んだことを特徴とする音響診断方法。 - 前記状態推定工程によって推定された前記診断対象設備の状態を出力する状態推定結果出力工程
を含んだことを特徴とする請求項1に記載の音響診断方法。 - 学習用の前記入力音から生成された前記特徴量ベクトルに基づいて前記学習モデルを生成する学習モデル生成工程
を含んだことを特徴とする請求項1に記載の音響診断方法。 - 前記学習モデルは、学習用の前記入力音から生成された前記特徴量ベクトルの正常時の分布をモデル学習した正常音モデルであり、
前記状態推定工程において、診断用の前記入力音から生成された前記特徴量ベクトルと前記学習モデルに基づいて前記診断対象設備が正常か否かを推定する
ことを特徴とする請求項3に記載の音響診断方法。 - 前記前処理工程によって計算された前記スペクトログラムを高頻度成分スペクトログラム及び低頻度成分スペクトログラムへ分離する頻度分離工程
を含み、
前記音源分離工程において、前記頻度分離工程によって分離された前記低頻度成分スペクトログラムが除去されたスペクトログラムを、前記調波音スペクトログラム及び前記突発音スペクトログラムへ分離する
ことを特徴とする請求項1~4の何れか1項に記載の音響診断方法。 - 前記入力音取得工程において、多チャンネルの前記入力音を取得し、
前記前処理工程によって計算された前記スペクトログラムを高頻度成分スペクトログラム及び低頻度成分スペクトログラムへ分離し、前記高頻度成分スペクトログラムを前記音源分離工程へ入力する頻度分離工程と、
前記音源分離工程によって前記高頻度成分スペクトログラムが分離された前記調波音スペクトログラム及び前記突発音スペクトログラムのうち、前記調波音スペクトログラムから第1のステアリングベクトルを生成し、前記突発音スペクトログラムから第2のステアリングベクトルを生成するステアリングベクトル生成工程と、
前記突発音スペクトログラム及び前記低頻度成分スペクトログラムから第1の空間共分散行列を計算し、前記調波音スペクトログラム及び前記低頻度成分スペクトログラムから第2の空間共分散行列を計算する空間共分散行列計算工程と、
前記第1のステアリングベクトル及び前記第1の空間共分散行列から第1のフィルタを計算し、前記第2のステアリングベクトル及び前記第2の空間共分散行列から第2のフィルタを計算するフィルタ計算工程と、
前記入力音取得工程によって取得された多チャンネルの前記入力音に対し前記第1のフィルタを適用することで無歪の前記調波音スペクトログラムを求め、前記入力音に対し前記第2のフィルタを適用することで無歪の前記突発音スペクトログラムを求めるフィルタリング工程と、
を含み、
前記特徴量ベクトル生成工程において、前記フィルタリング工程によって求められた前記調波音スペクトログラム及び前記突発音スペクトログラムを連結して前記特徴量ベクトルを生成する
ことを特徴とする請求項1~4の何れか1項に記載の音響診断方法。 - 音響診断システムが行う音響診断方法であって、
診断対象設備の稼働音を含む多チャンネルの入力音を取得する入力音取得工程と、
前記入力音のスペクトログラムを計算する前処理工程と、
前記スペクトログラムを高頻度成分スペクトログラム及び低頻度成分スペクトログラムへ分離する頻度分離工程と、
前記スペクトログラムから前記低頻度成分スペクトログラムが除去された除去後スペクトログラムを、調波音-突発音音源分離により、調波音スペクトログラム及び突発音スペクトログラムへ分離する音源分離工程と、
前記調波音スペクトログラム及び前記突発音スペクトログラムのうちの第1のスペクトログラムからステアリングベクトルを生成するステアリングベクトル生成工程と、
前記調波音スペクトログラム及び前記突発音スペクトログラムのうちの第2のスペクトログラムから空間共分散行列を計算する空間共分散行列計算工程と、
前記ステアリングベクトル及び前記空間共分散行列からフィルタを計算するフィルタ計算工程と、
前記入力音取得工程によって取得された多チャンネルの前記入力音に対し前記フィルタを適用することで、無歪の前記第1のスペクトログラムを求めるフィルタリング工程と、
前記フィルタリング工程によって求められた無歪の前記第1のスペクトログラムと学習モデルに基づいて前記診断対象設備の状態を推定する状態推定工程と
を含んだことを特徴とする音響診断方法。 - 前記状態推定工程によって推定された前記診断対象設備の状態を出力する状態推定結果出力工程
を含んだことを特徴とする請求項7に記載の音響診断方法。 - 学習用の前記入力音から生成された無歪の前記第1のスペクトログラムに基づいて前記学習モデルを生成する学習モデル生成工程
を含んだことを特徴とする請求項7に記載の音響診断方法。 - 診断対象設備の状態を診断する音響診断システムであって、
診断対象設備の稼働音を含む入力音を取得する入力音取得部と、
前記入力音のスペクトログラムを計算する前処理部と、
前記スペクトログラムを、調波音-突発音音源分離により、調波音スペクトログラム及び突発音スペクトログラムへ分離する音源分離部と、
前記調波音スペクトログラム及び前記突発音スペクトログラムを連結した特徴量ベクトルを生成する特徴量ベクトル生成部と、
前記特徴量ベクトルと学習モデルに基づいて前記診断対象設備の状態を推定する状態推定部と
を備えたことを特徴とする音響診断システム。 - 診断対象設備の状態を診断する音響診断システムであって、
診断対象設備の稼働音を含む多チャンネルの入力音を取得する入力音取得部と、
前記入力音のスペクトログラムを計算する前処理部と、
前記スペクトログラムを高頻度成分スペクトログラム及び低頻度成分スペクトログラムへ分離する頻度分離部と、
前記スペクトログラムから前記低頻度成分スペクトログラムが除去された除去後スペクトログラムを、調波音-突発音音源分離により、調波音スペクトログラム及び突発音スペクトログラムへ分離する音源分離部と、
前記調波音スペクトログラム及び前記突発音スペクトログラムのうちの第1のスペクトログラムからステアリングベクトルを生成するステアリングベクトル生成部と、
前記調波音スペクトログラム及び前記突発音スペクトログラムのうちの第2のスペクトログラムから空間共分散行列を計算する空間共分散行列計算部と、
前記ステアリングベクトル及び前記空間共分散行列からフィルタを計算するフィルタ計算部と、
前記入力音取得部によって取得された多チャンネルの前記入力音に対し前記フィルタを適用することで、無歪の前記第1のスペクトログラムを求めるフィルタリング部と、
前記フィルタリング部によって求められた無歪の前記第1のスペクトログラムと学習モデルに基づいて前記診断対象設備の状態を推定する状態推定部と
を備えたことを特徴とする音響診断システム。 - 請求項10又は11に記載の音響診断システムとしてコンピュータを機能させるための音響診断プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020017101A JP7304301B2 (ja) | 2020-02-04 | 2020-02-04 | 音響診断方法、音響診断システム、及び音響診断プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020017101A JP7304301B2 (ja) | 2020-02-04 | 2020-02-04 | 音響診断方法、音響診断システム、及び音響診断プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021124887A JP2021124887A (ja) | 2021-08-30 |
JP7304301B2 true JP7304301B2 (ja) | 2023-07-06 |
Family
ID=77459030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020017101A Active JP7304301B2 (ja) | 2020-02-04 | 2020-02-04 | 音響診断方法、音響診断システム、及び音響診断プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7304301B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004317248A (ja) | 2003-04-15 | 2004-11-11 | Ricoh Co Ltd | 音響識別方法、騒音評価装置、騒音評価方法、騒音評価プログラム及び記録媒体 |
JP2016095231A (ja) | 2014-11-14 | 2016-05-26 | 積水化学工業株式会社 | 分析データ作成方法、周波数フィルター作成方法、異常音発生位置の特定方法、分析データ作成装置、周波数フィルター作成装置および異常音発生位置の特定装置 |
JP2017090606A (ja) | 2015-11-09 | 2017-05-25 | 日本電信電話株式会社 | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム |
CN106847306A (zh) | 2016-12-26 | 2017-06-13 | 华为技术有限公司 | 一种异常声音信号的检测方法及装置 |
-
2020
- 2020-02-04 JP JP2020017101A patent/JP7304301B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004317248A (ja) | 2003-04-15 | 2004-11-11 | Ricoh Co Ltd | 音響識別方法、騒音評価装置、騒音評価方法、騒音評価プログラム及び記録媒体 |
JP2016095231A (ja) | 2014-11-14 | 2016-05-26 | 積水化学工業株式会社 | 分析データ作成方法、周波数フィルター作成方法、異常音発生位置の特定方法、分析データ作成装置、周波数フィルター作成装置および異常音発生位置の特定装置 |
JP2017090606A (ja) | 2015-11-09 | 2017-05-25 | 日本電信電話株式会社 | 異常音検出装置、異常音検出学習装置、これらの方法及びプログラム |
CN106847306A (zh) | 2016-12-26 | 2017-06-13 | 华为技术有限公司 | 一种异常声音信号的检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2021124887A (ja) | 2021-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10504539B2 (en) | Voice activity detection systems and methods | |
US11282505B2 (en) | Acoustic signal processing with neural network using amplitude, phase, and frequency | |
KR101153093B1 (ko) | 다감각 음성 향상을 위한 방법 및 장치 | |
US8438026B2 (en) | Method and system for generating training data for an automatic speech recognizer | |
JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
JP3154487B2 (ja) | 音声認識の際の雑音のロバストネスを改善するためにスペクトル的推定を行う方法 | |
JP6371516B2 (ja) | 音響信号処理装置および方法 | |
JP5634959B2 (ja) | 雑音/残響除去装置とその方法とプログラム | |
JP2009535674A (ja) | 音源と室内音響の確率モデルに基づく音声残響除去のための方法及び装置 | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
JP4705414B2 (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体 | |
CN112466276A (zh) | 一种语音合成***训练方法、装置以及可读存储介质 | |
Rahman et al. | Dynamic time warping assisted svm classifier for bangla speech recognition | |
JP5974901B2 (ja) | 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
Poorjam et al. | A parametric approach for classification of distortions in pathological voices | |
JP7304301B2 (ja) | 音響診断方法、音響診断システム、及び音響診断プログラム | |
JP2021071586A (ja) | 音抽出システム及び音抽出方法 | |
CN107919136B (zh) | 一种基于高斯混合模型的数字语音采样频率估计方法 | |
JP2003044077A (ja) | 音声特徴量抽出方法と装置及びプログラム | |
Shome et al. | Non-negative frequency-weighted energy-based speech quality estimation for different modes and quality of speech | |
Bonifaco et al. | Comparative analysis of filipino-based rhinolalia aperta speech using mel frequency cepstral analysis and Perceptual Linear Prediction | |
JP6139430B2 (ja) | 信号処理装置、方法及びプログラム | |
Patil et al. | Audio environment identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220629 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230531 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7304301 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |