JP3248522B2 - 音源種別識別装置 - Google Patents
音源種別識別装置Info
- Publication number
- JP3248522B2 JP3248522B2 JP20616599A JP20616599A JP3248522B2 JP 3248522 B2 JP3248522 B2 JP 3248522B2 JP 20616599 A JP20616599 A JP 20616599A JP 20616599 A JP20616599 A JP 20616599A JP 3248522 B2 JP3248522 B2 JP 3248522B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound source
- learning
- neural network
- source type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
に関し、特に交差点において発生する衝撃音の音源を識
別する音源種別識別装置に関する。
めには、事故発生を早期検出し通報するシステムによっ
て二次災害を防止したり、事故の事後処理の早期解決を
図るとともに、事故発生のメカニズムを解析することが
不可欠である。事故発生のメカニズムを解析するために
は、事故やニアミス事象の検出を行なうことが必要であ
り、事故などによる衝突音や急ブレーキ音などの交通音
響に基づき事故などを検出することが行なわれている。
その音圧による解析と、周波数分布による線形的な解析
を行なうことが一般的である。ここでいう音圧による解
析とは、時系列の音圧分布において、音圧の変動値が予
め定められたしきい値を超えるような状態が観測された
場合、衝撃音が発生したとするものである。
圧判定によって衝撃音と判定された音響信号の周波数解
析を行ない、そのスペクトル分布から衝撃音の音源を特
定するものがある。
法で解析し、音源の特定を行なう場合、事故音と似たよ
うな特徴を示す音、たとえば大型車の荷台の雑音や工事
作業中に発生する金属音など、事故音との音源の識別が
困難であるものも存在する。これにより、事故の誤検出
が発生する可能性もある。
AMS)による交通事故の発生メカニズムに関する研
究」(科学警察研究所報告,交通編,Vol.38,N
o.2,64−81,1997)の第6章「考察」の
「(3)事故記録から見た識別性能」の部分において
は、「交差点に放置された空き缶や道路の側溝の蓋をタ
イヤで踏みつける音などは事故音と類似した性質を示
し、それらを識別することは現時点では困難である。さ
らに、道路工事などによる金属音などを不動作にするこ
とはできない。実際に、TAAMSの映像記録の中に
は、大型トラックの通過しただけの映像であるとか、特
別な現象が発生していないにもかかわらず記録されてい
る例が観察される。」と記載されており、音響処理によ
る線形的な解析方法を用いた事故検出の精度には一定の
限界があることが報告されている。
種別を識別することができる音源種別識別装置を提供す
ることを目的としている。
この発明のある局面に従うと、音源種別識別装置は、音
響を入力する入力手段と、入力された音響の音圧を測定
する測定手段と、測定手段の測定結果に基づいて、入力
された音響のパワースペクトル分布を演算する演算手段
と、演算されたパワースペクトル分布を複数のサブバン
ドに分割する分割手段と、複数のサブバンドに分割され
たパワースペクトル分布のそれぞれに基づいて、入力さ
れた音響の音源種別の判定を行なう、学習機能を有する
判定手段と、判定手段の学習結果を審査する審査手段
と、審査手段の審査結果に基づいて、判定手段の再学習
を行なう再学習手段とを備える。
手段により、複数のサブバンドに分割されたパワースペ
クトル分布のそれぞれに基づいて音源種別の判定が行な
われるため、より正確に音響の音源種別を識別すること
ができる音源種別識別装置を提供することが可能とな
る。また、学習結果の審査を行ない、その結果に基づい
て再学習が行なわれるため、精度の高い判定ができる。
撃音の音圧が測定されたときに演算を行なう。
に演算を行なうようにすると、衝撃音の音源種別の判定
を効率的に行なうことができる。
ワークにより構成される。好ましくは再学習手段は、遺
伝アルゴリズムを用いて再学習を行なう。
明の第1の実施の形態における音源種別識別装置につい
て説明する。本実施の形態における音源種別識別装置
は、線形的なパターン認識ではなく、ニューラルネット
ワークなどを用いた非線形な対応づけによる音源識別ア
ルゴリズムを採用しており、そのアルゴリズムにより音
源種別を判定する。
発生を検出し、周波数解析によってそのスペクトル分布
を求め、求められたスペクトル分布をいくつかの周波数
帯域にサブバンド化する。そして、そのサブバンド化さ
れたスペクトル分布をニューラルネットワークに対して
入力し、音源の種別を判定させる。このような方法を適
用した場合、ニューラルネットワークによって音源種別
の識別が行なわれると同時に、フィールドで装置を自己
学習させながら判定精度を向上させることができる。
を有するアルゴリズムを構築することで、音源種別の大
幅な判定精度の向上が期待できる。
別装置の構成を示すブロック図である。
付近(特に交差点付近など)における交通音響を収集す
るためのマイクロホン101と、マイクロホン101で
収集された音響の音圧を測定し、演算を行なう音圧演算
回路103と、音響のパワースペクトルを演算するパワ
ースペクトル演算回路105と、パワースペクトルをい
くつかの周波数帯域にサブバンド化するサブバンド化演
算回路107と、音源の種別を判定するニューラルネッ
トワーク109と、ニューラルネットワーク109の出
力結果を用いてニューラルネットワーク109を学習さ
せる学習回路111とから構成される。
の音源が何であるかを示す音源種別信号が出力される。
示すフローチャートである。図を参照してステップS1
01で、マイクロホン101を用いて、交差点などの道
路における交通音響が収集される。ステップS103
で、音圧演算回路は収集された交通音響の時系列の音圧
分布から、衝撃音が発生したか否かを判定する。発生し
ていなければステップS101へ戻り、発生したのであ
れば、ステップS105へ進む。
事故により衝撃音が発生した場合、時系列の音圧分布を
観察すれば、急激に音圧レベルが上昇する地点が観測さ
れる。そこで、予めしきい値を定めておき、音圧の変動
値がそのしきい値を超えた場合、衝撃音が発生したと判
断するのである。
で、その時点における音響データの周波数解析を行な
い、パワースペクトル演算回路105においてパワース
ペクトル分布が演算される。
107により、求められたパワースペクトル分布が複数
のサブバンドに分割される。
トルを示す。たとえばサブバンド化は、所定の周波数範
囲内に含まれるパワースペクトルの平均をとることなど
により行なうことができる。
されたスペクトル値がニューラルネットワーク109の
入力層にそれぞれ入力される。ニューラルネットワーク
は予め人の与えた教師信号によって十分知能化されてお
り、これによりステップS111で衝撃音がいかなる種
別の音源によるものか判定される。
ンド化されたスペクトル値が入力されたときに、ニュー
ラルネットワークの出力層に現われるパターンから、
(1,0,0,…,0,0,0)なら車両衝突音、
(0,1,0,…,0,0,0)なら急ブレーキ音とい
ったような方法で音源の特定は行なわれる。
トワーク109の判定結果(音源種別信号)が学習回路
111に入力され、これによりスペクトル分布データと
音源種別との対応づけがニューラルネットワーク109
で学習される。
S101へ戻る。人の与えた教師信号によるニューラル
ネットワークの知能化とは、予め収集された複数の衝撃
音のスペクトル分布データと音源種別とを対応づけて、
ニューラルネットワークに予め学習させておくことであ
る。このようにして、一般的に交差点で発生する衝撃音
データの学習が行なわれる。
識別を行なう場合、入力された音響のスペクトル分布と
識別した音源種別とを対応づけて、新たにそのデータを
ニューラルネットワークに学習させることが行なわれ
る。このような学習は、人の手を介することなく自動的
に行なうことが可能である。
−1)個の衝撃音データを学習したニューラルネットワ
ークを実際のフィールドで使用する場合、以下のような
処理が行なわれる。
法について説明するためのフローチャートである。
教師信号による学習がニューラルネットワークで行なわ
れる。これにより、ニューラルネットワークの初期化が
行なわれる。
検出された衝撃音の音源データ(N番目のデータ)がニ
ューラルネットワーク109に入力される。
ク109は、N番目のデータの音源を識別する。判別し
た衝撃音のスペクトル分布と音源種別との対応づけをN
番目のデータとして自動的にニューラルネットワーク1
09は学習する(S209)。ステップS211で、N
の値を1インクリメントし、ステップS205へ戻る。
ーラルネットワークにより、次に検出された衝撃音
((N+1)のデータ)の音源種別が識別される。
繰返すことで、より高度に知能化しながら自動的にニュ
ーラルネットワークは学習を続けていく。それにより、
音源種別の識別をより正確に行なうことができるように
なる。
ステムとしてニュートラルネットワークを用いている
が、学習機能を有するカオスやファジィなどを用いたシ
ステムを用いることもできる。
形態における音源種別識別装置においては、学習機能を
有するアルゴリズムを構築することで自らの音源識別性
能を向上させることが可能である。しかし、一方でニュ
ーラルネットワークの自己学習に関して、一般的に用い
られる山下り法による誤差逆伝播法などにおいては、学
習結果が局所最適解に陥る可能性があり、学習したこと
によってかえって音源識別性能が低下するおそれがあ
る。
結果できあがったニューラルネットワークが十分な学習
を行なえたかどうかをチェックし、学習結果が適切でな
い場合に、より高度な学習手法を用いて再度学習を行な
う。ここでは、再学習させる手法として、遺伝アルゴリ
ズム(GAとも称する)を用いる方法を採用している。
ワークにおいて、学習に用いた複数のデータをニューラ
ルネットワークに判定させ、その判定誤差の値が予め定
められたしきい値を超えた場合、学習が適切でないと判
断し、遺伝アルゴリズムを用いて再度学習をやり直し
て、最適なニューラルネットワークを構成させるように
する方法を採用する。
ータの組(染色体)を複数発生させ、それらに対して遺
伝アルゴリズムの手法に沿って、(選択、淘汰)→(交
叉)→(突然変異)を順番に繰返し行ない、判定誤差の
値が予め定められたしきい値以内におさまった場合に、
そのパラメータ組(染色体)を最適なものとして採用す
るという方法である。
別装置の構成を示すブロック図である。
源種別識別装置は、音響を入力するマイクロホン101
と、入力された音響データの音圧を測定する音圧演算回
路103と、測定された時系列の音圧分布データから、
衝撃音発生の有無を判定し、発生した衝撃音を周波数解
析することでパワースペクトル分布を演算するパワース
ペクトル演算回路105と、パワースペクトル分布を複
数のサブバンドに分割するサブバンド化演算回路107
と、サブバンド化されたスペクトル分布を入力するニュ
ーラルネットワーク109と、ニューラルネットワーク
109によって音源種別の判定を行なう音源識別回路2
05とを備える。
111によってニューラルネットワーク109をより高
度に、自動的に知能化する学習機能を備えることを特徴
としている。
ーラルネットワークの学習結果を審査する学習結果審査
回路201を有しており、学習が適切か否かを審査す
る。また、音源種別識別装置は、学習結果審査回路20
1による自己審査によって学習が適切でないと判定され
る場合、遺伝アルゴリズムを用いて繰返し再学習を行な
う再学習回路203を備えている。
きあがったニューラルネットワークを、衝撃音の音源識
別に適用するのが妥当であるか否かを判定する。すなわ
ち、現在まで学習した衝撃音データの中から1個以上
(N+1)個以下の衝撃音データを選択し、(N+1)
個の衝撃音データを学習し終えたニューラルネットワー
クに対し、それらの選択された衝撃音データの音源を判
定させる。
づけが正しく行なわれているか否かが、学習結果審査回
路201により審査される。学習結果審査回路201で
は、発火すべき出力層のニューロンの値が予め定められ
たしきい値を超えているか否かを基準として判定を行な
う。もし、しきい値を超えていない場合には、再学習回
路203によってニューラルネットワークは再度学習さ
れる。
を用いてニューラルネットワークに与えるパラメータ組
を決定する。ニューラルネットワークに与えるパラメー
タとしては、ネットワーク中の各ニューロンとニューロ
ンとを結合するリンクの重みデータや、ニューロン数な
どが考えられる。ここでは、重みデータを例に挙げて説
明する。
様子を示すフローチャートである。図を参照して、ま
ず、ニューラルネットワーク109に与える初期の重み
データ組をランダムに複数個(p個)作り、これを遺伝
アルゴリズムにおける染色体と定義する(S301)。
る。それぞれの染色体について、ニューラルネットワー
クを学習させることで、新たな染色体B1,B2,…,B
pが誕生する(S303)。
ークに与えられている各重みデータ組を新たな染色体と
して作成するのである。その中から音源種別の識別精度
の高い染色体のみを複数個(q個)選択し(選択、淘
汰)、選択された染色体をC1,C2,…Cqとする(p
>q)(S305)。
染色体間で遺伝子の組替えを行ない(交叉)(S30
7)、またランダムに染色体を突然変異させて新しい染
色体を複数発生させる(突然変異)(S309)。
うち、学習結果審査回路201の基準を満たすものがあ
れば(S311でYES)、その染色体をニューラルネ
ットワーク109に与える重みに決定して、再学習を終
える(S313)。
311でNO)、染色体の中から音源種別の識別精度の
高い染色体のみを選択し、交叉、突然変異の順番に行な
い、審査基準を満足するような染色体が発生するまでこ
の操作を繰返す。
適切に学習したニューラルネットワークを用いて、次に
検出された衝撃音の音源が識別される。このように、音
源の識別とそのデータの学習、審査、再学習を順次繰返
すことで、より高度にニューラルネットワークの知能化
を行ないながら学習は続けられる。
別装置の学習の流れを示すフローチャートである。
の教師信号による学習が行なわれる。ステップS403
で、音源種別識別装置はフィールド(現地)に設置され
る。ステップS405で、N番目のデータがマイクロホ
ン101より入力される。
データの音源の識別が行なわれ、そのデータはステップ
S409で学習される。
い、審査基準を満足するかが判定される。ここでYES
であれば、ステップS415で、Nの値を1インクリメ
ントし、ステップS405へ戻る。
ステップS413で再学習回路203により遺伝アルゴ
リズムを用いた再学習が行なわれ、ステップS411へ
戻る。
より判定精度の高い音源種別識別装置を提供することが
可能となる。
点で例示であって、制限的なものではないと考えられる
べきである。本発明の範囲は上記した説明ではなくて特
許請求の範囲によって示され、特許請求の範囲と均等の
意味および範囲内でのすべての変更が含まれることが意
図される。
識別装置の構成を示すブロック図である。
る。
るための図である。
ーラルネットワークに入力されるデータを示す図であ
る。
ローチャートである。
のブロック図である。
た再学習の処理を示すフローチャートである。
ワークの学習プロセスを示すフローチャートである。
パワースペクトル演算回路、107 サブバンド化演
算回路、109 ニューラルネットワーク、111 学
習回路、201 学習結果審査回路、203 再学習回
路。
Claims (4)
- 【請求項1】 音響を入力する入力手段と、 前記入力された音響の音圧を測定する測定手段と、 前記測定手段の測定結果に基づいて、前記入力された音
響のパワースペクトル分布を演算する演算手段と、 前記演算されたパワースペクトル分布を複数のサブバン
ドに分割する分割手段と、 前記複数のサブバンドに分割されたパワースペクトル分
布のそれぞれに基づいて、前記入力された音響の音源種
別の判定を行なう、学習機能を有する判定手段と、 前記判定手段の学習結果を審査する審査手段と、 前記審査手段の審査結果に基づいて、前記判定手段の再
学習を行なう再学習手段とを備えた、音源種別識別装
置。 - 【請求項2】 前記演算手段は、前記測定手段により衝
撃音の音圧が測定されたときに演算を行なう、請求項1
に記載の音源種別識別装置。 - 【請求項3】 前記判定手段はニューラルネットワーク
により構成される、請求項1または2に記載の音源種別
識別装置。 - 【請求項4】 前記再学習手段は、遺伝アルゴリズムを
用いて再学習を行なう、請求項1から3のいずれかに記
載の音源種別識別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20616599A JP3248522B2 (ja) | 1999-07-21 | 1999-07-21 | 音源種別識別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20616599A JP3248522B2 (ja) | 1999-07-21 | 1999-07-21 | 音源種別識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001033304A JP2001033304A (ja) | 2001-02-09 |
JP3248522B2 true JP3248522B2 (ja) | 2002-01-21 |
Family
ID=16518893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20616599A Expired - Fee Related JP3248522B2 (ja) | 1999-07-21 | 1999-07-21 | 音源種別識別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3248522B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4629922B2 (ja) * | 2001-07-05 | 2011-02-09 | 三菱電機エンジニアリング株式会社 | 交通事故音検出装置 |
JP5791092B2 (ja) * | 2007-03-06 | 2015-10-07 | 日本電気株式会社 | 雑音抑圧の方法、装置、及びプログラム |
KR101810539B1 (ko) * | 2017-04-18 | 2017-12-19 | 주식회사 핸디소프트 | 교통사고 판단 장치 및 방법 |
JP6994874B2 (ja) * | 2017-08-31 | 2022-01-14 | リオン株式会社 | アノテーション装置および騒音測定システム |
JP6749874B2 (ja) * | 2017-09-08 | 2020-09-02 | Kddi株式会社 | 音波信号から音波種別を判定するプログラム、システム、装置及び方法 |
KR102281676B1 (ko) * | 2019-10-18 | 2021-07-26 | 한국과학기술원 | 파형 음원 신호를 분석하는 신경망 모델에 기반한 음원 분류 방법 및 분석장치 |
JPWO2021215221A1 (ja) * | 2020-04-24 | 2021-10-28 |
-
1999
- 1999-07-21 JP JP20616599A patent/JP3248522B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001033304A (ja) | 2001-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Karim et al. | Comparison of fuzzy-wavelet radial basis function neural network freeway incident detection model with California algorithm | |
JP4242422B2 (ja) | 突発事象の記録・解析システム | |
KR101493552B1 (ko) | 신호판정방법, 신호판정장치, 프로그램, 신호판정시스템 | |
CN109616140B (zh) | 一种异常声音分析*** | |
CN110736968B (zh) | 基于深度学习的雷达异常状态诊断方法 | |
CN110188737B (zh) | 基于锂电池安全阀开启声信号检测的热失控预警方法 | |
CN114155879B (zh) | 一种利用时频融合补偿异常感知及稳定性的异音检测方法 | |
CN112039903B (zh) | 基于深度自编码神经网络模型的网络安全态势评估方法 | |
CN113762329A (zh) | 一种大型轧机状态预测模型的构建方法及构建*** | |
US5712796A (en) | Method for evaluating the faulted sections and states in a power transmission line | |
JP3248522B2 (ja) | 音源種別識別装置 | |
CN106198749A (zh) | 一种基于金属裂纹监测的多路传感器的数据融合方法 | |
EP2028651A1 (en) | Method and apparatus for detection of specific input signal contributions | |
CN107992902B (zh) | 一种基于监督学习的地面公交扒窃个体自动检测方法 | |
CN113064976A (zh) | 基于深度学习算法的事故车判定方法 | |
CN111476102A (zh) | 一种安全防护方法、中控设备及计算机存储介质 | |
Smailov et al. | A novel deep CNN-RNN approach for real-time impulsive sound detection to detect dangerous events | |
CN117007977B (zh) | 一种储能电池健康状态诊断方法 | |
Harlow et al. | Automated accident detection system | |
WO2000070310A1 (fr) | Dispositif d'identification de signal faisant intervenir un algorithme genetique et systeme d'identification en ligne | |
CN117786538A (zh) | 基于代价敏感改进的CsAdaBoost集成学习算法 | |
JP3164100B2 (ja) | 交通音源種別識別装置 | |
CN116720073A (zh) | 一种基于分类器的异常检测提取方法与*** | |
JP3012449B2 (ja) | 音響信号の識別方法および装置 | |
CN116910662A (zh) | 基于随机森林算法的旅客异常识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20011009 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071109 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081109 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091109 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091109 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101109 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |