JP2011247950A - 信号特徴抽出装置および信号特徴抽出方法 - Google Patents
信号特徴抽出装置および信号特徴抽出方法 Download PDFInfo
- Publication number
- JP2011247950A JP2011247950A JP2010118536A JP2010118536A JP2011247950A JP 2011247950 A JP2011247950 A JP 2011247950A JP 2010118536 A JP2010118536 A JP 2010118536A JP 2010118536 A JP2010118536 A JP 2010118536A JP 2011247950 A JP2011247950 A JP 2011247950A
- Authority
- JP
- Japan
- Prior art keywords
- feature extraction
- data
- feature
- signal
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】信号特徴抽出装置は、所定期間だけサンプリングされたデジタル入力信号を周波数軸に変換する複素フーリエ変換手段、複素フーリエ変換手段において変換されたデータから高次局所相関特徴データを抽出する特徴抽出手段を備える。特徴抽出手段の後あるいは前に所定の帯域毎にデータを加算するフィルター手段を備えてもよい。音声、音響信号あるいはその他の時系列信号から高精度に特徴を抽出することができ、位相に特徴がある信号の識別精度が向上する。
【選択図】図1
Description
(1)信号に含まれる各周波数成分の位相情報が抽出されておらず、位相に特徴がある信号の識別精度が低かった。
(2)各周波数成分からの線形特徴を抽出しており、周波数間での関係性に注目した特徴量はほとんど提案されていない。
(1)音声、音響信号あるいはその他の時系列信号から高精度に特徴を抽出することができ、位相に特徴がある信号の識別精度が向上する。
(2)高次局所自己相関により、周波数間の関係性を効果的に抽出することが可能となり、識別精度が向上する。
Index HLAC、以下PHLAC)と記す)のいずれか1つの特徴データを算出する。
FHLACは本発明者が発明したフーリエ高次局所自己相関特徴である。まず、図3右側に示された時間軸および周波数軸にそって配列された多数の複素数データFの内の1つに注目し、その注目複素数データと予め定められたマスクパターンによって決定される近傍の複素数データとの相関値を算出する。この処理を全てのマスクパターンについて実行することによって、1つの注目複素数データに関して、マスクパターンの数と等しい複数の複素数データXの集合からなる特徴データが得られる。
マスクパターンの黒丸●のある位置の複素数データ同士の相関値が算出される。同じ位置に2個以上の黒丸●があるときは、その値が2個以上あると考えて他と同様に相関を取る(自分自身を2回以上かける)。なお、特徴データの抽出には1次あるいは2次マスクの一方のみを使用してもよいし、1次および2次マスクの双方を使用してもよい。
なお、図4のパターン(5)、(29)など、自分自身のみのマスクパターンの場合には、実数値の特徴が得られ、これは従来のパワースペクトル特徴に一致する。
PHLACはやはり本発明者が発明したフーリエ高次局所自己相関特徴である。図3右側に示された時間軸および周波数軸にそって2次元に配列された多数の複素数データFの1つに注目し、その注目複素数データと予め定められたマスクパターンによって決定される近傍の複素数データとの相関値を算出する。この際、各複素数データについて位相情報を量子化表現(ベクトル表現)に変換してから相関をとる。
なお、PHLACにおいては、自分自身を2回以上選択する相関(図4のマスクパターン(5)、(21)〜(29))はとらない。
図7はMelフィルターの特性例を示す説明図である。公知のMelフィルターは、複数のバンドパスフィルターからなるフィルターバンクである。各フィルターの特性は図7に示すような3角形の形をしており、それぞれのフィルターの重みを積分した値は同一となっている。
前記したMelフィルターは各バンドパスフィルターの中心周波数が対数スケールにおいて等間隔に配置されているが、信号によってはこれが最適な配置とは限らない。そこで、本発明者は以下に示す分布平滑化フィルターを発明した。この分布平滑化フィルターにおいては、Melフィルターと同様に複数のバンドパスフィルターからなるフィルターバンクを用いる。
フィルターをこのように構成すれば、入力信号の特性に合わせて、振幅の大きな帯域はバンドパスフィルターの帯域幅が狭くなり、特徴を細かく抽出することができる。従って、認識、識別精度が向上する。
11…コンピューター
12…モニタ装置
13…キーボード
14…マウス
Claims (7)
- 所定期間だけサンプリングされたデジタル入力信号を周波数軸に変換する複素フーリエ変換手段と、
前記複素フーリエ変換手段において変換されたデータから高次局所相関特徴データを抽出する特徴抽出手段と
を備えたことを特徴とする信号特徴抽出装置。 - 前記高次局所相関特徴は、時間軸および周波数軸にそって2次元に配列された多数のデータの内の1つに注目し、その注目データと予め定められたマスクパターンによって決定される近傍のデータとの相関値を算出するものであることを特徴とする請求項1に記載の特徴抽出装置。
- 前記高次局所相関特徴は、フーリエ変換手段から入力された複素データの位相情報をベクトル表現に変換するベクトル変換手段を備えていることを特徴とする請求項2に記載の特徴抽出装置。
- 複数のバンドパスフィルターからなるフィルターバンクであり、各バンドパスフィルターは入力されたデータに重みを乗算して加算し、出力するフィルター手段が、前記複素フーリエ変換手段と前記特徴抽出手段の間に、あるいは前記特徴抽出手段の後に配置されていることを特徴とする請求項1に記載の特徴抽出装置。
- 前記フィルター手段は、入力信号を参照して、各バンドパスフィルターの帯域幅が振幅の時間平均値の周波数分布が一様になるように決定された分布平滑化フィルターであることを特徴とする請求項4に記載の特徴抽出装置。
- 前記特徴抽出手段の後にあるいは前記フィルター手段の後に振幅情報の対数変換手段が配置されたことを特徴とする請求項2に記載の特徴抽出装置。
- 所定期間だけサンプリングされたデジタル入力信号を周波数軸に変換する複素フーリエ変換処理を行うステップと、
前記複素フーリエ変換処理において変換されたデータから高次局所相関特徴データを抽出する特徴抽出処理を行うステップと
を含むことを特徴とする信号特徴抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010118536A JP5598815B2 (ja) | 2010-05-24 | 2010-05-24 | 信号特徴抽出装置および信号特徴抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010118536A JP5598815B2 (ja) | 2010-05-24 | 2010-05-24 | 信号特徴抽出装置および信号特徴抽出方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013253726A Division JP5644934B2 (ja) | 2013-12-09 | 2013-12-09 | 信号特徴抽出装置および信号特徴抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011247950A true JP2011247950A (ja) | 2011-12-08 |
JP5598815B2 JP5598815B2 (ja) | 2014-10-01 |
Family
ID=45413332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010118536A Active JP5598815B2 (ja) | 2010-05-24 | 2010-05-24 | 信号特徴抽出装置および信号特徴抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5598815B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015177602A (ja) * | 2014-03-13 | 2015-10-05 | 株式会社東芝 | 列車制御車上装置 |
CN107967917A (zh) * | 2016-10-19 | 2018-04-27 | 福特全球技术公司 | 通过神经网络机器学习的车辆周围音频分类 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01233499A (ja) * | 1988-03-14 | 1989-09-19 | Nec Corp | 音声信号符号化復号化方法及びその装置 |
JPH10332774A (ja) * | 1997-05-29 | 1998-12-18 | Hitachi Ltd | 電子デバイス特性評価装置の制御装置 |
JP2008116588A (ja) * | 2006-11-01 | 2008-05-22 | National Institute Of Advanced Industrial & Technology | 特徴抽出装置及び方法並びにプログラム |
JP2008145504A (ja) * | 2006-12-06 | 2008-06-26 | Nippon Telegr & Teleph Corp <Ntt> | 信号特徴抽出方法、信号特徴抽出装置、信号特徴抽出プログラム、及びその記録媒体 |
JP2008185845A (ja) * | 2007-01-30 | 2008-08-14 | National Institute Of Advanced Industrial & Technology | 1次元信号の変換値からのhlac特徴抽出方法および装置 |
WO2009034686A1 (ja) * | 2007-09-11 | 2009-03-19 | Panasonic Corporation | 音判定装置、音検知装置及び音判定方法 |
-
2010
- 2010-05-24 JP JP2010118536A patent/JP5598815B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01233499A (ja) * | 1988-03-14 | 1989-09-19 | Nec Corp | 音声信号符号化復号化方法及びその装置 |
JPH10332774A (ja) * | 1997-05-29 | 1998-12-18 | Hitachi Ltd | 電子デバイス特性評価装置の制御装置 |
JP2008116588A (ja) * | 2006-11-01 | 2008-05-22 | National Institute Of Advanced Industrial & Technology | 特徴抽出装置及び方法並びにプログラム |
JP2008145504A (ja) * | 2006-12-06 | 2008-06-26 | Nippon Telegr & Teleph Corp <Ntt> | 信号特徴抽出方法、信号特徴抽出装置、信号特徴抽出プログラム、及びその記録媒体 |
JP2008185845A (ja) * | 2007-01-30 | 2008-08-14 | National Institute Of Advanced Industrial & Technology | 1次元信号の変換値からのhlac特徴抽出方法および装置 |
WO2009034686A1 (ja) * | 2007-09-11 | 2009-03-19 | Panasonic Corporation | 音判定装置、音検知装置及び音判定方法 |
Non-Patent Citations (2)
Title |
---|
CSNJ201010075198; 加藤俊祐他: '"フィッシャー重みマップを利用した高次局所自己相関特徴による音素認識"' 日本音響学会2005年秋季研究発表会講演論文集CD-ROM , 200509, pp.171-172 * |
JPN6013050125; 加藤俊祐他: '"フィッシャー重みマップを利用した高次局所自己相関特徴による音素認識"' 日本音響学会2005年秋季研究発表会講演論文集CD-ROM , 200509, pp.171-172 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015177602A (ja) * | 2014-03-13 | 2015-10-05 | 株式会社東芝 | 列車制御車上装置 |
CN107967917A (zh) * | 2016-10-19 | 2018-04-27 | 福特全球技术公司 | 通过神经网络机器学习的车辆周围音频分类 |
Also Published As
Publication number | Publication date |
---|---|
JP5598815B2 (ja) | 2014-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101122838B1 (ko) | 음원 신호 분리 장치 및 방법, 및 피치 검출 장치 및 방법 | |
JP6027087B2 (ja) | スペクトル挙動の変換を実行する音響信号処理システム及び方法 | |
JP5101316B2 (ja) | 基本周波数の高調波及び分数調波の抑制を用いたピッチ抽出 | |
JP4650662B2 (ja) | 信号処理装置および信号処理方法、プログラム、並びに記録媒体 | |
CN107305774A (zh) | 语音检测方法和装置 | |
US20120103166A1 (en) | Signal Processing Device, Signal Processing Method, and Program | |
JP5644934B2 (ja) | 信号特徴抽出装置および信号特徴抽出方法 | |
JP2015097355A (ja) | 収音装置及びその制御方法、プログラム | |
CN112786057B (zh) | 一种声纹识别方法、装置、电子设备及存储介质 | |
JP2013205830A (ja) | トーン成分検出方法、トーン成分検出装置およびプログラム | |
JP4705480B2 (ja) | 高調波信号の基本周波数を求める方法 | |
JP5598815B2 (ja) | 信号特徴抽出装置および信号特徴抽出方法 | |
JP4496378B2 (ja) | 定常雑音下における音声区間検出に基づく目的音声の復元方法 | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP5825607B2 (ja) | 信号特徴抽出装置および信号特徴抽出方法 | |
Ram et al. | Deep neural network based speech enhancement | |
JP5131863B2 (ja) | Hlac特徴量抽出方法、異常検出方法及び装置 | |
Baghel et al. | Classification of multi speaker shouted speech and single speaker normal speech | |
JP2017067929A (ja) | 学習装置、識別装置、その方法、およびプログラム | |
JP7014682B2 (ja) | 音源分離の評価装置および音源分離装置 | |
JP5579884B2 (ja) | 音識別条件選定装置および異音判定装置 | |
de León et al. | A complex wavelet based fundamental frequency estimator in singlechannel polyphonic signals | |
US20220301536A1 (en) | Mask generation device, mask generation method, and recording medium | |
CN113703568B (zh) | 手势识别方法、手势识别装置、手势识别***及存储介质 | |
Chithra et al. | A Comprehensive Study of Time-Frequency Analysis of Musical Signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140804 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5598815 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |