JP7218688B2 - 位相推定装置、位相推定方法、およびプログラム - Google Patents
位相推定装置、位相推定方法、およびプログラム Download PDFInfo
- Publication number
- JP7218688B2 JP7218688B2 JP2019135981A JP2019135981A JP7218688B2 JP 7218688 B2 JP7218688 B2 JP 7218688B2 JP 2019135981 A JP2019135981 A JP 2019135981A JP 2019135981 A JP2019135981 A JP 2019135981A JP 7218688 B2 JP7218688 B2 JP 7218688B2
- Authority
- JP
- Japan
- Prior art keywords
- phase
- estimator
- group delay
- instantaneous frequency
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
位相スペクトログラムの時間方向の微分(瞬時周波数)と周波数方向の微分(群遅延)は、対数振幅スペクトログラムと関係があることが知られている(参考文献1-3参照)。
〔参考文献2〕Z. Prusa, P. Balazs, and P. L. Sndergaard, "A noniterative method for reconstruction of phase from STFT magnitude," IEEE/ACM Transactions on Audio, Speech, Language Processing, Vol. 25, No. 5, pp. 1154-1164, May 2017.
〔参考文献3〕K. Yatabe, Y. Masuyama, T. Kusano, and Y. Oikawa, "Representation of complex spectrogram via phase conversion," Acoustic Science & Technology, Vol. 40, No. 3, pp. 170-177, May 2019.
式(9)では、瞬時周波数と群遅延の推定精度が、全ての時間周波数ビンで等しいと仮定した。しかし、振幅が小さい時間周波数ビンでは推定精度が悪い可能性がある。そこで、式(9)をσω,τ∈(0, 1)で重みづけした式(10)で求める方法をとることもできる。
本発明で利用するディープニューラルネットワークは、FIFとFGDの2つである。また変形例としてFweightを利用することもできる。この学習は何を利用してもよいが、一例として以下の方法を挙げる。
〔参考文献6〕J. Le Roux, N. Ono, and S. Sagayama, "Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction," In ISCA Workshop on Statistical and Perceptual Audition (SAPA), pp. 23-28, September 2008.
実施形態の位相推定装置は、音声信号の振幅スペクトログラムから位相スペクトログラムを推定して出力する信号処理装置である。実施形態の位相推定装置1は、図2に示すように、瞬時周波数推定部11、群遅延推定部12、および位相推定部13を備える。この位相推定装置1が図3に例示する各ステップの処理を行うことにより実施形態の位相推定方法が実現される。
図4に実施形態の位相推定装置による実行結果の例を示す。図4の一段目はスペクトログラム、二段目は位相スペクトログラム、三段目は瞬時周波数、四段目は群遅延である。図4の二~四段目の左側は真値であり、右側は推定値である。図4の結果から、瞬時周波数と群遅延は、推定値が真値とほぼ一致しており、位相スペクトログラムも精度よく推定できていることがわかる。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図5に示すコンピュータの記憶部1020に読み込ませ、制御部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
11 瞬時周波数推定部
12 群遅延推定部
13 位相推定部
Claims (5)
- 推定すべき位相スペクトログラムをΦとして、Φをτ番目の時間フレームに関する情報ごとに分割した位相情報^φ τ を再帰的に求めることでΦを決定する位相推定装置であって、
音声信号のτ-1番目の時間フレームの音響特徴量から瞬時周波数v τ-1 をディープニューラルネットワークで推定する瞬時周波数推定部と、
上記音声信号のτ番目の時間フレームの音響特徴量から群遅延u τ をディープニューラルネットワークで推定する群遅延推定部と、
^φ τ と^φ τ-1 から求めた瞬時周波数とv τ-1 の差分、および^φ τ から求めた群遅延とu τ の差分を最小化する^φ τ を決定する位相推定部
を含む位相推定装置。 - 音声信号の音響特徴量から瞬時周波数を推定する瞬時周波数推定部と、
上記音声信号の音響特徴量から群遅延を推定する群遅延推定部と、
直前の時刻の位相スペクトルおよび上記瞬時周波数と、現在時刻の上記群遅延とを用いて上記音声信号の位相スペクトログラムを推定する位相推定部と、を含み、
上記位相推定部は、~φτ-1を時刻τ-1の位相スペクトルとし、vτ-1を時刻τ-1の瞬時周波数とし、uτを時刻τの群遅延とし、Dωを周波数方向の差分作用素とし、ΣIFを対角要素が予め学習した重みστ=[σ0,τ, σ1,τ, …, σK-1,τ]Tで与えられる対角行列とし、Iを単位行列とし、ΣGD=I-ΣIFとし、||・||2 Σ=・TΣ・とし、次式を解くことで上記音声信号の位相スペクトル^φτを求める、
位相推定装置。 - 推定すべき位相スペクトログラムをΦとして、Φをτ番目の時間フレームに関する情報ごとに分割した位相情報^φ τ を再帰的に求めることでΦを決定する位相推定方法であって、
瞬時周波数推定部が、音声信号のτ-1番目の時間フレームの音響特徴量から瞬時周波数v τ-1 をディープニューラルネットワークで推定し、
群遅延推定部が、上記音声信号のτ番目の時間フレームの音響特徴量から群遅延u τ をディープニューラルネットワークで推定し、
位相推定部が、^φ τ と^φ τ-1 から求めた瞬時周波数とv τ-1 の差分、および^φ τ から求めた群遅延とu τ の差分を最小化する^φ τ を決定する、
位相推定方法。 - 請求項1から3のいずれかに記載の位相推定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019135981A JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019135981A JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021018398A JP2021018398A (ja) | 2021-02-15 |
JP7218688B2 true JP7218688B2 (ja) | 2023-02-07 |
Family
ID=74565994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019135981A Active JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7218688B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097430A (ja) | 2016-12-08 | 2018-06-21 | 日本電信電話株式会社 | 時系列信号特徴推定装置、プログラム |
JP2019512740A (ja) | 2016-03-18 | 2019-05-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング |
-
2019
- 2019-07-24 JP JP2019135981A patent/JP7218688B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019512740A (ja) | 2016-03-18 | 2019-05-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング |
JP2018097430A (ja) | 2016-12-08 | 2018-06-21 | 日本電信電話株式会社 | 時系列信号特徴推定装置、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021018398A (ja) | 2021-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3479377B1 (en) | Speech recognition | |
Kartal Koc et al. | Model selection in multivariate adaptive regression splines (MARS) using information complexity as the fitness function | |
Piironen et al. | Projection predictive model selection for Gaussian processes | |
WO2018039011A1 (en) | Asychronous training of machine learning model | |
US10244339B2 (en) | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition | |
Cruz et al. | Optimizing quantum phase estimation for the simulation of Hamiltonian eigenstates | |
US20140078867A1 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
US11620530B2 (en) | Learning method, and learning apparatus, and recording medium | |
JP7027365B2 (ja) | 信号処理装置、信号処理方法およびプログラム | |
CN112164008A (zh) | 图像数据增强网络的训练方法及其训练装置、介质和设备 | |
Rendon et al. | Improved error scaling for trotter simulations through extrapolation | |
JP7218688B2 (ja) | 位相推定装置、位相推定方法、およびプログラム | |
Cruz et al. | Superresolution of Green's functions on noisy quantum computers | |
CN112951263A (zh) | 语音增强方法、装置、设备和存储介质 | |
JP4630203B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
Strauss et al. | Towards interval-based non-additive deconvolution in signal processing | |
Krémé et al. | Phase reconstruction for time-frequency inpainting | |
CN112578458B (zh) | 叠前弹性阻抗随机反演方法、装置、存储介质及处理器 | |
JP6912780B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
Sircar et al. | Signal parameter estimation of complex exponentials using fourth order statistics: additive Gaussian noise environment | |
Hwang et al. | Martingale estimating functions for stochastic processes: A review toward a unifying tool | |
JP7159928B2 (ja) | 雑音空間共分散行列推定装置、雑音空間共分散行列推定方法、およびプログラム | |
WO2021100215A1 (ja) | 音源信号推定装置、音源信号推定方法、プログラム | |
JP6915579B2 (ja) | 信号分析装置、信号分析方法および信号分析プログラム | |
CN113138556B (zh) | 一种高精度闭环***辨识方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190724 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210924 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220831 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20220909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7218688 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |