JP2009063928A - 補間方法、情報処理装置 - Google Patents
補間方法、情報処理装置 Download PDFInfo
- Publication number
- JP2009063928A JP2009063928A JP2007233273A JP2007233273A JP2009063928A JP 2009063928 A JP2009063928 A JP 2009063928A JP 2007233273 A JP2007233273 A JP 2007233273A JP 2007233273 A JP2007233273 A JP 2007233273A JP 2009063928 A JP2009063928 A JP 2009063928A
- Authority
- JP
- Japan
- Prior art keywords
- pseudo
- sound
- noise
- interpolation method
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 160
- 230000010365 information processing Effects 0.000 title claims description 110
- 238000004458 analytical method Methods 0.000 claims abstract description 129
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 97
- 238000001228 spectrum Methods 0.000 claims description 70
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000006866 deterioration Effects 0.000 abstract description 13
- 238000004364 calculation method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000004519 manufacturing process Methods 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 230000003252 repetitive effect Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
【課題】 本発明に係る補間方法は、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生による異音などによる音質劣化を低減すること、パケットロスが長い時間継続した際でも無音化による音質劣化を低減するパケットロスを補間することを目的とする。
【解決手段】 本実施例における補間方法は、伝送で損失した音声のデジタル信号を補間する補間方法において、該デジタル信号の特徴量を算出する分析手順と、該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順とからなることを特徴とする。
【選択図】 図1
Description
図1は本実施例に係る情報処理装置100の構成図である。
図2は本実施例に係る情報処理装置200の構成図である。
図3は本実施例に係る情報処理装置300の構成図である。
図4は本実施例に係る情報処理装置400の構成図である。
図5は本実施例に係る情報処理装置500の構成図である。
図6は本実施例に係る情報処理装置600の構成図である。
図7は本実施例に係る情報処理装置700の構成図である。
図8は図1〜図7に示す情報処理装置100〜700における補間処理のフローチャートである。この補間処理のフローチャートは情報処理装置100〜700実行する概要となる処理ステップを示している。
図9は本実施例に係る分析手段101〜701における背景雑音の周波数特性の算出の処理手順を示すフローチャートである。
そして分析手段101〜701は、音声を検出した否かを判別する(ステップS902)。分析手段101〜701が音声を検出した場合(ステップS902 YES)、分析手段101〜701は背景雑音のパワースペクトルの算出を行う(ステップS905)。背景雑音のパワースペクトルの算出は、また分析手段101〜701が音声を検出しない場合(ステップS902 NO)、分析手段101〜701は入力信号を時間周波数変換する(ステップS903)。具体的には分析手段101〜701は高速フーリエ変換などを行う。時間周波数変換は、入力信号を周波数ごとに分解し、時間領域から周波数領域へ変換する変換である。同様にして後述する周波数時間変換は、入力信号を周波数領域から時間領域へ変換する変換である。分析手段101〜701は式(F1)より入力信号(現フレーム)のパワースペクトルを算出する(ステップS904)。ここでPiはi番目の帯域のパワースペクトル(dB)、reiはi番目の帯域のスペクトルの実部(dB)、imiはi番目の帯域のスペクトルの虚部(dB)である。
分析手段101〜701が算出する周期性は、入力信号、音声成分の信号または音声の音源の周期性である。本実施例において周期性は対象信号(入力信号、音声成分の信号、音声の音源)の周期と周期性の強さを意味する。本実施例において周期性の強さは最大の自己相関係数の値である。分析手段101〜701は対象信号の自己相関係数を式(F3)により算出する。そして分析手段101〜701は、自己相関係数が最大となる信号のずらし位置の長さを周期として算出する。ここで周期=a_max、周期性=MAX(corr(a))、xは周期性算出の対象の信号、Mは相関係数を算出する区間の長さ(サンプル)、aは相関係数を算出する信号の開始位置、corr(a)はずらし位置がaの場合の相関係数、a_maxは最大相関係数に対応するaの値(自己相関係数が最大となる位置)、iは信号のインデックス(サンプル)である。
図5に示す分析手段501は入力信号の音声成分を算出する。図10は本実施例に係る分析手段501が実行する音声成分の算出手順のフローチャートである。以下、分析手段501が実行する入力信号の音声成分の算出手順について説明する。
図6及び図7に示す分析手段601、701は入力信号の音声の包絡、音声の音源を算出する。図11は本実施例に係る分析手段601、701が実行する音声の包絡、音声の音源の算出手順のフローチャートである。
図7に示す分析手段701は入力信号の音声の包絡パターンを算出する。図12は本実施例に係る分析手段701が実行する音声の包絡パターンの算出手順のフローチャートである。
図13は本実施例に係る擬似音声生成手段102〜502が実行する擬似音声の生成手順のフローチャートである。また図14は本実施例に係る繰り替えしの信号片の接続関係を示す模式図である。Mは相関係数を算出する区間の長さ(サンプル)であり、Lはオーバラップ長である。
図15は本実施例に係る擬似音声生成手段601が実行する擬似音声の生成手順のフローチャートである。
図16は本実施例に係る擬似音声生成手段701が実行する擬似音声の生成手順のフローチャートである。
図17は本実施例に係る擬似雑音生成手段203が実行する擬似雑音の生成手順を示すフローチャートである。
図18は本実施例に係る背景雑音生成手段303が実行する背景雑音の生成手順のフローチャートである。
図19は本実施例に係る出力信号生成手段104〜704が実行する出力信号の生成手順のフローチャートである。
図20は本実施例に係る出力信号生成手段104〜704の振幅係数の第1の算出手順を示すフローチャートである。
図21は本実施例に係る出力信号生成手段104〜704の振幅係数の第2の算出手順を示すフローチャートである。
図22は本実施例に係る出力信号生成手段104〜704が実行する擬似音声の劣化判定の処理を示すフローチャートである。
本発明に係る情報処理装置100〜700は、入力信号に含まれる音声の特徴量と雑音の特徴量から擬似音声と擬似雑音をそれぞれ独立に生成することにより、パケットロス直前の信号が子音や背景雑音などの周期性が小さいものであっても、不自然な周期発生の異音などによる音質劣化を低減してパケットロスを補間することができる。
(付記1) 伝送で損失した音声のデジタル信号を補間する補間方法において、
該デジタル信号の特徴量を算出する分析手順と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順と、
からなることを特徴とする補間方法。
(付記2) 付記1に記載の補間方法において、
該分析手順は、該背景雑音の周波数特性を算出することを特徴とする補間方法。
(付記3) 付記1に記載の補間方法において、
該擬似雑音生成手順は、該背景雑音の周波数特性を持つ信号を生成することを特徴とすることを特徴とする補間方法。
(付記4) 付記2に記載の補間方法において、
該擬似雑音生成手段は、白色雑音に該分析手順で算出した背景雑音の周波数特性を適用して擬似雑音を生成することを特徴とする補間方法。
(付記5) 付記1に記載の補間方法において、
該分析手順は、該背景雑音のパワースペクトルを算出することを特徴とする補間方法。
(付記6) 付記5に記載の補間方法において、
該擬似雑音生成手順は、該分析手順において算出した背景雑音のパワースペクトルにランダムな位相を適用して擬似雑音を生成することを特徴とする補間方法。
(付記7) 付記1に記載の補間方法において、
該分析手順は、該デジタル信号の周期性を算出することを特徴とする補間方法。
(付記8) 付記1に記載の補間方法において、
該擬似音声生成手順は、該デジタル信号を該デジタル信号の周期の整数倍の長さで繰り返して擬似音声を生成することを特徴とする補間方法。
(付記9) 付記1に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡と該音声の音源と該音声の周期を算出することを特徴とする補間方法。
(付記10) 付記9に記載の補間方法において、
該擬似音声生成手段は、該音声の包絡と、該音声の音源から擬似音声を生成することを特徴とする補間方法。
(付記11) 付記1に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡の変化パターンと該音声の音源と該音源の周期性を算出することを特徴とする補間方法。
(付記12) 付記11に記載の補間方法において、
該擬似音声生成手順は、該音声の包絡の変化パターンと該音声の音源と該音源の周期性を用いて擬似音声を生成することを特徴とする補間方法。
(付記13) 伝送で損失した音声のデジタル信号を補間する情報処理装置において、
該デジタル信号を受信し、該デジタル信号の特徴量を算出する分析手段と、
該デジタル信号に含まれる音声を模倣した擬似音声を生成する擬似音声生成手段と、
該デジタル信号に含まれる背景雑音を模倣した擬似雑音を生成する擬似雑音生成手段と、
該擬似音声と該擬似雑音を重畳して補間信号を生成する出力信号生成手段と、
からなることを特徴とする情報処理装置。
(付記14) 付記1に記載の補間方法は、
該分析手順において信号損失発生前のデジタル信号の特徴量を算出することを特徴とする補間方法。
101…分析手段
102…擬似音声生成手段
103…擬似雑音生成手段
104…出力信号生成手段
200…情報処理装置
201…分析手段
202…擬似音声生成手段
203…擬似雑音生成手段
204…出力信号生成手段
300…情報処理装置
301…分析手段
302…擬似音声生成手段
303…擬似雑音生成手段
304…出力信号生成手段
400…情報処理装置
401…分析手段
402…擬似音声生成手段
403…擬似雑音生成手段
404…出力信号生成手段
500…情報処理装置
501…分析手段
502…擬似音声生成手段
503…擬似雑音生成手段
504…出力信号生成手段
600…情報処理装置
601…分析手段
602…擬似音声生成手段
603…擬似雑音生成手段
604…出力信号生成手段
700…情報処理装置
701…分析手段
702…擬似音声生成手段
703…擬似雑音生成手段
704…出力信号生成手段
Claims (10)
- 伝送で損失した音声のデジタル信号を補間する補間方法において、
該デジタル信号の特徴量を算出する分析手順と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手順と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手順と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手順と、
からなることを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該分析手順は、該背景雑音の周波数特性を算出することを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該擬似雑音生成手順は、該背景雑音の周波数特性を持つ信号を生成することを特徴とすることを特徴とする補間方法。 - 請求項2に記載の補間方法において、
該擬似雑音生成手段は、白色雑音に該分析手順で算出した背景雑音の周波数特性を適用して擬似雑音を生成することを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該分析手順は、該背景雑音のパワースペクトルを算出することを特徴とする補間方法。 - 請求項5に記載の補間方法において、
該擬似雑音生成手順は、該分析手順において算出した背景雑音のパワースペクトルにランダムな位相を適用して擬似雑音を生成することを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該分析手順は、該デジタル信号の周期性を算出することを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該擬似音声生成手順は、該デジタル信号を該デジタル信号の周期の整数倍の長さで繰り返して擬似音声を生成することを特徴とする補間方法。 - 請求項1に記載の補間方法において、
該分析手順は、該デジタル信号の音声の包絡と該音声の音源と該音声の周期を算出することを特徴とする補間方法。 - 伝送で損失した音声のデジタル信号を補間する情報処理装置において、
該デジタル信号の特徴量を算出する分析手段と、
該特徴量に応じて、擬似音声を生成する擬似音声生成手段と、
該特徴量に応じて、擬似雑音を生成する擬似雑音生成手段と、
該擬似音声と該擬似雑音を組み合わせて補間信号を生成する出力信号生成手段と、
からなることを特徴とする情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007233273A JP2009063928A (ja) | 2007-09-07 | 2007-09-07 | 補間方法、情報処理装置 |
US12/230,873 US20090070117A1 (en) | 2007-09-07 | 2008-09-05 | Interpolation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007233273A JP2009063928A (ja) | 2007-09-07 | 2007-09-07 | 補間方法、情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009063928A true JP2009063928A (ja) | 2009-03-26 |
Family
ID=40432834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007233273A Pending JP2009063928A (ja) | 2007-09-07 | 2007-09-07 | 補間方法、情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20090070117A1 (ja) |
JP (1) | JP2009063928A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
JP5477357B2 (ja) * | 2010-11-09 | 2014-04-23 | 株式会社デンソー | 音場可視化システム |
PT3664086T (pt) * | 2014-06-13 | 2021-11-02 | Ericsson Telefon Ab L M | Gestão de erros de tramas em rajada |
JP2016038513A (ja) * | 2014-08-08 | 2016-03-22 | 富士通株式会社 | 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム |
US10347273B2 (en) * | 2014-12-10 | 2019-07-09 | Nec Corporation | Speech processing apparatus, speech processing method, and recording medium |
CN110430316B (zh) * | 2019-06-25 | 2021-05-14 | 努比亚技术有限公司 | 一种语音降噪方法、移动终端及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0588697A (ja) * | 1991-09-26 | 1993-04-09 | Kokusai Denshin Denwa Co Ltd <Kdd> | 欠落音声補間方式 |
JP2004077961A (ja) * | 2002-08-21 | 2004-03-11 | Oki Electric Ind Co Ltd | 音声復号装置 |
JP2005107283A (ja) * | 2003-09-30 | 2005-04-21 | Tadashi Aoki | VoIP音声通信におけるパケット損失隠蔽方法、装置およびプログラム |
JP2006235643A (ja) * | 2001-08-23 | 2006-09-07 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号復号化方法、装置、プログラム及び記録媒体 |
WO2006130236A2 (en) * | 2005-05-31 | 2006-12-07 | Microsoft Corporation | Robust decoder |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
FI980132A (fi) * | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
DE60327371D1 (de) * | 2003-01-30 | 2009-06-04 | Fujitsu Ltd | EINRICHTUNG UND VERFAHREN ZUM VERBERGEN DES VERSCHWINDENS VON AUDIOPAKETEN, EMPFANGSENDGERuT UND AUDIOKOMMUNIKAITONSSYSTEM |
PL1897085T3 (pl) * | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、***和装置 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
-
2007
- 2007-09-07 JP JP2007233273A patent/JP2009063928A/ja active Pending
-
2008
- 2008-09-05 US US12/230,873 patent/US20090070117A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0588697A (ja) * | 1991-09-26 | 1993-04-09 | Kokusai Denshin Denwa Co Ltd <Kdd> | 欠落音声補間方式 |
JP2006235643A (ja) * | 2001-08-23 | 2006-09-07 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号復号化方法、装置、プログラム及び記録媒体 |
JP2004077961A (ja) * | 2002-08-21 | 2004-03-11 | Oki Electric Ind Co Ltd | 音声復号装置 |
JP2005107283A (ja) * | 2003-09-30 | 2005-04-21 | Tadashi Aoki | VoIP音声通信におけるパケット損失隠蔽方法、装置およびプログラム |
WO2006130236A2 (en) * | 2005-05-31 | 2006-12-07 | Microsoft Corporation | Robust decoder |
Also Published As
Publication number | Publication date |
---|---|
US20090070117A1 (en) | 2009-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101978671B1 (ko) | 오디오 프로세서 및 수평 위상 보정을 사용하여 오디오 신호를 처리하기 위한 방법 | |
TWI493541B (zh) | 用以操縱包含暫態事件的音訊信號之裝置、方法和電腦程式 | |
JP4162604B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
RU2526745C2 (ru) | Низведение параметров последовательности битов sbr | |
JP4423300B2 (ja) | 雑音抑圧装置 | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
EP1918910A1 (en) | Model-based enhancement of speech signals | |
EP1772855A1 (en) | Method for extending the spectral bandwidth of a speech signal | |
JP2007316254A (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
JP2009063928A (ja) | 補間方法、情報処理装置 | |
US6694018B1 (en) | Echo canceling apparatus and method, and voice reproducing apparatus | |
US9454956B2 (en) | Sound processing device | |
EP1342230A1 (en) | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering | |
JP2010055000A (ja) | 信号帯域拡張装置 | |
US20090326950A1 (en) | Voice waveform interpolating apparatus and method | |
Tsilfidis et al. | Blind single-channel suppression of late reverberation based on perceptual reverberation modeling | |
US11622208B2 (en) | Apparatus and method for own voice suppression | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JP2007310298A (ja) | 帯域外信号生成装置及び周波数帯域拡張装置 | |
Dorran et al. | Time-scale modification of music using a synchronized subband/time-domain approach | |
Fingscheidt et al. | Towards objective quality assessment of speech enhancement systems in a black box approach | |
KR20130014515A (ko) | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 | |
JP3748081B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP4447546B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 | |
JP3770901B2 (ja) | 広帯域音声復元方法及び広帯域音声復元装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100517 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121015 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130514 |