JP2009003388A - ピッチ探索範囲決定装置、ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 - Google Patents
ピッチ探索範囲決定装置、ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP2009003388A JP2009003388A JP2007166883A JP2007166883A JP2009003388A JP 2009003388 A JP2009003388 A JP 2009003388A JP 2007166883 A JP2007166883 A JP 2007166883A JP 2007166883 A JP2007166883 A JP 2007166883A JP 2009003388 A JP2009003388 A JP 2009003388A
- Authority
- JP
- Japan
- Prior art keywords
- search range
- pitch
- section
- search
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【解決手段】採択指標計算部11が、ピッチを求めようとする部分の音声信号の母音性を表す指標である採択指標を計算する。判断部12が、採択指標と予め定められた採択基準値を比較することにより、ピッチを求めようとする部分の音声信号の母音性が所定の強さよりも強いかどうかを判断する。探索範囲決定部13が、ピッチを求めようとする部分の音声信号の母音性が所定の強さよりも強いと判断された場合には、探索範囲Aを探索範囲として決定し、そうでない場合には、探索範囲Aよりも狭い探索範囲Bを探索範囲として決定する。
【選択図】図1
Description
出力音声バッファ66に蓄積された音声信号は、ピッチ探索部67に送られる。
ピッチ探索部67は、後述する方法によりピッチを計算して、音響波形補完処理部68に送る。
音響波形補完処理部68は、出力音声バッファ66に蓄えられた直前フレームの再生音声から、ピッチ長の波形又は予め規則によって決められたピッチ長に対応する長さの波形(以下、総称してピッチ長の波形という。)を切り出し、切り出したビッチ長の波形をピッチ長の間隔で並べることによって、ロスしたフレーム部分の音声信号を生成する。
従来、ピッチ探索部67では、パケットロスが発生すると、ロスしたフレームの直前フレームを基準区間とする。この基準区間を、予め定められた探索範囲で順次ずらして行き、そのずらした区間の信号と、基準区間の信号との相関値を順次計算する。相関値を最大にする区間を決定して、その区間を相関最大区間とする。そして、相関最大区間と基準区間とのサンプル位置の差からピッチを求めていた。
ITU-T G.711 Appendix I、[online]、[平成19年6月8日検索]、インターネット<http://www.itu.int/rec/T-REC-G.711-199909-I!AppI/en>
また、このピッチの推定精度の低さに起因して、パケットロスコンシールメントによる再生音声の音質が必ずしも良くないという問題があった。
また、本発明のパケット消失補償装置によれば、上記計算されたピッチ長の音響信号を切り出して、パケットが消失した部分に繰り返し並べる。
図1〜3,5,6を参照して、本発明の第一実施形態によるピッチ探索装置100について説明をする。図1は、ピッチ探索装置100の機能構成を例示する図である。図1に例示するように、ピッチ探索装置100は、例えば、ピッチの探索範囲を決定するピッチ探索範囲決定部1、ピッチの探索範囲に関する情報が格納された探索範囲記憶部2、決定された探索範囲に基づいてピッチを計算するピッチ計算部3を備える。ピッチ探索範囲決定部1は、例えば、ピッチを求めようとする部分の音声信号の母音性を示す指標である採択指標を計算する採択指標計算部11、採択指標と採択基準値を比較することによりピッチを求めようとする部分の音声信号の母音性の強さを判断する判断部12、母音性の強さに応じて探索範囲を定める探索範囲決定部13を備える。判断部12は、採択基準値を格納した採択基準値記憶部121を備えている。
ピッチ探索範囲決定部1(図1)の採択指標計算部11は、ピッチを求めようとする部分の音声信号の母音性を表す指標である採択指標を計算して、判断部12に送る。
採択指標計算部11の相関値計算部111(図2)は、入力された音声信号を用いて、基準区間を第一探索範囲で順次ずらして、そのずらした区間の信号と基準区間の信号の相関値を順次計算して、相関最大値決定部112に送る(ステップS11)。第一探索範囲は、探索範囲記憶部2から読み込んだ情報を用いて特定される。また、基準区間は、図示していない記憶部から読み込んだ情報を用いて特定される。
採択指標計算部11の相関最大値決定部112(図2)は、相関値計算部111が計算した相関値の中で最大の相関値を決定し、その相関値の最大値を採択指標として判断部12に送る(ステップS12)。
判断部12(図1)は、採択指標計算部11が計算した採択指標と、採択基準値記憶部121から読み込んだ採択基準値とを比較することにより、ピッチを求めようとする部分の音声信号の母音性が所定の強さよりも強いかどうかを判断する。具体的には、採択指標が採択基準値以上であるかどうかを判断する。判断結果は、判断情報として、探索範囲決定部13に送られる(ステップS2)。
探索範囲決定部13は、判断部12から受け取った判断情報が、ピッチを求めようとする部分の音声信号の母音性が所定の強さよりも強いことを示すものであれば、第一探索範囲と第二探索範囲とを合わせた範囲を探索範囲とする。判断部12から受け取った判断情報が、ピッチを求めようとする部分の音声信号の母音性が所定の強さよりも強くないことを示すものであれば、第二探索範囲を探索範囲とする。決定された探索範囲についての情報(探索範囲情報)は、ピッチ計算部3に送られる(ステップS3)。第一探索範囲と第二探索範囲は、探索範囲記憶部2から読み込んで特定される。
ピッチ計算部3(図1、図3)は、ピッチ探索範囲決定部1が決定した探索範囲に基づいて、入力音声信号のピッチを計算して出力する。ステップS4は、下記のステップS41〜S43から構成される。
まず、ピッチ計算部3の相関値計算部31(図3)は、予め定められた基準区間を決定された探索範囲で順次ずらした区間のそれぞれについて、そのずらした区間の信号と、上記決定された基準区間の信号との相関値を順次計算する(ステップS41)。計算された計算値は相関最大区間決定部32に送られる。
相関最大区間決定部32は、相関値を最大にする区間を決定して、その区間を相関最大区間とする。相関最大区間についての情報(相関最大区間情報)は、差計算部33に送られる(ステップS42)。
差計算部33は、相関最大区間と、基準区間とのサンプル位置の差を計算してピッチ長を求める。このピッチ長をピッチとして出力する(ステップS43)。相関最大区間は相関最大区間情報から特定され、基準区間は図示していない記憶部から読み込んだ情報を用いて特定される。
しかし、上述のように、ピッチを求めようとする部分の母音性が強い場合にのみ、探索範囲に20〜39サンプルずれの範囲を含めることにより、上記の問題を解決することができる。
第二実施形態のピッチ探索装置101は、採択指標として異なる複数の採択指標を用いており、これらの採択指標と対応する採択基準値とを採択指標ごとに比較した結果に基づいて探索範囲を求める点で第一実施形態のピッチ探索装置100と異なる。他の点については第一実施形態のピッチ探索装置100と同様である。以下では、第一実施形態と異なる部分について説明をする。同じ部分については同じ符号を付けて重複説明を省略する。
上記実施形態では、第一探索範囲を20≦j≦39、第二探索範囲の範囲を40≦j≦120として、ピッチを探索しようとする部分の音声信号の母音性の強さによって、対応する周波数が高い第一探索範囲を探索範囲に含めるかどうかを決定した。しかし、例えば、第一探索範囲を121≦j≦160、第二探索範囲の範囲を40≦j≦120として、ピッチを探索しようとする部分の音声信号の母音性が強ければ、第一探索範囲を探索範囲に含め、そうでなければ第一探索範囲を探索範囲に含めないようにしてもよい。
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
1’ ピッチ探索範囲決定部
2 探索範囲記憶部
3 ピッチ計算部
4 パケット送信部
5 パケット通信網
6 パケット受信部
7 音声通信システム
11 採択指標計算部
12 判断部
13 探索範囲決定部
14 動的閾値計算部
31 相関値計算部
32 相関最大区間決定部
33 差計算部
61 受信バッファ
62 音声復号部
63 パケットロス検出部
64 スイッチ
65 パケットロスコンシールメント部
66 出力音声バッファ
67 ピッチ探索部
68 音響波形補完処理部
100 ピッチ探索装置
101 ピッチ探索装置
111 相関値計算部
112 相関最大値決定部
121 採択基準値記憶部
122 第一判断部
123 第二判断部
124 採択基準値記憶部
331 変換部
Claims (17)
- 音響信号のピッチを探索するために用いる、予め定められた基準区間に対するサンプルずれの範囲で表される探索範囲を決定するピッチ探索範囲決定装置において、
ピッチを求めようとする部分の音響信号の母音性を表す指標である採択指標を計算する採択指標計算手段と、
上記計算された採択指標と予め定められた採択基準値を比較することにより、上記ピッチを求めようとする部分の音響信号の母音性が所定の強さよりも強いかどうかを判断する判断手段と、
上記ピッチを求めようとする部分の音響信号の母音性が所定の強さよりも強いと判断された場合には、探索範囲Aを探索範囲として決定し、そうでない場合には、探索範囲Bを探索範囲として決定する探索範囲決定手段と、
を備え、
探索範囲Aは、探索範囲Bよりも広い、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項1に記載のピッチ探索範囲決定装置において、
上記探索範囲Aは、所定の第一探索範囲と、その第一探索範囲に隣接する所定の第二探索範囲とを合わせた範囲であり、
上記探索範囲Bは、上記第二探索範囲である、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項2に記載のピッチ探索範囲決定装置において、
上記第一探索範囲は、上記基準区間からJ11〜J12サンプルずれの範囲であり、
上記第二探索範囲は、上記基準区間からJ21〜J22サンプルずれの範囲であり、
J11<J12<J21<J22である、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項2又は3に記載のピッチ探索範囲決定装置において、
上記採択指標は、上記基準区間を上記第一探索範囲で順次ずらした区間のそれぞれについて計算した、そのずらした区間の信号と上記基準区間の信号との相関値の最大値である、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項1から3の何れかに記載のピッチ探索範囲決定装置において、
上記採択指標は、異なる複数の採択指標であり、
上記採択基準値は、上記異なる複数の採択指標にそれぞれ対応する予め定められた複数の採択基準値であり、
上記判断手段は、
上記異なる複数の採択指標を対応する採択指標とそれぞれ比較することにより、各採択指標ごとに、母音性が所定の強さよりも強いかどうかを判断する第一判断手段と、
すべての採択指標において、母音性が所定の強さよりも強いと判断とされた場合には、上記ピッチを求めようとする部分の音響信号の母音性が所定の強さよりも強いと最終的に判断する第二判断手段と、
である、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項1から5の何れかに記載のピッチ探索範囲決定装置において、
さらに、上記採択基準値を動的に定める動的閾値計算手段を備える、
ことを特徴とするピッチ探索範囲決定装置。 - 請求項1から6の何れかに記載のピッチ探索範囲決定装置と、
上記基準区間を上記決定された探索範囲で順次ずらした区間のそれぞれについて、そのずらした区間の信号と、上記基準区間の信号との相関値を順次計算する相関値計算手段と、
上記計算された相関値を最大にする区間を決定して、その区間を相関最大区間とする相関最大区間決定手段と、
上記決定された相関最大区間と、上記基準区間とのサンプル位置の差を計算して、その差をピッチとするサンプル差計算手段と、
を備えるピッチ探索装置。 - 請求項7に記載のピッチ探索装置を備え、
上記基準区間は、パケットが消失した部分に近い音響信号の区間であり、
さらに、上記計算されたピッチ長に対応する音響信号を切り出して、パケットが消失した部分に繰り返し並べる音響波形補完処理手段を備える、
ことを特徴とするパケット消失補償装置。 - 音響信号のピッチを探索するために用いる、予め定められた基準区間に対するサンプルずれの範囲で表される探索範囲を決定するピッチ探索範囲決定方法において、
採択指標計算手段が、ピッチを求めようとする部分の音響信号の母音性を表す指標である採択指標を計算する採択指標計算ステップと、
判断手段が、上記計算された採択指標と予め定められた採択基準値を比較することにより、上記ピッチを求めようとする部分の音響信号の母音性が所定の強さよりも強いかどうかを判断する判断ステップと、
探索範囲決定手段が、上記ピッチを求めようとする部分の音響信号の母音性が所定の強さよりも強いと判断された場合には、探索範囲Aを探索範囲として決定し、そうでない場合には、探索範囲Bを探索範囲として決定する探索範囲決定ステップと、
を有し、
探索範囲Aは、探索範囲Bよりも広い、
ことを特徴とするピッチ探索範囲決定方法。 - 請求項9に記載のピッチ探索範囲決定方法の各ステップと、
相関値計算手段が、上記基準区間を上記決定された探索範囲で順次ずらした区間のそれぞれについて、そのずらした区間の信号と、上記基準区間の信号との相関値を順次計算する相関値計算ステップと、
相関最大区間決定手段と、上記計算された相関値を最大にする区間を決定して、その区間を相関最大区間とする相関最大区間決定ステップと、
サンプル差計算手段と、上記決定された相関最大区間と、上記基準区間とのサンプル位置の差を計算して、その差をピッチとするサンプル差計算ステップと、
を有するピッチ探索方法。 - 請求項10に記載のピッチ探索方法の各ステップを有し、
上記基準区間は、パケットが消失した部分に近い音響信号の区間であり、
さらに、音響波形補完処理手段が、上記計算されたピッチ長に対応する音響信号を切り出して、パケットが消失した部分に繰り返し並べる音響波形補完処理ステップを有する、
ことを特徴とするパケット消失補償方法。 - 請求項1から請求項6の何れかに記載のピッチ探索範囲決定装置の各手段としてコンピュータを機能させるためのピッチ探索範囲決定プログラム。
- 請求項7に記載のピッチ探索装置の各手段としてコンピュータを機能させるためのピッチ探索プログラム。
- 請求項8に記載のパケット消失補償装置の各手段としてコンピュータを機能させるためのパケット消失補償プログラム。
- 請求項12に記載のピッチ探索範囲決定プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項13に記載のピッチ探索プログラムを記録したコンピュータ読み取り可能な記録媒体。
- 請求項14に記載のパケット消失補償プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166883A JP4928367B2 (ja) | 2007-06-25 | 2007-06-25 | パケット受信装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166883A JP4928367B2 (ja) | 2007-06-25 | 2007-06-25 | パケット受信装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003388A true JP2009003388A (ja) | 2009-01-08 |
JP4928367B2 JP4928367B2 (ja) | 2012-05-09 |
Family
ID=40319786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007166883A Active JP4928367B2 (ja) | 2007-06-25 | 2007-06-25 | パケット受信装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4928367B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838477A (zh) * | 2021-09-13 | 2021-12-24 | 阿波罗智联(北京)科技有限公司 | 音频数据包的丢包恢复方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5969798A (ja) * | 1982-10-14 | 1984-04-20 | 松下電器産業株式会社 | ピツチ抽出方法 |
JPH0351900A (ja) * | 1989-07-20 | 1991-03-06 | Fujitsu Ltd | エラー処理方式 |
-
2007
- 2007-06-25 JP JP2007166883A patent/JP4928367B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5969798A (ja) * | 1982-10-14 | 1984-04-20 | 松下電器産業株式会社 | ピツチ抽出方法 |
JPH0351900A (ja) * | 1989-07-20 | 1991-03-06 | Fujitsu Ltd | エラー処理方式 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838477A (zh) * | 2021-09-13 | 2021-12-24 | 阿波罗智联(北京)科技有限公司 | 音频数据包的丢包恢复方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4928367B2 (ja) | 2012-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4928366B2 (ja) | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 | |
KR100770839B1 (ko) | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 | |
US7664650B2 (en) | Speech speed converting device and speech speed converting method | |
US11211077B2 (en) | Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program | |
EP2506253A2 (en) | Audio signal processing method and device | |
JP2013537324A (ja) | ピッチラグを推定すること | |
KR20090083070A (ko) | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 | |
KR101096540B1 (ko) | 피치 검색을 위한 방법 및 장치 | |
US5704000A (en) | Robust pitch estimation method and device for telephone speech | |
KR100463417B1 (ko) | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 | |
JP4758879B2 (ja) | 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法 | |
US10096330B2 (en) | Utterance condition determination apparatus and method | |
JP4928367B2 (ja) | パケット受信装置及び方法 | |
US8392177B2 (en) | Method and apparatus for frequency encoding, and method and apparatus for frequency decoding | |
CN113658581B (zh) | 声学模型的训练、语音处理方法、装置、设备及存储介质 | |
JP4580622B2 (ja) | 広帯域音声符号化方法及び広帯域音声符号化装置 | |
US9620139B2 (en) | Adaptive linear predictive coding/decoding | |
JPH113098A (ja) | 音声符号化方法および装置 | |
KR20060002569A (ko) | 수신단 기반의 패킷 손실 복구 장치 및 그 방법 | |
JP5182112B2 (ja) | デコード装置および音声符号化方式推定方法 | |
JP6502099B2 (ja) | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム | |
KR100668247B1 (ko) | 음성 전송 시스템 | |
JP5002642B2 (ja) | 広帯域音声符号化方法及び広帯域音声符号化装置 | |
JP2001147700A (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP2014228599A (ja) | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100520 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4928367 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |