JP3746067B2 - 音声復号化方法及び音声復号化装置 - Google Patents
音声復号化方法及び音声復号化装置 Download PDFInfo
- Publication number
- JP3746067B2 JP3746067B2 JP2005175020A JP2005175020A JP3746067B2 JP 3746067 B2 JP3746067 B2 JP 3746067B2 JP 2005175020 A JP2005175020 A JP 2005175020A JP 2005175020 A JP2005175020 A JP 2005175020A JP 3746067 B2 JP3746067 B2 JP 3746067B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- time
- codebook
- series vector
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
適応符号帳108、駆動符号帳109からの各時系列ベクトルはゲイン符号化手段110から与えられるそれぞれのゲインに応じて重み付け加算手段138で重み付けして加算され、その加算結果を駆動音源信号として合成フィルタ107へ供給し符号化音声を得る。距離計算手段111は符号化音声と入力音声S101との距離を求め、距離が最小となる適応符号、駆動符号、ゲインを探索する。上記符号化が終了した後、線形予測パラメータの符号、入力音声と符号化音声との歪みを最小にする適応符号、駆動符号、ゲインの符号を符号化結果として出力する。
一方復号化部102において、線形予測パラメータ復号化手段112は線形予測パラメータの符号から線形予測パラメータを復号化し、合成フィルタ113の係数として設定する。次に、適応符号帳114は、適応符号に対応して、過去の駆動音源信号を周期的に繰り返した時系列ベクトルを出力し、また駆動符号帳115は駆動符号に対応した時系列ベクトルを出力する。これらの時系列ベクトルは、ゲイン復号化手段116でゲインの符号から復号化したそれぞれのゲインに応じて重み付け加算手段139で重み付けして加算され、その加算結果が駆動音源信号として合成フィルタ113へ供給され出力音声S103が得られる。
「Code-excited linear prediction(CELP):High-quality speech at very low bit rates」(M.R.Shroeder and B.S.Atal著、ICASSP '85, pp.937-940, 1985) Phonetically-based vector excitation coding of speech at 3.6kbps」(S.Wang and A.Gersho著、ICASSP '89, pp.49-52, 1989)
上記入力音声符号を復号して適応符号帳が出力する時系列ベクトルに乗ずるゲインを取得するゲイン復号化ステップを有し、
上記駆動符号帳が出力する第1の時系列ベクトルを変更して振幅値がゼロのサンプルの数が上記第1の時系列ベクトルとは異なる第2の時系列ベクトルを生成する時系列ベクトル生成ステップと、
第1又は第2の時系列ベクトルを上記ゲインに基づいて選択する選択ステップと、
上記選択ステップにおいて選択された時系列ベクトルを用いて音声を合成する音声合成ステップと、
を有することを特徴とする。
上記入力音声符号を復号して適応符号帳が出力する時系列ベクトルに乗ずるゲインを取得するゲイン復号化手段を有し、
上記駆動符号帳が出力する第1の時系列ベクトルを変更して振幅値がゼロのサンプルの数が上記第1の時系列ベクトルとは異なる第2の時系列ベクトルを生成する時系列ベクトル生成手段と、
第1又は第2の時系列ベクトルを上記ゲインに基づいて選択する選択手段と、
上記選択手段により選択された時系列ベクトルを用いて音声を合成する音声合成手段と、
を有することを特徴とする。
また、適応符号帳が出力する時系列ベクトルに乗ずるために入力音声符号から復号したゲインに基づいて、振幅値がゼロのサンプル数が異なる時系列ベクトルを切り替えることとしたので、時系列ベクトル選択を行うのに用いる情報を別途送出することが不要となるため、符号側の送出ビット数増加を抑制することができる。
図1は、この発明による音声符号化方法及び音声復号化方法の実施の形態1の全体構成を示す。図中、1は符号化部、2は復号化部、3は多重化部、4は分離部である。符号化部1は、線形予測パラメータ分析部5、線形予測パラメータ符号化部6、合成フィルタ7、適応符号帳8、ゲイン符号化部10、距離計算部11、第1の駆動符号帳19、第2の駆動符号帳20、雑音度評価部24、駆動符号帳切替部25、重み付け加算部38より構成されている。また、復号化部2は線形予測パラメータ復号化部12、合成フィルタ13、適応符号帳14、第1の駆動符号帳22、第2の駆動符号帳23、雑音度評価部26、駆動符号帳切替部27、ゲイン復号化部16、重み付け加算部39より構成されている。図1中5は入力音声S1を分析し、音声のスペクトル情報である線形予測パラメータを抽出するスペクトル情報分析部としての線形予測パラメータ分析部、6はスペクトル情報であるその線形予測パラメータを符号化し、符号化した線形予測パラメータを合成フィルタ7の係数として設定するスペクトル情報符号化部としての線形予測パラメータ符号化部、19、22は非雑音的な複数の時系列ベクトルが記憶された第1の駆動符号帳、20、23は雑音的な複数の時系列ベクトルが記憶された第2の駆動符号帳、24、26は雑音の度合いを評価する雑音度評価部、25、27は雑音の度合いにより駆動符号帳を切り替える駆動符号帳切替部である。
上述の実施の形態1では、2つの駆動符号帳を切り替えて用いているが、これに代え、3つ以上の駆動符号帳を備え、雑音の度合いに応じて切り替えて用いるとしても良い。この実施の形態2によれば、音声を雑音/非雑音の2通りだけでなく、やや雑音的であるなどの中間的な音声に対してもそれに適した駆動符号帳を用いることができるので、品質の高い音声を再生することができる。
図1との対応部分に同一符号を付けた図3は、この発明の音声符号化方法及び音声復号化方法の実施の形態3の全体構成を示し、図中28、30は雑音的な時系列ベクトルを格納した駆動符号帳、29、31は時系列ベクトルの低振幅なサンプルの振幅値を零にするサンプル間引き部である。
上述の実施の形態3では、時系列ベクトルのサンプルを間引く/間引かないの2通りとしているが、これに代え、雑音の度合いに応じてサンプルを間引く際の振幅閾値を変更するとしても良い。この実施の形態4によれば、音声を雑音/非雑音の2通りだけでなく、やや雑音的であるなどの中間的な音声に対してもそれに適した時系列ベクトルを生成し、用いることができるので、品質の高い音声を再生することができる。
図1との対応部分に同一符号を付けた図4は、この発明の音声符号化方法及び音声復号化方法の実施の形態5の全体構成を示し、図中32、35は雑音的な時系列ベクトルを記憶している第1の駆動符号帳、33、36は非雑音的な時系列ベクトルを記憶している第2の駆動符号帳、34、37は重み決定部である。
上述の実施の形態1〜5でさらに、雑音の度合いの評価結果に応じてゲインの符号帳を変更するとしても良い。この実施の形態6によれば、駆動符号帳に応じて最適なゲインの符号帳を用いることができるので、品質の高い音声を再生することができる。
上述の実施の形態1〜6では、音声の雑音の度合いを評価し、その評価結果に応じて駆動符号帳を切り替えているが、有声の立ち上がりや破裂性の子音などをそれぞれ判定、評価し、その評価結果に応じて駆動符号帳を切り替えても良い。この実施の形態7によれば、音声の雑音的な状態だけでなく、有声の立ち上がりや破裂性子音などさらに細かく分類し、それぞれに適した駆動符号帳を用いることができるので、品質の高い音声を再生することができる。
上述の実施の形態1〜6では、図2に示すスペクトル傾斜、短期予測利得、ピッチ変動から、符号化区間の雑音の度合いを評価しているが、適応符号帳出力に対するゲイン値の大小を用いて評価しても良い。
Claims (2)
- 駆動符号帳と適応符号帳とを用い、入力音声符号に基づいて音声を合成する符号駆動線形予測(Code-Excited Linear Prediction : CELP)音声復号化方法において、
上記入力音声符号を復号して適応符号帳が出力する時系列ベクトルに乗ずるゲイン値を取得するゲイン復号化ステップと、
上記ゲイン値が大なるか小なるかを評価しその評価結果に基づいて、上記駆動符号帳が出力する第1の時系列ベクトルの変更が必要か否かを判断し、上記第1の時系列ベクトルの変更が必要と判断された場合に、上記第1の時系列ベクトルを変更して振幅値がゼロのサンプルの数が上記第1の時系列ベクトルとは異なる第2の時系列ベクトルを生成する時系列ベクトル生成ステップと、
上記評価結果において上記ゲイン値が大なりと評価された場合に、上記第1又は第2の時系列ベクトル
のうち振幅値がゼロのサンプル数が多い方の時系列ベクトルを用いて音声を合成するとともに、上記評価結果において上記ゲイン値が小なりと評価された場合に、上記第1又は第2の時系列ベクトルのうち振幅値がゼロのサンプル数が少ない方の時系列ベクトルを用いて音声を合成する音声合成ステップと、
を有することを特徴とする音声復号化方法。 - 駆動符号帳と適応符号帳とを用い、入力音声符号に基づいて音声を合成する符号駆動線形予測(Code-Excited Linear Prediction : CELP)音声復号化装置において、
上記入力音声符号を復号して適応符号帳が出力する時系列ベクトルに乗ずるゲイン値を取得するゲイン復号化手段と、
上記ゲイン値が大なるか小なるかを評価しその評価結果に基づいて、上記駆動符号帳が出力する第1の時系列ベクトルの変更が必要か否かを判断し、上記第1の時系列ベクトルの変更が必要と判断された場合に、上記第1の時系列ベクトルを変更して振幅値がゼロのサンプルの数が上記第1の時系列ベクトルとは異なる第2の時系列ベクトルを生成する時系列ベクトル生成手段と、
上記評価結果において上記ゲイン値が大なりと評価された場合に、上記第1又は第2の時系列ベクトル
のうち振幅値がゼロのサンプル数が多い方の時系列ベクトルを用いて音声を合成するとともに、上記評価結果において上記ゲイン値が小なりと評価された場合に、上記第1又は第2の時系列ベクトルのうち振幅値がゼロのサンプル数が少ない方の時系列ベクトルを用いて音声を合成する音声合成手段と、
を有することを特徴とする音声復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005175020A JP3746067B2 (ja) | 1997-12-24 | 2005-06-15 | 音声復号化方法及び音声復号化装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35475497 | 1997-12-24 | ||
JP2005175020A JP3746067B2 (ja) | 1997-12-24 | 2005-06-15 | 音声復号化方法及び音声復号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002202211A Division JP3736801B2 (ja) | 1997-12-24 | 2002-07-11 | 音声復号化方法及び音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005326868A JP2005326868A (ja) | 2005-11-24 |
JP3746067B2 true JP3746067B2 (ja) | 2006-02-15 |
Family
ID=35473204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005175020A Expired - Lifetime JP3746067B2 (ja) | 1997-12-24 | 2005-06-15 | 音声復号化方法及び音声復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3746067B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014123032A1 (ja) | 2013-02-08 | 2014-08-14 | 三菱瓦斯化学株式会社 | レジスト組成物、レジストパターン形成方法及びそれに用いるポリフェノール誘導体 |
US10745372B2 (en) | 2014-12-25 | 2020-08-18 | Mitsubishi Gas Chemical Company, Inc. | Compound, resin, material for forming underlayer film for lithography, underlayer film for lithography, pattern forming method, and purification method |
KR102562846B1 (ko) | 2015-03-31 | 2023-08-02 | 미쯔비시 가스 케미칼 컴파니, 인코포레이티드 | 레지스트 조성물, 레지스트패턴 형성방법, 및 이것에 이용하는 폴리페놀 화합물 |
EP3279727B1 (en) | 2015-03-31 | 2021-06-09 | Mitsubishi Gas Chemical Company, Inc. | Compound, resist composition, and method for forming resist pattern using it |
WO2017038643A1 (ja) | 2015-08-31 | 2017-03-09 | 三菱瓦斯化学株式会社 | リソグラフィー用下層膜形成材料、リソグラフィー用下層膜形成用組成物、リソグラフィー用下層膜及びその製造方法、並びにレジストパターン形成方法 |
JP6919838B2 (ja) | 2015-08-31 | 2021-08-18 | 三菱瓦斯化学株式会社 | リソグラフィー用下層膜形成材料、リソグラフィー用下層膜形成用組成物、リソグラフィー用下層膜及びその製造方法、パターン形成方法、樹脂、並びに精製方法 |
CN108137478B (zh) | 2015-09-10 | 2021-09-28 | 三菱瓦斯化学株式会社 | 化合物、其组合物、纯化方法以及抗蚀图案形成方法、非晶膜的制造方法 |
-
2005
- 2005-06-15 JP JP2005175020A patent/JP3746067B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005326868A (ja) | 2005-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4916521B2 (ja) | 音声復号化方法及び音声符号化方法及び音声復号化装置及び音声符号化装置 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
WO2001052241A1 (en) | Multi-mode voice encoding device and decoding device | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JPH0612098A (ja) | 音声符号化装置 | |
JPH08272395A (ja) | 音声符号化装置 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2001075600A (ja) | 音声符号化装置および音声復号化装置 | |
JP4800285B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP3353852B2 (ja) | 音声の符号化方法 | |
JP4170288B2 (ja) | 音声符号化方法及び音声符号化装置 | |
JP3736801B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JPH10207496A (ja) | 音声符号化装置及び音声復号装置 | |
JP4510977B2 (ja) | 音声符号化方法および音声復号化方法とその装置 | |
JP3144284B2 (ja) | 音声符号化装置 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JPH0519795A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3563400B2 (ja) | 音声復号化装置及び音声復号化方法 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
JPH0519796A (ja) | 音声の励振信号符号化・復号化方法 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JPH08185198A (ja) | 符号励振線形予測音声符号化方法及びその復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20050902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091202 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091202 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101202 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111202 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111202 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111202 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121202 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121202 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131202 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |