JPWO2005057550A1

JPWO2005057550A1 - 音声圧縮伸張装置

Info

Publication number: JPWO2005057550A1
Application number: JP2005516130A
Authority: JP
Inventors: 浩章近藤
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2003-12-15
Filing date: 2004-12-07
Publication date: 2007-12-13
Also published as: CN1894742A; WO2005057550A1; US20070118362A1

Abstract

本発明の音声圧縮伸張装置は、ＡＤＰＣＭ方式でデジタル音声データを圧縮伸張する際に、ＡＤＰＣＭ回路（１０１）に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断するＬＰＦ（１０２）を備えることで、圧縮率を高めたことによって伸張後のデジタル音声データに発生する高周波数帯域の量子化ノイズを低減する。また、ＡＤＰＣＭ回路（１０１）の圧縮ビットレートに応じてＬＰＦ（１０２）の特性を変えることのできるコントローラー（１０３）を備えることで、圧縮ビットレートに応じた最適な特性を持つＬＰＦを構成することができ、使用者の好みに合わせた音質で音声データを再生することができる。

Description

本発明は、音声データの圧縮及び圧縮音声データの伸張を行う音声圧縮伸張装置に関し、特に、適応差分パルス符号変調（ＡｄａｐｔｉｖｅＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ；ＡＤＰＣＭ）方式により、音声データの圧縮及び圧縮音声データの伸張を行う音声圧縮伸張装置に関する。

音声信号を原音声信号に近い形で蓄積する際に行なう代表的な音声信号の変調方式として、パルスコード符号変調（ＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ；ＰＣＭ）方式、デルタ変調（ＤｅｌｔａＭｏｄｕｌａｔｉｏｎ；ＤＭ）方式、差分パルス符号変調（ＤｉｆｆｅｒｅｎｔｉａｌＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ；ＤＰＣＭ）方式、ＡＤＰＣＭ方式がある。

ＰＣＭ方式は、音声波形をある周期ごとにサンプリングして各サンプリング点での音声信号値をアナログ／デジタル変換（Ａ／Ｄ変換）し、その値を０と１の符号別で表示する方式であり、音声信号値をデジタル符号化するときに必要とするビット数は、初めのアナログ信号をどの程度忠実に記録したいかの要求により決まる。ビット数を増やせば増やすほど信号の細かな変化も記録され、デジタル誤差に基づく雑音が少なくなり、実際の音の波形に近い音になるため、音質は良くなる。しかし、ビット数を増やすほど音声データが大きくなり、音声データを記録するメモリの容量が増加するという欠点がある。そこで、ある限られた容量のメモリに多くの音声データを記録するために、効率的に音声データを圧縮する必要がある。

その方法の１つとして、１サンプルの音声信号の情報に対し、量子化して変調するデータ量を最低限の１ビットとしたＤＭ方式がある。ＤＭ方式は、あるタイミングの信号とその次のタイミングの信号とを比較して、現在のタイミングの音声信号値が次のタイミングの音声信号値より高いか低いかを判定して、高ければ符号１、低ければ符号０を与えることによって音声信号を符号化することを特徴とする。従って、メモリは各サンプリングクロックに対して１ビットずつデータを記録すればよい。こうすればメモリの容量が少なくてすむので、音声データを長時間記録することが可能となる。例えば、音声データを圧縮せずに変調する方式ではメモリに限度があるので１０秒位しか音声データを記録できないところを、このＤＭ方式では約１０倍の１００秒位まで音声データを記録できる。しかし、ＤＭ方式は、１クロックに対して音声信号値（アナログ値）が１ステップしか変化しないので音質が悪くなるという欠点がある。

ＤＭ方式とＰＣＭ方式の中間ともいうべき方式がＤＰＣＭ方式である。ＤＰＣＭ方式は、ＤＭ方式における１ビット量子化の部分を複数のビットに置き換えたもので、あるサンプリングクロックでの音声信号値と、その次のサンプリングクロックの音声信号値との残差信号値を直接記憶することを特徴とする。しかし、ＤＰＣＭ方式では音声信号の波形がどのような傾斜で上っているかを記録することができないという欠点がある。

この問題を解決し、ＤＰＣＭ方式で適応予測を行なう方式をＡＤＰＣＭ方式と呼んでいる。ＡＤＰＣＭ方式は、あるサンプリングクロックの音声信号値とその次のサンプリングクロックの音声信号値とを比較して、入力された信号と予測信号との差分を複数ビットで量子化することで、音声データを圧縮することを特徴とする。

従来、ＡＤＰＣＭ方式を用いて音声データを圧縮して、圧縮データを記録再生する音声記録再生装置が提案されている（特許文献１参照）。以下、特許文献１に記載の音声記録再生装置について図９を用いて説明する。この音声記録再生装置は、ローパスフィルター（ＬＰＦ）９０１で高周波数帯域を遮断したアナログ音声信号をＡ／Ｄ変換回路９０２でデジタル信号にＡ／Ｄ変換する。そして、ＡＤＰＣＭ回路９０３でデジタル信号をＡＤＰＣＭ方式により圧縮する。圧縮された音声データは半導体メモリ９０７に記録される。記録した音声データを再生するときは、半導体メモリ９０７から圧縮データを読み出し、ＡＤＰＣＭ回路９０３で伸張した後、Ｄ／Ａ変換回路９０４でアナログ信号に変換する。なお、ＡＤＰＣＭ回路９０３は、圧縮処理と逆の処理を行うことで、圧縮した音声データを伸張する。そして、Ｄ／Ａ変換回路９０４から出力されるアナログ信号の高周波数帯域をＬＰＦ９０５で遮断し、そのアナログ信号に対して再生用増幅回路９０６で再生処理を行う。なお、図９において、制御部９０８は、ＡＤＰＣＭ回路９０３の圧縮伸張動作と、半導体メモリ９０７への圧縮データの記録及び半導体メモリ９０７からの圧縮データの読み出しを制御する。
特開昭６３−２５９７００号公報特開平６−８５６０７号公報

上述のように、ＡＤＰＣＭ方式を用いることによって、高音質を維持しつつ、音声データの圧縮を図ることができる。しかし、ＡＤＰＣＭ方式は、量子化ノイズのパワースペクトルの分布が周波数的に一様ではないため、高周波数帯域に量子化ノイズが発生しやすいという欠点がある。例えば、同一のサンプリング周波数で比較すると、符号ビット数を１ビット減少させると、ノイズの周波数帯域は約１／２となってしまう。このため、符号ビット数を減少させて行き、ある圧縮ビットレートを超えてしまうと、量子化ノイズが発生する周波数帯域が人間の可聴帯域（２２ｋＨｚ程度まで）に入ってしまう。この場合、可聴な量子化ノイズが音声に混入し、耳障りな音となってしまう。したがって、ＡＤＰＣＭ方式では、低い圧縮率で音声データを圧縮する場合は、量子化ノイズはほとんど目立たないが、音声データの圧縮率を高くしすぎると、特に高周波数帯域において目立った量子化ノイズが発生してしまう。以上のことから、従来のＡＤＰＣＭ方式では、ある一定以上の圧縮率で音声データを圧縮するのは困難であった。

図９に示す音声記録再生装置では、Ａ／Ｄ変換前に高周波数成分をＬＰＦ９０１で除去しているが、このＬＰＦは、アナログ信号をデジタル化するためにデータとしては現れない成分、又は原音と異なる波形として現れる成分を除去するだけであり、音声データをＡＤＰＣＭ方式で圧縮する際に発生する高周波数帯域の量子化ノイズを低減することはできない。また、この音声記録再生装置は、アナログ信号を取り込んで圧縮するため、記録媒体に、例えば、ＣＤ−ＤＡ（ＣｏｍｐａｃｔＤｉｓｋ−ＤｉｇｉｔａｌＡｕｄｉｏ）方式で記録されているデジタル音声データを処理することはできない。

以上のことから、本発明では、ＡＤＰＣＭ方式でデジタル音声データを圧縮伸張する際に、高周波数帯域に発生する量子化ノイズを低減する音声圧縮伸張装置を提供することを目的とする。

前記課題を解決するために、本発明（請求項１）に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする。

また、本発明（請求項２）に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする。

また、本発明（請求項３）に係る音声圧縮伸張装置は、請求項１または請求項２に記載の音声圧縮伸張装置において、前記高音域成分遮断部がローパスフィルターであることを特徴とする。

また、本発明（請求項４）に係る音声圧縮伸張装置は、請求項２に記載の音声圧縮伸張装置において、前記高音域成分遮断部がノイズシェーパーであることを特徴とする。

また、本発明（請求項５）に係る音声圧縮伸張装置は、請求項１または請求項２に記載の音声圧縮伸張装置において、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーを備えることを特徴とする。

また、本発明（請求項６）に係る音声圧縮伸張装置は、請求項１に記載の音声圧縮伸張装置において、前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データに対し、前記高音域成分遮断部によって遮断された高音域成分に相当するノイズ成分を付加するノイズ付加回路を備えることを特徴とする。

また、本発明（請求項７）に係る音声圧縮伸張装置は、請求項６に記載の音声圧縮伸張装置において、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性と、前記ノイズ成分、前記ノイズ成分を付加する周波数帯域、及びノイズの音量のうちの少なくとも１つを変えるコントローラーを備えることを特徴とする。

また、本発明（請求項８）に係る音声圧縮伸張装置は、請求項１または請求項２に記載の音声圧縮伸張装置において、前記高音域成分遮断部が、入力デジタル音声データを遅延する複数の第１遅延回路と、前記複数の第１遅延回路の出力に予め設定された係数を乗算する複数の第１乗算器と、前記入力デジタル音声データと前記複数の第１乗算器の出力とを加算する第１加算器と、前記第１加算器の出力に予め設定された係数を乗算する第２乗算器と、出力デジタル音声データを遅延する複数の第２遅延回路と、前記複数の第２遅延回路の出力に予め設定された係数を乗算する複数の第３乗算器と、前記第２乗算器の出力と前記複数の第３乗算器の出力とを加算する第２加算器と、前記第２加算器の出力に予め設定された係数を乗算する第４乗算器と、を備えるローパスフィルターであることを特徴とする。

また、本発明（請求項９）に係る音声圧縮伸張装置は、請求項８に記載の音声圧縮伸張装置において、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記ローパスフィルターの遮断周波数特性を変えるコントローラーを備え、前記コントローラーが、前記複数の第１乗算器の各係数と前記複数の第３乗算器の各係数とを、乗算器毎に変えることを特徴とする。

また、本発明（請求項１０）に係る音声圧縮伸張装置は、請求項１に記載の音声圧縮伸張装置において、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高音域の振幅を検出する振幅検出回路と、前記振幅検出回路により検出された振幅としきい値とを比較し、その比較結果に基づいて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備えることを特徴とする。

また、本発明（請求項１１）に係る音声圧縮伸張装置は、請求項１０に記載の音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、しきい値を超えた場合、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする。

また、本発明（請求項１２）に係る音声圧縮伸張装置は、請求項１０に記載の音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えた場合、または前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えなかった場合に、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする。

本発明に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする。これにより、適応差分パルス符号変調方式にてデジタル音声データを圧縮伸張する際に、圧縮率を高めたことによって発生する伸張後のデジタル音声データの高周波数帯域における量子化ノイズを低減することができる。

また、本発明に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする。これにより、適応差分パルス符号変調方式にてデジタル音声データを圧縮伸張する際に、圧縮率を高めたことによって発生する伸張後の音声データの高周波数帯域における量子化ノイズを低減することができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記高音域成分遮断部がノイズシェーパーであることを特徴とする。これにより、量子化ノイズを効果的に除去して、デジタル音声データを高音質で再生することができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーを備えることを特徴とする。これにより、前記高音域成分遮断部の遮断周波数特性を、適応差分パルス符号変調回路の圧縮ビットレートに応じた最適な特性に変えることができ、その結果、使用者の好みに合わせた音質で、デジタル音声データを再生することができる。

また、本発明に係る音声圧縮伸張装置は前記音声圧縮伸張装置において、前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データに対し、前記高音域成分遮断部によって遮断された高音域成分に相当するノイズ成分を付加するノイズ付加回路を備えることを特徴とする。これにより、適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データを前記高音域成分遮断部に通したことによって抑制された高音域成分を擬似的に再現することができる。その結果、高音域が抑制されることが原因で生じる再生時の音声データの不自然さをなくし、人間にとって快適な音声データの再生を実現することができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性と、前記ノイズ成分、前記ノイズ成分を付加する周波数帯域、及びノイズの音量のうちの少なくとも１つを変えるコントローラーを備えることを特徴とする。これにより、圧縮ビットレートに応じて、付加する前記ノイズ成分、前記ノイズ成分を付加する周波数帯域、またはノイズの音量を制御することができ、音声データを高音質で再生することができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記高音域成分遮断部が、入力デジタル音声データを遅延する複数の第１遅延回路と、前記複数の第１遅延回路の出力に予め設定された係数を乗算する複数の第１乗算器と、前記入力デジタル音声データと前記複数の第１乗算器の出力とを加算する第１加算器と、前記第１加算器の出力に予め設定された係数を乗算する第２乗算器と、出力デジタル音声データを遅延する複数の第２遅延回路と、前記複数の第２遅延回路の出力に予め設定された係数を乗算する複数の第３乗算器と、前記第２乗算器の出力と前記複数の第３乗算器の出力とを加算する第２加算器と、前記第２加算器の出力に予め設定された係数を乗算する第４乗算器とを備えるローパスフィルターであることを特徴とする。これにより、ＬＰＦの遮断周波数特性をより細かく調整することができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高音域の振幅を検出する振幅検出回路と、前記振幅検出回路により検出された振幅としきい値とを比較し、その比較結果に基づいて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備え、前記コントローラーが、前記振幅検出回路により検出された振幅が、しきい値を超えた場合、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする。これにより、前記高音域成分遮断部の遮断周波数特性を、音声データの性質に応じて変えることができる。その結果、音声データの性質に応じて、使用者が高音域成分遮断部の遮断周波数特性を変えることなく、または初めて聴く音声データにおいても、高音域成分遮断部の遮断周波数特性を音声データに合った特性に変えることができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えた場合、または前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えなかった場合に、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする。これにより、高音域の長さが異なる様々な種類の音声データに対応して、前記高音域成分遮断部の遮断周波数特性を変えることができる。

図１は、本発明の実施の形態１に係る音声圧縮伸張装置の概略構成図である。図２は、本発明の実施の形態２に係る音声圧縮伸張装置の概略構成図である。図３は、本発明の実施の形態３に係る音声圧縮伸張装置の概略構成図である。図４は、本発明の実施の形態４に係る音声圧縮伸張装置の概略構成図である。図５は、本発明の実施の形態５に係る音声圧縮伸張装置のＬＰＦの構成図である。図６は、本発明の実施の形態６に係る音声圧縮伸張装置の概略構成図である。図７は、本発明の実施の形態１に係る音声圧縮伸張装置のＬＰＦの構成図である。図８は、本発明の音声圧縮伸張装置をショックループ再生に適応した時の図である。図９は、従来の音声圧縮記録装置の概略構成図である。

符号の説明

１０１、８０６、９０３ＡＤＰＣＭ回路
１０２、２０２、８０５、９０１、９０５ＬＰＦ
１０３コントローラー
１０４ノイズ付加回路
１０５振幅検出回路
５０１ａ〜５０１ｃ、５０８ａ〜５０８ｃ、７０１、８１２遅延回路
５０２ａ〜５０２ｃ、５０４、５０６、５０７ａ〜５０７ｃ、７０２、７０４、８１３、８１５乗算器
５０３、５０５、７０３、８１４加算器
８０１ＣＤ
８０２ピックアップ
８０３ヘッドアップ
８０４デジタル信号処理回路
８０８、９０７半導体メモリ
８０９、９０４Ｄ／Ａ変換回路
８１０アンプ
８１１スピーカー
９０２Ａ／Ｄ変換回路
９０８制御部

（実施の形態１）
以下、本発明の実施の形態１に係る音声圧縮伸張装置について図１を用いて説明する。図１に示す音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１と、ＬＰＦ１０２とを備え、入力したデジタル音声データをＡＤＰＣＭ方式で圧縮伸張する。入力するデジタル音声データは、例えば、記録媒体にＣＤ−ＤＡ方式で記録されているデジタル音声データである。

図１において、音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部を備える。本発明の実施の形態１に係る音声圧縮伸張装置は、この高音域成分遮断部としてＬＰＦ１０２を備え、このＬＰＦ１０２によって高音域成分を直接的に遮断する。

図７にＬＰＦ１０２の簡単な構成例を示す。図７において、ＬＰＦ１０２は、入力したデジタル音声データを遅延回路７０１で遅延し、遅延データに乗算器７０２で乗算係数α_１を乗算し、入力したデジタル音声データと乗算器７０２の出力とを加算器７０３で加算し、加算器７０３の出力に、乗算係数α_１に１を加算した加算結果の逆数を乗算器７０４で乗算する。そして、この乗算器７０４の出力がＡＤＰＣＭ回路１０１に入力される。

このようにして、高周波数帯域上に存在する高音域成分を遮断したデジタル音声データをＡＤＰＣＭ回路１０１でＡＤＰＣＭ方式により圧縮する。ＡＤＰＣＭ方式による圧縮処理及び伸張処理については従来の技術で説明したので、ここでの説明は省略する。

以上のように、本発明の実施の形態１に係る音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分をＬＰＦ１０２で遮断するようにした。これにより、ＡＤＰＣＭ方式によりデジタル音声データを圧縮する際に、圧縮率を高めたことによって、伸張後のデジタル音声データの高周波数帯域に発生する量子化ノイズを低減することができる。

その結果、本発明の実施の形態１に係る音声圧縮伸張装置は、ショックプルーフ再生に対して有用なものになる。ショックプルーフ再生とは、例えば、ＣＤからＣＤ−ＤＡ方式で記録されたＰＣＭ信号を読み出し、その音声データを再生させるときに、何らかの外的要因によって信号を読み出せなかった場合に備えて、音声データを圧縮して半導体メモリに記録しておく方法である。本発明の実施の形態１に係る音声圧縮伸張装置は、音声データの圧縮率を高めても高周波数帯域に発生する量子化ノイズを抑えることができることから、ショックプルーフ再生において、音声データの圧縮率を高くして半導体メモリの容量を有効に利用することができる。

（実施の形態２）
以下、本発明の実施の形態２に係る音声圧縮伸張装置について図２を用いて説明する。図２に示す音声圧縮伸張装置が、図１に示す音声圧縮伸張装置と異なる点は、ＡＤＰＣＭ回路１０１の後段に高音域成分遮断部としてＬＰＦ２０２を備える点である。すなわち、ＡＤＰＣＭ回路１０１が出力する伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分をＬＰＦ２０２で直接的に遮断する。

以上のように、本発明の実施の形態２に係る音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１が出力する伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分をＬＰＦ２０２により直接的に遮断するようにした。これにより、ＡＤＰＣＭ方式によりデジタル音声データを圧縮する際に、圧縮率を高めたことによって、伸張後のデジタル音声データの高周波数帯域に発生する量子化ノイズを低減することができる。

なお、本発明の実施の形態２では、ＡＤＰＣＭ回路の後段に高音域成分遮断部としてＬＰＦを備えるようにしたが、本発明はこれに限るものではなく、高音域成分遮断部としてＡＤＰＣＭ回路の後段にノイズシェイパーを備え、このノイズシェーパーによってＡＤＰＣＭ回路から出力される伸張後のデジタル音声データの高周波数帯域に発生する量子化ノイズを除去するようにしても良い。この場合、ノイズシェーパー自体の構成が複雑なこともあり、回路構成全体も複雑化してしまうが、量子化ノイズを効果的に除去することができるため、デジタル音声データを高音質で再生することが可能となる。

（実施の形態３）
以下、本発明の実施の形態３に係る音声圧縮伸張装置について図３を用いて説明する。図３に示す音声圧縮伸張装置は、図１に示す音声圧縮伸張装置にさらにコントローラー１０３を備えることを特徴とする。コントローラー１０３は、ＡＤＰＣＭ回路１０１の圧縮ビットレートに応じてＬＰＦ１０２の特性（遮断周波数特性）を変える。

例えば、ＡＤＰＣＭ回路１０１の圧縮ビットレートのビット数を大きくして、圧縮率を低くすると、伸張後のデジタル音声データの量子化ノイズがあまり目立たず、ＬＰＦを通すことによって高周波数帯域を過剰に遮断してしまい、音質の低下を招いてしまう場合がある。この場合、コントローラー１０３は、デジタル音声データをＬＰＦ１０２に通さないように制御するか、またはＬＰＦ１０２の特性をカットオフの立下りが緩やかなものにする。なお、ＬＰＦ１０２の構成が図７に示す構成の場合、コントローラー１０３は乗算係数α_１を０にすることで、デジタル音声データがＬＰＦ１０２を通過しないことにできる。また、乗算係数α_１を変えることで、ＬＰＦ１０２の特性をカットオフの立下りが緩やかなものになるように制御しても良い。なお、カットオフとは、どの周波数帯域から音声データを遮断するかを意味し、カットオフの立ち下がりとは、音声データを遮断する周波数帯域からの立ち下がりを意味する。

これに対して、ＡＤＰＣＭ回路１０１の圧縮ビットレートのビット数を小さくして、圧縮率を高めることで、伸張後のデジタル音声データの高周波数帯域に目立った量子化ノイズが発生してしまう場合は、ＬＰＦ１０２の特性をカットオフの立下りが急峻なものにして、音声データを再生する際の音質の低下を抑える。ＬＰＦ１０２の構成が図７に示す構成である場合、コントローラー１０３は乗算係数α_１を変えることでＬＰＦ１０２の特性をカットオフの立下りが急峻なものにできる。

さらに、コントローラー１０３は、ＬＰＦ１０２の特性だけでなく、ＡＤＰＣＭ回路１０１の圧縮ビットレートを変えるようにする。ＡＤＰＣＭ回路の圧縮ビットレートを変えるには、デジタル音声データを圧縮する階調の段階を変化させる。例えば、デジタル音声データが１６ビット（６５５３６種類のデータ）で、圧縮ビットレートを４ビット（１６階調のデータ）にする場合には、デジタル音声データを±８段階（１６種類）の階調に割り当て、圧縮ビットレートを３ビット（８階調のデータ）にする場合には、デジタル音声データを±４段階（８種類）の階調に割り当てる。そして、音声の値がある範囲の間にあれば、Ｘ階調目、というように、データを振り分ける。すなわち、音声の値に応じて、データを振り分ける階調を決定する。なお、音声の値に応じてデータを振り分ける階調を決める基準となるデータは、圧縮ビットレート（例えば、４ビットや、３ビット）に応じて、それぞれ予め設定しておく。

また、コントローラー１０３は、使用者からの指示を受け付ける機能を有するようにしても良い。これにより、ＬＰＦ１０２の特性を使用者が変えることができる。使用者の好みに応じて手動でＬＰＦ１０２の特性を変えることによって、音声データを使用者の好みの音質で再生できる。再生した音声データの音質が良いか悪いかという判断についてはすべて使用者の好みが反映されるため、使用者の好みに合わせてＬＰＦ１０２の特性を変えることは有効である。さらに、コントローラー１０３が使用者からの指示に基づいてＬＰＦ１０２の特性と共にＡＤＰＣＭ回路１０１の圧縮ビットレートを変えるようにしても良い。これにより、メモリに保存する音声データの時間も使用者が手動で変えることができる。ＬＰＦ１０２の特性と圧縮ビットレートの両方を変えることができることで、音質を重視するか、より多くの音声データをメモリ（例えば、半導体メモリ）に記録するかを、使用者が選択することができる。

また、コントローラー１０３が自動でＬＰＦ１０２の特性を変化させることも有効である。例えば、使用者が一度聴いた音声データに合った好みのＬＰＦ１０２の特性を記憶しておき、次回からは自動的にそのＬＰＦ１０２の特性を選択するといった機能をコントローラー１０３に持たせることで、利便性を上げることもできる。同様に、使用者が設定した圧縮ビットレートを記憶しておき、次回からその圧縮ビットレートを自動的にコントローラー１０３が選択するようにしても良い。

以上のように、本発明の実施の形態３に係る音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１と、ＡＤＰＣＭ回路１０１に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断するＬＰＦ１０２と、ＬＰＦ１０２の特性をＡＤＰＣＭ回路１０１の圧縮ビットレートに応じて変えるコントローラー１０３とを備えるようにした。これにより、ＡＤＰＣＭ回路１０１の圧縮ビットレートに応じた最適なＬＰＦの特性を選択することができ、その結果、使用者の好みに合わせた音質で、音声データを再生することができる。さらに、コントローラー１０３がＡＤＰＣＭ回路１０１の圧縮ビットレートも変えるようにすることで、使用者の好みに合わせてメモリに記録できる音声データの時間を変えることができる。

なお、実施の形態３では、図１に示す音声圧縮伸張装置にコントローラー１０３を備える場合について説明したが、本発明はこれに限るものでなく、図２に示す音声圧縮伸張装置にコントローラー１０３を備えることでも良い。

（実施の形態４）
以下、本発明の実施の形態４に係る音声圧縮伸張装置について図４を用いて説明する。図４に示す音声圧縮伸張装置は、図１に示す音声圧縮伸張装置にノイズ付加回路１０４を備えることを特徴とする。ノイズ付加回路１０４は、ＡＤＰＣＭ回路１０１から出力される伸張後のデジタル音声データに対して、ＬＰＦ１０２で遮断された高音域成分に相当するノイズ成分を付加する。具体的には、可聴周波数帯の上限やその上限以上の周波数帯域にノイズ成分を付加する。以下、ノイズ付加回路１０４の一例について説明する（特許文献２参照）。特許文献２に記載のノイズ付加回路は、原音声信号の周波数分析を行い、分析結果から原音声信号帯域中の基音と倍音が組みで存在する音色成分を抽出する。そして、抽出した音色成分を用いて、原音声信号帯域より高音域側の倍音成分を予測し、予測した倍音成分を原音声信号に挿入する。なお、ノイズ付加回路１０４は、これに限るものではなく、可聴周波数帯の上限やその上限以上の周波数帯域にノイズ成分を付加するものであれば何でも良い。

さらに、図４に示す音声圧縮伸張装置は、図３に示すコントローラー１０３を備え、このコントローラーが、ＡＤＰＣＭ回路１０１の圧縮ビットレートに応じて、ＬＰＦ１０２の特性と共にノイズ付加回路１０４を制御するようにしても良い。具体的には、付加するノイズ成分や、ノイズを付加する周波数帯域や、ノイズの音量等を制御する。これにより、圧縮ビットレートに応じて、付加するノイズ成分、ノイズを付加する周波数帯域、ノイズの音量等を最適なものに変えて、音声データを高音質で再生することができる。

さらに、コントローラーは、ＡＤＰＣＭ回路１０１の圧縮ビットレートを変えるようにしても良い。

以上のように本発明の実施の形態４に係る音声圧縮伸張装置は、ＡＤＰＣＭ回路１０１に入力される圧縮前のデジタル音声データをＬＰＦ１０２に通して、高周波数帯域上に存在する高音域成分を遮断する際に、ＡＤＰＣＭ回路１０１が出力する伸張後のデジタル音声データに対して、ＬＰＦ１０２で遮断された高音域成分に相当するノイズを付加するノイズ付加回路１０４を備えるようにした。これにより、ＬＰＦ１０２によって遮断された高音域成分を擬似的に再現することができる。その結果、高音域が遮断されてしまうことによる再生音声データの不自然さをなくし、人間にとって快適な音声データの再生を実現することができる。

（実施の形態５）
以下、本発明の実施の形態５に係る音声圧縮伸張装置について図５を用いて説明する。実施の形態５に係る音声圧縮伸張装置は、図１〜図４のいずれかに示すＬＰＦを、過去数サンプル分の入力デジタル音声データと出力デジタル音声データを用いて、高周波数帯域上の高音域成分を遮断する構成とする。具体的には、図５に示すように、入力側の遅延回路及び乗算器をそれぞれ複数備え、さらに、出力側にも遅延回路及び乗算器をそれぞれ複数備える。

以下、図５に示すＬＰＦ５００の動作について説明する。まず、入力側の複数の第１遅延回路（遅延回路５０１ａ〜５０１ｃ）が数サンプル分の入力デジタル音声データを遅延する。次に、複数の第１乗算器が複数の第１遅延回路の出力に対して予め設定した係数を乗算する。すなわち、遅延回路５０１ａの出力に乗算器５０２ａが乗算係数α_１を、遅延回路５０１ｂの出力に乗算器５０２ｂが乗算係数α_２を、遅延回路５０１ｃの出力に乗算器５０２ｃが乗算係数α_３を乗算する。次に、第１加算器（加算器５０３）が乗算器５０２ａ〜５０２ｃの出力と入力デジタル音声データを加算する。次に、第２乗算器（乗算器５０４）が加算器５０３の出力に対して、予め設定した係数として、乗算係数α_１〜α_３の合計に１を加算した加算結果の逆数（１／１＋α_１＋α_２＋α_３）を乗算する。この乗算器５０４の係数は、正確に（１／１＋α_１＋α_２＋α_３）の値でなくても良く、おおよそ（１／１＋α_１＋α_２＋α_３）の値で良い。次に、出力側の複数の第２遅延回路（遅延回路５０８ａ〜５０８ｃ）が出力デジタル音声データを数サンプル分遅延する。次に、複数の第３乗算器が複数の第２遅延回路の出力に対して予め設定した係数を乗算する。すなわち、遅延回路５０８ａの出力に乗算器５０７ａが乗算係数β_１を、遅延回路５０８ｂの出力に乗算器５０７ｂが乗算係数β_２を、遅延回路５０８ｃの出力に乗算器５０８ｃが乗算係数β_３を乗算する。次に、第２加算器（加算器５０５）が乗算器５０７ａ〜５０７ｃの出力と乗算器５０４の出力とを加算する。次に、第４乗算器（乗算器５０６）が加算器５０５の出力に対して、予め設定した係数として、乗算係数β_１〜β_３の合計に１を加算した加算結果の逆数（１／１＋β_１＋β_２＋β_３）を乗算する。この乗算器５０６の係数は、正確に（１／１＋β_１＋β_２＋β_３）の値でなくても良く、おおよそ（１／１＋β_１＋β_２＋β_３）の値で良い。そして、乗算器５０６の出力が高周波数帯域上の高音域成分が除去されたデジタル音声データとして外部に出力される。

また、コントローラーを用いて、ＡＤＰＣＭ回路１０１の圧縮ビットレートに応じてＬＰＦ５００の特性を変えるようにしても良い。その場合は、乗算器５０１ａ〜５０１ｂの乗算係数α_{１，２，３}と、乗算器５０７ａ〜５０７ｃの乗算係数β_{１，２，３}とをそれぞれ変えるだけで良い。

以上のように、本発明の実施の形態５に係る音声圧縮伸張装置によれば、ＡＤＰＣＭ回路１０１で圧縮前のデジタル音声データまたはＡＤＰＣＭ回路１０１で伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断するＬＰＦの構成を、過去数サンプル分の入力デジタル音声データと出力デジタル音声データを用いて、高音域成分を遮断する構成としたことから、ＬＰＦの特性をより細かく調整できる。

なお、本発明の実施の形態５において、ＬＰＦ５００は、入力側と出力側に３個の遅延回路と乗算器をそれぞれ備えるようにしたが、遅延回路及び乗算器の数はこれに限るものではなく、複数であれば良い。さらに、入力側及び出力側のうちのいずれか一方の側の遅延回路及び乗算器を複数備えることでも良い。

（実施の形態６）
以下、本発明の実施の形態６に係る音声圧縮伸張装置について図６を用いて説明する。図６に示す音声圧縮伸張装置は、図３に示す音声圧縮伸張装置に振幅検出回路１０５をさらに備えることを特徴とする。

振幅検出回路１０５はデジタル音声データの高音域における予め設定された周波数帯域の振幅を検出する。コントローラー１０３は、振幅検出回路１０５が検出した振幅に基づいてＬＰＦ１０２の特性を変える。具体的には、振幅検出回路１０５が検出した振幅が予め設定されたしきい値を超えるとＬＰＦ１０２の特性を変える。振幅が大きくなると、伸張後のデジタル音声データの量子化ノイズが大きくなることが想定されるので、ＬＰＦ１０２の特性をカットオフの立ち下がりが急峻なものに変える。

また、音声データはその種類によって高音域の長さが異なるので、コントローラー１０３は、振幅検出回路１０５が検出した振幅が予め設定した時間（数サンプル分）、しきい値を超えた場合に、自動的にＬＰＦ１０２の特性を変えるようにしても良い。この場合、コントローラー１０３は、ＬＰＦ１０２の特性をカットオフの立ち下がりが急峻なものに変える。また、振幅検出回路１０５が検出した振幅が、予め設定した時間、しきい値を超えなかった場合に、ＬＰＦ１０２の特性を変えるようにしても良い。この場合、コントローラー１０３はＬＰＦ１０２の特性をカットオフの立ち下がりが緩やかなものに変える。

以上のように本発明の実施の形態６に係る音声圧縮伸張装置は、デジタル音声データの高音域における予め設定された周波数帯域の振幅を検出する振幅検出回路１０５を備え、この振幅に応じて、デジタル音声データの高周波数帯域を遮断するＬＰＦ１０２の特性をコントローラー１０３が変えるようにした。これにより、音声データの違いによって使用者がその都度ＬＰＦ１０２の特性を変える必要がなくなる。また、初めて視聴する音声データに対しても、その音声データの特性に最適なＬＰＦ１０２の特性を設定することが可能となる。

以下、本発明に係る音声圧縮伸張装置の実施例について図８を用いて説明する。本実施例では、本発明の音声圧縮伸張装置をショックプルーフ再生に適応する場合について説明する。

図８に示す再生装置は、ＣＤ８０１からピックアップ８０２を介して読み出したＲＦ信号をヘッドアンプ８０３にて増幅し、デジタル信号処理回路８０４でＲＦ信号をサンプリング周波数４４．１ｋＨｚの１６ビットのＰＣＭ信号に復調する。そしてこの信号をＬＰＦ８０５に通した後、ＡＤＰＣＭ回路８０６で圧縮、すなわち、１６ビットのＰＣＭ信号を４ビット又は３ビットの圧縮音声データに圧縮し、半導体メモリ８０８に記録する。また同時に再生も行い、半導体メモリ８０８に記録された圧縮音声データをＡＤＰＣＭ回路８０６で伸張した後、Ｄ／Ａ変換回路８０９でアナログ信号に変換し、このアナログ信号をアンプ（ＡＭＰ）８１０で増幅してスピーカー（ＳＰ）８１１で再生する。このような構成により、何らかの原因でＣＤからの音声データを得ることができなかった場合、例えば外部からの振動によってＣＤからデータを読み取っているピックアップが外れた場合においても、半導体メモリ８０８に記憶している圧縮音声データを利用して再生を続行させ、その間にＣＤから音声データを読み出すことができなくなった原因を取り除いて、再生を中断させることなく元の状態に復帰させることができる。実際に、半導体メモリに１６ＭビットのＤＲＡＭ（ＤｙｎａｍｉｃＲＡＭ）を用いた時、ＡＤＰＣＭ回路８０６にて４ビットの圧縮を行なった場合には約４５秒の音声データを、３ビットの圧縮を行った場合には約６０秒の音声データを半導体メモリに記録することができる。

ここで、音声データを半導体メモリに長時間記録しておく方法として、半導体メモリの容量を増やすか、又は音声データの圧縮率を高めるという方法が考えられる。ところが、メモリ容量の増加はコストアップや装置の増大を招くことにつながり、また圧縮率を高めすぎると、音声データの高周波数帯域の量子化ノイズが増大するという問題が生じる。実際に、デジタル信号処理回路８０４にて復調された１６ビットのＰＣＭ信号を、ＬＰＦ８０５を通さずに直接ＡＤＰＣＭ回路８０６に入力し、３ビットで圧縮を行なったとき、伸張後の音声データを再生すると、高周波数帯域において可聴な量子化ノイズが目立ったものとなった。

そこで、本実施例では、この可聴な量子化ノイズを抑制するために、ＡＤＰＣＭ回路８０６に入力する圧縮前のＰＣＭ信号をＬＰＦ８０５に通し、高周波数帯域上に存在する高音域成分を遮断する。なお、ＬＰＦ８０５の動作は、図７に示すＬＰＦの動作と同様であるで説明を省略する。また、ＬＰＦ８０５の構成は図５に示すＬＰＦ５００と同様の構成であっても良い。

ここで、ＡＤＰＣＭ回路８０６の圧縮ビットレートが３ビットであり、３ビットでＰＣＭ信号を圧縮すると量子化ノイズが発生したとする。この場合、コントローラー８０７は、この圧縮ビットレートで量子化ノイズを抑制する最適な乗算係数α_１をＬＰＦ８０５内の乗算器８１３に設定する。例えば乗算係数α_１の値を１と設定すると、入力ＰＣＭ信号と、その１サンプリングクロック前に入力されたＰＣＭ信号との中間値を取ることになり、ＰＣＭ信号の高周波数帯域上に存在する高音域成分が遮断される。本実施例ではα_１＝１としたが、α_１の値は１以外でも値でも良い。なお、乗算係数α_１は整数でなくても良い。

一方、圧縮率を低くして高音質で音声データを再生させる場合には、ＰＣＭ信号をＬＰＦ８０５に通さずに直接ＡＤＰＣＭ回路８０６に入力したとしても、可聴な量子化ノイズがそれほど目立たないことがある。この場合においてもＰＣＭ信号をＬＰＦ８０５に通すと、ＰＣＭ信号から高周波数帯域上に存在する高音域成分を過剰に遮断してしまい、再生時の音声データの音質を低下させてしまうことになる。例えば、上述のように３ビットの圧縮ビットレートに応じてＬＰＦ８０５の乗算係数α_１を設定しておくと、ＡＤＰＣＭ回路８０６の圧縮ビットレートを４ビットにした場合、再生時の音声データの音質を低下させてしまうことになる。よって、圧縮率を低くすることで、ＬＰＦ８０５にＰＣＭ信号を通す必要がない場合には、コントローラー８０７により、α_１の値を０とし、元のＰＣＭ信号のままＡＤＰＣＭ回路８０６で圧縮を行なうようにする。また、乗算係数α_１の値を変えて、ＬＰＦ８０５の特性をカットオフの立ち下がりがより緩やかなものになるようにしても良い。

なお、本実施例では、ＡＤＰＣＭ回路８０６に入力される圧縮前のＰＣＭ信号をＬＰＦ８０５に通す場合について説明したが、ＡＤＰＣＭ回路８０６の後段にＬＰＦ８０５を備え、ＡＤＰＣＭ回路８０６が出力する音声データをＬＰＦ８０５に通すことでも良い。

本発明は、デジタル音声データをＡＤＰＣＭ方式によって圧縮し、圧縮データを記録しながら再生（例えば、ショックプルーフ再生）する装置及び方法に好適である。また、デジタル音声データをメモリに記憶する場合だけでなく、デジタル音声データを圧縮して伝送する場合にも有用である。

前記課題を解決するために、本発明（請求項１）に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データ、または前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部と、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備えることを特徴とする。

また、本発明（請求項２）に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高音域の振幅を検出する振幅検出回路と、前記振幅検出回路により検出された振幅としきい値とを比較し、その比較結果に基づいて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備えることを特徴とする。

また、本発明（請求項３）に係る音声圧縮伸張装置は、請求項２に記載の音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、しきい値を超えた場合、前記高音域成分遮断部の遮断周波数特性を変えることを特徴とする。

また、本発明（請求項４）に係る音声圧縮伸張装置は、請求項２に記載の音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えた場合、または前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えなかった場合に、前記高音域成分遮断部の遮断周波数特性を変えることを特徴とする。

本発明に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データ、または前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部と、前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備えることを特徴とする。これにより、前記高音域成分遮断部の遮断周波数特性を、適応差分パルス符号変調回路の圧縮ビットレートに応じた最適な特性に変えることができ、その結果、使用者の好みに合わせた音質で、デジタル音声データを再生することができる。

本発明に係る音声圧縮伸張装置は、デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部と、前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高音域の振幅を検出する振幅検出回路と、前記振幅検出回路により検出された振幅としきい値とを比較し、その比較結果に基づいて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備え、前記コントローラーが、前記振幅検出回路により検出された振幅が、しきい値を超えた場合、前記高音域成分遮断部の遮断周波数特性を変えることを特徴とする。これにより、前記高音域成分遮断部の遮断周波数特性を、音声データの性質に応じて変えることができる。その結果、音声データの性質に応じて、使用者が高音域成分遮断部の遮断周波数特性を変えることなく、または初めて聴く音声データにおいても、高音域成分遮断部の遮断周波数特性を音声データに合った特性に変えることができる。

また、本発明に係る音声圧縮伸張装置は、前記音声圧縮伸張装置において、前記コントローラーが、前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えた場合、または前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えなかった場合に、前記高音域成分遮断部の遮断周波数特性を変えることを特徴とする。これにより、高音域の長さが異なる様々な種類の音声データに対応して、前記高音域成分遮断部の遮断周波数特性を変えることができる。

図７にＬＰＦ１０２の簡単な構成例を示す。図７において、ＬＰＦ１０２は、入力したデジタル音声データを遅延回路７０１で遅延し、遅延データに乗算器７０２で乗算係数α₁を乗算し、入力したデジタル音声データと乗算器７０２の出力とを加算器７０３で加算し、加算器７０３の出力に、乗算係数α₁に１を加算した加算結果の逆数を乗算器７０４で乗算する。そして、この乗算器７０４の出力がＡＤＰＣＭ回路１０１に入力される。

例えば、ＡＤＰＣＭ回路１０１の圧縮ビットレートのビット数を大きくして、圧縮率を低くすると、伸張後のデジタル音声データの量子化ノイズがあまり目立たず、ＬＰＦを通すことによって高周波数帯域を過剰に遮断してしまい、音質の低下を招いてしまう場合がある。この場合、コントローラー１０３は、デジタル音声データをＬＰＦ１０２に通さないように制御するか、またはＬＰＦ１０２の特性をカットオフの立下りが緩やかなものにする。なお、ＬＰＦ１０２の構成が図７に示す構成の場合、コントローラー１０３は乗算係数α₁を０にすることで、デジタル音声データがＬＰＦ１０２を通過しないことにできる。また、乗算係数α₁を変えることで、ＬＰＦ１０２の特性をカットオフの立下りが緩やかなものになるように制御しても良い。なお、カットオフとは、どの周波数帯域から音声データを遮断するかを意味し、カットオフの立ち下がりとは、音声データを遮断する周波数帯域からの立ち下がりを意味する。

これに対して、ＡＤＰＣＭ回路１０１の圧縮ビットレートのビット数を小さくして、圧縮率を高めることで、伸張後のデジタル音声データの高周波数帯域に目立った量子化ノイズが発生してしまう場合は、ＬＰＦ１０２の特性をカットオフの立下りが急峻なものにして、音声データを再生する際の音質の低下を抑える。ＬＰＦ１０２の構成が図７に示す構成である場合、コントローラー１０３は乗算係数α₁を変えることでＬＰＦ１０２の特性をカットオフの立下りが急峻なものにできる。

以下、図５に示すＬＰＦ５００の動作について説明する。まず、入力側の複数の第１遅延回路（遅延回路５０１ａ〜５０１ｃ）が数サンプル分の入力デジタル音声データを遅延する。次に、複数の第１乗算器が複数の第１遅延回路の出力に対して予め設定した係数を乗算する。すなわち、遅延回路５０１ａの出力に乗算器５０２ａが乗算係数α₁を、遅延回路５０１ｂの出力に乗算器５０２ｂが乗算係数α₂を、遅延回路５０１ｃの出力に乗算器５０２ｃが乗算係数α₃を乗算する。次に、第１加算器（加算器５０３）が乗算器５０２ａ〜５０２ｃの出力と入力デジタル音声データを加算する。次に、第２乗算器（乗算器５０４）が加算器５０３の出力に対して、予め設定した係数として、乗算係数α₁〜α₃の合計に１を加算した加算結果の逆数（１／１＋α₁＋α₂＋α₃）を乗算する。この乗算器５０４の係数は、正確に（１／１＋α₁＋α₂＋α₃）の値でなくても良く、おおよそ（１／１＋α₁＋α₂＋α₃）の値で良い。次に、出力側の複数の第２遅延回路（遅延回路５０８ａ〜５０８ｃ）が出力デジタル音声データを数サンプル分遅延する。次に、複数の第３乗算器が複数の第２遅延回路の出力に対して予め設定した係数を乗算する。すなわち、遅延回路５０８ａの出力に乗算器５０７ａが乗算係数β₁を、遅延回路５０８ｂの出力に乗算器５０７ｂが乗算係数β₂を、遅延回路５０８ｃの出力に乗算器５０７ｃが乗算係数β₃を乗算する。次に、第２加算器（加算器５０５）が乗算器５０７ａ〜５０７ｃの出力と乗算器５０４の出力とを加算する。次に、第４乗算器（乗算器５０６）が加算器５０５の出力に対して、予め設定した係数として、乗算係数β₁〜β₃の合計に１を加算した加算結果の逆数（１／１＋β₁＋β₂＋β₃）を乗算する。この乗算器５０６の係数は、正確に（１／１＋β₁＋β₂＋β₃）の値でなくても良く、おおよそ（１／１＋β₁＋β₂＋β₃）の値で良い。そして、乗算器５０６の出力が高周波数帯域上の高音域成分が除去されたデジタル音声データとして外部に出力される。

また、コントローラーを用いて、ＡＤＰＣＭ回路１０１の圧縮ビットレートに応じてＬＰＦ５００の特性を変えるようにしても良い。その場合は、乗算器５０１ａ〜５０１ｂの乗算係数α_1,2,3と、乗算器５０７ａ〜５０７ｃの乗算係数β_1,2,3とをそれぞれ変えるだけで良い。

ここで、ＡＤＰＣＭ回路８０６の圧縮ビットレートが３ビットであり、３ビットでＰＣＭ信号を圧縮すると量子化ノイズが発生したとする。この場合、コントローラー８０７は、この圧縮ビットレートで量子化ノイズを抑制する最適な乗算係数α₁をＬＰＦ８０５内の乗算器８１３に設定する。例えば乗算係数α₁の値を１と設定すると、入力ＰＣＭ信号と、その１サンプリングクロック前に入力されたＰＣＭ信号との中間値を取ることになり、ＰＣＭ信号の高周波数帯域上に存在する高音域成分が遮断される。本実施例ではα₁＝１としたが、α₁の値は１以外でも値でも良い。なお、乗算係数α₁は整数でなくても良い。

一方、圧縮率を低くして高音質で音声データを再生させる場合には、ＰＣＭ信号をＬＰＦ８０５に通さずに直接ＡＤＰＣＭ回路８０６に入力したとしても、可聴な量子化ノイズがそれほど目立たないことがある。この場合においてもＰＣＭ信号をＬＰＦ８０５に通すと、ＰＣＭ信号から高周波数帯域上に存在する高音域成分を過剰に遮断してしまい、再生時の音声データの音質を低下させてしまうことになる。例えば、上述のように３ビットの圧縮ビットレートに応じてＬＰＦ８０５の乗算係数α₁を設定しておくと、ＡＤＰＣＭ回路８０６の圧縮ビットレートを４ビットにした場合、再生時の音声データの音質を低下させてしまうことになる。よって、圧縮率を低くすることで、ＬＰＦ８０５にＰＣＭ信号を通す必要がない場合には、コントローラー８０７により、α₁の値を０とし、元のＰＣＭ信号のままＡＤＰＣＭ回路８０６で圧縮を行なうようにする。また、乗算係数α₁の値を変えて、ＬＰＦ８０５の特性をカットオフの立ち下がりがより緩やかなものになるようにしても良い。

符号の説明

１０１、８０６、９０３ＡＤＰＣＭ回路
１０２、２０２、８０５、９０１、９０５ＬＰＦ
１０３コントローラー
１０４ノイズ付加回路
１０５振幅検出回路
５０１ａ〜５０１ｃ、５０８ａ〜５０８ｃ、７０１、８１２遅延回路
５０２ａ〜５０２ｃ、５０４、５０６、５０７ａ〜５０７ｃ、７０２、７０４、８１３、８１５乗算器
５０３、５０５、７０３、８１４加算器
８０１ＣＤ
８０２ピックアップ
８０３ヘッドアンプ
８０４デジタル信号処理回路
８０８、９０７半導体メモリ
８０９、９０４Ｄ／Ａ変換回路
８１０アンプ
８１１スピーカー
９０２Ａ／Ｄ変換回路
９０８制御部

Claims

デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、
前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする音声圧縮伸張装置。
デジタル音声データを適応差分パルス符号変調方式で変調する適応差分パルス符号変調回路と、
前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データの高周波数帯域上に存在する高音域成分を遮断する高音域成分遮断部とを備えることを特徴とする音声圧縮伸張装置。
請求項１または請求項２に記載の音声圧縮伸張装置において、
前記高音域成分遮断部はローパスフィルターであることを特徴とする音声圧縮伸張装置。
請求項２に記載の音声圧縮伸張装置において、
前記高音域成分遮断部はノイズシェーパーであることを特徴とする音声圧縮伸張装置。
請求項１または請求項２に記載の音声圧縮伸張装置において、
前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーを備えることを特徴とする音声圧縮伸張装置。
請求項１に記載の音声圧縮伸張装置において、
前記適応差分パルス符号変調回路から出力される伸張後のデジタル音声データに対し、前記高音域成分遮断部によって遮断された高音域成分に相当するノイズ成分を付加するノイズ付加回路を備えることを特徴とする音声圧縮伸張装置。
請求項６に記載の音声圧縮伸張装置において、
前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記高音域成分遮断部の遮断周波数特性と、前記ノイズ成分、前記ノイズ成分を付加する周波数帯域、及びノイズの音量のうちの少なくとも１つを変えるコントローラーを備えることを特徴とする音声圧縮伸張装置。
請求項１または請求項２に記載の音声圧縮伸張装置において、
前記高音域成分遮断部は、
入力デジタル音声データを遅延する複数の第１遅延回路と、
前記複数の第１遅延回路の出力に予め設定された係数を乗算する複数の第１乗算器と、
前記入力デジタル音声データと前記複数の第１乗算器の出力とを加算する第１加算器と、
前記第１加算器の出力に予め設定された係数を乗算する第２乗算器と、
出力デジタル音声データを遅延する複数の第２遅延回路と、
前記複数の第２遅延回路の出力に予め設定された係数を乗算する複数の第３乗算器と、
前記第２乗算器の出力と前記複数の第３乗算器の出力とを加算する第２加算器と、
前記第２加算器の出力に予め設定された係数を乗算する第４乗算器と、を備えるローパスフィルターであることを特徴とする音声圧縮伸張装置。
請求項８に記載の音声圧縮伸張装置において、
前記適応差分パルス符号変調回路の圧縮ビットレートに応じて、前記ローパスフィルターの遮断周波数特性を変えるコントローラーを備え、
前記コントローラーは、前記複数の第１乗算器の各係数と、前記複数の第３乗算器の各係数とを、乗算器毎に変えることを特徴とする音声圧縮伸張装置。
請求項１に記載の音声圧縮伸張装置において、
前記適応差分パルス符号変調回路に入力される圧縮前のデジタル音声データの高音域の振幅を検出する振幅検出回路と、
前記振幅検出回路により検出された振幅としきい値とを比較し、その比較結果に基づいて、前記高音域成分遮断部の遮断周波数特性を変えるコントローラーとを備えることを特徴とする音声圧縮伸張装置。
請求項１０に記載の音声圧縮伸張装置において、
前記コントローラーは、前記振幅検出回路により検出された振幅が、しきい値を超えた場合、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする音声圧縮伸張装置。
請求項１０に記載の音声圧縮伸張装置において、
前記コントローラーは、前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えた場合、または前記振幅検出回路により検出された振幅が、予め設定された時間しきい値を超えなかった場合に、前記高音域成分遮断部の遮断周波数特性を変えること特徴とする音声圧縮伸張装置。