JP6700507B2 - オーディオ信号のデジタルカプセル化 - Google Patents

オーディオ信号のデジタルカプセル化 Download PDF

Info

Publication number
JP6700507B2
JP6700507B2 JP2017517426A JP2017517426A JP6700507B2 JP 6700507 B2 JP6700507 B2 JP 6700507B2 JP 2017517426 A JP2017517426 A JP 2017517426A JP 2017517426 A JP2017517426 A JP 2017517426A JP 6700507 B2 JP6700507 B2 JP 6700507B2
Authority
JP
Japan
Prior art keywords
response
sampling rate
filter
encoder
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017517426A
Other languages
English (en)
Other versions
JP2017521977A (ja
JP6700507B6 (ja
Inventor
グラハム クレイブン ピーター
グラハム クレイブン ピーター
ジョン ロバート スチュアート
ジョン ロバート スチュアート
Original Assignee
エムキューエー リミテッド
エムキューエー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エムキューエー リミテッド, エムキューエー リミテッド filed Critical エムキューエー リミテッド
Publication of JP2017521977A publication Critical patent/JP2017521977A/ja
Application granted granted Critical
Publication of JP6700507B2 publication Critical patent/JP6700507B2/ja
Publication of JP6700507B6 publication Critical patent/JP6700507B6/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明は、オーディオ信号の高品質なデジタル表現の提供に関する。
コンパクトディスク(CD)の導入から30年の間に、一般大衆は、「CDクオリティ」をデジタルオーディオの基準として受け入れるようになった。それと同時に、2つの種類の議論がオーディオ業界で巻き起こった。一つの議論は、CDの16ビットの解像度及び44.1kHzのサンプリングレートは、データのむだであり、同等の音声は、よりコンパクトな、MP3やAACのような、ロスありの圧縮されたフォーマットによって伝搬され得るという前提に立つ。もう一つの議論は、対蹠的に反対の見方であり、CDの解像度及びサンプリングレートは不適切であって、例えば、96/24と一般に略記される仕様である、24ビット及び96kHzのサンプリングレートを用いれば聴覚的によりよい結果が得られると主張している。
もし44kHzが十分に良いとは本当には考えられないのなら、96kHzが解答なのか、それとも192kHz又はさらに384kHzまでもが「究極の」品質のためにはサンプリングレートとして必要なのかという疑問がわく。多くのオーディオ愛好家たちは、96kHzは、44.1kHzよりも確かに音が良く、192kHzは96kHzよりも本当に音が良いと主張する。
歴史的には、アナログ波形の連続時間表現からサンプリングされたデジタル表現への遷移は、サンプリング定理によって正当化されてきており(www.en.wikipedia.org/wiki/Sampling_theorem)、この定理は、最大fmax最大までの周波数しか含まない連続時間波形は、1秒当たり2×fmaxのサンプリング点を有するサンプリングされた表現によって正確に再構成され得ることを記述している。サンプリングレートの半分に対応する周波数は、ナイキスト周波数として知られており、例えば96KHzにおけるサンプリングだと48kHzになる。
したがって、連続時間波形は、帯域制限をする「アンチエイリアス」フィルタをまず通されることによって、そうでなければサンプリングプロセスによってエイリアシングされてfmaxより下のイメージとして再生されてしまう、fmaxより上の周波数を除去する。
標準的な通信の慣習に従えば、帯域制限をするアンチエイリアスフィルタは、fmaxまでは平坦な周波数応答にふつうは近く、それによって周波数応答のグラフは、「ブリックウォール」の様相を見せる。同じことは、サンプリングされた表現から連続波形を再生するのに用いられる再構成フィルタにもあてはまる。
この方法論によれば、サンプリングのプロセス及び後に続く再構成は、fmaxより上の周波数を除去し、fmaxよりも非常に低い周波数にはほとんど又は全く影響を与えない時間独立リニアフィルタリングプロセスと全く等価である。したがって、192kHzにおけるサンプリングが96kHzにおけるサンプリングよりも音がよく聴こえ得るのは、理解しがたいことであるが、これは、唯一の差異が、約40kHzより上の周波数が存在しているか、存在していないかであり、これは、従来からの人間の可聴範囲20Hzから20kHzよりも2倍高いからである。
この矛盾を部分的に説明しようと試みる2つの論文には、Dunn J、「Anti-alias and anti-image filtering: The benefits of 96kHz サンプリングレート formats for those who cannot hear above 20kHz」、予稿4734頁、第104回AES大会(1998年)、及びhttp://www.cirlinca.com/include/aes97ny.pdfから入手可能なStory M、「A Suggested Explanation For (Some Of) The Audible Differences Between High Sample Rate And Conventional Sample Rate Audio Material」がある。
両論文は、調和は、フィルタの時間領域応答を観察することにあるとする。Dunnは、パスバンドリプルは、プリ及びポストエコーのような効果を有し、一方で、Storyは、どのようにフィルタが時間軸でインパルスのエネルギーを拡散するかに着目する。両著者は、異なる属性に注目しているが、両著者にとって、サンプリングレートが増せば、問題は減る。これは、もし平坦な応答がナイキスト周波数の近傍ではなく、20kHzまでしか維持されないなら、特にあてはまり、よってナイキスト周波数においてエイリアシングの完全な阻止が要求される前の遷移帯域を増すことになる。
Storyのアプローチは、Craven, P.G.、「アンチエイリアス Filters and System Transient 応答 at High Sample Rates」に引き継がれている。ここでCravenは、仮に96kHzシステムにおける間引き及び補間システムが、インパルスエネルギーの広範な拡散という音響的欠点を作ってしまう「ブリックウォール」応答を有するとしても、96kHzのレートで動作する「アポダイジング」フィルタは、実効的な遷移帯域を広げることによって、インパルスエネルギーの拡散を狭めることができる。図1は、96kHzにダウンサンプリングする例示的なブリックウォールフィルタの周波数応答(実線)と、加えてアポダイジングフィルタの応答(破線)を示す。フィルタの対応するインパルス応答は、図2A及び2Bに示され、これらは、アポダイジングフィルタの適用によって、図2Aにおけるブリックウォールフィルタの高度に拡散的な時間応答が、図2Bのコンパクトな時間応答へといかに短縮されるかを示している。
しかしアポダイジングでもってしても、96kHzよりも高いレートにおけるサンプリングは、Storyが報告するのと同じ語、すなわち「散らかった感じがより少ない」、「より空気感がある」、「より良いハイファイの詳細さ」、及び特に「より良い空間的解像度」で記述される聴感上の改善をもたらし得ることは、こんにちでも依然として正しい。当然の帰結として、現代の技術水準では、96kHzのような凡庸なサンプリングレートを用いるときは、欠落を何が起こしているかを特定することにおいて有用な発展があるとはいえ、これら音響的属性の何かが失われてしまうことになる。
したがって、最高品質の再生のためには、非常に高いサンプリングレートの使用が要求され、結果として、ファイルサイズ及び帯域幅条件に影響する。そのため、フォーマットからの厄介な要求か、品質が損なわれたという現実かのいずれかのために、多くの人々に対して高解像度に興味を持たせる見込みは暗いようである。したがって、より高いサンプリングレートに関連する感覚上の利点を有する高品質オーディオを、中程度のサンプリングレートで伝達する代替の方法論の必要がある。
本発明の第1局面によれば、オーディオキャプチャの音声を伝達するための、エンコーダ及びデコーダシステムを備えるシステムであって、前記エンコーダは、前記オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成され、前記デコーダは、前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成され、
前記エンコーダは、前記伝送サンプリングレートの倍数である第1サンプリングレートにおける前記オーディオキャプチャを表す前記信号を受け取り、前記信号をダウンサンプリングすることによって前記デジタルオーディオ信号を出力するよう構成されるダウンサンプラを備え、
前記エンコーダ及び前記デコーダを組み合わせたインパルス応答は、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける5サンプル周期を超えないことを特徴とする、システムが提供される。
本発明の第1局面の代替の特徴は、前記エンコーダ及び前記デコーダを組み合わせたインパルス応答は、その累積絶対応答が最終値の1%から50%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける2サンプル周期を超えないことである。
結果としてできあがるシステムは、システムの特定された組み合わされたインパルス応答に関連付けられるアンチエイリアシング阻止が緩和されているにもかかわらず、音質を劣化させることなく、オーディオを低減されたサンプリングレートで伝送することを可能にする。さらにエンコーダ及びデコーダの個別の応答は、合成インパルス応答がコンパクトなシステム応答についての特定の水準を満足する限り、さまざまな適切な設計に適合し得る。このように本発明は、高サンプリングレートに関連する聴感上の利点を維持しつつ、オーディオキャプチャの配信のためのサンプリングレートをどのように低下するかという課題を解決し、これを従来の考えとは逆のやり方で行う。
いくつかの知見によって本発明者は、この解法に到達し、これは部分的には、人間の耳の観測された特性に基づくものであって、その応用が耳(神経処理も含む)は線形で、時間不変であると暗黙に仮定する、従来の通信理論だけに基づくものではない。これには、人間の耳は20kHz未満の周波数に敏感であるが、20kHzの帯域が示唆するよりも時間的に精密なインパルスにも敏感であるという知見も含まれる。
帯域制限されたマテリアルに対する良いフィルタパフォーマンスのためのダウンサンプリングの条件は、インパルス的な音に対する良いパフォーマンスのための条件と、一般には相反する。古典的に理想的なブリックウォールフィルタは、インパルスのエネルギーを非常に広いタイムスパンで拡散するので、両耳時間差及び空間特性のような正確な特性を決定するのが難しくなる。
しかし本発明者は、192kHz以上のサンプリングレートで動作させることによって観測された有益な音響特性は、少なくとも部分的には、より高い周波数信号チェーンにおけるダウンサンプリングフィルタ及びアップサンプリングフィルタのよりコンパクトなインパルス応答に起因する。本発明者は、より低いサンプリングレートへのダウンサンプリング及びより低いサンプリングレートからのアップサンプリングのための同様にコンパクトなインパルス応答を用いることによって、96kHz以下のようなより低いサンプリングレートを用いつつも、これらの音響特性を維持できることをさらに見出した。
実際、本発明者は、より高いサンプリングレートにおいて既存の機器が用いるものよりも、よりコンパクトなインパルス応答を用いることによって、サンプリングレートがより低くなるにもかかわらず、これら音響特性が改善さえもされ得ることを見出した。
本発明者は、現実世界のオーディオは、上昇するノイズスペクトラム及び下降する信号スペクトラムを有し、よって、特にリサンプリングされるべき実際のオーディオの分析によってエイリアス要件が決定されるなら、従来の知識が要求するよりもずっと少ないエイリアス阻止しか要求されないことをさらに見出した。
そのような非常にコンパクトなインパルス応答は、高品質オーディオのためにオーディオ産業界が信じているよりも少ないエイリアス阻止を呈するが、本発明者は、コンパクトなインパルス応答の音響的利点の方が、要求されるレベルへの減少されたエイリアス阻止に起因する軽い欠点よりもはるかに勝ることを本発明者は見出した。
最後に、本発明者は、デシメーション及び補間の両方を組み込んだ信号チェーンが、両方のフィルタを個別にではなく、ペアとして設計することによって改良され得ることを見出した。
本発明を開発するにあたり本発明者は、フィルタがコンパクトであり、過剰なポストリンギング、及び特に過剰なプリリンギングがないことが重要であることに気付いた。これは直感的な概念としては理屈が通るが、聴感上大きい期間の基準を確立することによって、フィルタ期間が比較できるようにすることが有用である。理想的には、この尺度は、延長された応答の聴感上の結果に対応するが、インパルス検出について既存の実験データからそのような尺度をどのように導き出すかは明らかではないかもしれない。
フィルタのサポートは、その期間の自然の尺度であるが、(1-0.01z-1)-1のような緩やかなIIRフィルタを考慮することによってわかるように、現在の目的のためには満足のいくものではない。このフィルタは、ほとんど全くインパルスを分散しないが、それでも無限のサポートを有する。むしろ、インパルス応答の大部分が時間軸でどの程度分散するかを見るために基準が必要とされる。
したがって、システムのインパルス応答の絶対的な大きさを、時間について積分することによって、累積応答を生成するような基準が提案される。この積分は、低いレベルであっても、大きく延長されたリンギングにペナルティを課すためになされる。経過時間は、累積応答が、低い第1閾値(例えば1%)から高い第2閾値(例えば95%)へ上昇する期間で測定され、ここで閾値は、図14で示されるように、累積応答の最終値のパーセンテージとして表現される。しかし、累積応答を特徴づけるときには、他の閾値が用いられてもよく、その場合は、異なる基準を反映させるために、サンプル周期(sample periods)について異なる持続期間(duration)が特定され得る。
システムへの入力がサンプリングされる場合、インパルス応答は連続ではない。しかし我々は、いつ累積率が閾値を超えるかの決定が、入力サンプル周期に量子化されるのを良しとしないので、絶対インパルス応答値は、サンプル周期の持続期間の間は一定に保持される。これは、サンプリングの瞬間の間において、累積率を線形に補間することと等価である。
図14は、本発明によるフィルタに対するこの基準の適用を示し、図5Bを参照して後述される。後述される本発明による他のフィルタも同様に、この基準に従う。入力サンプリングレートは、伝送レートの2倍なので、インパルス応答は、伝送サンプル周期の半分の間、保持される。累積率は、インパルス応答の絶対値を積分するので、t=0におけるその最終値の0%から、t=4.5(フィルタは9タップのFIR)におけるその最終値の100%まで変化する。95%のレベルは、累積率のグラフで、伝送レートサンプル点のt=2.69において交差する。同様に、1%のレベルは、グラフでサンプル点のt=0.03において交差するが、左下の隅においてこの比率では目に見えないので、図では示されていない。その結果、この基準では、このフィルタは、2.69-0.03=2.66個分の伝送レートサンプル点の持続期間を有し、これによって本発明の条件を満足する。
リスニング試験によって、より短いインパルス応答は、ほとんど常により良好であることが判明し、ほとんどの場合において、5伝送レートサンプル周期を超えて延長する、この定義による大きな応答持続期間を有しないフィルタを設計することが可能であることが判明した。しかし全ての他の点が同じであれば、より短い方がより良好であり、持続期間が4伝送レートサンプル点未満であることが好ましく、3未満であることがさらに好ましい。
時間的持続期間のこの定義は、基準を満足するシステムのための具体的なフィルタ設計間で比較するための、合成インパルス応答の意味のある基準を提供する。加えて、インパルス応答の時間的持続期間についての同じ定義は、エンコーダ又はデコーダ又は個別フィルタのような、システム内の要素の応答にも適用され得て、それにより直接的な比較と、あるものが他のものよりもコンパクトであるかについての決定とを可能にする。
時間的持続期間の上記定義における閾値は、非対称であることによって、フィルタのプリ応答からポスト応答のより大きい可聴性を反映することが重要であると考えられる。さらなる研究をすれば、サンプル長についての持続期間に対し対応する変更を持たせて可聴の影響によりよくマッチした他の具体的な閾値レベルがわかるかもしれない。
例えば、最初に素早く立ち上がる累積率についての測定に集中することが理屈に合うかもしれない。このことは、第1閾値は1%でも、第2閾値が50%であれば可能かもしれない。図14では、50%レベルは、累積率グラフとt=0.99において交差するので、このフィルタの持続期間は、この代替の測定によれば0.99-0.03=0.96である。この代替の測定では明らかに持続期間は、より短くなるので、この場合、システムインパルス応答の持続期間は、好ましくは2伝送レートサンプル点未満であり、より好ましくは1.5伝送レートサンプル点未満である。
時間不変線形フィルタ又はシステムを考慮するとき、インパルス応答は、十分に理解されている特性である。しかしデシメーションを含むシステムについては、インパルスに対するこの応答は、デシメーションされた処理のサンプル点に対してインパルスが与えられるときとは異なるかもしれない。したがって、そのようなシステムのインパルス応答を参照するときは、我々は、元のインパルスの全てのそのような提示の瞬間にわたって平均化された応答を意味する。
好ましくは、ダウンサンプラは、第1サンプリングレートで特定されるデシメーションフィルタを備え、ここでこのデシメーションフィルタのエイリアス阻止は、デシメーションで範囲0〜7kHzに折り返される周波数において少なくとも32dBである。
範囲0〜7kHzは、耳が最も敏感な範囲である。要求される減衰の量は、そのナイキスト周波数の近傍におけるエンコードされるべき信号のスペクトラムに従って大きく変わり、多くの信号は、32dBより大きい減衰を要求するかもしれない。
デシメーションフィルタと同じエイリアス阻止と、累積絶対応答が最終値の1%から95%まで上昇するのにかかる期間が、伝送サンプリングレートにおける5サンプル周期を超えない応答とを有する第2フィルタがあるのがさらに好ましい。持続期間は、4サンプル周期を超えないことが好ましく、3サンプル周期を超えないことがより好ましい。
このことは、所望の音響パフォーマンスを持つ第2フィルタを設計することが好ましいからだが、デシメーションのために、同じエイリアス阻止を持つが、レガシー機器を用いているリスナーの便宜のために、追加でパスバンド平坦化を組み込んでいる異なるフィルタを用いるのが好ましい。よって実際のデシメーションフィルタは、より長い持続期間を有するかもしれないが、マッチされたデコーダは、パスバンド平坦化をもとに戻し、それによってもともと設計された第2フィルタの音響特性へのアクセスを可能にする。
フィルタ長の代替の測定では、第2フィルタは、その累積絶対応答が最終値の1%から50%まで上昇するのにかかる期間が、伝送サンプリングレートにおける2サンプル周期を超えない持続期間を有する応答によって特徴づけられる。好ましくは、持続期間は、1.5サンプル周期を超えない。
ある実施形態においては、エンコーダは、極を有する無限インパルス応答(IIR)フィルタを備え、デコーダは、z平面の位置が前記極と一致する零点を有することによって、極の効果が再構成された信号において相殺されるフィルタを備える。
他の実施形態においては、デコーダは、極を有する無限インパルス応答(IIR)フィルタを備え、エンコーダは、z平面の位置が前記極と一致する零点を有することによって、極の効果が再構成された信号において相殺されるフィルタを備える。
好ましくは、デコーダは、伝送サンプリングレートに対応するナイキスト周波数の周辺の領域で上昇する応答を有するフィルタを備え、エンコーダは、前記領域において下降する応答を有するフィルタを備えることによって、ナイキスト周波数より上の周波数の、ナイキスト周波数より下の周波数へのエンコーダにおける下側へのエイリアシングを低減するが、これは全システムの周波数応答又はインパルス応答を悪化させることはない。この特徴は、元の信号が急に立ち上がるノイズスペクトラムを有する場合に特に有用である。
好ましい実施形態において、前記伝送サンプリングレートは、88.2kHz及び96kHzのうちの1つであり、前記第1サンプリングレートは、176.4kHz、192kHz、352.8kHz、及び384kHzのうちの1つであり、これらは、本発明が聴感上利益をもたらすとわかった標準化されたサンプリングレートである。
本発明の第2局面によれば、伝送サンプリングレートにおける伝送のためのデジタルオーディオ信号を、キャプチャされたオーディオの音声を伝達するのに要求される前記サンプリングレートを低減することによって出力する方法であって、前記伝送サンプリングレートの倍数である第1サンプリングレートを有する前記キャプチャされたオーディオの表現を、前記第1サンプリングレートで特定されるデシメーションフィルタを用いてフィルタリングするステップ、及び前記フィルタリングされた表現をデシメーションすることによって、前記デジタルオーディオ信号を出力するステップであって、前記デシメーションフィルタのインパルス応答は、デシメーションで範囲0〜7kHzにエイリアシングされる周波数において少なくとも32dBであるエイリアス阻止を有する、前記デジタルオーディオ信号を出力するステップを含み、前記デシメーションフィルタと同じ前記エイリアス阻止と、累積絶対応答が最終値の1%から95%まで上昇するのにかかる期間が、前記伝送サンプリングレートにおける5サンプル周期を超えない応答とを有する第2フィルタがある方法が提供される。
再び、第2フィルタは、実際のデシメーションフィルタが、マッチされていないレガシー機器を用いるリスナーの便宜のためのパスバンド平坦化の組み込みに起因して延ばされた持続期間を有することを可能にするよう用いられ得る。代替として、もしレガシーリスナーのためのパスバンド平坦化が実行されないなら、デシメーションフィルタは、第2フィルタと同じになる。
よって本発明は、不要なエイリアス生成物、及び第1サンプリングレートにおける表現のナイキスト周波数付近の任意のリンギングの適切な阻止を提供し、システムのインパルス応答を必要以上には延長しない。
ある実施形態において、前記方法は、キャプチャされたオーディオのスペクトラムを分析するステップ、及び前記分析されたスペクトラムに応じてデシメーションフィルタを選択するステップをさらに備える。前記方法はさらに、デコーダによって使われるよう、デシメーションフィルタの選択に関連する情報を出力するステップをさらに備える。ある実施形態においては、前記方法は、キャプチャされたオーディオのノイズフロアを分析するステップ、及び分析されたノイズフロアに応じて前記デシメーションフィルタを選択するステップをさらに備える。このようにして、デシメーションフィルタ及びデコーダ内の対応する再構成フィルタの両方は、伝達されるべき信号のノイズスペクトラム又は他の特性に対して最適になるようマッチされる。
好ましい実施形態において、前記伝送サンプリングレートは、88.2kHz及び96kHzのうちの1つであり、前記第1サンプリングレートは、176.4kHz、192kHz、352.8kHz、及び384kHzのうちの1つであり、これらは、本発明が聴感上利益をもたらすとわかった標準化されたサンプリングレートである。
本発明は、伝送サンプリングレートの6サンプル周期より大きくない広がりを有する連続時間領域で動作するが、ある実施形態においては、この連続時間領域の広がりは、優位性があることに、伝送サンプリングレートの5周期、4周期又は3周期よりも大きくはない。ある信号については、これらのより短いインパルス応答は、6周期続くインパルス応答を持つ実施形態よりも聴感上さらに有益であることがわかった。
本発明の第3局面によれば、データ担体は、前記局面の方法を実行することによって出力されたデジタルオーディオ信号を保持する。
本発明の第4局面によれば、オーディオストリームのためのエンコーダは、第2局面の方法を用いてデジタルオーディオ信号を出力するよう構成される。
好ましい実施形態において、前記エンコーダは、前記伝送ナイキスト周波数について対称な応答を有する平坦化フィルタを備える。好ましくは、前記平坦化フィルタは、極を有する。
本発明の第5局面によれば、オーディオキャプチャの音声を伝達するためのシステムであって、前記オーディオキャプチャを表す信号を受け取り、伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成されたエンコーダであって、前記エンコーダは、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる期間を有するインパルス応答を特徴とする、エンコーダ、及び前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成されたデコーダであって、前記デコーダは、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる期間を有するインパルス応答を特徴とする、デコーダ、を備え、前記エンコーダ及び前記デコーダの組み合わされたインパルス応答は、前記エンコーダ単体のインパルス応答の特徴である期間及び前記デコーダ単体のインパルス応答の特徴である期間よりも短い、累積絶対応答が1%から95%まで上昇するのにかかる期間を有する全システムインパルス応答をつくるシステムが提供される。
この局面は、エンコードされているマテリアルの特別な特性が、キャプチャされたオーディオにおけるノイズレベルが高いスペクトラム領域に対応するために、エンコーダの周波数応答において追加の極又は零点を要求するときに有用であり得る。デコーダ応答中の対応する零点又は極は、特別な基準(special measures)が、完全なシステムのパスバンドに影響を与えず、また、完全なシステムのインパルス応答がこの特別な基準によって変化しないようにする。しかし個別のエンコーダ及びデコーダの応答は、この基準によって長くなり、両方とも組み合わせられたシステムの応答よりも長くなり得る。
好ましくは、デコーダは、その位置が前記エンコーダの前記応答における極の位置と一致する、z平面の零点を有するフィルタを備える。
好ましくは、前記デコーダは、前記エンコーダから受け取られた情報に依存して選択されるフィルタを備える。
ある実施形態において、エンコーダ及びデコーダを組み合わせたインパルス応答が、最大ピークを有し、伝送サンプリングレートの6サンプル周期より大きくない広がりを有する連続時間領域によって特徴づけられ、ここでこの6サンプル周期の外では平均されたインパルス応答の絶対値がその最大ピークの10%を超えないことが好ましい。
本発明の第6局面によれば、オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成されるエンコーダであって、前記エンコーダは、零点周波数へエイリアシングされる各周波数において二重零点(double zero)を有し、前記伝送ナイキスト周波数においてマイナス13デシベル/オクターブより大きい勾配を有する周波数応答のフィルタの応答の非対称成分に等しい応答の非対称成分を有するダウンサンプリングフィルタを備えるエンコーダが提供される。
前記エンコーダは、前記伝送ナイキスト周波数について対称な応答を有する平坦化フィルタを備えることが好ましい。好ましくは、前記平坦化フィルタは、極を有する。さらに好ましくは、前記伝送周波数は44.1kHzであり、前記エンコーダの周波数応答ドループは、20kHzにおいて1dBを超えない。
本発明の第7局面によれば、オーディオキャプチャの音声を伝達するための、エンコーダ及びデコーダシステムを備えるシステムであって、前記エンコーダは、前記オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成され、前記デコーダは、前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成され、前記エンコーダは、前記伝送サンプリングレートの倍数である第1サンプリングレートにおける前記オーディオキャプチャを表す前記信号を受け取り、前記信号をダウンサンプリングすることによって前記デジタルオーディオ信号を出力するよう構成されるダウンサンプラを備え、前記エンコーダは、極を有する無限インパルス応答(IIR)フィルタを備え、前記デコーダは、z平面の位置が前記極と一致する零点を有することによって、前記極の効果が前記再構成された信号において相殺されるフィルタを備えるシステムが提供される。
好ましくは、エンコーダ及びデコーダを組み合わせたインパルス応答が、最大ピークを有し、伝送サンプリングレートの6サンプル周期より大きくない広がりを有する連続時間領域によって特徴づけられ、ここでこの6サンプル周期の外では平均されたインパルス応答の絶対値がその最大ピークの10%を超えない。
本発明の第8局面によれば、オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成されるエンコーダであって、前記エンコーダは、前記伝送サンプリングレートの倍数である第1サンプリングレートにおける前記オーディオキャプチャを表す前記信号を受け取り、前記信号をダウンサンプリングすることによって前記デジタルオーディオ信号を出力するよう構成されるダウンサンプラを備え、前記エンコーダは、前記キャプチャされたオーディオのスペクトラムを分析し、前記分析されたスペクトラムに応じて前記ダウンサンプリングフィルタを選択する
エンコーダが提供される。
好ましくは、前記選択されたダウンサンプリングフィルタは、もし前記分析されたスペクトラムが伝送ナイキスト周波数において急峻に立ち上がるなら、前記伝送ナイキスト周波数においてより急な減衰を有する。
前記エンコーダは、前記選択されたダウンサンプリングフィルタを特定する情報をデコーダにメタデータとして伝送するよう構成されることが好ましい。
好ましい実施形態において、前記エンコーダは、前記伝送ナイキスト周波数について対称な応答を有する平坦化フィルタを備える。好ましくは、前記平坦化フィルタは、極を有する。
本発明の第9局面によれば、伝送サンプリングレートにおけるデジタルオーディオ信号を受け取り、出力オーディオ信号を出力するデコーダであって、前記デコーダは、前記伝送サンプリングレートに対応する前記ナイキスト周波数の周辺の周波数領域において周波数とともに増加する振幅応答を有するフィルタを備えるデコーダが提供される。
この特徴は、より高いサンプリングレートにおける表現が、ナイキスト周波数で強く上昇するスペクトラムを呈する場合、及び従来のオーディオ帯域0〜20kHzにわたって位相歪みを最小化することが要求される場合において、ナイキスト周波数に近い周波数についての信号対エイリアス比を最適化するために必要である。
好ましくは、前記フィルタは、前記伝送サンプリングレートに対応する前記ナイキスト周波数において、DCにおける応答に対して少なくとも+2dBの振幅応答を有する。一般に、立ち上がるデコーダ応答は、エンコーダが適切なエイリアス減衰を提供しつつも、オーディオ範囲で平坦な周波数応答を提供し、トータルシステムインパルス応答を長くはしないことを可能にする点で有利であり得るが、デコーダ応答は、最終的には下がらなければならず、それはふつうはナイキスト周波数においていくらか盛り上がる。
ある実施形態において、前記フィルタは、エンコーダから受け取られた情報に依存して選ばれる応答を有することが好ましい。これは、エンコーダが、ケースバイケースでフィルタリングを最適に選ぶことを可能にする。
当業者には理解されるように、再構成された信号の音響を最適化するための、特に、望まれないやり方でシステムのトータルインパルス応答を長くすることなく、デシメーションエイリアスを制御するための、さまざまな方法が開示されている。
有利には、フィルタは、ソースマテリアルの特性に応じて選択される。同様に、全零点、全極、及びポリフェーズのような異なるフィルタ実現例がそれぞれの場合について適切なものとして採用され得る。さらなる変形例及び装飾は、本開示に照らせば当業者には明らかになるだろう。
本発明の例は、以下の添付の図面を参照して詳細に説明される。
図1は、96kHzサンプリングで使うための既知の「ブリックウォール」アンチエイリアスフィルタ応答(実線)と、アポダイズされたフィルタ応答(点線)とを示す。 図2Aは、図1に示される周波数応答を有する線形位相フィルタに対応する既知のインパルス応答を示す。 図2Bは、図1に示される周波数応答を有する線形位相フィルタに対応する既知のインパルス応答を示す。 図3は、低減されたサンプリングレートにおいてオーディオ信号を伝送し、後で連続時間に再構成するシステムを示す。 図4は、DCにおいてユニティゲインに正規化された、(1/2, 1, 1/2)再構成フィルタの応答を示す。 図5Aは、非平坦化されたダウンサンプリングフィルタの周波数応答を示す。 図5Bは、平坦化を組み込んだダウンサンプリングフィルタの周波数応答を示す。 図6は、連続時間へのアップサンプリング、及び図5Aのパスバンドドループのための3次補正を含む再構成フィルタの応答を示す。 図7は、図4及び図5Bのフィルタが組み合わされ、さらに連続時間へのアップサンプリングも持つときの、トータルシステムインパルス応答を示す。 図8は、強く立ち上がる超音波応答を有する2つの商業レコーディングのスペクトラムを示す。 図9は、図5Bのダウンサンプリングフィルタとともに使うための48kHzについて対称な平坦化フィルタの応答を示す。 図10は、図5Aのダウンサンプリングフィルタの応答(下のプロット)、及び図9の対称平坦器を用いた平坦化の後の応答(上のプロット)を示す。 図11は、線形Bスプラインサンプリングカーネルを示す。 図12Aは、元の88.2kHzのストリームの偶数サンプル点とアラインされた、44.1kHzで赤外エンコードされたサンプル点からの88.2kHzにおけるインパルス再構成を示す。 図12Bは、元の88.2kHzのストリームの奇数サンプル点とアラインされた、44.1kHzで赤外エンコードされたサンプル点からの88.2kHzにおけるインパルス再構成を示す。 図13Aは、60kHz付近で強い減衰を提供するために零点を有するダウンサンプリングフィルタの応答を示す。 図13Bは、図13Aのフィルタ中の零点の全応答に対する効果を打ち消すために極を有するアップサンプリングフィルタの応答を示す。 図13Cは、図13A、図13B及び想定される外部ドループの応答を組み合わせたエンドツーエンドの応答を示す。 図14は、サンプル周期単位で時間についてプロットされた、図5Aに示されるフィルタの正規化された累積インパルス応答を示す。
本発明は、用いられるシステムによっていくつかの異なるやり方で実現され得る。下記は、図を参照していくつかの例示的実現例を記述する。
公理
多くの成人のリスナーは、20kHzより上の単独の正弦波を聴き取ることができず、このことは、20kHzより上の信号の周波数成分も重要ではないと、従来、しばしば想定されてきた。最近の経験によれば、この想定は、線形システム理論とのアナロジーによればもっともらしいが、正確ではない。
人間の聴覚の現在の理解は非常に不完全である。したがって進歩をするために、我々は、部分的又は間接的にしか証明されてきていない仮定に依拠してきた。よって本発明は、以下の仮定に基づいて説明される。
・耳は線形システムのようには振る舞わない。
・周波数領域で音色が分析されるのと共に、耳は、時間領域でも過渡状態を分析する。これは、超音波領域では主要なメカニズムであり得る。
・40kHz〜100kHzの高超音波の範囲であっても、アンチエイリアス及び再構成のために用いられるフィルタのリンギングは、望ましくない。
・48kHzより上の周波数の、48kHzより下の周波数へのエイリアシングは、エイリアシングされた産物が従来の可聴範囲0〜20kHzの中に入らない限り、音質にとって壊滅的ではない。
・プリリングは、ポストリングよりもふつうはより問題となるが、いずれも悪い。
・もしシステム全体のインパルス応答の時間的な程度を最小限にし得るなら、それがベストと思われる。
これらの点の最後のものについて、「システム全体」とは、アナログ/デジタル変換器及びデジタル/アナログ変換器の間のデジタルチェーン全体と共に、これらの変換器をも含むように意図される。理想的には、トランスジューサー応答も含み得るが、これらは本書類の範囲外になると考えられる。
サンプリング及びエイリアシング
連続時間信号は、サンプリングレートが無限大に向かうときのサンプリングされた信号の限定的な場合と見ることができる。この時点で、我々は、元の信号がアナログであり、よって時間的に連続であるか、又は、それがデジタルであり、よって既にサンプリングされているかには関心がない。我々がリサンプリングというときは、それは、元のサンプル点によって表現される概念的に連続時間の信号をサンプリングすることを意味する。
サンプリング又はリサンプリングの周波数領域記述は、元の周波数成分がリサンプリングされた信号中に存在するが、振幅変調で発生する「側波帯」と類似の、複数のイメージを伴うことを示す。よって元の45kHzの音は、もし96kHzでリサンプリングされるなら、51kHzでイメージを発生するが、この51kHzは、96kHzによる変調の下側波帯である。全ての周波数が、ナイキスト周波数である48kHzについて「折り返し」されると考えればより直感的かもしれない。つまり、51kHzは、45kHzの鏡像であり、同様に、元の51kHzの音は、リサンプリングされた信号中では45kHzに低く折り返しされる。
もし伝送チャネルが、異なるレートでのいくつかのリサンプリングを伴うなら、元のスペクトルのイメージは累積し、オーディオトーンが1つのリサンプリングによって上に折り返され、後続のリサンプリングによって下に折り返され、可聴範囲内ではあるが、元の周波数とは異なる周波数に行き着く可能性が大きい。「正しい」通信実務が、アンチエイリアス及び再構成フィルタがそれぞれのステージで使用され、全てのイメージが抑圧されなければならないことを教示するのは、これを防ぐためである。もしこれがなされるなら、リサンプリングは、アーティファクトを積み上げることなく、恣意的にカスケードされ得て、制約としては、周波数範囲がチェーン中で最も低いサンプリングレートによって扱われ得るものに制限されるということだけになる。
しかし、我々は、通信工学で正しいと考えられるフィルタは、多数配信のために現在実用的であるサンプリングレートにおいては少なくとも、聴感上満足がいくものではないという見方をとっている。我々はエイリアシングが発生し得ることは受け入れて、エイリアシングと、フィルタリングによって引き起こされるシステムのインパルス応答の拡大に起因する過渡現象の「タイムスミア」とのバランスをとることを提案している。
よって従来の実務とは異なり、エイリアシングは、完全には除去されずに、信号の各リサンプリングにおいて積み重なる。したがって恣意的なレートへのマルチリサンプリングは、ペナルティなしでは実行されることはなく、もし信号が、配信に用いられるレートの整数倍であるサンプリングレートで常に表現されるならそれがベストである。例えば、96kHzにおける配信の後の192kHzにおけるアナログ/デジタル変換は問題ないが、変換器の広帯域雑音特性によっては、384kHzにおける変換の方がより良いかもしれない。
配信の後に、消費者の再生装置は、長いフィルタ応答を発生しないように設計される必要があり、実際、トータルシステム応答の確実性を与えるために、エンコーディング及びデコーディング仕様は、好ましくは共に設計されるべきである。
96kHz配信のための192kHzからのダウンサンプリング
既に192kHzでデジタイズされている信号を取り込み、信号を伝送のために96kHzにダウンサンプリングし、その後、受信に際して192kHzにアップサンプリングし直すことの問題を考察する。ここで記述される原理は、伝送と共に記憶にも当てはまり、「伝送」という語は、記憶及び伝送の両方を包含することが理解されよう。
図3に示されるシステムを参照して、192kHzのようなサンプリングレートにおける入力信号1は、ダウンサンプリングフィルタ2に渡され、それからデシメータ3に渡され、96kHzのようなより低いサンプリングレート信号4をつくる。伝送又は記憶装置5を通った後、96kHz信号6は、アップサンプリングされ(7)、フィルタリングされ(8)、192kHzのようなサンプリングレートにおける部分的に再構成された信号9を供給する。
この文書の主な焦点は、部分的に再構成された信号9をつくる方法にあるが、連続時間アナログ信号11を供給するためには、さらなる再構成10が必要とされることにも注意されたい。本発明の目的は、入力信号1をつくるようデジタイズされたアナログ信号の音になるべく近い信号11の音をつくることである。このことは、信号9が工学的な意味において信号1になるべく近くなければならないことを必ずしも示唆しない。また、さらなる再構成10は、周波数応答ドループ(droop)を有していてもよく、これはもし所望であれば、フィルタ2及び8の設計において考慮されてもよい。
図3は、フィルタ2及びダウンサンプラ3を別個の要素として示しているが、例えばポリフェーズの実現例のように、それらを統合した方がより効率的な場合もある。同様に、アップサンプラ7及びフィルタ8は、別個に識別し得るような機能ユニットとして存在しなくてもよい。
ダウンサンプリングは、デシメーションを用い、ここでは、192kHzの信号からサンプル点を交互に廃棄し、一方、アップサンプリングはパディングを用い、ここでは、96kHzのサンプル点の連続するペアのそれぞれの間にゼロサンプル値を挿入し、低い周波数に対して同じ応答を維持するために2で乗ずることもする。ダウンサンプリングでは、48kHzの「フォールドオーバー」周波数より上は、フォールドオーバー周波数より下の対応するイメージに映される。アップサンプリングでは、フォールドオーバー周波数より下の周波数は、フォールドオーバー周波数より上の対応するイメージに映される。よって、アップサンプリング及びダウンサンプリングは、上側にエイリアシングされた生成物及び下側にエイリアシングされた生成物をつくるが、これらは、デシメーションの前のアップサンプリングフィルタ及びパディングの後のダウンサンプリングフィルタによって制御され得る。アップサンプリング及びダウンサンプリングフィルタは、s are specified at the original 元のサンプリング周波数である192kHzにおいて特定される。
もしエイリアシングされた生成物が無視されるなら、トータル応答は、アップサンプリング及びダウンサンプリングフィルタの応答の組み合わせである。時間領域においては、この組み合わせは、畳み込みである。
トータル応答が、最小長の有限インパルス応答(FIR)フィルタのそれであるように、アップサンプリング及びダウンサンプリングフィルタを設計することによって、良好な結果を得ることができることを我々は見出した。z変換領域において、不要な応答を抑圧するために、ゼロがこれらのフィルタに導入される。具体的には、96kHzのナイキスト周波数の近傍の信号を抑圧するために、それぞれのフィルタが1つ以上の伝達関数ゼロをz=−1の近傍に有することが多い。フィルタリングなしのダウンサンプリングでは、そのような信号は、耳が最も敏感である10kHzよりも下の周波数を含むオーディオ周波数へエイリアシングする。逆に、もしフィルタリングなしでアップサンプリングがパディングによって行われるなら、大きな低い周波数信号の内容が、大きなイメージエネルギーを96kHz近傍につくりだし、これは聴感上の結果に関わらず、後続の電子装置のスルーレート能力に対して許容できない要求を課すことになり、場合によってはツイータスピーカを焼損することにもなりかねない。
そのゼロ点がナイキストに近いFIRフィルタは、それら自身では、オーバーシュートやリンギングは生じない。インパルス応答は、単極であり、妥当な程度にコンパクトである。しかし192kHzにおいて実現される(1 + z−1)のファクタは、20kHzにおいて0.47dBの周波数応答ドループを発生する。これは、プロフェッショナルデジタルオーディオ装置においては、かろうじて許容できる程度に過ぎず、もし、例えば5つ以上のそのようなファクタを我々が必要とするなら、パスバンドドループ及び結果として生じる音のこもりは、確実に許容できないものになろう。したがって、すぐあとで説明するように、補正すなわち「平坦化」のフィルタが必要である。
再生のための96kHzからのアップサンプリング
連続時間信号への再構成は、「2×」のステージの連続を用いて実行されるのがふつうである。すなわち、サンプリングレートは、典型的には、それぞれのステージで2倍にされ、デジタルからアナログへの変換は、サンプリングレートが384kHz又はそれより高い周波数に到達してから実行される。我々は、最初の、最も重要なステージ、すなわち96kHzから192kHzへのアップサンプリングにまず集中する。
このアップサンプリングの中心にあるのは、192kHzのストリームをつくるために、概念的であれ、物理的であれ、96kHzのサンプル点のストリームにゼロパディングをする操作である。すなわち、我々は、そのサンプル点が96kHzの信号及びゼロから交互にサンプリングされる192kHzの信号を生成するのである。
ゼロパディングは、エイリアシングされた周波数と同じ振幅を有する、上側にエイリアシングされた生成物をつくる。このコンテキストでは、これら生成物は、全て48kHzより上であるので、それらは聴き取れないと想定する人がいるかもしれない。しかしこの信号は、低いオーディオ周波数における高い振幅を一般には有し、このことは、96kHzに近い周波数における高いレベルのエイリアシング生成物を示唆する。既に述べたように、これらエイリアシング生成物は、後続の電子装置に過剰なスルーレートの要求を課さないように、かつ、ツイータスピーカの焼損のリスクを犯さないように制御される必要がある。アップサンプリング又は再構成フィルタの目的は、この制御を提供することであり、96kHz近傍での強い減衰が主要な要件であることがわかろう。
96kHzから192kHzへの再構成のために我々が満足できると考える、最も簡単な再構成フィルタは、192kHzのレートにおいて実現されたタップ(1/2, 1, 1/2)を有する3-タップFIRフィルタである。このフィルタの正規化された応答は図4に示される。このフィルタは、z平面で2つのゼロ点を、ナイキスト周波数である96kHzに対応するz=−1において有する。これらのゼロ点は、96kHzの近傍での減衰をもたらすが、それで十分なこともあり、不十分であることもあるので、さらなるナイキスト近傍のゼロ点が要求されるかもしれない。この(1/2, 1, 1/2)フィルタは、20kHzにおいて0.95dBのドループを発生し、もし176.4kHzにおいて動作されるなら1.13dBのドループを発生するので、これらは補正される必要があろう。
パスバンド平坦化
本システムは、ダウンサンプラを含むので、従来の0〜20kHzのオーディオ範囲の上端に向かってドループしていく周波数応答を平坦化する補正は、元のサンプリングレート又はダウンサンプリングされたレートのいずれかにおいてなされ得るが、アップサンプリングされた出力において最も短いエンドツーエンドインパルス応答を得るためには、この平坦化は、192kHzのような最も高いサンプリングレートにおいて実行されるべきである。このことは、補正が実行される場所についての選択肢を依然として残す。すなわち以下の通りである。
a.エンコーダ(ダウンサンプラ)及びデコーダ(アップサンプラ)が、自分自身のドループについての補正をそれぞれ内蔵する。
b.エンコーダが、それ自身についての補正、及びデコーダについての補正を提供する。
c.デコーダが、それ自身についての補正、及びエンコーダについての補正を提供する。
d.エンコーダ及びデコーダの間に補正を任意のやり方で分散させる。
選択肢aは、結果として生じるダウンサンプリングされたストリームは、平坦な周波数応答を有することとなり、特別なデコーダなしで再生され得るので、実際には便利かもしれない。しかし、結果として生じるエンコーダ及びデコーダが結合された「エンドツーエンド」のインパルス応答は、単一の補正器がトータルドループのために設計されたときよりもふつうは長くなる。
選択肢b及びcは、同じエンドツーエンドのインパルス応答を提供し得るが、選択肢dも、もしトータル応答に対する単一の補正器が生成され、分解され、ファクタ群が分散されるなら、選択肢b及びcと同様である。しかし、エンドツーエンドの応答が同じかもしれないが、ダウンサンプリングの前にエンコーダ内に平坦化フィルタを置くことは、エンコーダにおける下側へのエイリアシングをふつうは増す。聴感試験によれば、平坦化フィルタをアップサンプリングの後のデコーダ内に置く方が、上側へのエイリアシングがそれによって強調されるにもかかわらず、よい結果になった。
補正フィルタの設計について、リニアフェーズドループの場合、リニアフェーズ補正フィルタは、z=1の近傍におけるべき級数として、ドループのz変換の逆数を展開することによって得られることが当業者ならわかるだろう。よって、このトータル応答は、べき級数展開の次数を調節することによって、任意の所望のオーダーに対して最大限平坦にされ得る。しかしこのコンテキストでは、プリ応答を防ぐために、最小位相補正フィルタが好まれる。この目的のために、ドループは、まずそれ自身の時間軸での逆転(time reverse)と畳み込みされることによって、対称フィルタをつくり、上述の手順が適用される。これは、オリジナルドループのために必要とされる、補正がデシベルの点で二倍の線形位相補正器になる。線形補正器は、zについての2次及び線形の多項式にそれから因数分解されるが、因数の半分は最小位相であり、半数は最大位相である。最小位相因数は、選択され、結合され、ユニティDCゲインに正規化されることによって、最終的な補正フィルタを提供する。この方法論は、Wilkinson(Wilkinson, R.H., “High-fidelity finite-impulse-response filters with optimal stopbands”. IEE Proc-G Vol. 120, no. 2, pp. 264-272: 1991 April)の成果物に基づいて構築された上述のCravenによる2004年の論文の3.6節に示されていた。
補正フィルタの効果は、パスバンドを平坦化することだけではなく、(b)の場合のエンコーダの、又は(c)の場合のデコーダの、又は潜在的には(d)の場合のナイキスト近傍の応答を増し、この増加は、所望のナイキスト近傍の減衰の仕様を達成するために、z=−1の近傍におけるさらなるゼロ点の導入をおそらくは要求する。これらさらなるゼロ点は、補正フィルタの強度が増すことを要求するだろう。よってナイキスト近傍で減衰するゼロ点及びパスバンド補正フィルタは、満足できる結果が得られるまで、共に調節される必要がある。
トータルシステム応答
ゼロがパディングされた96kHzの信号が与えられると、192kHzのレートで実現されるタップ(1/2, 1, 1/2)を有する3タップ再構成フィルタの出力は、192kHzのストリームであり、偶数のサンプル点のそれぞれは、その対応する96kHzのサンプル点と同じ値を有し、奇数のサンプル点のそれぞれは、その隣の偶数サンプル点2個の平均に等しい値を有する。ここでもし連続時間への多段再構成が、それぞれの段において同じように3タップ(1/2, 1, 1/2)再構成フィルタを用いるなら、結果は、連続する96kHzのサンプル点間での線形補間と等価になる。
周波数領域においては、このような多段再構成の応答は、sinc関数の平方である。すなわち、
(sinc(πf/96kHz))2
であり、ここでfは周波数であり、sinc(x) = sin(x)/xである。
パスバンドドループは、fの2次式によって概算され得て、すなわち
1 - π2(f/96kHz)2/3 ≒ 1−3.290(f/96kHz)2
となり、これは、もし96kHzからの再構成なら20kHzにおいて-1.34dBの応答を含意し、もし88.2kHzからの再構成なら20kHzにおいて-1.61dBの応答を含意する。
このように再構成され、連続時間信号のスルーレートは、線形補間に基づいて96kHzのサンプル点によって含意されるものよりは決して大きくはならない。にもかかわらず、それは、勾配の小さな不連続を有することになる。十分に小さな時間スケールで見れば、これは、電気的には可能ではなく、ましてや音響的にはなおさらである。アナログ処理を詳細に考慮することは我々の議論すべき範囲ではないが、どこでも正であるインパルス応答は、ディラックのデルタ関数ではない限り、なんらかの周波数応答ドループを有するに違いないことに注意されたい。我々にとっては、平坦な全体的応答をつくるためのアナログ「ピーキング」フィルタを要求しない方が好ましいが、それは、そのような最短の全体的インパルス応答は、全てのパスバンド補正が単一の点において適用される場合に得られるからである。したがって我々は、デジタルパスバンド平坦化が、アナログドループのためのある程度の余裕を持つことを好む。
にもかかわらず、補正されるドループが多いほど、アップサンプリングフィルタはコンパクトではなくなる。したがってここで示されるフィルタにおいて、我々は、192kHzのストリームから連続時間への想定された多段の再構成のためにsinc(・)2のドループを補償しており、後続のアナログ処理における、20kHzにおいて0.162dBになる小さいドループのためにはさらなるマージンを設けている。このマージンは、長方形形状及び長さ5μsの厳密に非負のインパルス応答を有するか、又は代替として、約3μsの標準偏差を持つガウス状応答を有するアナログシステムを考慮することになる。
図5Aは、これらの原理に従って設計された、ナイキスト近傍における72dBの減衰を有する6-タップダウンサンプリングフィルタの応答を示し、z変換応答は以下の通りである。
0.0633 + 0.2321z-1 + 0.3434z-2+ 0.2544z-3 + 0.0934z-4 + 0.0134z-5
もし(1/2 + z-1 + 1/2 z-2)の応答を有する前述の3タップアップサンプリングフィルタと対にされるなら、4タップ補正フィルタ
4.3132 - 5.3770z-1 + 2.4788z-2- 0.4151z-3
は、ダウンサンプリングフィルタ及び3タップアップサンプリングフィルタからの合計ドループを補正することによって、上述のようなアナログドループの効果を含み、20kHzにおいて0.1dB以内のフラットなエンドツーエンド応答を提供できるであろうことがわかる。もしこの補正フィルタが、ダウンサンプリングフィルタによって折り返しされるなら、組み合わされたエンコーディングフィルタは、以下のz変換
0.27289 + 0.66093/z + 0.39002/z2- 0.20014/z3 - 0.20992/z4 + 0.04329/z5 + 0.05411/z6 - 0.00563/z7 - 0.00555/z8
を有し、図5Bに示される応答を有し、この応答は、後続のアップサンプリング及び再構成からのドループをプリ補正するために、20kHzより上で上昇する。
代替として、この補正は、その応答が図4に示されるアップサンプリングフィルタ(1/2 + z-1 + 1/2 z-2)で折り返しされ得て、それにより図6に示される応答と、以下のz変換を有するデコーディングフィルタをつくることができる。
2.1566 - 0.5319z-1 + 0.7076z-2- 1.6566z-3 + 1.0319z-4 - 0.2076z-5
この場合において、図5Aの応答を有する6タップエンコーディングフィルタのドループを補正するために増大する応答を有するのはデコーダである。聴感試験によると、この9タップダウンサンプリングフィルタは、より長いフィルタに対して顕著な優位性を有することがわかり、我々は、一般に短いフィルタの方が好ましいと推定した。
しかし、より重要なことは、ダウンサンプラ、アップサンプラ、及び推定されたアナログ応答が結合されたときの全体的な応答である。図7は、上で提案されたダウンサンプラ、多段アップサンプラ、及び幅5μsの長方形インパルス応答を有するアナログシステムのインパルス応答を示す。スレッショルドが適用されない場合、応答の合計長さは、13サンプル点、つまり67.7μsであるが、-40dB、つまり最大値の1%のスレッショルドがあると、応答の絶対値は、長さ49.5μs、すなわち192kHzレートにおいて9.5サンプル点、96kHzの伝送サンプリングレートにおいては4.75サンプル点の領域においてだけスレッショルドを超える。同様に-20dB、つまり最大値の10%のスレッショルドでは、応答の絶対値は、長さ32.2μs、すなわち192kHzのレートで6.2サンプル点、つまり96kHzの伝送サンプリングレートにおいて3.1サンプル点の領域においてだけスレッショルドを超える。よって、このフィルタの時間的長さは、伝送サンプリングレートの4サンプル周期を超えないといって差し支えない。他の基準が厳しい場合は、インパルス応答は、ある程度長くなる必要があろうが、ほとんど全ての妥当な場合において、伝送サンプリングレートにおける6サンプル周期を超えない長さのインパルス応答を達成できる。
上述のダウンサンプリング及びアップサンプリングを組み込んだフィルタエンコーダ及びデコーダの組み合わせ、及び図7に示されるトータルシステム応答は、利用可能な192kHz録音に対して聴感上良好な結果をもたらすことがわかった。実際、デコードされた信号は、ダウンサンプリングなしの192kHzのストリームの従来の再生より音質が良いこともあったが、これは、192kHzストリームに既に存在する96kHz近傍の任意のリンギングがダウンサンプリングフィルタによって減衰することによるものだといえよう。
ノイズスペクトラム分析に基づくエイリアシングトレーディング
多くの商業的なソースマテリアルは、アナログ/デジタル変換器及びノイズシェーパーの振る舞いによる、超音波領域において増大するノイズフロアを有する。例えば、図8の上側のグラフに示される、Dave Brubeck Quartetの「Take 5」の商業的に利用可能な176.4kHzの録音のスペクトラムは、33kHz及び55kHzの間で42dB増加するノイズフロアを呈し、これらの周波数は、ダウンサンプリングされるときに44.1kHzの折り返し周波数から等距離にある。もし間引きの前にフィルタリングがなされないなら、結果として生じる88.2kHzのストリームは、55kHzからエイリアシングされたほぼ全てのノイズを含む33kHzにおけるノイズを有することになり、それによって録音の176.4kHzのバージョンにおけるよりも42dB程度、スペクトル密度が高くなるだろう。
図5Bのダウンサンプリングフィルタは、もし192kHzではなく176.4kHzで動作されると、+2.3dB及び-6.7dBのゲインをそれぞれ33kHz及び55kHzにおいて与えることになり、その差は9dBになるだろう。このフィルタで「Take 5」をダウンサンプリングすると、55kHzから折り返された成分は、元の33kHzの成分を33dBだけ大きく有することになる。図5Aの代替のダウンサンプリングフィルタは、これら2つの周波数間で16.8dBの差異を与えるので、折り返された成分は、元の成分よりも25dB高くなる。これはいくらか例外的な場合なので、さらにより大きい差異を有するフィルタ(後述)の方が好ましいかもしれない。とはいえ、図5Aのフィルタは、多くの場合において満足できるものであり、図5Bのフィルタよりも聴感上より良い結果を生むことがわかった。よって前述した選択肢(c)のように補正フィルタをデコーダ中に設けることは、選択肢(b)のようにエンコーダ中に補正フィルタを設けるよりも好ましいようだ。
上述の説明は、下側にエイリアシングされた信号成分に着目していたが、補正フィルタをデコーダ内に設けることは、上側にエイリアシングされた成分をブーストすることに注意されたい。これは、下側エイリアシングと、上側エイリアシングとを天秤にかけることになるが、192kHzから96kHzへの、又は176.4kHzから88.2kHzへのダウンサンプリングについては、仮に上側へのエイリアシングがそれによって増すとしても、下側へのエイリアシングを低減する方が聴感上、良いようだ。
元の成分と比較してエイリアシングされた成分をどのくらい低減すべきかについての基準は確立されていないが、総ノイズに対するオーディオ帯域の位相歪みの釣り合いに基づいて基準が導出され得る。我々は、プリ応答を避けるために、合計応答が最小位相になるべきであると推定している。平坦化フィルタは、4次まで平坦である合計振幅応答を与えるように常に設計されるが、ボードの位相シフト定理によれば、超音波減衰が発生するときは、最小位相システムにおいて位相歪みは不可避である。位相応答が周波数における数列で展開されるとき、奇数のベキ指数だけが存在する。線形項は無関係であるが、これは、時間遅延と等価であるからで、3乗の項が主だからである。もしここでさらなる減衰δgデシベルが、周波数fを中心とする周波数インターバルδfにわたって導入されるなら、我々は、ボードの定理から、結果として生じる位相応答における3乗の項への追加は、δg.δf/fに比例することを推定する。周波数の4乗の逆数に依存することから、我々は、所与の位相歪み及び所与のエンドツーエンド周波数応答と整合性がとれる最低合計ノイズを得るためには、上側及び下側エイリアシングは、元の雑音電力の、エイリアシングされた雑音電力に対する比が、関与する2つの周波数の比の4乗の逆数に等しいよう、バランスがとられるべきである。
96kHzへのダウンサンプリングの場合、この基準は、元の60kHzのノイズから生じる36kHzにおける雑音スペクトル密度は、元の192kHzでサンプリングされた信号中の36kHzにおける雑音スペクトル密度よりも8.9dB低くなければならないことを示唆する。また折り返し周波数である48kHzにおいて、ダウンサンプリングフィルタによるフィルタリングの後のノイズのスペクトルは、−12dB/8veの勾配を最適には有しているべきである。したがって図5Aのダウンサンプリングフィルタの勾配は、この基準に従えば、「Take 5」の場合、十分ではなく、もしこの基準が関係すると考えられるなら、48kHz近傍でより急な勾配を持つダウンサンプリングフィルタが示唆される。「Take 5」は、いくらか例外的ではあるが、図8に示される「Dire Straits」による「Brothers in Arms」のスペクトルも、折り返し周波数の近傍でやはり高い勾配を有する。
ダウンサンプリングされた信号の平坦化
上述のように、エイリアシングを考慮すれば、ダウンサンプリングフィルタは、平坦化されるべきではなく、平坦化は、後続のアップサンプラまで先延ばしされるべきことがしばしば示唆される。伝送された信号は、それによって、平坦な周波数応答を有することにはならず、このことは、平坦化しないレガシー装置との相互運用性に関して不利な点となり得る。
ダウンサンプラのエイリアシング特性に影響を与えることなく、この不利な点を避ける一つの方法は、ナイキスト周波数、すなわち伝送サンプリング周波数の半分について対称である、図9に示されるような応答を持つフィルタを用いて平坦化することである。もし192kHzから96kHzへのダウンサンプリングなら、伝送ナイキスト周波数は48kHzであり、平坦化されない応答及び平坦化されたダウンサンプリング応答は、図10に示される。
不利な点が回避される理由は、「レガシー平坦器」が、それぞれの周波数及びそのエイリアスを等しく扱う対称フィルタであることである。2つの周波数は、同じ比でブースト又はカットされるので、後続するデシメーションにおいて上側エイリアシングの、下側エイリアシングに対する比は、影響を受けないのである。
図9に示される応答は、実際、以下のフィルタの応答である。
1.660575124/(1 + 0.6108508622z-2+ 0.04972426151z-4)
これは、最小位相、全極フィルタであり、zの偶数乗だけを含む。2分の1のデシメーションの前にこのフィルタでフィルタリングすれば、以下の全極フィルタを用いてデシメートされたストリームをフィルタリングすることと等価である。
1.660575124/(1 + 0.6108508622z-1+ 0.04972426151z-2)
これは、アップサンプリングの前に、受け取られたデシメートされた信号に、例えば、以下の対応する逆フィルタを適用することによってデコーダ中で逆変換され得るプロセスである。
.6022009998/(1 + 0.6108508622z-1+ 0.04972426151z-2)
よってエンコーディングフィルタ中のz平面の極は、デコーダ中の零点によってキャンセルされる。時間領域において、エンコーダ中のレガシー平坦器によって生じる任意のリンギングは、デコーダ中の対応する「レガシー非平坦化」(legacy unflattening)によって抑制することができ、これは、エンコーダ及びデコーダの組み合わせの全インパルス応答が、エンコーダだけのそれよりもよりコンパクトになるようにする方法の一つである。
アップサンプリングの後に、デコーダは、レガシー平坦器があたかも存在しないかのように、より高いサンプリングレートにおいて心理音響的に最適な平坦器を適用することができる。よって、デシメートされた信号が平坦化され、その後、再び非平坦化されることは、完全にトランスペアレントである。
「レガシー非平坦器」(legacy unflattener)は、代替としては、アップサンプリングの後で、より高いサンプリングレートにおいて以下を用いて実現され得る。
.6022009998 (1 + 0.6108508622z-2+ 0.04972426151z-4)
これは、FIRフィルタなので、アップサンプリングフィルタ及びエンドツーエンド平坦器と結合するにはおそらく便利であろう。この場合、このレガシー非平坦器は、別個に識別可能な機能ユニットではないかもしれない。よって、レガシー平坦器及びレガシー非平坦器の両方について、伝送サンプリングレートにおける実現の選択肢と、より高いサンプリングレートにおける実現の選択肢とがあり、後者の場合、その応答が伝送ナイキスト周波数について対称であるフィルタを使う。本明細書では、これら2つの実現方法は、等価であると考えられ、これらのうちのいずれか一方についての言及は、他方についての言及を包含するものと理解され得る。さらに、もしより高いサンプリングレートにおいて実現されるなら、平坦器又は非平坦器は、他のフィルタリングと結合され得るが、もし全デシメーションフィルタリング又は全再構成フィルタリングのそれぞれのz変換が、nがデシメーション比又は補間比であるzのべき乗をだけを含むz変換因数を有するなら、その存在は推定され得る。
レガシー平坦器が全極であることは要求されず、それは、その応答が伝送ナイキスト周波数について対称である限り、FIRフィルタ又は一般のIIRフィルタであってもよい。例えば、FIRフィルタ
1.444183138 - 0.5512608378z-1 + 0.1190498978z-2 - 0.01197219763z-3
は、エンコード内でデシメーションの後で、かつその逆がデコーダ内でアップサンプリングの前に適用され得るが、この3次のFIRフィルタは、伝送された信号を平坦化するのに図9の2次全極フィルタに対しても同様に効果的である。この場合、デコーダは、エンコード内で零点をキャンセルする極を有することになる。このFIR平坦器は、代替として、
1.444183138 - 0.5512608378z-2 + 0.1190498978z-4 - 0.01197219763z-6
を用いてデシメーションの前に実現され得て、この形態では、ダウンサンプリングフィルタと結合され得るが、その場合、別個の機能ユニットとしては識別できない。
2:1のダウンサンプリングのコンテキストにおいてレガシー平坦器がここでは説明されてきたが、同じ原理は、n:1のダウンサンプリングの場合にも当てはまる。その場合、レガシー平坦化及び非平坦化は、一般的な最小位相フィルタ及びその逆フィルタを用いて伝送サンプリングレートにおいて実行され得て、又は、zのべき乗だけを含むフィルタを用いてより高いサンプリングレートにおいて実行され得る。両方の場合において、レガシー平坦器は、伝送ナイキストについて対称であるデシベル応答を有する。
元のサンプリングレートにおいて適用された逆変換可能な(invertible)対称フィルタは、フィルタリングのエイリアス特性に差異を生じないこと、及びその効果は、デコーダにおいて完全に逆変換され得ることに注意すれば、ある候補になるダウンサンプリングフィルタと他のものとを比較するときにおいて、デシベル応答における対称的な差異は無関係であることになる。よって我々は、所与のフィルタのデシベル応答dB(f)を、対称成分
(dB(f) + dB(fstrans-f))/2
と、非対称成分
(dB(f) - dB(fstrans-f))/2
とに分解する。ここでfは周波数であり、fstransは伝送サンプリング周波数であり、2つのダウンサンプリングフィルタを比較するに際して、我々は、非対称成分だけに着目すればよく、対称成分は必要であればデコーダにおいて調整すればよい。実際、非対称成分は、エイリアス阻止の半分になるので、
エイリアス阻止 = dB(f) - dB(fstrans - f)
となる。
赤外コーディング
我々は、Dragotti P.L.、Vetterli M.、及びBlu T.による「Sampling Moments and Reconstructing Signals of Finite Rate of Innovation: Shannon Meets Strang-Fix」、IEEE Transactions on Signal Processing, Vol. 55, No. 5, May 2007という論文を参照する。この論文のセクションIIIは、任意の位置及び振幅を有するディラックパルスのストリームからなる信号を検討し、信号の均一にサンプリングされた表現から、ディラックパルスの位置及び振幅が一義に推測され得るためには、どのようなサンプリングカーネルが使用され得るかについての問いが呈されている。
我々は、小枝を折るような多くの自然環境音はインパルス的であり、この種の信号についてはフーリエ表現が適切とは決して明らかとはいえない点において、この問いはオーディオの再生に関連し得ると考える。図11に示されるリニアBスプラインカーネルが、ディラックパルスの位置及び振幅の一義的な再構成を可能にする、最も簡単な多項式カーネルである。我々は、これらの考えに基づいたダウンサンプリング仕様に「赤外コーディング」という名前を付けた。
ダウンサンプリングにおいては、我々は、既にサンプリングされている信号からスタートするが、この概念的モデルは、これが連続時間信号であるということであり、ここで元のサンプル点は、ディラックパルスの列として提供される。連続時間信号は、カーネルと畳み込みがなされ、ダウンサンプリングされた信号のレートにおいてリサンプリングされる。図11を参照すれば、リサンプリングの瞬間は、整数0, 1, 2, 3等であり、一方で、元の信号はより細かいグリッドで提供される。元のサンプル点及びリサンプリングの瞬間がアラインされると仮定すると、リニアBスプラインとの連続時間の畳み込みの後で、リサンプリングすることは、デシメーション前の以下の列との離散時間の畳み込みと等価である。
(1, 2, 1) / 4 2でデシメーション
(1, 2, 3, 2, 1) / 9 3でデシメーション
(1, 2, 3, 4, 3, 2, 1) / 16 4でデシメーション

(1, 2, 3, 4, 5, 6, 7, 8, 7, 6, 5, 4, 3, 2, 1) / 64 8でデシメーション。
これらの列は、Bスプラインカーネルの元のサンプリングレートにおけるサンプリング値に過ぎない。カーネルは、ダウンサンプリングされるレートにおける2つのサンプル周期の時間的な広がりを有するので、全ての場合において、ダウンサンプリングフィルタは、ダウンサンプリングされるレートにおける2つのサンプル周期を超えない、時間的な広がりを有することとなる。
よって、2でデシメーションするためには、ダウンサンプリングフィルタは、z変換(1/4 + 1/2z-1 + 1/4z-2)を有することになる。ダウンサンプリングのためにこのフィルタを、アップサンプリングのための適当に振幅の点でスケーリングした同じフィルタと共に、さらには適当な平坦器と共に用いて、非常に満足のいく結果が得られることを我々は見出した。平坦器は、アップサンプリングの後に置いてもよく、又はアップサンプラと組み合わせされてもよい。176.4kHzから88.2kHzへのダウンサンプリングのためには、結合されたダウンサンプリング及びアップサンプリングドループは、20kHzにおいて2.25dBであったものが、
2.1451346747 - 1.4364916731z-1 + 0.2913569984z-2
のような短い平坦器を用いて176.4kHzにおいて0.12dBに低減され得る。
全アップサンプリング及びダウンサンプリング応答は、わずか7タップしか持たないFIRであり、よって176.4サンプリングレートにおける6サンプル周期、つまりダウンサンプリングされたレートにおける3サンプル周期が全時間幅になる。これは、しばしば聴感上満足のいく、0〜20kHzにわたって平坦な応答を維持する、我々が知っている最も短い全フィルタ応答である。
この赤外処方は、強く立ち上がるノイズスペクトラムを持つ信号のために望ましいと考えられる下側へのエイリアシングの強力な阻止を提供しないが、商業録音の中には超音波ノイズスペクトルがよりほとんど平坦か、又は下がっていくものも多い。2:1のダウンサンプリング比だと、赤外ダウンサンプリングフィルタの勾配は、ダウンサンプリングされたナイキスト周波数において9.5dB/8veであり、4:1の比だと-11.4dB/8veであり、連続時間からのダウンサンプリングである限定された場合では-12dB/8veである。これは、図5Aのダウンサンプリングフィルタの勾配-22.7dB/8veに匹敵し、この種類のソースマテリアルについては、赤外エンコーディング仕様は適さないかもしれない。
ルーチンで用いられるプロフェッショナルユースのためのエンコーダは、例えば静かなパッセージの間の超音波スペクトラムを測定することによって、エンコーディングのために提供されたマテリアルの超音波ノイズスペクトラムを理想的には決定するよう試み、それによって、その特定の録音を再構成するために最適なダウンサンプリングフィルタ及びアップサンプリングフィルタのペアを、知った上で選択できなければならない。それからこの選択は、対応するデコーダへメタデータとして通信されなければならず、それによりこのデコーダは、適切なアップサンプリングフィルタを選定できる。
上の説明は、192kHz又は176.4kHzのような「4x」のサンプリングレートから、96kHz又は88.2kHzのような「2x」のサンプリングレートへのダウンサンプリングに実質的に中心に据えたが、4x又は2xのサンプリングレートからの、48kHz又は44.1kHzのような1xのサンプリングレートへのダウンサンプリングも商業的には重要である。実際、88.2kHzから44.1kHzへのダウンサンプリングのときも、より高いサンプリングレートにおいて用いられる上述のものと同じ「赤外」係数(1/4 + 1/2z-1 + 1/4z-2)が聴感上良好な結果を提供することがわかった。耳は、このより低いサンプリングレートにおいて元の周波数の下側にエイリアシングされたイメージをより大きく阻止することを要求するはずだと考える人もいるかもしれないので、上記はおそらくは驚くべきことだろうが、多数のリスニング試験によれば、それを耳が要求するわけではないようである。アップサンプリングのためには、平坦器と組み合わせられ、又は後に平坦器が設けられて、同じフィルタが用いられ得る。このより低いサンプリングレートにおいて、平坦器は、より多くのタップが必要であり、例えば88.2kHzで動作するフィルタ
4.0185 - 5.9764z-1 + 4.6929z-2- 2.4077z-3 + 0.8436z-4 - 0.1971z-5 + 0.0279z-6- 0.0018z-7
は、ダウンサンプラ及びアップサンプラの全応答を20kHzにおいて0.2dB以内に平坦化し、聴感上も満足のいくものであることがわかった。
44.1kHzの再生機器との互換性を与えるため、前述のように平坦器及び非平坦器のペアが提供され得る。20kHzにおいて0.5dBを超えないドループを持つ、最適に平坦な応答を提供するために、44.1kHzにおいて実現される9タップの全極平坦器
1.2305/(1 + 0.2489z-1 - 0.0231z-2+ 0.0058z-3 - 0.0015z-4 + 0.0003z-5 - 0.0001z-6+ 0.8166 10-5z-7 - 0.7262 10-6z-8 + 0.3151 10-7z-9)
が理論的には必要であるが、パスバンドにおけるリップルが最小限、加わってもよいなら、ここに与えられた分母の後ろの項のいくつかは省略され得る。いずれにしても、ここで与えられた数式表現は、対応するFIR非平坦器を提供するために逆変換(inverted)され得る。高解像度デコーダは、典型的には44.1kHzにおいて非平坦化し、88.2kHzにアップサンプリングし、それから88.2kHzにおいて上に挙げたように7次のFIRフィルタのような最適設計された平坦器を用いて平坦化する。この場合、エンコーダ及び高解像度デコーダ両方のインパルス応答は、12の非零のタップを有し、一方で、エンコーダ単体は、-40dBから-60dBのようなより低いレベルではあるが、より長く続くインパルス応答を有する。
44.1kHzのレートで動作するためのここで提示された平坦化及び非平坦化フィルタのうちの1つ又は両方は、88.2kHz以上のレートで動作するときに同じ機能を提供するために、前述のように変形され得る。
88.2kHzのストリーム内でt=0における単一のサンプルとして与えられたインパルスの44.1kHzの赤外コーディングからの連続時間への上述の再構成は、図12A及び図12Bに示される。図12Aにおいて、再構成は、菱形で示される44.1kHzのサンプル点からであり、88.2kHzのストリームの偶数サンプル点と時間軸で一致し、一方、図12Bにおいては、再構成は、円形で示される44.1kHzのサンプル点からであり、88.2kHzのストリーム点の奇数サンプル点と一致する。水平軸は、88kHzのサンプル周期で区切っている時刻tであり、垂直軸は、振幅の0.21乗であって、これは小さい応答の可視性を提供するだけでなく、短いインパルスについては、末梢強度は、振幅の0.21乗に比例することを示唆するヒト聴覚の神経生理学的なモデルに従ったもっともらしさも提供し得る。この44.1kHzの表現は、レガシー機器との互換性のための平坦化を含め、上述のように赤外法を用いて導出されてきたが、一方で、2つの高解像度再構成は、同様に、赤外再構成が後に続くレガシー非平坦器と、88.2kHzにおいて実現される平坦器とを用いる。
この44kHzストリームは、インパルスの高解像度再構成が終わったずっと後までも持続する時間応答を呈するので、エンコーダ単体の応答よりもコンパクトであるエンドツーエンド応答を提供することにおける極零相殺の効果を示すことになることに注意されたい。
図12A及び12Bは、デシメーションが関係するときには「インパルス応答」の概念が、より明確に定義される必要があることも示す。2:1でデシメーションする場合、その結果は、奇数サンプル上で示されるインパルスと、偶数サンプル上で示されるものとでは異なる。本明細書では、これら2つの場合において得られた応答の平均を指すために「インパルス応答」という語を使う。
上述の赤外コーディングは、ダウンサンプリングされた信号のサンプリング周波数において2つのz平面の零点を与え、ダウンサンプリングの比が2より大きい場合には、当該周波数の全ての倍数においてそうであることが理解されよう。
下側へのエイリアシングの抑圧
上述のように、「take 5」のようなアイテムをエンコーディングするときには、図8に示されるように、ノイズスペクトラムがピークを持つ55kHzのような周波数においてダウンサンプリングフィルタが強い減衰を提供する方が望ましいかもしれない。この周波数の近傍でのエネルギーを抑圧するために1つ以上のz平面の零点を配置することを考えるのは当然だろう。しかしながらそうするためには、エンドツーエンドのインパルス応答の全長を増す必要がある。一つめの理由は、それぞれの複素零点は、ダウンサンプリングフィルタ上でさらに2つのタップを要求するからであり、二つめの理由は、55kHz近傍の零点は、合計のドループを極めて大きくする結果、より長い平坦化フィルタもおそらくは要求されるからである。
一つの注意点として、長さが増すことは、極零相殺を用いて回避され得ることである。すなわちエンコーダのフィルタ内の複素零点は、デコーダ内の極によってキャンセルされる。ある実施形態において、3つのそのような零点を含むダウンサンプリングフィルタは、3つの対応する極を有するアップサンプリングフィルタとペアにされる。結果として生じるダウンサンプリングフィルタ及びアップサンプリングフィルタの応答は、図13A及び13Bに示され、推定される外部ドループと併せた、これら2つのフィルタを組み合わせたときのエンドツーエンドの応答は、図13Cに示される。他のグラフとの一貫性のために、これらプロットは、サンプリングレート196kHzを想定しており、最大の減衰は、55kHzではなく60kHz近傍である。
ここでの注意点は、下側エイリアシングは抑圧されたが、上側エイリアシングは、増大されたことである。「Take 5」のような曲で使用するためには、増大された上側にエイリアシングされたノイズは、急に立ち上がる元のノイズによって十分にカバーされる。しかし33kHz近傍の信号成分は、55kHz近傍のずっと大きなエイリアスにもなる。よって、エイリアシングされた成分を無視する、エンドツーエンドの周波数応答を単に提示することは、議論の余地があるとはいえ、誤解を招くものである。にもかかわらず、エイリアスに適用されるブーストが過剰でなければ、上側へのエイリアスに対して耳は比較的寛容であるようである。
図13Bに示される57kHzにおける38dBの大きなブーストは、一見すると賢明とは思えないが、もしレガシー平坦器が上述のように用いられるなら、このブーストのほとんどを補償するレガシーの非平坦器をデコーダは取り込むので、全体としてデコーダは、ブーストを呈しない。
結論
本明細書で説明されたデコーディング応答のうちいくつかは、通常では再構成フィルタには存在しない特徴を有することに注意されたい。これらの特徴には、44.kkHz又は48kHzのナイキスト周波数の半分において低下するのではなく、増大する応答と、zの偶数乗だけの関数である1つ以上の要素を有するz変換とが含まれ、それによってナイキスト周波数の半分の周波数について対称的である個別の応答を有する。

Claims (25)

  1. オーディオキャプチャの音声を伝達するための、エンコーダ及びデコーダを備えるシステムであって、
    前記エンコーダは、前記オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成され、
    前記デコーダは、前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成され、
    前記エンコーダは、前記伝送サンプリングレートの倍数である第1サンプリングレートにおける前記オーディオキャプチャを表す前記信号を受け取り、前記信号をダウンサンプリングすることによって前記デジタルオーディオ信号を出力するよう構成されるダウンサンプラを備え、
    前記エンコーダ及び前記デコーダを組み合わせたインパルス応答は、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける5サンプル周期を超えないことを特徴とし、
    前記累積絶対応答は、前記インパルス応答の絶対的な大きさの時間積分である
    システム。
  2. 前記エンコーダ及び前記デコーダを組み合わせた前記インパルス応答の前記持続期間は、前記伝送サンプリングレートの4周期を超えない
    請求項1に記載のシステム。
  3. オーディオキャプチャの音声を伝送するための、エンコーダ及びデコーダを備えるシステムであって、
    前記エンコーダは、前記オーディオキャプチャを表す信号から伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成され、
    前記デコーダは、前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成され、
    前記エンコーダは、前記伝送サンプリングレートの倍数である第1サンプリングレートにおける前記オーディオキャプチャを表す前記信号を受け取り、前記信号をダウンサンプリングすることによって前記デジタルオーディオ信号を出力するよう構成されるダウンサンプラを備え、
    前記エンコーダ及び前記デコーダを組み合わせたインパルス応答は、その累積絶対応答が最終値の1%から50%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける2サンプル周期を超えないことを特徴とし、
    前記累積絶対応答は、前記インパルス応答の絶対的な大きさの時間積分である
    システム。
  4. 前記エンコーダ及び前記デコーダを組み合わせた前記インパルス応答の前記持続期間は、前記伝送サンプリングレートの1.5周期を超えない
    請求項3に記載のシステム。
  5. 前記ダウンサンプラは、第1サンプリングレートにおいて特定されたデシメーションフィルタを備え、前記デシメーションフィルタのエイリアス阻止は、デシメーションで範囲0〜7kHzにエイリアシングされる周波数において少なくとも32dBである
    請求項1〜4のいずれか1項に記載のシステム。
  6. 前記デシメーションフィルタとして機能するよう構成された第2フィルタが数学的に存在し、
    前記第2フィルタは、前記デシメーションフィルタと同じエイリアス阻止を有し、かつ累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける5サンプル周期を超えないインパルス応答を有する
    請求項1又は請求項2に従属するときの請求項5に記載のシステム。
  7. 前記エンコーダの応答は、極を有し、
    前記デコーダの応答は、z平面の位置が前記極と一致する零点を有することによって、前記極の効果が前記再構成された信号において相殺される
    請求項1〜6のいずれか1項に記載のシステム。
  8. 前記デコーダの応答は、極を有し、
    前記エンコーダの応答は、z平面の位置が前記極と一致する零点を有することによって、前記極の効果が前記再構成された信号において相殺される
    請求項1〜6のいずれか1項に記載のシステム。
  9. 前記デコーダの応答が、前記伝送サンプリングレートに対応するナイキスト周波数の周辺の領域で上昇し、前記エンコーダの応答が、前記領域において下降する応答を有することによって、ナイキスト周波数より上の周波数の、前記ナイキスト周波数より下の周波数へのエンコーダにおける下側へのエイリアシングを低減する
    請求項1〜8のいずれか1項に記載のシステム。
  10. 前記伝送サンプリングレートは、88.2kHz及び96kHzのうちの1つであり、前記第1サンプリングレートは、176.4kHz、192kHz、352.8kHz、及び384kHzのうちの1つである
    請求項1〜9のいずれか1項に記載のシステム。
  11. 伝送サンプリングレートにおける伝送のためのデジタルオーディオ信号を、キャプチャされたオーディオの音声を伝達するのに要求されるサンプリングレートを低減することによって出力する方法であって、
    前記伝送サンプリングレートの倍数である第1サンプリングレートを有する前記キャプチャされたオーディオの表現を、前記第1サンプリングレートで特定されるデシメーションフィルタを用いてフィルタリングするステップ、及び
    前記フィルタリングされた表現をデシメーションすることによって、前記デジタルオーディオ信号を出力するステップであって、前記デシメーションフィルタのインパルス応答は、デシメーションで範囲0〜7kHzにエイリアシングされる周波数において少なくとも32dBであるエイリアス阻止を有する、前記デジタルオーディオ信号を出力するステップを含み、
    前記デシメーションフィルタとして機能するよう構成された第2フィルタが数学的に存在し、
    前記第2フィルタは、前記デシメーションフィルタと同じエイリアス阻止を有し、かつ累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間が、前記伝送サンプリングレートにおける5サンプル周期を超えないインパルス応答を有し、
    前記累積絶対応答は、前記インパルス応答の絶対的な大きさの時間積分である
    方法。
  12. 前記第2フィルタの前記インパルス応答の前記持続期間は、前記伝送サンプリングレートの4周期を超えない
    請求項11に記載の方法。
  13. 前記第1サンプリングレートにおいて前記キャプチャされたオーディオの前記表現を得るステップをさらに備える
    請求項11又は請求項12に記載の方法。
  14. 前記キャプチャされたオーディオのスペクトラムを分析するステップ、及び
    前記分析されたスペクトラムに応じて前記デシメーションフィルタを選択するステップをさらに備える
    請求項11〜13のいずれか1項に記載の方法。
  15. 前記キャプチャされたオーディオのノイズフロアを分析するステップ、及び
    前記分析されたノイズフロアに応じて前記デシメーションフィルタを選択するステップをさらに備える
    請求項11〜14のいずれか1項に記載の方法。
  16. デコーダによって使われるよう、デシメーションフィルタの選択に関連する情報を出力するステップをさらに備える
    請求項14又は請求項15に記載の方法。
  17. 前記伝送サンプリングレートは、88.2kHz及び96kHzのうちの1つであり、前記第1サンプリングレートは、176.4kHz、192kHz、352.8kHz、及び384kHzのうちの1つである
    請求項11〜16のいずれか1項に記載の方法。
  18. 前記フィルタリングするステップは、前記伝送サンプリングレートに対応するナイキスト周波数について対称な応答を有する平坦化フィルタで前記デシメーションフィルタの応答を平坦化することを含む、
    請求項11〜17のいずれか1項に記載の方法。
  19. 前記平坦化フィルタの応答は、極を有する
    請求項18に記載の方法
  20. 請求項11〜19のいずれか1項に記載の方法を実行することによって出力されたデジタルオーディオ信号を保持するデータ担体。
  21. 請求項11〜19のいずれか1項に記載の方法を用いてデジタルオーディオ信号を出力するよう構成されるエンコーダ。
  22. オーディオキャプチャの音声を伝達するためのシステムであって、
    前記オーディオキャプチャを表す信号を受け取り、伝送サンプリングレートにおけるデジタルオーディオ信号を出力するよう構成されたエンコーダであって、前記エンコーダは、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間を有するインパルス応答を特徴とする、エンコーダ、及び
    前記デジタルオーディオ信号を受け取り、再構成された信号を出力するよう構成されたデコーダであって、前記デコーダは、その累積絶対応答が最終値の1%から95%まで上昇するのにかかる持続期間を有するインパルス応答を特徴とする、デコーダ、
    を備え、
    前記エンコーダ及び前記デコーダの組み合わされたインパルス応答は、
    前記エンコーダ単体のインパルス応答の特徴である持続期間及び前記デコーダ単体のインパルス応答の特徴である持続期間よりも短い、累積絶対応答が1%から95%まで上昇するのにかかる持続期間を有する全システムインパルス応答をつくり、
    前記累積絶対応答は、前記インパルス応答の絶対的な大きさの時間積分である
    システム。
  23. 前記デコーダの応答は、z平面における位置が前記エンコーダの前記応答における極の位置と一致する
    請求項22に記載のシステム。
  24. 前記デコーダの応答は、前記エンコーダから受け取られた情報に依存して選択される
    請求項22又は請求項23に記載のシステム。
  25. 前記システムのインパルス応答の前記持続期間は、前記伝送サンプリングレートの5サンプル周期よりも大きくない
    請求項22〜24のいずれか1項に記載のシステム。
JP2017517426A 2014-06-10 2014-06-10 オーディオ信号のデジタルカプセル化 Active JP6700507B6 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/GB2014/051789 WO2015189533A1 (en) 2014-06-10 2014-06-10 Digital encapsulation of audio signals

Publications (3)

Publication Number Publication Date
JP2017521977A JP2017521977A (ja) 2017-08-03
JP6700507B2 true JP6700507B2 (ja) 2020-05-27
JP6700507B6 JP6700507B6 (ja) 2020-07-22

Family

ID=51014560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017517426A Active JP6700507B6 (ja) 2014-06-10 2014-06-10 オーディオ信号のデジタルカプセル化

Country Status (7)

Country Link
US (4) US10115410B2 (ja)
EP (3) EP3998605A1 (ja)
JP (1) JP6700507B6 (ja)
KR (3) KR102661191B1 (ja)
CN (1) CN106575508B (ja)
PL (1) PL3155617T3 (ja)
WO (1) WO2015189533A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115410B2 (en) 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
US9959883B2 (en) * 2015-10-06 2018-05-01 The Trustees Of Princeton University Method and system for producing low-noise acoustical impulse responses at high sampling rate
KR20180088184A (ko) * 2017-01-26 2018-08-03 삼성전자주식회사 전자 장치 및 그 제어 방법
US10797926B2 (en) * 2018-01-26 2020-10-06 California Institute Of Technology Systems and methods for communicating by modulating data on zeros
CN108564957B (zh) * 2018-01-31 2020-11-13 杭州士兰微电子股份有限公司 码流的解码方法、装置、存储介质和处理器
US11496350B2 (en) * 2018-03-27 2022-11-08 University Of South Carolina Dual-polarization FBMC in wireless communication systems
SG11202108549YA (en) * 2019-02-07 2021-09-29 California Inst Of Techn Systems and methods for communicating by modulating data on zeros in the presence of channel impairments
CA3142036A1 (en) 2019-05-28 2020-12-24 Utility Associates, Inc. Systems and methods for detecting a gunshot
US10945074B2 (en) 2019-06-07 2021-03-09 Cirrus Logic, Inc. Low-latency compensating audio filters using negative group delay
US11438697B2 (en) 2019-06-07 2022-09-06 Cirrus Logic, Inc. Low-latency audio output with variable group delay
CN113607269B (zh) * 2021-02-02 2023-12-15 深圳市冠旭电子股份有限公司 声音剂量确定方法、装置、电子设备及存储介质
US20220383858A1 (en) * 2021-05-28 2022-12-01 Asapp, Inc. Contextual feature vectors for processing speech
CN113782043B (zh) * 2021-09-06 2024-06-14 北京捷通华声科技股份有限公司 语音采集方法、装置、电子设备及计算机可读存储介质
US11889280B2 (en) * 2021-10-05 2024-01-30 Cirrus Logic Inc. Filters and filter chains
WO2023148540A1 (en) * 2022-08-16 2023-08-10 Arekat Safwan A recursive fir digital filter

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5121204A (en) * 1990-10-29 1992-06-09 General Electric Company Apparatus for scrambling side panel information of a wide aspect ratio image signal
ES2135408T3 (es) 1991-05-29 1999-11-01 Pacific Microsonics Inc Sistema mejorado de codificacion/decodificacion de señales.
US5757931A (en) * 1994-06-15 1998-05-26 Sony Corporation Signal processing apparatus and acoustic reproducing apparatus
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5928313A (en) * 1997-05-05 1999-07-27 Apple Computer, Inc. Method and apparatus for sample rate conversion
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
JPH11215006A (ja) * 1998-01-29 1999-08-06 Olympus Optical Co Ltd ディジタル音声信号の送信装置及び受信装置
FR2783651A1 (fr) * 1998-09-22 2000-03-24 Koninkl Philips Electronics Nv Dispositif et procede de filtrage d'un signal de parole, recepteur et systeme de communications telephonique
JP4386514B2 (ja) * 1998-11-24 2009-12-16 株式会社アドバンテスト 半導体試験装置
US6208276B1 (en) * 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
US6337645B1 (en) 1999-03-23 2002-01-08 Microsoft Corporation Filter for digital-to-analog converters
CN1151606C (zh) * 1999-03-23 2004-05-26 太平洋微超声公司 用于数模转换器的滤波器和降低混叠失真的方法
JP2002330075A (ja) * 2001-05-07 2002-11-15 Matsushita Electric Ind Co Ltd サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
US7236839B2 (en) * 2001-08-23 2007-06-26 Matsushita Electric Industrial Co., Ltd. Audio decoder with expanded band information
US7173966B2 (en) * 2001-08-31 2007-02-06 Broadband Physics, Inc. Compensation for non-linear distortion in a modem receiver
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7069212B2 (en) * 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
JP2004120182A (ja) * 2002-09-25 2004-04-15 Sanyo Electric Co Ltd デシメーションフィルタおよびインターポレーションフィルタ
US7262716B2 (en) * 2002-12-20 2007-08-28 Texas Instruments Incoporated Asynchronous sample rate converter and method
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
DE102004062291B4 (de) * 2004-12-23 2010-04-08 Austriamicrosystems Ag FIR-Dezimationsfilter und Anordnung mit demselben
BRPI0611430A2 (pt) * 2005-05-11 2010-11-23 Matsushita Electric Ind Co Ltd codificador, decodificador e seus métodos
WO2007002770A2 (en) * 2005-06-27 2007-01-04 Qualcomm Flarion Technologies, Inc. Methods and apparatus for implementing and using amplifiers for performing various amplification related operations
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
US9496850B2 (en) * 2006-08-04 2016-11-15 Creative Technology Ltd Alias-free subband processing
CN101366080B (zh) * 2006-08-15 2011-10-19 美国博通公司 一种更新解码器的状态的方法和***
CN100487789C (zh) * 2006-09-06 2009-05-13 华为技术有限公司 感知加权滤波方法及感知加权滤波器
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
CN200962315Y (zh) * 2006-10-18 2007-10-17 中兴通讯股份有限公司 一种语音处理装置
EP4300825A3 (en) * 2006-10-25 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
US8902365B2 (en) * 2007-03-14 2014-12-02 Lance Greggain Interference avoidance in a television receiver
US7728658B2 (en) 2007-07-25 2010-06-01 D2Audio Corporation Low-noise, low-distortion digital PWM amplifier
EP2144228A1 (en) * 2008-07-08 2010-01-13 Siemens Medical Instruments Pte. Ltd. Method and device for low-delay joint-stereo coding
CN101369898B (zh) * 2008-09-12 2011-04-20 中国电子科技集团公司第五十四研究所 流星余迹自适应变速率突发调制解调器
US7808419B2 (en) * 2008-10-22 2010-10-05 Mediatek Inc. Digitizer with variable sampling clock and method using the same
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
CN101419800B (zh) * 2008-11-25 2011-12-14 浙江大学 基于频谱平移的情感说话人识别方法
US8938313B2 (en) * 2009-04-30 2015-01-20 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
EP2649614B1 (en) * 2010-12-09 2015-11-04 Dolby International AB Psychoacoustic filter design for rational resamplers
US8467141B2 (en) * 2011-08-23 2013-06-18 Lsi Corporation Read channel with oversampled analog to digital conversion
US9236064B2 (en) * 2012-02-15 2016-01-12 Microsoft Technology Licensing, Llc Sample rate converter with automatic anti-aliasing filter
CN102915736B (zh) * 2012-10-16 2015-09-02 广东威创视讯科技股份有限公司 混音处理方法和混音处理***
CN103209152B (zh) * 2013-03-20 2015-09-23 苏州东奇信息科技股份有限公司 基于双零点冲击滤波器的mppsk相干解调方法
WO2014153604A1 (en) * 2013-03-26 2014-10-02 Barratt Lachlan Paul Audio filters utilizing sine functions
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
US10115410B2 (en) 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
US9793879B2 (en) * 2014-09-17 2017-10-17 Avnera Corporation Rate convertor

Also Published As

Publication number Publication date
EP3155617A1 (en) 2017-04-19
CN106575508B (zh) 2021-05-25
EP3155617B1 (en) 2022-01-05
KR20170023941A (ko) 2017-03-06
KR102661191B1 (ko) 2024-04-26
US20170110141A1 (en) 2017-04-20
PL3155617T3 (pl) 2022-04-19
EP4002359A1 (en) 2022-05-25
KR20230028594A (ko) 2023-02-28
KR102503347B1 (ko) 2023-02-23
KR20210132222A (ko) 2021-11-03
US20240029749A1 (en) 2024-01-25
US20190057709A1 (en) 2019-02-21
EP3998605A1 (en) 2022-05-18
US10115410B2 (en) 2018-10-30
JP2017521977A (ja) 2017-08-03
WO2015189533A1 (en) 2015-12-17
US11710493B2 (en) 2023-07-25
JP6700507B6 (ja) 2020-07-22
CN106575508A (zh) 2017-04-19
KR102318581B1 (ko) 2021-10-27
US20210193157A1 (en) 2021-06-24
US10867614B2 (en) 2020-12-15

Similar Documents

Publication Publication Date Title
JP6700507B2 (ja) オーディオ信号のデジタルカプセル化
KR101422368B1 (ko) 오디오 신호를 처리하기 위한 방법 및 장치
AU2007280822B2 (en) Device and method for processing a real subband signal for reducing aliasing effects
JP2005530432A (ja) 部屋における拡声器からの音声のデジタル等化方法、および、この方法の使用法
US9076437B2 (en) Audio signal processing apparatus
WO2014108677A1 (en) Digital encapsulation of audio signals
Stuart et al. A hierarchical approach to archiving and distribution
JP4593364B2 (ja) オーディオデータの補間方法および補間装置
CN107112979B (zh) 具有在高解析音频的前响应频率下的群延迟的非线性滤波器
De Koning et al. On psychoacoustic noise shaping for audio requantization
JP2006243042A (ja) 高域補間装置及び再生装置
JP4715385B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
US11889280B2 (en) Filters and filter chains
EP3029674B1 (en) Mastering improvements to audio signals
JP2007108360A (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2012141873A1 (en) A method, system and apparatus for improving the sonic quality of an audio signal
Nikoleta Compression techniques for digital hearing aids

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170125

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A525

Effective date: 20170125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170609

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20170616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180403

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191107

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20191206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20191210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200331

R150 Certificate of patent or registration of utility model

Ref document number: 6700507

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250