JP2017506038A - オーディオ信号を圧縮するためのオーディオ圧縮システム - Google Patents

オーディオ信号を圧縮するためのオーディオ圧縮システム Download PDF

Info

Publication number
JP2017506038A
JP2017506038A JP2016549367A JP2016549367A JP2017506038A JP 2017506038 A JP2017506038 A JP 2017506038A JP 2016549367 A JP2016549367 A JP 2016549367A JP 2016549367 A JP2016549367 A JP 2016549367A JP 2017506038 A JP2017506038 A JP 2017506038A
Authority
JP
Japan
Prior art keywords
audio signal
frequency
filter
audio
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016549367A
Other languages
English (en)
Inventor
ペーター・グロシェ
ユエ・ラン
チン・ジャン
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2017506038A publication Critical patent/JP2017506038A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/002Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本発明は、入力オーディオ信号を圧縮するためのオーディオ圧縮システム(100)に関し、オーディオ圧縮システム(100)は、フィルタされたオーディオ信号を取得するために入力オーディオ信号をフィルタするためのデジタルフィルタ(101)であって、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は人間の耳の等ラウドネス曲線によって形成された、デジタルフィルタ(101)と、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて入力オーディオ信号を圧縮するように構成されているコンプレッサ(103)とを含む。

Description

本発明は、オーディオ信号処理の分野に関する。
オーディオ信号のダイナミックレンジの縮小は、録音、音声再生、およびブロードキャストの分野において重要な主題である。ダイナミックレンジの縮小は、用いられるオーディオ装置の物理的能力においてオーディオ信号の特性を適合させるのに適している場合がある。
オーディオ信号のダイナミックレンジを縮小するために、コンプレッサが用いられ得る。コンプレッサの圧縮特性は、オーディオ信号の認知される品質に著しく影響を及ぼす可能性がある複数の圧縮パラメータによって制御され得る。
パラメータの調整は、人間の音知覚の複雑な性質のために困難な場合があり、オーディオ信号の特性に大きく依存している。
G. W. McNally、「Dynamic Range Control of Digital Audio Signals」、Journal of the Audio Engineering Society、vol. 32、pp. 316〜327、1984年において、コンプレッサを使用するダイナミックレンジ圧縮が記述されている。
G. W. McNally、「Dynamic Range Control of Digital Audio Signals」、Journal of the Audio Engineering Society、vol. 32、pp. 316〜327、1984年
本発明は、圧縮されたオーディオ信号の高い認知される品質を可能にする入力オーディオ信号を効率的に圧縮するためのオーディオ圧縮システムを提供することを目的とする。
この目的は、独立請求項に記載の特徴によって達成される。他の実装形態は、従属請求項、記述、および図から明白である。
本発明は、デジタルフィルタによって入力オーディオ信号がフィルタされ得るという発見に基づいており、デジタルフィルタの周波数伝達関数の周波数を通じた振幅は、人間の耳の等ラウドネス曲線によって形成され得る。デジタルフィルタによって入力オーディオ信号をフィルタすることによって、人間の耳の低いラウドネスに対する感度を用いる入力オーディオ信号の部分は増幅され得、人間の耳の高いラウドネスに対する感度を用いる入力オーディオ信号の部分は減衰され得る。言い換えると、本発明によるオーディオ信号処理のために人間の音知覚の特性が考慮される。コンプレッサは、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて、入力オーディオ信号を連続的に圧縮することができる。したがって、圧縮は、人間の耳の低いラウドネスに対する感度を用いる入力オーディオ信号の部分に集中することができるため、したがって、圧縮されたオーディオ信号の認知される品質を向上させることができる。
第1の態様によると、本発明は、入力オーディオ信号を圧縮するためのオーディオ圧縮システムに関し、オーディオ圧縮システムは、フィルタされたオーディオ信号を取得するために入力オーディオ信号をフィルタするためのデジタルフィルタであって、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は人間の耳の等ラウドネス曲線によって形成される、デジタルフィルタと、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて入力オーディオ信号を圧縮するように構成されているコンプレッサとを含む。したがって、圧縮されたオーディオ信号の高い認知される品質が達成され得る。
入力オーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。入力オーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
デジタルフィルタは、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタとして実装され得る。デジタルフィルタのフィルタリング特性は、周波数伝達関数を使用して、周波数領域において決定され得る。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
フィルタされたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。フィルタされたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
コンプレッサは、デジタルコンプレッサの場合がある。コンプレッサは、圧縮されたオーディオ信号を取得するために、入力オーディオ信号をフィルタされたオーディオ信号と組み合わせるように構成され得る。
圧縮されたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。圧縮されたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
そのような第1の態様によるオーディオ圧縮システムの第1の実装形態では、デジタルフィルタは、時間領域においてフィルタされたオーディオ信号を提供するために時間領域入力オーディオ信号をフィルタする時間領域に対する時間領域フィルタである。したがって、入力オーディオ信号をフィルタする低い待機時間が達成され得る。
時間領域入力オーディオ信号は、フィルタされたオーディオ信号のサンプルの連続を取得するために時間領域フィルタによってフィルタされ得るサンプルの連続を取得するためにサンプリングされ得る。時間領域フィルタは、たとえば、直接型構造(direct form structure)または格子構造を使用して実装され得る。
そのような第1の態様によるオーディオ圧縮システムの第2の実装形態、または第1の態様の任意の先行する実装形態では、周波数伝達関数は、所定の周波数を下回るか、または上回る一定の振幅を持つ。したがって、周波数伝達関数の振幅の全体的な範囲は、制限され得る。
所定の周波数を下回る一定の振幅の場合には、所定の周波数は、たとえば、10Hzの場合がある。所定の周波数を上回る一定の振幅の場合には、所定の周波数は、たとえば、7kHzの場合がある。
周波数伝達関数の振幅は、周波数を通じて正規化され得る。周波数を通じた周波数伝達関数の振幅の中間値は、1の値を持つことができる。
そのような第1の態様によるオーディオ圧縮システムの第3の実装形態、または第1の態様の任意の先行する実装形態では、周波数伝達関数の位相は、周波数を通じて直線的に増加または減少し得る。したがって、デジタルフィルタの一定の群遅延が達成され得る。
そのような第1の態様によるオーディオ圧縮システムの第4の実装形態、第1の態様の第1の実装形態、または第1の態様の第2の実装形態では、周波数伝達関数の位相は、周波数を通じて一定であり、特にゼロに等しい。したがって、デジタルフィルタは、効率的に実装され得る。
そのような第1の態様によるオーディオ圧縮システムの第5の実装形態、または第1の態様の任意の先行する実装形態では、周波数伝達関数は、フィルタ係数によって決定され、そこにおいて、デジタルフィルタは、決定ユニットおよびフィルタリングユニットを含み、そこにおいて、決定ユニットは、少なくとも1つの等ラウドネス曲線に基づいてフィルタ係数を決定するように構成され、そこにおいて、フィルタリングユニットは、決定されたフィルタ係数に基づいてオーディオ信号をフィルタするように構成される。したがって、デジタルフィルタのフィルタリング特性の適応が達成され得る。
決定ユニットは、たとえばパークス-マクレランアルゴリズムなど、デジタルフィルタ設計技術を使用して、少なくとも1つの等ラウドネス曲線に基づいてフィルタ係数を決定するように構成され得る。フィルタ係数は、実数(たとえば2.5または7.8)または複素数(たとえば1+j、4-3j)の場合がある。フィルタ係数は、フィルタタップを含むことができる。
フィルタリングユニットは、有限インパルス応答(FIR)または無限インパルス応答(IIR)フィルタ構造を含むことができる。
第1の態様の第5の実装形態によるオーディオ圧縮システムの第6の実装形態では、決定ユニットは、フィルタ係数を決定するために、異なる等ラウドネス曲線に関連付けられた1組のフィルタ係数から等ラウドネス曲線に関連付けられたフィルタ係数を選択するように構成される。したがって、異なる等ラウドネス曲線がデジタルフィルタによって用いられ得る。
第1の態様の第6の実装形態によるオーディオ圧縮システムの第7の実装形態では、異なる等ラウドネス曲線は、オーディオ信号の異なるラウドネスレベルに関連付けられ、そこにおいて、決定ユニットは、オーディオ信号のラウドネスレベルを決定するようにさらに構成され、そこにおいて、決定ユニットは、決定されたラウドネスレベルに基づいて等ラウドネス曲線に関連付けられたフィルタ係数を選択するようにさらに構成される。したがって、デジタルフィルタの周波数伝達関数は、オーディオ信号のラウドネスレベルにより適応され得る。
オーディオ信号のラウドネスレベルは、所定の時間間隔内のオーディオ信号の平均エネルギに関係する場合がある。所定の時間間隔は、たとえば、20msまたは100msの場合がある。
そのような第1の態様によるオーディオ圧縮システムの第8の実装形態、または第1の態様の任意の先行する実装形態では、コンプレッサは、フィルタされたオーディオ信号に基づいて圧縮利得信号を決定し、圧縮されたオーディオ信号を取得するために、入力オーディオ信号を圧縮利得信号と組み合わせるように構成されている。したがって、入力オーディオ信号の圧縮は、効率的に実行され得る。
圧縮利得信号は、たとえば部分的線形の圧縮特性曲線など、圧縮特性曲線に基づいてフィルタされたオーディオ信号から得ることができる。圧縮利得信号との入力オーディオ信号の組み合わせは、入力オーディオ信号と圧縮利得信号の乗算を含むことができる。
そのような第1の態様または第1の態様の任意の先行する実装形態によるオーディオ圧縮システムの第9の実装形態では、オーディオ圧縮システムは、圧縮されたオーディオ信号をフィルタするための等化フィルタをさらに含み、等化フィルタは、周波数を通じて強度を持つ周波数伝達関数を含み、強度は、人間の耳の等ラウドネス曲線によって形成される。したがって、オーディオ圧縮システムの平坦な周波数レスポンスが達成され得る。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
そのような第1の態様または第1の態様の任意の先行する実装形態によるオーディオ圧縮システムの第10の実装形態では、オーディオ圧縮システムは、時間領域において圧縮されたオーディオ信号の最大強度を低減するためのピークリミッタをさらに含む。したがって、圧縮されたオーディオ信号のクリッピング効果が緩和され得る。
ピークリミッタは、高圧縮しきい値および/または高圧縮比を有するダイナミックレンジコンプレッサとして実現され得る。
第2の態様によると、本発明は、入力オーディオ信号を圧縮するためのオーディオ圧縮方法に関し、オーディオ圧縮方法は、フィルタされたオーディオ信号を取得するために、デジタルフィルタによって入力オーディオ信号をフィルタするステップであって、デジタルフィルタは、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は人間の耳の等ラウドネス曲線によって形成されている、ステップと、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて、入力オーディオ信号を圧縮するステップとを含む。したがって、圧縮されたオーディオ信号の高い認知される品質が達成され得る。
オーディオ圧縮方法は、そのような第1の態様または第1の態様の任意の実装形態によるオーディオ圧縮システムによって実行され得る。オーディオ圧縮方法の他の特徴は、そのような第1の態様または第1の態様の任意の実装形態によるオーディオ圧縮システムの機能から直接的に生じ得る。
第3の態様によると、本発明は、オーディオ信号をフィルタするためのデジタルフィルタに関し、デジタルフィルタは、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は、人間の耳の等ラウドネス曲線によって形成されている。したがって、人間の音知覚に関係するアプリケーションのためのデジタルフィルタが提供され得る。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
第4の態様によると、本発明は、オーディオ信号をフィルタするためのデジタルフィルタリング方法に関し、デジタルフィルタリング方法は、デジタルフィルタによってオーディオ信号をフィルタするステップを含み、デジタルフィルタは、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は、人間の耳の等ラウドネス曲線によって形成されている。したがって、人間の音知覚に関係するアプリケーションのためのデジタルフィルタリング方法が提供され得る。
デジタルフィルタリング方法は、そのような第3の態様によるデジタルフィルタによって実行され得る。デジタルフィルタリング方法の他の機能は、そのような第3の態様によるデジタルフィルタの機能から直接的に得られ得る。
そのような第4の態様によるデジタルフィルタリング方法の第1の実装形態では、周波数伝達関数は、フィルタ係数によって決定され、そこにおいて、デジタルフィルタリング方法は、少なくとも1つの等ラウドネス曲線に基づいてフィルタ係数を決定するステップと、決定されたフィルタ係数に基づいてオーディオ信号をフィルタするステップとを含む。したがって、デジタルフィルタリング方法のフィルタリング特性の適応が達成され得る。
第4の態様の第1の実装形態によるデジタルフィルタリング方法の第2の実装形態では、フィルタ係数を決定するステップは、フィルタ係数を決定するために、異なる等ラウドネス曲線に関連付けられた1組のフィルタ係数から等ラウドネス曲線に関連付けられたフィルタ係数を選択するステップを含む。したがって、異なる等ラウドネス曲線がデジタルフィルタリング方法によって用いられ得る。
第5の態様によると、本発明は、コンピュータで実行されたときに、そのような第2の態様によるオーディオ圧縮方法を実行するため、または、そのような第4の態様によるデジタルフィルタリング方法もしくは第4の態様の任意の実装形態を実行するためのプログラムコードを含むコンピュータプログラムに関する。したがって、方法は、自動的で反復可能な方法で適用され得る。
コンピュータプログラムは、機械可読のプログラムコードの形態で提供され得る。プログラムコードは、コンピュータのプロセッサに対する一連のコマンドを含むことができる。コンピュータのプロセッサは、プログラムコードを実行するように構成され得る。
本発明は、ハードウェアおよび/またはソフトウェアにおいて実装され得る。
本発明の他の実施形態について、以下の図に関して記述する。
実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮システムを示す図である。 実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮方法を示す図である。 実装形態によりオーディオ信号をフィルタするためのデジタルフィルタを示す図である。 実装形態によりオーディオ信号をフィルタするためのデジタルフィルタリング方法を示す図である。 実装形態により高ダイナミックレンジのオーディオ信号および圧縮されたオーディオ信号を示す図である。 実装形態によるダイナミックレンジ圧縮の原理を示す図である。 実装形態による指数関数型減衰を使用する時間的な平滑化を示す図である。 実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮システムを示す図である。 実装形態による異なる等ラウドネス曲線を示す図である。 実装形態によりオーディオ信号をフィルタするためのデジタルフィルタを示す図である。 実装形態による人間の耳のラウドネスに対する感度をモデル化するために使用されるデジタルフィルタの周波数レスポンスを示す図である。 実装形態により入力オーディオ信号を圧縮するためのコンプレッサを示す図である。 実装形態による等化フィルタの周波数レスポンスを示す図である。 実装形態による入力オーディオ信号に対するオーディオ圧縮システムの効果を示す図である。 実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮システムを示す図である。 実装形態により入力オーディオ信号を圧縮するためのコンプレッサを示す図である。 実装形態によりオーディオ信号をフィルタするためのデジタルフィルタを示す図である。
同じ引用符号は、同様または同等な機能を指している。
図1は、実装形態による入力オーディオ信号を圧縮するためのオーディオ圧縮システム100を示す図である。
オーディオ圧縮システム100は、フィルタされたオーディオ信号を取得するために入力オーディオ信号をフィルタするためのデジタルフィルタ101であって、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は人間の耳の等ラウドネス曲線によって形成される、デジタルフィルタ101と、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて入力オーディオ信号を圧縮するように構成されているコンプレッサ103とを含む。
入力オーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。入力オーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
デジタルフィルタ101は、有限インパルス応答(FIR)フィルタまたは無限インパルス応答(IIR)フィルタとして実装され得る。デジタルフィルタ101のフィルタリング特性は、周波数伝達関数を使用して、周波数領域において決定され得る。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
フィルタされたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。フィルタされたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
コンプレッサ103は、デジタルコンプレッサの場合がある。コンプレッサ103は、圧縮されたオーディオ信号を取得するために、入力オーディオ信号をフィルタされたオーディオ信号と組み合わせるように構成され得る。
圧縮されたオーディオ信号は、サンプリングおよび/または量子化されたオーディオ信号の場合がある。圧縮されたオーディオ信号は、モノラルオーディオ信号、ステレオオーディオ信号、またはマルチチャネルオーディオ信号を含むことができる。
図2は、実装形態による入力オーディオ信号を圧縮するためのオーディオ圧縮方法200を示す図である。
オーディオ圧縮方法200は、フィルタされたオーディオ信号を取得するために、デジタルフィルタによって入力オーディオ信号をフィルタするステップ201であって、デジタルフィルタは、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は人間の耳の等ラウドネス曲線によって形成される、ステップ201と、圧縮されたオーディオ信号を取得するために、フィルタされたオーディオ信号に基づいて入力オーディオ信号を圧縮するステップ203とを含む。
オーディオ圧縮方法200は、図1のオーディオ圧縮システム100によって実行され得る。オーディオ圧縮方法200の他の特徴は、図1のオーディオ圧縮システム100の機能から直接的に生じ得る。
図3は、実装形態によりオーディオ信号をフィルタするためのデジタルフィルタ101の図を示している。
デジタルフィルタ101は、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は、人間の耳の等ラウドネス曲線によって形成されている。
人間の耳の等ラウドネス曲線は、人間が、純音かつ/または安定した音を使用して一定のラウドネスを認知する周波数を通じた音圧曲線に関係する場合がある。人間の耳の等ラウドネス曲線は、ISO226:2003による等ラウドネス曲線の場合がある。
図4は、実装形態によるオーディオ信号をフィルタするためのデジタルフィルタリング方法400を示す図である。
デジタルフィルタリング方法400は、デジタルフィルタによってオーディオ信号をフィルタするステップ401を含み、デジタルフィルタは、周波数を通じて振幅を持つ周波数伝達関数を含み、振幅は、人間の耳の等ラウドネス曲線によって形成されている。
デジタルフィルタリング方法400は、図3のデジタルフィルタ101によって実行され得る。デジタルフィルタリング方法400の他の機能は、図3のデジタルフィルタ101の機能から直接的に得られ得る。
図5は、実装形態による、高ダイナミックレンジオーディオ信号および圧縮されたオーディオ信号の図を示している。左側において、ピーク振幅1のオリジナルの高ダイナミックレンジオーディオ信号が描写されている。右側において、ピーク振幅1だが縮小されたダイナミックレンジの圧縮されたオーディオ信号が描写されている。
タブレットまたはスマートフォンなどのモバイルデバイスは、典型的には、小型で低品質のマイクロスピーカおよび低出力の増幅器を装備している。その結果、そのようなデバイスの電気音響システムによって再生され得る音の品質は制限され得る。特に、作られ得る最大音圧レベルは制限され得る。この結果として、より高いレベルおよび制限されたダイナミックレンジの信号歪みが生じる可能性がある。
さらに、そのようなデバイスは、多くの場合、高い出力レベルが要求される可能性がある騒々しい環境において音を再生するために使用される。さらに、スピーカ間の短い距離を補償するためにステレオ拡張(stereo widening)などの他の処理のために、最大出力レベルがさらに下がる可能性がある。
この問題の解決策の1つとして、より高品質のスピーカおよびより高い出力を備えた増幅器の統合があり得る。しかしながら、これには、小さなモバイルデバイスに統合できない場合があるより大きなスピーカおよびバッテリからより多くのエネルギを消費する増幅器が要求される可能性がある。したがって、そのようなモバイルデバイスによって作られた音響信号の認知されたラウドネスを増強することができる信号処理技術に対する需要がある場合がある。オーディオ信号のダイナミックレンジ圧縮(DRC)は、ラウドネス増強のための1つの技術になり得る。DRCの目標として、電気音響システムの能力によって課された制限内にピークエネルギを維持しながら、中間信号エネルギを増加させることがあり得る。この効果を達成するために、弱い信号成分のレベルを増強することが1つの戦略であり得る。
オーディオ信号のダイナミックレンジ圧縮の効果は、図5に示されている。左の図は、典型的な音楽の実施例の信号振幅を示している。定期的に発生する高振幅ピークは、典型的には、ドラムの打撃に対応する。信号は、電気音響システムによって扱われ得る最大振幅に対応し得るピーク振幅1を取得するために正規化され得る。デジタルオーディオ信号の振幅は、典型的には、間隔[-1;1]に抑制される。これらの制限を超える振幅の結果として、クリッピングが生じる場合がある。すなわち、それらはこの制限へと制限され得る。これにより高い信号歪みが生じる場合がある。このピーク振幅は、高ダイナミックレンジのオーディオ信号にまれにしか発生しない場合があるため、信号の全体的な出力レベルを限定する可能性がある。信号の大部分は、低振幅を持つ可能性がある。この信号に対して実行されたダイナミックレンジ圧縮動作の結果として、図5の右側の振幅プロットが得られる。結果として生じる信号のピーク振幅は、今までどおり1の可能性があるが、認知される平均的なラウドネスを規定することができる中間振幅は、はるかに高い可能性がある。特に、低振幅を有する成分は、大きく増強され得る。低エネルギ成分と高エネルギ成分の比率として規定され得るダイナミックレンジは、縮小することができる。
図6は、実装形態によるダイナミックレンジ圧縮原理の図を示している。ピーク振幅検出に基づく静的な圧縮カーブを使用するダイナミックレンジ圧縮の基本原理が示されている。圧縮なしの場合については、実線で示されている。-15dBの圧縮しきい値および3:1の圧縮比を使用する圧縮の場合は、破線で示されている。
入力信号のxと圧縮された信号χcの間の伝達関数は、以下の振る舞いを示す場合がある。入力信号xのレベルがdBで指定された所与のしきい値Tを下回る場合、それは修正されないことがある。圧縮された信号χcは、xと同一である場合がある。入力信号xのレベルがしきい値Tを超える場合、χcは、所与の圧縮比Rだけ低減される場合がある。圧縮比は、入力信号のレベル変更を出力信号のレベル変更に関連付けることができる。この実施例では、R=3の圧縮比は、入力信号において3dBだけしきい値Tを超えるレベルは、出力信号においてしきい値を1dBのみ上回るレベルに減らされる場合があることを示すことができる。その結果、
Figure 2017506038
は、時間変化利得g(t)により、入力信号のレベルPxと比較して下がる場合がある。
等式1は、以下のように与えられ得る。
Figure 2017506038
これは、ダイナミックレンジ圧縮の基本原理であり得る。DRCは、音楽の録音および生産において重要なテーマになり得るため、アナログ領域においてさえ、多くの異なる実装および拡張が適用され得る。特に、図6に示す区分的線形圧縮カーブは、たとえば、屈曲部(knee)を伴う柔軟な圧縮カーブ、またはシグモイドなど飽和する圧縮カーブと取り替えられ得る。
図7は、実装形態により指数関数型減衰を使用する時間的な平滑化の図を示している。指数関数型減衰を使用する時間的な平滑化は、アタックおよび/または減衰の時間をモデル化するのに用いられ得る。実線は、Pxを示している。破線は、30msのアタックフィルタ時間定数および150msのリリースフィルタ時間定数を使用するPsを示している。
出力信号のレベルが迅速に変化しすぎる可能性があるので、時間的な平滑化なしで、ダイナミックレンジ圧縮は多くのアーティファクトを導入できる。出力信号は、入力信号の特性に似ていない場合がある。DRCの可聴アーティファクトを低減するために、圧縮利得は、ゆっくり変化している可能性がある。
この効果を達成する手法として、図7に示されるようにアタックおよびリリースの時間に対する指数関数型減衰を追加することによって、ピーク振幅の検出を平滑化することがあり得る。アタック、インデックスA、およびリリース、インデックスRに対して異なる時間定数τA、τRを指定することで、音響イベントの異なる状態において平滑作用を制御することを可能にすることができる。アタックは、信号レベルにおける増加に付随するイベントの開始を表すことができる。リリースは、典型的により遅いこのイベントのエネルギ減衰を表すことができる。アタックおよびリリースに対する指数関数型減衰は、以下のように計算され得る。
τA、τRは、アタックおよびリリースに対して終値の63%に到達するための時間として規定され得る:
Figure 2017506038
等式2は、以下のように与えられ得る。
Figure 2017506038
次いで、Ps(t)は、Pχ(t)に代わる時間変化利得g(t)の演算のために、等式1または2で使用され得る。
たとえば、分断(decoupled)、分岐(branching)、フィードフォワード、フィードバック、サイドチェーン、バイアス、および/またはポスト利得の実装など、異なる実装が使用され得る。
時間的に平滑化するパラメータ設定は、関連する場合があり、圧縮の量とオーディオ品質、すなわちアーティファクトの間のトレードオフをなす可能性がある。特に、それらは、ドラムまたは過渡の結果として生じる振幅ピークが、どのように影響され得るかに影響する可能性がある。長いリリース時間定数の場合には、ピークまたは過渡の後に、信号は、長い間、減衰され得る可能性があり、Pyは、低減されすぎる可能性がある。短いリリース時間定数の場合には、過渡の後に信号レベルのジャンプが発生する可能性がある。長いアタック時間定数の場合には、過渡は、アタック時間より短い可能性があるため減衰されない場合があり、ピークレベルは、それまでどおり高い可能性がある。短いアタック時間定数の場合には、過渡はつぶされる(squash)場合があり、明瞭さの欠如につながり、レベルが下げられすぎる可能性があり、過渡のレベルは、過渡の直前の信号のレベルと同じ可能性がある。
異なるソリューションがDRCに対して適用され得る。DRCアルゴリズムを評価するための主な4つの基準は、音質、圧縮率、計算の複雑度、およびユーザの可制御性であり得る。高圧縮は、典型的には、低い音質につながり得るため、圧縮と品質の間にトレードオフがある可能性がある。たとえば、過渡またはアタックなど、波形のピークは、高圧縮利得を取得するために減衰され得る。この結果として、知覚できる明瞭さの欠如につながり得る。たとえば、テレビおよびラジオ放送で使用されるような高品質のダイナミックレンジ圧縮システムは、典型的には、周波数領域において、またはフルバンド信号のサブバンド分解に対して機能することができる。この結果として、高い計算の複雑度につながり得る。特にモバイルデバイスについては、計算およびエネルギのリソースは制限され得る。
パラメータ設定は、高いオーディオ品質を維持しながら、大量の圧縮を取得することに適している可能性がある。最適なパラメータ設定は、また、特定のオーディオ信号および聴取環境に依存する可能性がある。消費者デバイスのアプリケーションに対して、パラメータは、典型的には、控えめなまたは最適度が低い設定を使用して事前規定され得る。ユーザは、オンまたはオフを除いていかなる制御機構も持たない場合がある。
図8は、実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮システム100の図を示している。オーディオ圧縮システム100は、ダイナミックレンジ圧縮システムを含むことができる。
オーディオ圧縮システム100は、デジタルフィルタ101、コンプレッサ103、等化フィルタ801、およびピークリミッタ803を含む。コンプレッサ103は、圧縮利得制御805および圧縮ユニット807を含む。圧縮ユニット807は、パラメータ指定ユニット809、利得推定ユニット811、第1の乗算器813、および第2の乗算器815を含む。パラメータ指定ユニット809は、利得推定ユニット811に、圧縮しきい値、圧縮比、アタックフィルタ時間定数、およびリリースフィルタ時間定数を提供する。
多くの手法が音楽制作アプリケーションに焦点を当てている。本発明は、特にモバイル音声再生シナリオに取り組むものであり、目標は、高い音質および低い計算の複雑度、および低電力消費または低バッテリ電力消費を維持しながら、リアルタイムにスマートフォンおよび/またはタブレットなど、モバイルデバイスのスピーカによって作られる平均出力レベルを増加させることであり得る。
本発明は、図8に示すような拡張されたオーディオ圧縮システム100またはダイナミックレンジ圧縮システムに関することができる。オーディオ圧縮システム100は、人間の耳の感度の周波数特性を考慮するために人間の音知覚のモデルを含むことができる。すなわち、デジタルフィルタ101またはフィルタ等価ラウドネスモジュールである。オーディオ圧縮システム100は、信号の明瞭さを維持しながら過渡のレベルを下げるために直列化されたダイナミックレンジ圧縮システムを含むことができる。すなわち、コンプレッサ103またはピークリミッタ803もしくはピークリミッタモジュールを用いて直列化されたダイナミックレンジ圧縮モジュールである。オーディオ圧縮システム100またはシステムは、継続的な方法でユーザまたは消費者によって制御され得る圧縮利得Gに対する単一の制御パラメータを含むことができる。オーディオ圧縮システム100またはシステムは、モバイルデバイスのリアルタイムアプリケーションに対する時間領域において複雑度の低いフルバンド実装を含むことができる。
オーディオ圧縮システム100またはシステムのフローチャートを図8に描写している。入力信号のx(t)を想定すると、オーディオ圧縮システム100またはシステムは、以下のステップを実行することができる。
最初に、デジタルフィルタ101またはフィルタ等価ラウドネスモジュールが適用され得る。すなわち、ラウドネスが等価された入力信号xl(t)を取得するために、等ラウドネス曲線を用いて入力信号x(t)をフィルタすることによって、簡素化されたラウドネスモデルを適用する前処理演算である。前処理の目標は、人間の耳がそれほど感度がよくない信号の周波数を強調することであり得る。第2に、コンプレッサ103またはダイナミックレンジ圧縮モジュールが適用され得る。それは、パラメータ指定ユニット809またはパラメータ指定モジュールを含むことができる。外部的に、たとえば、ユーザが指定した望まれる圧縮利得をdBで想定すると、内部ダイナミックレンジ圧縮パラメータT、R、τA、τRは、最適な方法で調整され得る。それは、ラウドネスが等価された入力信号xl(t)から時間変化利得g(t)を推定することができる利得推定ユニット811または利得推定モジュールをさらに含むことができる。取得された圧縮は、人間の耳がそれほど感度がよくない区域に対応できる等化によって強調された区域においてより強くなる可能性がある。その結果、ダイナミックレンジ圧縮のアーティファクトは、可聴性が低くなり得、より強い圧縮が適用され得る。入力信号x(t)のダイナミックレンジ圧縮は、圧縮信号xc(t)を取得するために、信号x(t)に時間変化利得g(t)および望まれる圧縮利得Gを適用することによって実行され得る。第3に、周波数依存の圧縮に対して補正し、信号xe(t)の平坦な周波数レスポンスを再作成するために、xc(t)に等化を適用することができる等化フィルタ801または等化モジュールが任意に適用され得る。これは、また、スピーカの周波数レスポンスを考慮に入れることができる。第4に、ピークリミッタ803が任意に適用され得る。出力信号y(t)を取得するために強いアタック段階においてクリッピングを防ぐために、ピークおよび/または過渡のソフトリミッティングが適用され得る。
図9は、実装形態による異なる等ラウドネス曲線の図を示している。
耳は、すべての周波数に等しく感度がよいとはかぎらない場合がある。図9は、等しいラウドネスとして認知された音圧のレベルを示す1組の曲線として、全体的な可聴範囲を通じて異なる周波数に対する応答を示している。低周波数および高周波数に対して、音圧のレベルは、中央周波数と同じ認知されたラウドネスを取得するためにはるかに高い場合がある。曲線は、4kHzのくぼみを有する2から5kHzまでの範囲において最低の場合があり、耳は、この範囲の周波数に最も感度がよい可能性があることを示している。同じ印象のラウドネスを作成するために、より高いか、またはより低い音の強さのレベルを実質的に上げることができる。この発見は、出力信号のより高い音質を達成するために利用され得る。考え方は、人間の耳がそれほど感度がよくない周波数域においてより強いダイナミックレンジ圧縮を適用することであり得る。
図10は、実装形態によりオーディオ信号をフィルタするためのデジタルフィルタ101の図を示している。デジタルフィルタ101は、フィルタ等価ラウドネスモジュールを含むことができる。
デジタルフィルタ101は、決定ユニット1001およびフィルタリングユニット1003を含むことができる。決定ユニット1001は、フィルタパラメータ指定に使用され得て、等ラウドネス曲線は、フィルタ係数を取得するために決定ユニット1001に提供され得る。フィルタリングユニット1003は、ラウドネスが等価された信号xl(t)を取得するために、フィルタ係数に基づいて入力信号x(t)をフィルタすることができる。
ラウドネスモデルは、等ラウドネス曲線を用いてフィルタリングすることによって人間の耳の感度をモデル化するために適用され得る。これにより、人間の耳がそれほど感度がよくない周波数を増強することができ、人間の耳が非常に感度のよい周波数を減衰させることができる。
図11は、実装形態による人間の耳のラウドネス感度をモデル化するために使用されるデジタルフィルタの周波数レスポンスの図を示している。低周波数においては、増幅は制限され得て、スピーカによって再生されない場合がある。高周波数においては、増幅は制限され得て、典型的にはスピーカによって増強される。
以下の処理は、この効果を得るために使用され得る。図10を参照されたい。等ラウドネス曲線に似ているフィルタ応答を用いてフィルタリングを実行する。これにより、人間の耳がそれほど感度がよくない周波数においてレベルを増強することができ、人間の耳が非常に感度のよい周波数を減衰させることができる。次いで、続くダイナミックレンジ圧縮は、人間の耳がそれほど感度がよくない周波数域に集中され得る。すなわち、高周波数および低周波数である。その結果、圧縮アーティファクトは、可聴性が低くなる可能性がある。特に、周波数範囲2〜5kHzまたは2〜6kHzは、ダイナミックレンジ圧縮によってほとんど修正され得ない。この範囲は、音の明瞭さにとって最も重要たり得る。
図11に示すようなフィルタ応答は、等ラウドネス曲線に基づく場合があるが、複数の態様により修正され得る。マイクロスピーカの特性および能力を考慮すると、最低および最高の周波数の増幅は、上限を導入することによって制限され得る。この制限に対する動機は、小さなスピーカを使用する考慮されたアプリケーションシナリオに基づく場合がある。ここでは、最低周波数は、スピーカによって再生されない場合があり、高周波数は、典型的には、そのようなスピーカによって増幅され得る。増幅の制限は、これを考慮に入れる可能性がある。増幅の全体的な範囲、すなわちフィルタ応答の最小と最大の差は、ちょうど範囲15dBに限定され得る。図9から、単一の等ラウドネス曲線の音圧のレベルの最小値と最大値の間の差が、最大80dBに到達する可能性があることが見てとれる。ダイナミックレンジ圧縮では、しきい値Tは、典型的なアプリケーションシナリオでは、6から20dBの間の値に設定され得る。その結果、他と比較して80dBだけ特定の周波数を増幅することができる等化を適用することは、これらの周波数だけが高度に圧縮されることにつながり得る。しかしながら、他はしきい値に到達せず、したがって、全く圧縮されない場合がある。増幅の全体的な範囲を抑制することにより、異なる周波数域においてダイナミックレンジ圧縮の強度を制御することが可能になる場合がある。
図12は、実装形態により入力オーディオ信号を圧縮するためのコンプレッサ103の図を示している。コンプレッサ103は、圧縮ユニット807またはダイナミックレンジ圧縮モジュールを含むことができる。
圧縮ユニット807は、パラメータ指定ユニット809、利得推定ユニット811、第1の乗算器813、および第2の乗算器815を含む。パラメータ指定ユニット809は、利得推定ユニット811に、圧縮しきい値T、圧縮比R、アタックフィルタ時間定数およびリリースフィルタ時間定数τR、τAを提供する。ラウドネスが等価されたオーディオ信号xl(t)は、利得推定ユニット811に提供され得る。入力オーディオ信号x(t)は、第2の乗算器815に提供され得る。圧縮されたオーディオ信号xc(t)は、第2の乗算器815によって提供され得る。
次に、ダイナミックレンジ圧縮は、図12に示すように入力信号に適用され得る。ダイナミックレンジ圧縮は、一般的な記述に従うことができ、同じ表記法を使用することができる。
第1に、たとえば、ユーザによって指定された望まれる圧縮利得Gを想定すると、導入されるようなダイナミックレンジ圧縮のためのパラメータT、R、τA、τRは、以下のように導出することができる。目標は、Gのヘッドルームがxc(t)のピーク振幅と、クリッピングなしで再生され得る最大値Pmaxの間で作成されるように信号を圧縮することであり得る。
Figure 2017506038
発見は、望まれる利得Gを取得するために、RおよびTに対して異なる値が可能であることであり得る。しきい値を低下させることは、より高いGを取得することを可能にする可能性があるが、同時に、また、DRCによって影響される信号成分の量を増加させる可能性がある。圧縮比Rを増加させると、しきい値を上回る成分はより強く圧縮される可能性がある。知覚品質に関して最適であるRおよびTの値を選択することは、困難な作業の可能性がある。発見は、しきい値Tと圧縮比Rの間の特定の関係が、高品質を得るのに望ましいということである。さらに、大規模な聴取テストの結果、ほぼ
R ≒ G / (2dB)
である場合、ダイナミックレンジ圧縮の知覚品質は最適であることが明らかになった。
時間的な平滑化定数τA、τRは、高い知覚品質を取得するために重要になり得る時間的な継続性を保証するために、圧縮の量を減らすことによってDRC結果に影響する場合がある。その結果、達成される最終的な圧縮は、望まれるGより低い。平滑化がより強いほど、すなわち時間定数τA、τRが大きいほど、達成される圧縮は低くなる。最良の可能な知覚品質を得るために、時間定数に対するパラメータ値は、望まれる圧縮利得Gに依存して選択され得る。
τA≒-0.0002秒/dB・G+0.006秒
τR≒-0.0033秒/dB・G+0.12秒
知覚の聴取テストにより、時間定数とGの間の線形の依存関係が、最良の結果につながることが明らかになった。Gの値を増加させるために、時間定数は、直線的に低下させられ得る。
平滑化の結果、Ps<Pχの場合がある。したがって、望まれる圧縮利得Gが達成され得ることを保証するために、許容λ≧1の加算が望ましい場合がある。許容は、高速な過渡は、アタック減衰によって見落とされる(miss)ことがあり、高い信号のピークを生じる可能性があることを考慮に入れることができる。したがって、許容の値は、アタック時間定数により選択され得る。
λ=1.122+65・1/秒・τA
最適なパラメータ設定を導出した後に、時間変化利得g(t)は、ラウドネスが等価された信号χl(t)から推定され得る。
Figure 2017506038
最後に、利得は、望まれる圧縮利得Gを掛けるか、または増幅することができ、最後に、ラウドネスが等価された信号にではなく、オリジナルの入力信号x(t)へと増大される。オリジナルの信号は、ラウドネスモデルによってではなく、ラウドネスを修正された利得によってのみ変更されるため、これにより、最良の可能な品質を提供する。
χc(t)=χ(t)・10G/20・g(t)
図13は、実装形態による等化フィルタ、たとえば等化フィルタ801の周波数レスポンスの図を示している。
任意の後処理ステップとして、等化フィルタ801が信号に適用され得る。等化は、周波数依存のダイナミックレンジ圧縮を補償するために望まれる可能性がある。ラウドネスモデルによって拡張される周波数範囲は、より強く圧縮され得るため、ラウドネスモデルによって減衰される周波数より低いレベルを受信することができる。この手法により、ダイナミックレンジ圧縮は、人間の耳が圧縮アーティファクトにそれほど感度がよくない周波数範囲に集中され得ることを保証することができるが、平坦な周波数レスポンスを持たない出力信号が生じる可能性もある。この効果を補償するために、再び、等ラウドネス曲線の変化を有するフィルタリングが使用され得る。
図13に示すようなフィルタ応答は、利得g(t)の演算に影響を及ぼす等しいラウドネスに対する前処理フィルタから生じる非線形の圧縮を補償するために調整され得る。利得g(t)はラウドネスが等価された信号から導出されるが、オリジナルの入力信号に適用され得るので、圧縮された信号は、典型的には、平坦な周波数レスポンスを持たない場合がある。特に、低周波数および高周波数は減衰され得る。図13に示すフィルタ応答は、しきい値T=12dBおよび2:1の比率を使用する例示的な圧縮の場合には、この効果を補償するために設計され得て、結果として6dBの圧縮利得Gが得られる。この場合、低周波数および高周波数は、平坦な周波数レスポンスを達成するために、約2dBだけ増幅され得る。Gの異なる値については、応答は直線的に変動させられ得る。
等化は、周波数依存のダイナミックレンジ圧縮を補償するために望ましい可能性がある。等ラウドネス曲線の変化を有するフィルタリングが使用され得る。潜在的に、等化は、圧縮利得に依存している。また、ターゲット出力デバイスは、等化を規定するために考慮され得る。
図14は、実装形態による入力オーディオ信号x(t)における、たとえばオーディオ圧縮システム100などのオーディオ圧縮システムの影響を示す図である。オーディオ圧縮システムは、ダイナミックレンジ圧縮システムを含むことができる。第1の波形は、入力信号x(t)を示し、第2の波形は、ステップ3、すなわち等化後のオーディオ信号xe(t)を示し、第3の波形は、ステップ4、つまりピークリミッティング後のオーディオ信号y(t)を示している。
最終ステップとして、ピークリミッタは、出力信号においてクリッピングを防ぐために適用され得る。クリッピングは、可能な最大値Pmaxを超える信号の振幅を表すことができる。時間定数τR、τAを用いて実行される時間的な平滑化のために、高速で強い過渡、たとえばドラムの打撃は、圧縮されない場合がある。その結果、信号レベルの迅速な変更は、高い知覚品質または信号の明瞭さを保証するために重要な側面になり得る出力信号において維持され得る。しかしながら、これらのピークは、また、望まれる圧縮利得Gが、クリッピングなしで達成され得ることを防ぐことができる。この問題の1つの簡単な解決策は、ダイナミックレンジ圧縮モジュールにおいて使用される時間定数を減少させることであり得る。しかし、これにより品質が低下する可能性がある。
最終的な処理ステップとしてピークリミッタを追加するときにクリッピングを回避しながら高音質が達成され得る。ピークリミッタは、信号の残りのピークにのみ影響するように調整され得るダイナミックレンジコンプレッサであり得る。このために、しきい値Tは、高いしきい値、たとえば、T=-1dBに設定され得て、圧縮比も、たとえば、R=60:1など高くなる可能性がある。アタックおよびリリース時間定数に対する小さな値と共に、これらの設定は、しきい値を超え、したがってクリッピングにつながるいかなるピークも、非常に大きな比率、たとえばR=60:1だけ圧縮され得ることを保証することができる。その結果、しきい値を超えるピークは、このしきい値を超えないことを保証するために、強く圧縮され得るか、またはソフトクリッピングされ得る。
圧縮ユニットまたはダイナミックレンジ圧縮モジュールによって実行される遅いダイナミックレンジ圧縮は、オーディオ信号の長期的および中期的な特性をゆっくり展開させることが、圧縮によって維持され得ること、および高速に反応するピークリミッタは、クリッピングを防ぐためだけにソフトクリッピングを実行できることを保証することができる。組み合わせると、信号品質、特に信号の明瞭さは、高圧縮利得を保証しながらも可能なかぎり維持され得る。
図14では、入力信号x(t)を等化後の圧縮された信号xe(t)だけでなく、ピークリミッティング後の最終出力信号y(t)と比較している。ダイナミックレンジ圧縮の後に、信号の中期的なレベル特性は維持され得るが、[-1;+1]の振幅値を超えるピークは、信号xe(t)のままである可能性がある。これらは、最後に、信号y(t)を取得するためにピークリミッタによってソフトクリッピングされ得る。
図15は、実装形態により入力オーディオ信号を圧縮するためのオーディオ圧縮システム100の図を示している。オーディオ圧縮システム100は、ダイナミックレンジ圧縮システムを含むことができる。
オーディオ圧縮システム100は、ラウドネスモデルを使用するデジタルフィルタ101、コンプレッサ103、等化フィルタ801、およびピークリミッタ803を含む。コンプレッサ103は、圧縮利得制御805、内部パラメータ適応のためのパラメータ指定ユニット809、およびダイナミックレンジ圧縮のための低減された圧縮ユニット1501を含む。入力オーディオ信号は、デジタルフィルタ101および低減された圧縮ユニット1501に提供され得る。出力信号は、ピークリミッタ803によって提供され得る。
簡素化されたラウドネスモデル、すなわち、デジタルフィルタ101または等ラウドネス曲線を有するフィルタの適用は、人間の耳がそれほど感度がよくない周波数を強調することができる。ダイナミックレンジ圧縮が達成され得る。ラウドネスモデルのために、圧縮は、耳がそれほど感度がよくなく、圧縮アーティファクトの可聴性が低い可能性がある区域においてより強くなる可能性がある。周波数依存の圧縮を修正し、平坦な周波数レスポンスを再作成するために等化を適用することが望ましい場合がある。強いアタック段階においてクリッピングを防ぐためにピークリミッタ803が用いられ得る。
図16は、実装形態により入力オーディオ信号を圧縮するためのコンプレッサ103の図を示している。コンプレッサ103は、圧縮ユニット807またはダイナミックレンジ圧縮モジュールを含むことができる。
圧縮ユニット807は、パラメータ指定ユニット809と、利得推定ユニット811と、結合器ユニット1601とを含む。パラメータ指定ユニット809は、利得推定ユニット811に、圧縮しきい値、圧縮比、アタックフィルタ時間定数、およびリリースフィルタ時間定数を提供する。ラウドネスが等価されたオーディオ信号は、利得推定ユニット811に提供され得る。入力オーディオ信号は、結合器ユニット1601に提供され得る。圧縮されたオーディオ信号は、結合器ユニット1601によって提供され得る。
ダイナミックレンジ圧縮が達成され得る。利得は、ラウドネスが等価された信号から推定し、オリジナルの入力信号に適用され得る。ダイナミックレンジ圧縮のパラメータ設定の簡素化が望ましい場合がある。ユーザは、継続的な方法で望まれる圧縮利得Gを指定することができる。ダイナミックレンジ圧縮のためのパラメータT、R、τA、τRが導出可能であり、DRCアルゴリズムに提供され得る。Ps<Pχである可能性があるので、許容λ≧1は、望まれる圧縮利得Gを取得するために追加され得る。
図17は、実装形態によりオーディオ信号をフィルタするためのデジタルフィルタ101の図を示している。デジタルフィルタ101は、フィルタ等価ラウドネスモジュールを含むことができる。
デジタルフィルタ101は、等ラウドネス曲線を使用する決定ユニット1001、およびフィルタリングユニット1003を含むことができる。フィルタリングユニット1003は、ラウドネスが等価されたオーディオ信号を提供するために、入力オーディオ信号をフィルタすることができる。デジタルフィルタ101は、ラウドネスモデルに基づくことができる。
本発明は、特に、制限された電気音響システム、処理能力、および電力消費を備えるモバイルデバイスのアプリケーションに対して調整され得る。より高音質が提供され得る。圧縮アーティファクトは、人間の耳の感度がより低い周波数範囲に集中され得る。低速圧縮および高速ピークリミッティングの組み合わせは、可能なかぎり、信号の低速および高速の成分の両方のオリジナルのプロパティを維持することができる。知覚の明瞭さが維持され得る。圧縮のユーザ制御可能な強度が提供され得る。望まれる圧縮利得を指定する単一の圧縮利得パラメータが用いられ得る。信号のコンテンツおよび/または聴取環境への適応は継続的に調整可能な場合がある。計算上の簡単な実装が提供され得る。周波数領域の代わりにフルバンド処理および/またはサブバンド処理が用いられ得る。周波数変換および/またはサブバンド分解が用いられ得ないため、低遅延が達成され得る。
実装形態では、本発明は、人間の耳の感度の周波数特性を考慮するための、人間の音知覚のフルバンドモデルを含むオーディオ信号の拡張されたダイナミックレンジ圧縮、ならびに、信号の明瞭さを維持しながら過渡のレベルを下げるための直列化されたダイナミックレンジ圧縮およびソフトクリッピングシステムのための方法および装置に関する。
実装形態では、本発明は、ユーザに継続的な方法で圧縮利得に対する単一の制御パラメータを制御させるユニットと、指定された圧縮利得パラメータから最適なパラメータ設定を導出する内部変換器とをさらに含む方法および装置に関する。
実装形態では、本発明は、端末および/または復号器の機能に関する。
100 オーディオ圧縮システム
101 デジタルフィルタ
103 コンプレッサ
200 オーディオ圧縮方法
801 等化フィルタ
803 ピークリミッタ
805 圧縮利得制御
807 圧縮ユニット
809 パラメータ指定ユニット
811 利得推定ユニット
813 第1の乗算器
815 第2の乗算器
1001 決定ユニット
1003 フィルタリングユニット
1501 圧縮ユニット
1601 結合器ユニット

Claims (15)

  1. 入力オーディオ信号を圧縮するためのオーディオ圧縮システム(100)であって、
    フィルタされたオーディオ信号を取得するために前記入力オーディオ信号をフィルタするためのデジタルフィルタ(101)であって、周波数を通じて振幅を持つ周波数伝達関数を含み、前記振幅は人間の耳の等ラウドネス曲線によって形成されている、デジタルフィルタ(101)と、
    圧縮されたオーディオ信号を取得するために、前記フィルタされたオーディオ信号に基づいて前記入力オーディオ信号を圧縮するように構成されているコンプレッサ(103)と
    を含む、オーディオ圧縮システム(100)。
  2. 前記デジタルフィルタ(101)は、時間領域においてフィルタされたオーディオ信号を提供するために時間領域入力オーディオ信号をフィルタする、時間領域に対する時間領域フィルタである、請求項1に記載のオーディオ圧縮システム(100)。
  3. 前記周波数伝達関数は、所定の周波数を下回るか、または上回る一定の振幅を持つ、請求項1または2に記載のオーディオ圧縮システム(100)。
  4. 前記周波数伝達関数の位相は、周波数を通じて直線的に増加または減少する、請求項1から3のいずれか一項に記載のオーディオ圧縮システム(100)。
  5. 前記周波数伝達関数の位相は、周波数を通じて一定であり、特にゼロに等しい、請求項1から3のいずれか一項に記載のオーディオ圧縮システム(100)。
  6. 前記周波数伝達関数は、フィルタ係数によって決定され、前記デジタルフィルタ(101)は、決定ユニット(1001)およびフィルタリングユニット(1003)を含み、前記決定ユニット(1001)は、少なくとも1つの等ラウドネス曲線に基づいて前記フィルタ係数を決定するように構成され、前記フィルタリングユニット(1003)は、前記決定されたフィルタ係数に基づいて前記オーディオ信号をフィルタするように構成される、請求項1から5のいずれか一項に記載のオーディオ圧縮システム(100)。
  7. 前記決定ユニット(1001)は、前記フィルタ係数を決定するために、異なる等ラウドネス曲線に関連付けられた1組のフィルタ係数から前記等ラウドネス曲線に関連付けられたフィルタ係数を選択するように構成される、請求項6に記載のオーディオ圧縮システム(100)。
  8. 前記異なる等ラウドネス曲線は、前記オーディオ信号の異なるラウドネスレベルに関連付けられ、前記決定ユニット(1001)は、前記オーディオ信号の前記ラウドネスレベルを決定するようにさらに構成され、前記決定ユニット(1001)は、前記決定されたラウドネスレベルに基づいて前記等ラウドネス曲線に関連付けられた前記フィルタ係数を選択するようにさらに構成される、請求項7に記載のオーディオ圧縮システム(100)。
  9. 前記コンプレッサ(103)は、前記フィルタされたオーディオ信号に基づいて圧縮利得信号を決定し、前記圧縮されたオーディオ信号を取得するために、前記入力オーディオ信号を前記圧縮利得信号と組み合わせるように構成される、請求項1から8のいずれか一項に記載のオーディオ圧縮システム(100)。
  10. 前記圧縮されたオーディオ信号をフィルタするための等化フィルタ(801)をさらに含み、前記等化フィルタ(801)は、周波数を通じて振幅を持つ周波数伝達関数を含み、前記振幅は人間の耳の等ラウドネス曲線によって形成されている、請求項1から9のいずれか一項に記載のオーディオ圧縮システム(100)。
  11. 時間領域において前記圧縮されたオーディオ信号の最大振幅を低減するためのピークリミッタ(803)をさらに含む、請求項1から10のいずれか一項に記載のオーディオ圧縮システム(100)。
  12. 入力オーディオ信号を圧縮するためのオーディオ圧縮方法(200)であって、
    フィルタされたオーディオ信号を取得するために、デジタルフィルタ(101)によって前記入力オーディオ信号をフィルタするステップ(201)であって、前記デジタルフィルタ(101)は、周波数を通じて振幅を持つ周波数伝達関数を含み、前記振幅は人間の耳の等ラウドネス曲線によって形成されている、ステップ(201)と、
    圧縮されたオーディオ信号を取得するために、前記フィルタされたオーディオ信号に基づいて前記入力オーディオ信号を圧縮するステップ(203)と
    を含む、オーディオ圧縮方法(200)。
  13. オーディオ信号をフィルタするためのデジタルフィルタ(101)であって、周波数を通じて振幅を持つ周波数伝達関数を含み、前記振幅は、人間の耳の等ラウドネス曲線によって形成されている、デジタルフィルタ(101)。
  14. オーディオ信号をフィルタするためのデジタルフィルタリング方法(400)であって、デジタルフィルタ(101)によって前記オーディオ信号をフィルタするステップ(401)を含み、前記デジタルフィルタ(101)は、周波数を通じて振幅を持つ周波数伝達関数を含み、前記振幅は、人間の耳の等ラウドネス曲線によって形成されている、デジタルフィルタリング方法(400)。
  15. コンピュータで実行されたときに、請求項12に記載のオーディオ圧縮方法(200)を実行するため、または請求項14に記載のデジタルフィルタリング方法(400)を実行するためのプログラムコードを含む、コンピュータプログラム。
JP2016549367A 2014-01-30 2014-01-30 オーディオ信号を圧縮するためのオーディオ圧縮システム Pending JP2017506038A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2014/051794 WO2015113601A1 (en) 2014-01-30 2014-01-30 An audio compression system for compressing an audio signal

Publications (1)

Publication Number Publication Date
JP2017506038A true JP2017506038A (ja) 2017-02-23

Family

ID=50064565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016549367A Pending JP2017506038A (ja) 2014-01-30 2014-01-30 オーディオ信号を圧縮するためのオーディオ圧縮システム

Country Status (8)

Country Link
US (1) US20160344356A1 (ja)
EP (1) EP3100353B1 (ja)
JP (1) JP2017506038A (ja)
KR (1) KR20160113224A (ja)
CN (1) CN105900335B (ja)
BR (1) BR112016017756A2 (ja)
MX (1) MX361826B (ja)
WO (1) WO2015113601A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041325A (ja) * 2017-08-28 2019-03-14 アイコム株式会社 信号処理装置、信号処理方法、および無線機器
KR20210114864A (ko) * 2020-03-10 2021-09-24 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
US11176958B2 (en) * 2017-04-28 2021-11-16 Hewlett-Packard Development Company, L.P. Loudness enhancement based on multiband range compression
DE102017216972B4 (de) 2017-09-25 2019-11-21 Carl Von Ossietzky Universität Oldenburg Verfahren und Vorrichtung zur rechnergestützten Verarbeitung von Audiosignalen
KR101942044B1 (ko) * 2018-05-25 2019-01-24 (주)유비아이사운드 다이나믹 부스트 오디오 신호 처리 장치 및 방법
US11012775B2 (en) * 2019-03-22 2021-05-18 Bose Corporation Audio system with limited array signals
JP7350973B2 (ja) * 2019-07-17 2023-09-26 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号内の特定の音声の検出に基づく歯擦音検出の適応
CN112992159B (zh) * 2021-05-17 2021-08-06 北京百瑞互联技术有限公司 一种lc3音频编解码方法、装置、设备及存储介质
KR20240098312A (ko) 2022-12-21 2024-06-28 서동민 가변 이득 증폭기를 이용한 음량 압축기

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01160207A (ja) * 1987-12-17 1989-06-23 Matsushita Electric Ind Co Ltd 音質調整装置
US4888808A (en) * 1987-03-23 1989-12-19 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
JPH0715281A (ja) * 1993-06-25 1995-01-17 Matsushita Electric Ind Co Ltd ノイズシェーピング装置
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JPH09230869A (ja) * 1996-02-23 1997-09-05 Kawai Musical Instr Mfg Co Ltd 電子楽器
JP2002504279A (ja) * 1997-06-06 2002-02-05 オーディオロジック ヒアリング システムズ エル.ピー. 連続周波数ダイナミックレンジ・オーディオ・コンプレッサ
JP2006020231A (ja) * 2004-07-05 2006-01-19 Yamaha Corp オーディオ再生装置
WO2009057488A1 (ja) * 2007-10-30 2009-05-07 Clarion Co., Ltd. 聴覚感度補正装置
US20090116664A1 (en) * 2007-11-06 2009-05-07 Microsoft Corporation Perceptually weighted digital audio level compression
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
JP2013098951A (ja) * 2011-11-07 2013-05-20 Onkyo Corp 音響再生装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5117726A (en) * 1990-11-01 1992-06-02 International Business Machines Corporation Method and apparatus for dynamic midi synthesizer filter control
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US7277767B2 (en) * 1999-12-10 2007-10-02 Srs Labs, Inc. System and method for enhanced streaming audio
EP1548940A1 (en) * 2003-12-18 2005-06-29 Harman Becker Automotive Systems GmbH Sample rate converter
US8054993B1 (en) * 2004-03-13 2011-11-08 Harman International Industries, Incorporated System for automatic compensation of low frequency audio based on human loudness perceptual models
CA2581810C (en) * 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
ATE448638T1 (de) * 2006-04-13 2009-11-15 Fraunhofer Ges Forschung Audiosignaldekorrelator
KR100810077B1 (ko) * 2006-05-26 2008-03-05 권대훈 표준 청력특성을 이용한 이퀄라이제이션 방법
DE602006003776D1 (de) * 2006-11-17 2009-01-02 Akg Acoustics Gmbh Audiokompressor
US20090086996A1 (en) * 2007-06-18 2009-04-02 Anthony Bongiovi System and method for processing audio signal
US20100318353A1 (en) * 2009-06-16 2010-12-16 Bizjak Karl M Compressor augmented array processing
US9998081B2 (en) * 2010-05-12 2018-06-12 Nokia Technologies Oy Method and apparatus for processing an audio signal based on an estimated loudness
US8284957B2 (en) * 2010-07-12 2012-10-09 Creative Technology Ltd Method and apparatus for stereo enhancement of an audio system
EP2605549B1 (en) * 2011-12-16 2019-11-13 Harman Becker Automotive Systems GmbH Digital equalizing filters with fixed phase response
US9020161B2 (en) * 2012-03-08 2015-04-28 Harman International Industries, Incorporated System for headphone equalization
US9253586B2 (en) * 2013-04-26 2016-02-02 Sony Corporation Devices, methods and computer program products for controlling loudness

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4888808A (en) * 1987-03-23 1989-12-19 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
JPH01160207A (ja) * 1987-12-17 1989-06-23 Matsushita Electric Ind Co Ltd 音質調整装置
JPH0715281A (ja) * 1993-06-25 1995-01-17 Matsushita Electric Ind Co Ltd ノイズシェーピング装置
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JPH09230869A (ja) * 1996-02-23 1997-09-05 Kawai Musical Instr Mfg Co Ltd 電子楽器
JP2002504279A (ja) * 1997-06-06 2002-02-05 オーディオロジック ヒアリング システムズ エル.ピー. 連続周波数ダイナミックレンジ・オーディオ・コンプレッサ
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
JP2006020231A (ja) * 2004-07-05 2006-01-19 Yamaha Corp オーディオ再生装置
US20100208917A1 (en) * 2007-10-30 2010-08-19 Clarion Co., Ltd. Auditory sense correction device
WO2009057488A1 (ja) * 2007-10-30 2009-05-07 Clarion Co., Ltd. 聴覚感度補正装置
US20090116664A1 (en) * 2007-11-06 2009-05-07 Microsoft Corporation Perceptually weighted digital audio level compression
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP2013098951A (ja) * 2011-11-07 2013-05-20 Onkyo Corp 音響再生装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019041325A (ja) * 2017-08-28 2019-03-14 アイコム株式会社 信号処理装置、信号処理方法、および無線機器
KR20210114864A (ko) * 2020-03-10 2021-09-24 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법
KR102491210B1 (ko) * 2020-03-10 2023-01-26 누보톤 테크놀로지 코포레이션 라우드 스피커의 주파수 응답 및 동적 범위 교정을 조합한 오디오 처리 장치 및 방법

Also Published As

Publication number Publication date
MX2016009912A (es) 2017-01-20
WO2015113601A1 (en) 2015-08-06
US20160344356A1 (en) 2016-11-24
BR112016017756A2 (pt) 2018-05-15
CN105900335B (zh) 2019-10-25
MX361826B (es) 2018-12-18
KR20160113224A (ko) 2016-09-28
CN105900335A (zh) 2016-08-24
EP3100353B1 (en) 2022-03-09
EP3100353A1 (en) 2016-12-07

Similar Documents

Publication Publication Date Title
JP6388457B2 (ja) オーディオ信号を圧縮するためのデジタルコンプレッサ
JP2017506038A (ja) オーディオ信号を圧縮するためのオーディオ圧縮システム
US9171552B1 (en) Multiple range dynamic level control
EP2798737B1 (en) Bass enhancement system
KR102473598B1 (ko) 왜곡 감지, 방지, 및 왜곡-인지 베이스 강화
US9196258B2 (en) Spectral shaping for speech intelligibility enhancement
US8868414B2 (en) Audio signal processing device with enhancement of low-pitch register of audio signal
US20230044872A1 (en) Multiband limiter modes and noise compensation methods
US9614486B1 (en) Adaptive gain control
EP3379847B1 (en) Audio device, speaker device, and audio signal processing method
JP2006324786A (ja) 音響信号処理装置およびその方法
EP2963816B1 (en) Adaptive detector and auto mode for dynamics processor
Stedman Technology review of dynamic range compression

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180814