JP4817658B2 - 音響仮想現実エンジンおよび配信された音声改善のための新技術 - Google Patents

音響仮想現実エンジンおよび配信された音声改善のための新技術 Download PDF

Info

Publication number
JP4817658B2
JP4817658B2 JP2004511932A JP2004511932A JP4817658B2 JP 4817658 B2 JP4817658 B2 JP 4817658B2 JP 2004511932 A JP2004511932 A JP 2004511932A JP 2004511932 A JP2004511932 A JP 2004511932A JP 4817658 B2 JP4817658 B2 JP 4817658B2
Authority
JP
Japan
Prior art keywords
audio signal
signal
sound
processing
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004511932A
Other languages
English (en)
Other versions
JP2005529520A (ja
Inventor
パッドク、トーマス
バーバー、ジェームス
Original Assignee
アーク・インターナショナル・ピーエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーク・インターナショナル・ピーエルシー filed Critical アーク・インターナショナル・ピーエルシー
Publication of JP2005529520A publication Critical patent/JP2005529520A/ja
Application granted granted Critical
Publication of JP4817658B2 publication Critical patent/JP4817658B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/05Application of the precedence or Haas effect, i.e. the effect of first wavefront, in order to improve sound-source localisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、帯域幅が制限された通信により配信された音楽のような、配信された音声信号改善のための新しい処理技術に関する。具体的には、あらゆるデジタル情報源から配信されたデジタル音響のリスナーに、実演感を生み出すための処理技術に関する。
関連出願の相互参照
この出願は、2002年6月5日に出願された米国仮出願番号60/386,541、発明名称「配信された音声改善のための新技術」と2003年5月20日に米国速達便(速達ラベル番号EV331871319US)にて出願された米国仮出願番号___、発明名称「音響仮想現実エンジン」に基づく優先権を主張する。
発明の技術的背景
急速なインターネットの拡大に伴い、単なるテキストベースのアプリケーションを越えて、インターネットの通信技術を用いるためのより新しいより効率の高い方法が開発されてきた。関心を集めた2つのアプリケーションは音響と映像のブロードキャスティングであった。これらのアプリケーションはともに共通の問題を抱えていた。すなわち、これらのユーティリティは、インターネットとの通信が帯域幅で制限されるとき、障害を受ける。このユーティリティは広い帯域幅を必要とするので、映像のブロードキャスティングは、限られた帯域幅での通信を行うインターネットの多数の最終ユーザ(すなわち、顧客)にとって特に問題となる。
インターネットでの音楽などの音響の配信における1つの共通的な方法は、顧客のコンピュータに音響ファイルを「ダウンロードすること」である。デジタル音響ファイルは一般に、コンパクトディスク(CD)、パーソナル・プレーヤー、またはコンピュータのハードディスク上にMPEGオーディオまたはその他のフォーマットに圧縮されてコピーされ、そこで、デジタル音響ファイルは、ストリーミング・オーディオと比較して好都合な、あるいはポータブルなリスニング環境で聴取される。
もう1つのインターネットでの音響の配信はストリーミング・オーディオである。「ストリーミング・オーディオ」とは、ダウンロードを行いながら聴取するものである。一般に、サーバは、顧客の通信と比較して非常に広い帯域幅でインターネットとの通信を行う。音楽にストリーミング・オーディオを用いて、インターネットのホスト側(すなわち「サーバ」)は音楽コンサートの実況、ディスクジョッキーにより選択された音楽、又は、記録された音楽を最終ユーザ(すなわち「顧客」)に提供する。しかし、顧客への通信におけるバンド幅のよくある制限により、ストリーミング音楽又はダウンロードされた(圧縮された)音楽は、望ましい顧客、特にDC音質の音楽に慣れた顧客の聴取体験からはかけ離れたものとなっている。
聴取体験の劣化は2つの原因に由来する。すなわち、制限された帯域幅での送信をする必要から又は保存の目的で小さくしたファイルサイズを補償するために圧縮された信号に対して起こる劣化と、顧客の劣悪な聴取環境によるものである。後者について言えば、インターネットからダウンロード中の音楽又はダウンロードされた音楽は、しばしば、顧客のコンピュータに付属するスピーカにより聴取され、一般にコンピュータが置かれたところには良い聴取環境を作るための注意が払われないからである。近年、チャンネルの帯域幅の制限に対する改善に努力が向けられているが、劣悪な聴取環境の問題についてはまだうまく解決を図る余地がある。したがって、制限された帯域幅からの通信により受信した音響信号を顧客が受け取り聴取する環境を改善する技術的な解決手段を提供することは、有利なことである。さらに、オーディオファイルを小さなファイルサイズに圧縮することからくる劣化を補償することができるシステムを提供することは有利なことである。
音楽の演奏は非常にたくさんの複雑で動的な音響ファイルから構成される。聴衆の構成員の聴取環境の定常的な変化と、音色、拍子および予想のつかない実況パーフォーマンスの強弱を伴うミュージシャンとが組み合わされてユニークで動的な音楽体験を作り出す。実況音場は、周囲音響に支えられた楽器と音声が、聴覚事象に基づく時間領域形式に合致したとき生成される。これらの要素は各々定常的に変化する。部屋の様式とノードがリスナーの位置を変化させ、音楽の動的特性が演奏者の意向を変化させ、さらにリスナーの頭の位置により刻々と体感が変化する。
デジタルレコーディングにおいてクリアな音声と単独の楽器の音を引き出すために様々な仕組みが用いられてきた。伝統的な改善技術における一般的な方法はハーモニックな変形を音響波形の高周波領域に付加することである(「エキサイタ(exciter)」)。しかしステレオ音場に人工的なひずみを与えることにより、やがてユーザに倦怠感や不快感を与える。「エキサイタ」型の処理に基づく改善技術は、しばしば高周波での調波を強調しすぎることにより細くなった音を補償するためにバスブーストを必要とする。
テレビジョンやカーステレオにおけるステレオ波形をより明瞭にするための他のやり方は、中間領域に時間遅れ回路を付加するとともに、低周波領域に時間遅れ回路を付加することである。このとき、両方の時間遅れ回路は高周波領域に対して固定の時間遅れポイントに固定される。この回路の目的は音響的な再現性を高めるためではなくスピーカを正常に働かせるためであり、増幅され音響的に伝送された音響波形における周波数に依存する位相のずれを生じさせるスピーカ回路のインピーダンスを補償することを意図している。このデザインにおいては、「テスト調整」レベル制御としてユーザによりあらかじめ設定され、それとともに、中・低周波数帯域幅の時間遅れ値のRMS合計値を計算した後に比率が動的に調整されるVCA制御電圧により高周波レベルを調整する。層状フェーズシフト技術は高周波調波を強調し、全体ミキシングの調波に高周波の「エッジ(edge)」を付加するものであるが、単独の楽曲や音声に深みと豊かさを与える第1の基本周波数をマスクしリスナーにこれを識別する能力を減らしてしまい、空虚で現実感のないものとしてしまうことがある。このスピーカ修正法の他の問題は、これはすべての変換形式に有用なものではなく、中・低周波数帯域幅の時間遅れのずれを公開し、この処理による時間修正回路に適合する形式の変換にのみ有用であることである。
ミキシングの明瞭さを改善させるために用いられる他のアプローチは、高周波レンジと比較して定型的な時間遅れポイントに、低周波数レンジの時間遅れ回路を付加することである。層状フェーズシフト技術は高周波調波を強調し、全体ミキシングに高周波の「エッジ(edge)」を付加するものであるが、単独の楽曲や音声に深みと豊かさを与える第1の基本周波数をマスクしリスナーにこれを識別する能力を減らしてしまい、空虚で現実感のないものとしてしまう。フェーズシフト技術の効果は、バスブースと回路の補償と結合したときの、高音域と低音域で単独の楽曲および音声基本周波数を強調しない「ラウドネスカーブ(loudness curve)」効果である。
圧縮装置および電圧制御増幅器(VCAs)は、信号のRMS値に基づくもとの音響に適用するひずみ量又はフェーズシフトされた素材の調整を行うためのさらに洗練されたバージョンの高周波ブースト回路に適用される。
ステレオミキシングにトラックを加算するのに先立ち各トラックに特別の効果を加えることは有用ではあるが、高周波ブースト(「エキサイタ」)処理は、職業的な品質の単独の楽曲や音声の基本周波数、及び、ステレオ音場の全体的なバランスに対して有害である。音楽波形の付加的な圧縮又はダウンサンプリング(downsampling)により、ひずみやフェーズシフトが信号強度の減少にあらかじめ付加されるとき、全く予期せぬ悪影響が現れることがある。音強度曲線を組み立てることは、低い聴取レベルにおいては効果的であるが、中程度又は高い聴取音量では、音響に耳障りでとげとげした音が混じり、リスナーに倦怠感と不満足感を与える。
したがって、これまでの方法で引き起こされる副作用なしにデジタル録音又は他の音源からのデジタル情報を、ユーザが正確に聴取するような実況パーフォーマンス感覚を正確に創り出す技術的信号処理方法が望まれる。
本出願により、改善された音響信号処理方法とシステムが開示される。開示される方法/システムは、圧縮される、及び/又は、圧縮された音響信号の音質を改善させるために用いられる。本システムは、音響信号の提供において異なった機能を実行する可変デジタル信号処理(DSPs)の配列を用いる。一実施の形態によれば、本方法/システムは、音響信号が小さなフォーマットに圧縮される前に、音響信号を「リップ(rip)」するために用いることができる。上述のとおり、音響信号の圧縮は制限された帯域幅のネットワーク接続を用いて信号を伝送するために必要となるかもしれない。圧縮はまた、ディスケット、CDロム、フラッシュメモリ、及び磁気ドライブのような限られた保存スペースを持つ媒体に音響信号の複製を保存するために必要となるかもしれない。本方法/システムの他の実施の形態では、伸張した後の音響信号の改善に用いられる。例えば、本方法/システムは、音響信号がストリーミング受信器により伸張した後の音響信号の改善のために顧客が用意したストリーミング媒体受信器とともに用いてもよい。他の例では、本方法/システムは、制限された保存媒体から音響信号を読み出し伸張したときに音響信号を改善する。好ましい実施の形態においては、開示された方法/システムは音響ストリームの圧縮及び伸張の両端において用いられる。しかしながら、開示された方法/システムをもっぱら音響ストリームの圧縮又は伸張の一方の端に用いることは十分検討した。
本方法/システムの上流側(すなわち、圧縮端)での応用は、実時間より速いスピードでオーディオ信号を処理する「リッピング(ripping)」プログラムとなる。この「リッピング」プログラムは、電子的なオーディオ信号を圧縮し記録装置に保存する前にオーディオ信号ファイルを改善するために有用である。この「リッピング」プログラムが実時間より速い速度で動作するので、ファイルを圧縮するのに必要な時間が大幅に短縮する。本方法/システムの上流側での実施形態により、インターネットのような帯域幅が制限されたネットワークを利用して伝送する前にオーディオ信号を改善することができる。この実施の形態によれば、本方法/システムは、ネットワークを介して伝送される前の圧縮により発生したひずみを補償する。他の応用例は、公開された本方法/システムの下流側(すなわち、伸張端)での実施の形態である。下流側での実施の形態は、記録媒体から読み出され伸張されたオーディオ信号を改善するために用いられる。下流側での実施の形態は、ストリーミング・オーディオ信号を受信器で受信したときにこのオーディオ信号を改善するためにも用いられる。公開された本方法/システムは、実際の速度より速い速度で動作することができるので、時間遅れの影響を最小にしてオーディオ信号の伸張を効果的に改善することができる。
本出願に開示された発明によれば、動的に適応するタイプの処理により、FSM(フラット・スペクトラ・モデリング(Flat Spectra Modeling))による音響的雰囲気モデリング技術を用いて元の実際の音楽パーフォーマンスに忠実な信頼性のある実況音場が作られる。ここに記載された処理技術は、音響が「実際の」レコーディングであろうと機械的に生成されたもの(例えばコンピュータ・ゲーム・サウンドトラック又は音響効果)であろうと、デジタル音楽レコーディング、音響効果、サウンドトラック、又はどんなデジタル音源の再生にも用いることができる。実況音楽は、予測できない、生き生きした動的で絶え間なく変化する活気をエミュレートする。動的に適応するタイプの処理は、デジタル音響の修復を行うために均衡の取れた生き物のようなアプローチである。ここに記載されたレコーディング環境模擬技術と結合することで、時間領域と周波数領域とで同時に音響波形が分析されて修正され、実況パーフォーマンスの予測モデルに基づき音楽の演奏が生成される。人工的に生成された又は「効果音の(「foley」)音場 ― 映画のサウンドトラックに見られるような ― 又はゲームに見られるような合成サウンドトラックとともに用いられるとき、この技術の使用は今まで実現されなかった写実主義の新しい様相を付加する。
公開された技術は、動的な激しさと全体的な音楽的写実主義と明瞭さを、広帯域幅の動的に適応するタイプの処理とフラット・スペクトラ・モデリングとの結合を通して、波形全体に付加する環境から生み出される信用できる音響仮想現実を創造する。これは、完成された32ビット及び64ビットの音響仮想現実エンジンの実現を通して達成される。ここでは対話ははっきりと表現され、空間は創造され操られ、ユーザは声と音の環境特性を簡単かつ完全に制御する。各楽器と音声に焦点が当てられて、各音楽の音色に基づく主要な要素となる基本周波数でさえも明瞭にされる。本発明にかかる動的に適応するタイプの処理におけるアプローチでは、とげとげしい過度なあるいは単なる調波の中心を付加することはない。本発明は全音場で明瞭さと「活力」とを再活性化する。鮮明度と中心点は、必要以上のあるいは不自然な調波の強調をどんな帯域においても行うことなく、すべての帯域幅で保持される。
動的に適応するタイプの処理とレコーディング環境シミュレーション技術は、2つの中心技術、すなわち、時を違えずに並んだいくつかのフィルターされた帯域幅と1つのフィルターされない帯域とを用いた音響波形の複数の経路と、壁のシミュレータと部屋のシミュレータとの相関性を必要とする。音響の波形は時間領域と周波数領域とで同時に分析されて修正され、そしてこれらの中心的な処理における処理パラメータを設定することにより、音響的表現における実況パーフォーマンスのあらかじめ予想できるモデルが生成される。
動的に適応するタイプの処理は、予測できない、生き生きした動的で絶え間なく変化する実況音響をエミュレートするために時間ビートを生成する。これは、時を違えずに並んではいるが音響特性の異なった多数のフィルターされた帯域又は音響経路及び1つのフィルターされていない帯域又は音響経路を用いて、達成される。音響特性におけるこれらの相違は、多数のフィルターされた帯域及び1つのフィルターされていない帯域の各々に異なった圧縮パラメータ(例えば、アタック、リリース、ゲインレシオ、及びターゲットレベル)を1つの開示された実施形態において導入される。例えば、フィルターされていない帯域に適用される圧縮は、中音域の帯域の圧縮が、スコアリング・ステージのようなもっと生き生きした環境から発せられる音響をシミュレートするために設定されるのに対して、サラウンド環境のない状態のステージから発せられる音響をシミュレートするような音響を提供するために設定される。このような違いにより、これらの違った経路からの出力音響で生成される時間ビートが生じ、これによりリスナーにさらに生き生きとしたあるいは動的なパーフォーマンスを与える。この時間ビートは、時間経路間での時間遅れを用いずに生成させることが好ましい。
公開された実施の形態における他の特徴は、音響に「尾部(tail)」を与える動的適応タイプでの処理にしたがって、壁、及び/又は、部屋効果を用いることである。壁/部屋は、音響に、早い、及び中間の、及び遅い反響成分を音響に与える処理に影響を与え、これにより仮想的な外郭又は演奏の周りの囲い面を創る。この外郭又は囲い面は創り出したい環境にしたがって様々に変化させることができる。
部屋ブロック(遅い反響)と結びついた壁ブロック(早い反響)と結びついたときの動的に適応するタイプによる処理により、音響環境のような比較的静的なシステム(音響波の衝突に起因する不調和と共に)と一緒になって音楽演奏のような乱雑なイベントのシミュレートすることができる。(壁及び部屋からの反響を通して)あらかじめ予想できる環境に(動的適応タイプの処理を通して)あらかじめ予想できないイベントを結合させることは独自なものであり、リスナーに実況音楽体験に類似した感覚を提供する。したがって、公開された技術は、デジタルレコーディングされた音楽、映画やゲームのサウンドトラック、又は他の音源を聞くユーザに実況パーフォーマンスの感触を創り出す。
実況イベントを適切にシミュレートする処理において信頼性を上げる他の要素は、リスニングレベル、リスニング空間のインパルス応答、及びリスニング空間とリスナーが使う変換器に関する時間情報と周波数情報に関する全体的な処理情報を与える、ユーザのリスニング環境についての特性を決定するための(マイクやスピーカなどの)機構を付加することである。この情報は、開示された実施形態の適切な操作に対して任意的なものであるが、システムの調整に用いることができる。
制限された帯域幅での伝送システム又は圧縮されたデジタルファイルを解してユーザに配信されたサウンドの質を改善させるための技術をここに開示する。開示されるのはとりわけ、CDやポータブルプレーヤーやセットトップボックスなどのようなクライアント・デバイスにインターネット又は他の方法でストリーム又はダウンロードとして配信され、周囲のノイズ又は他の貧弱な音響条件の下での限られた忠実度を持ったコンピュータベースのサウンドシステムにより演奏されるようなサウンド・ファイルの、クライアント側での質の改善技術である。開示されるのはまた、オーディオ信号を制限された帯域幅を使用してブロードキャストすることができるように実時間より速い速度でオーディオ信号を圧縮する技術である。他の実施の形態には、ストリーミング・メディア受信器または電子オーディオファイルプレーヤー(すなわち、MP3プレーヤー)のような、オーディオ信号を伸張した後でオーディオ信号の質を改善するクライアントベースのアプリケーションが含まれる。したがって、ここで開示された方法/システムは以下のアプリケーションに用いることができる。
・実時間より速い速度で動作するサーバ側の「リッパー」
・プレ・リップしたサウンド・ファイルを必要としない、クライアント側の音質改善装置
・オーディオ信号の質を実時間で改善させるブロードキャスト・サーバー
・オーディオ信号の質を実時間で改善させる受信クライアント
・音の質と明瞭さをさらに改善させるためにクライアント側で圧縮ファイルが後でデコードされる、サーバ側の「リッパー」
・オーディオ信号が圧縮される前にサーバ側で音質を改善させ、さらに、伸張した後にクライアント側で音質を改善させるクライアント―サーバ構成
図1は、好ましい実施の形態による、圧縮したオーディオデータの質を改善させる先進的な技術のフローダイアグラムである。ステップ102において、オーディオデータはデジタル的にフォーマットされた信号としてコード化される。ここで、デジタル信号もまたこれに続く伝送の準備のために圧縮してよい。いったんデジタルフォーマットになると、ステップ104で、続く伝送時に失われたり壊れたりする周波数や活力を強調する様々な処理技術を用いてコード化されたオーディオ信号を改善させることができる。その後、ステップ106で、この音質を改善させたオーディオ信号が、狭いあるいは中程度の帯域幅の通信によりインターネットのようなネットワークに伝送される。クライアント側に到達した後は、ステップ108で、伝送されたオーディオ信号がデコードされる(必要なら、さらに伸張される)。最後に、ステップ110で、ここでは、デコードされたオーディオ信号が、伝送時に失われたり壊れたりする周波数や活力を改善させる処理の対象となる。
図2Aは、好ましい実施の形態による、ネットワークのサーバ側(すなわち、ホスト・サイト)で質を改善させる処理を示す。ホスト・サイト210では、例えば保存されたファイルや実況伝送された音源202から音楽が選択される。この音源202とオーディオ・コーディック204とを仲介するのは音質改善処理要素212である。音質改善処理要素212は、オーディオ信号を伝送するオーディオ・コーディック204によりコード化されるに先立って、オーディオ信号の音質を改善させる。音質改善処理は、既知の、及び/又は、類似のリスニング環境で、ストリーミング・サーバ206がクライアントにブロードキャストしているときに有益である。ブロードキャストされた音楽のタイプが既知のタイプ、又は決められたタイプ、又は常に類似のタイプであるとき有益である。なぜなら音質改善処理は、特定の種類の音楽にもっとも効果があるような方法で調整することができるからである。
オーディオ・コーディック204の伝送により、クライアントのインターネット通信の帯域幅に適合するように音楽をフォーマットし圧縮するエンコーダを介して音楽の処理(すなわち、コーディック・ペアの半分の伝送)が行われる。
ここで説明に使われているコーディックとは、オーディオのデータ圧縮機能(エンコーダ)及びオーディオ/データの伸張機能である。データ圧縮/伸張コーディックはまた「圧伸器(compander)」としても知られている。ここでの開示では、「データ圧縮」は、データファイルのサイズを縮減するすべての処理を言い、「サウンドレベル圧縮」とは、オーディオ信号のダイナミックレンジを縮減するすべての処理を言う。普通に用いられるコーディックは、ソニー8トラック、ドルビーAC3、及びWMA(UP3)である。
オーディオ・コーディック204の伝送を適用した後、ストリーミング・サーバ206はデータ圧縮されフォーマットされた音楽データを、インターネットへの出力接続端214を介して指定されたアドレスへ伝送する。この説明は、本来ストリーミングと音楽の質の改善についてのものであるが、同様にどんなオーディオ又はオーディオ/ビデオ材料にも適用できる。さらに、このシステムと技術は、例えばリアルオーディオ、MP3、及びウインドウズメディアを含む様々な音楽伝達プロトコールとともに用いることができる。
ここでは、「リアルタイム」とは、サーバが音楽をオーディオ・コーディック内で処理しているのと同時に実質的にリスニング・クライアントが音楽を聴くことを意味する。接続端から「リアルタイム」と考えるべきスピーカへは時間遅れがあるかもしれないが、音源での音の流れ同士と、クライアントが聞いているスピーカとスピーカで順番に連続する音楽の断片の順序とですべての音の断片に実質的なバッファを持たないことが好ましい。圧縮比はリアルタイム・ストリーミングに用いられる圧縮比より小さいかもしれないが、ダウンロードされたファイルはすべて保存され遅れ時間を持って演奏され、そしてストリーミング・ファイルと同じ方法で圧縮されることが好ましい。
図2Bは、他の好ましい実施の形態による、ネットワークのクライアント側での、質を改善させた処理(すなわち、「デコーダ・サイドの質改善」)を示すブロックダイアグラムである。このタイプの質改善処理はリスニング環境及び/又は音楽形式が多岐にわたるような条件で有益である。狭いか中間の帯域幅での接続端222であっても、質の工場がなされ、コード化された信号はクライアント・サイト230に届く。特に、信号222は、パーソナルコンピュータ244又は他の適切なプラットフォームに提供される。好ましい実施の形態において、パーソナルコンピュータ244にはモデム242、及び、受信したオーディオ・コーディック246と音質改善処理要素252とスピーカ・ドライバ248とスピーカ250とに結び付いたプロセッサが含まれる。サーバ・サイト210で提供される音質改善処理要素212と同様に、信号が受信器のオーディオ・コーディック244でデコードされた後に、音質改善処理要素252がデコードされた信号の音質改善に供されることが好ましい。
クライアントの受信コーディック246のプロセッサは、CPU244と結びつき、おおむねサーバの伝送オーディオ・コーディック244の逆変換を行う。具体的には受信コーディック246はデータ・ストリームを直ちに利用可能な音楽フォーマットに変換し、音楽を可能な限り音源202での元の音質に近づけて保存するために復元する。受信オーディオ・コーディック244での処理は、CPU244でのソフトウエアとして処理することもできるし、付加したサウンドカードを用いてハードウエアで処理することもできる。スピーカ・ドライバ248もサウンドカード又は組み込まれたソフトウエア内に見出すことができる。一般的なクライアントのリスニング環境におけるスピーカ250は、貧弱な音質から中間的な音質までの中音域のドライバにより成り立っていて、ウーハ及び/又はサブウーハが含まれることもある。クライアントとコンピュータのあるクライアント・サイト230は最小限のリスニング環境である。クライアント・サーバはそこから出てくる共鳴や周囲ノイズのようなスペクトル応答により認知されるサウンドの音質にかなりの影響を与えるからである。
伝送オーディオ・コーディック204及び受信オーディオ・コーディック246は、両者間の通信における帯域幅の制限が与えられて、実質的に入力信号に相似する出力を出すよう設計される。これらのコーディック(204、246)におけるデータ圧縮処理は、予期せぬアーティファクトや歪みをもたらすことがある。これらの圧縮処理は必ずしも以下に記載する先進的な技術により変化が加えられるわけではない。
図2B(及び図3)の構成において、音質改善処理要素252はプロセッサに組み込まれたソフトウエアであることが好ましい。しかし他の構成も別の実施形態として考えることができる。例えば、その場所又はそこに接続された装置の特別なデジタル信号処理装置で処理を行ってもよい。
図3は、他の好ましい実施の形態による、ネットワークのクライアント側での、音質を改善させる処理を示すブロックダイアグラムである。図2Bに描かれた実施形態と異なり、図3に描かれた実施形態ではクライアント・サイト300にマイクロフォン302が含まれる。マイクロフォン302はカップリング306を介して音質改善処理要素252に接続され要素にフィードバック信号を送る。このフィードバック信号に基づき、音質改善処理要素252はスピーカ・ドライバ248の付加的な制御を行うことができる。
いくつかの改善及びテクニックが用いられ、控え目又は普通の電力のみを用いて並外れた処理効率が可能となる。このテクニックの1つは、強い入力リミッタの必要性を未然に防ぎ、切捨てエラーによるノイズを減らし、システムの広いダイナミックレンジを生み出すために拡張したビット深度を用いた音楽処理を行うことである。
あらゆる処理(例えば、信号のミキシング、イコライジング、圧縮、等)が元のデジタルデータを修正する程度は、データのビット分解能に反比例して変化する。説明のために、データ処理における64ビットのサウンド・サンプルを用いる技術について以下に記述する。しかしながら、8ビット、16ビット、及び32ビットのような他のサンプリングサイズを用いることができるように考慮してある。
図4は、好ましい実施の形態による、オーディオ信号の音質を改善させる処理機能を示すブロックダイアグラムである。図4において、オーディオ信号405はアーティフィッシアル・インテリジェンス(AI)ダイナミクス圧縮装置410に送られる。AIダイナミクス圧縮装置410は、入力したオーディオ信号405のダイナミックレンジを所望のレンジに改善するために、信号ライン412を経由してAIダイナミクス伸張装置415と直列に動作する。これらの2つの処理装置410,415は信号の全体としてのダイナミックレンジを広げる。AIダイナミクス圧縮装置410により処理された後、オーディオ信号は並列におかれた二つの要素、すなわち高周波アーティファクト・マスキング処理装置420とクラリティ処理装置(中間音域)425により処理される。調節可能なフィルターと可変時間遅れ回路からなる高周波アーティファクト・マスキング処理装置420は、入力オーディオ信号からの不快なアーティファクトや不快なサウンドをマスクする効果を生み出す。同じく調節可能なフィルターと可変時間遅れ回路からなるクラリティ処理装置425は、入力オーディオ信号の不快な中間音域の周波数に対して再編成を行う効果を生み出す。これらの二つの要素によって処理された後、オーディオ信号は、ミキサー427により結合され3D/ライブ音質改善装置430に入力する。3D/ライブ音質改善装置430は、オーディオ信号の音場に奥行きと活力を与える。3D/ライブ音質改善装置430は、現れる信号処理の広がりを決定するために、3次元模型を用いる。オーディオ信号は、3D/ライブ音質改善装置430により処理された後、オーディオ信号に拡散、残響、深み、再生、及び部屋減衰を与えるレコーディング環境シミュレータ435により処理される。レコーディング環境シミュレータ435は、仮想レコーディングルームに反響モードとノードを与えないで、これらの効果を達成する。レコーディング環境シミュレータ435により処理された後、オーディオ信号は、オーディオ信号から音声トラックを効果的に除去する音声除去装置440により処理される。ほとんどの音声トラックは中央にあり全体オーディオ信号の中で比較的無味乾燥であることから、この機能を実行することができる。音声信号を除去した後、オーディオ信号は、オーディオ信号の音場により広いステレオの奥行きを付加する、広域ステレオ音質改善装置445により処理される。この点で、オーディオ信号は、全ダイナミックレンジのオーディオ信号を確かに復活させるための人工知能アルゴリズムを用いて処理するAIダイナミクス伸張装置415に入力する。AIダイナミクス伸張装置415により処理された後、オーディオ信号は、信号を最適なゲインで実行されるまでレベル(すなわち、ボリューム)を調整するAIフェーダー及び歪み検出処理装置450により処理される。満足できる信号レベルを連続してリスナーに提供できるようにオーディオ信号のゲインをダイナミックに調整するために、AIフェーダー及び歪み検出処理装置450をなじませる。この点にて、処理されたオーディオ信号455を、個人が信号を聞くことができるように1つのドライバ又は1組のドライバに送ってもよい。
図5は、好ましい実施の形態による、制限された帯域幅の音楽のクライアント側での音質の改善に関係する処理機能を示すブロックダイアグラムである。図5には1チャンネルの処理しか示されていないが、複数処理チャンネルもこのように用いられる。さらに、以下に説明するデコード処理及び音質改善処理はプロセッサ上で走るソフトウエアルーチンであることが好ましい。それゆえ、信号経路の意味も1つのルーチンから他のルーチンにデータを送る一般的なプログラム技術を意味する。したがって、好ましい実施の形態と整合が取れた形態において、信号の経路は物理的な接続を意味するものではない。しかし、個別の接続路も他の実施の形態として用いてもよい。
音質改善処理は、レセプション・コーディック(reception codec)246から出力されたオーディオ信号を受信するところから始まる。まず、この信号はチャンネル入力502を経由してリミッタ504に向かう。リミッタ504は、大きな音の部分がダイナミックレンジ不足によりその後の処理を押しつぶしてしまうことを防止する処理機能である、通常のオーディオリミッタであることが好ましい。サウンドレベルに応答して、リミッタ504は、「ポンピング(pumping)」や「クリッピング(clipping)」のような彩色効果(coloring effect)をサウンドに与えるゲインを変化させる。制限をかけること又は伸張の結果により起こるゲインの変化は、しばしばリスナーに注目され「ポンピング」と呼ばれる。「クリッピング」はシステムが可能とする最大値を信号が越えるときに起こる。
リミッタ504の出力は信号を4個の不連続の経路又は帯域に分割する。これらは全帯域幅経路510、低音域経路520、中音域経路540、及び高音域経路560と呼ばれる。各経路は独立に処理されることが好ましい。全帯域幅経路510は出力ミキサー578に全帯域幅サウンドを届けるためにある。以下に説明する様々なふるいをかけた帯域幅の処理に対して、全帯域幅経路510はサウンドレベルを伸張しないことが好ましい。低音域、中音域、及び高音域の経路(520,540,560)は信号にふるいをかけて重複のない周波数帯域幅にすることが好ましい。
経路はもっと多くしても少なくしてもよい。例えば、サブウーファーとして経路を追加してもよく、中間周波数帯域幅は2つの別々の中間周波数帯域幅に分けてもよい。代わりの実施の形態に用いる周波数帯域の数は非常に高く、フィルターは、ARBIフィルターによるものが好ましい。例えば、リミッタ504はダイナミックフィルタリング、パラメトリックフィルタリングの300のステレオチャンネルを持ったARBIフィルター(したがって、300のステレオチャンネルのサウンドレベル伸張と300のステレオチャンネルの時間遅による整合も必要となる)でもよい。
処理の前に、全帯域の各入力、低音域、中音域、及び高音域の経路(510,520,540,560)は、増幅器506a〜dにより増幅される。処理の後、全帯域の各出力、低音域、中音域、及び高音域の経路(510,520,540,560)は、増幅器507a〜dにより増幅され、ミキサー578で混合される。
フィルターにより形成される各周波数帯域は図5に示され、以下の段落に記載した様々な処理要素により独立に処理される。
全帯域幅経路510を除いて、各帯域はパラメトリック・イコライゼイションのためのイコライザを有する。このようなパラメトリック・イコライザは、低音域経路、中音域経路、及び高音域経路として各々参照番号522,542,及び562で示されている。このようなパラメトリック・イコライザ(522,542,562)は、各々がゲイン、帯域幅又は「Q」、及び中央周波数を持つ複数の狭帯域フィルターを提供する。イコライザ(522,542,562)は、サンプリング・アリアスに起因するスプリアスを減らすナイキスト補償フィルターを含んでもよい。
各周波数帯域に対するプログラマブルな具体的なエキスバンド又は圧縮は、各低音域、中音域、及び高音域の経路(520,540,560)に含まれるダイナミックな処理要素により実行される。このような処理要素は、エキスパンダ及び/又は圧縮装置と共に様々なフィルターを具備することが好ましい。低音域経路520は、エキスパンダ530及び圧縮装置532と共にハイ・シェルビングフィルター524、ローパスフィルター526、及びハイパスフィルター528を具備することが好ましい。中音域経路540は、エキスパンダ548及び圧縮装置550と共にハイ・シェルビングフィルター544、及びバンドパスフィルター546を具備することが好ましい。高音域経路560は、エキスパンダ570と共にハイ・シェルビングフィルター564、ローパスフィルター566、及びハイパスフィルター568を具備することが好ましい。全帯域経路は圧縮装置512に限定することが好ましい。各経路で用いられる処理要素は、他の設計的選択のみならず経路に関係する帯域の数とタイプにより変化することは評価されるべきである。
各帯域(全帯域幅510を含む)は、先の要素により生じた時間遅れ、又は、サーバ側でのレコーディングや処理により生じた時間遅れの相違を補償するために時間遅れ整合要素を提供することもまた好ましい。このような時間遅れ要素は、各々全帯域幅の各出力、低音域、中音域、及び高音域の経路(510,520,540,560)に対して参照番号514,534,552,及び572で示されている。一般に、適切に整合をとるための時間遅れはマイクロセカンド単位となる。
処理の後、各帯域の出力はミキサー578に接続される。このミキサー578は、4つの経路(510,520,540,560)間で信号のバランスをとり、混合した信号をマスター・イコライザ580に送る。
マスター・イコライザ580は、ミキサー578にある信号にパラメトリック・イコライジング処理を行う。これにより、広いスペクトル範囲で信号の最終的な成形が行われる。イコライズされた信号は、次いで(オプション的に)高度にイコライズした共鳴フィルターを通してサブウーファーと低音周波数域の強化がなされる。このようなフィルターは、ハイ・シェルビングフィルター582、ローパスフィルター584、及びハイパスフィルター586を具備することが好ましい。
壁シミュレータはハイパスフィルター586と結合することができる。壁シミュレータ590は、実際のステージからの反響をシミュレートする時間遅れを生成するために、ディフューズド・フィールド・マトリックス(DFM)技術を用いる。このようなサウンドの反響環境をシミュレートすることで、共鳴による不快なピークを招くことなく、音楽に活力と残響を与えることができる。
一般的なDFM技術は、調和振動と共鳴のない波の反射についての数論によるアルゴリズムを用いる。例えば、M. R. Schroeder, Springer-Verlag, Berlinの「Number Theory in Science and Communication」1986年、第2版の15.8節に記載された平方余剰と13.9節に記載された原始根は、この文脈に適用することができる。これらの一般的な技術は、しかしながら、部屋の「残響」をシミュレートする時間の長い反響を与えるのみである。早期に反射してくるサウンド、すなわち直接のサウンドから5から30ミリセカンド以内に反射するサウンドを提供するために、ディフューズド・フィールド・マトリックスDFM技術を用いることでSchroederによる方法を改良する、原始根の計算を適用することが好ましい。
壁シミュレータ590は、強い周期的な処理アーティファクト又は煩わしい周期的特徴を持つ不快な現象を破棄し、成形し又は取り除くための手助けをすることができる。このシミュレータ段階で用いられるDFM技術は、この処理要素の出力から入力へのフィードバックである再生信号を用いない。この処理の段階での制御パラメータには、大きさと壁からの距離が含まれる。
壁シミュレータ590の出力は部屋シミュレータ592に入力する。部屋シミュレータ592は、DFM技術を用いて、部屋でのありのままの音響に類似する時間遅れと共鳴を生み出す。DFM技術は壁シミュレータ590で用いる技術に似ているが、再生信号を用いる。部屋シミュレータ592は、ドライな音楽素材とぼんやりしたかすかなコーディックに起因する歪みを改善するために、残響と減衰を加えることができる。この処理段階における他のパラメータには、部屋の大きさ、部屋のアスペクト比、及びウエット/ドライミキサーが含まれる。部屋シミュレータ592の他の用途は、リスナーのリスニング環境における貧弱な部屋の音響を補償するために用いることである。ドライ信号に自然な部屋又はステージの音響を付加するために用いられる上述と同じDFM技術は、リスナーの部屋の共鳴を弱め又はふるいをかけるために、及び、部屋で感知されたノイズレベルを減少させるために用いることもできる。この目的のために、リスナーの部屋の音響は、リスナーが通常聞いている位置のそばに置かれ、図3に示すようにCPUに機能的に接続されたマイクロフォンの使用により得られる。DFM技術は、壁シミュレータ590と部屋シミュレータ592の中でのみ用いることが好ましい。ここでは、部屋シミュレータ592のみが再生成分を用いる。
部屋シミュレータ592により計測され補償される、クライアント・サイト又はリスニング・ルームの質に基づき種々のフィルターを適用することができる。1つのフィルターは、多数の共鳴を有する伝達関数、R(ω)、に基づき、リスニング・ルームの音響を補償することができる。もし部屋にカーペットやカーテンやクッションのような柔らかい表面を持つものが多数ある場合には、部屋伝達関数R(ω)は高周波域で減衰するであろう。しかしながら、もしリスニング・ルームに固い表面を持つものが多数あれば、部屋の伝達関数R(ω)の高周波端でそれほど減衰はないであろう。
部屋共鳴の補償を行うための最初のステップは、マイクロフォン302(図3参照)を用いてリスニング・ルームの音響を測定することである。部屋の音響は、スピーカ250(図3参照)を用いて既知の周波数スペクトルN(ω)を持つサウンドを発生させ、マイクロフォンを用いてスピーカにより生成されたサウンドに対する部屋での音響効果を観測することにより測定する。スピーカ250は、各周波数で同じエネルギーをもつ「白色ノイズ」のようなサウンドを生成する。マイクロフォンで変換されたスペクトルN(ω)は、次いで、下式に従い部屋伝達関数R(ω)を計算するために用いられる。

R(ω)=N(ω)/[N(ω)M(ω)]

ここで、両方のスペクトルN(ω)とN(ω)は、SPLAスケールのデシベルで測定し、上述のとおり、M(ω)はマイクロフォンにより変換されてできた値である。又は、N(ω)が好ましい実施の形態に置けるような「フラットな」白色ノイズスペクトルであれば、

R(ω)=N(ω)/[kM(ω)]

一般に部屋フィルターの補償は部屋のスペクトルを逆にすることにより調整される。すなわち

F(ω)=1/R(ω)

ここで、F(ω)はリスニング・ルームの補償フィルターである。フィルターF(ω)は、部屋シミュレータ592又はマスター・イコライザ580のどちらか一方又は両方の音質改善装置に導入することができる。
他のフィルターは、周囲ノイズを補償するために採用してもよい。周囲ノイズ補償は、周辺部屋ノイズのスペクトル帯域全体の帯域の特定の音楽を強調することにより得られる。このような強調により、ノイズに対する信号比が改善され、それにより、全体的なボリュームを上げることによらないで音楽の明瞭さが改善される。このノイズ低減技術は、ノイズスペクトルが本質的に変化しないときにうまく機能する。音響に対するフィルターと同様に、マイクロフォン302(図3参照)を、リスニング・ルーム内の周囲ノイズの計測に採用してもよい。サウンドから電気信号への変換はマイクロフォン伝達関数、M(ω)により記述される。したがって、元のサウンドのスペクトルからマイクロフォンにより変換された信号のスペクトルへの変換を表す式は以下で与えられる。

M(ω)・T(ω)=M(ω)・R(ω)・S(ω)・C(ω)・I(ω)・P(ω)

リスナーが聞くサウンドはリスナーの位置のそばにマイクロフォン302を置くことにより最も正確に観測される。周囲ノイズを補償するためのフィルターのスペクトルは一般に周囲ノイズのスペクトルと同じ概略形状を持つ。このようなフィルターは、部屋シミュレータ592又はマスター・イコライザ580のどちらか一方又は両方の音質改善装置に導入することができる。
さらなる音質改善は、音楽が録音される環境又はシミュレートされた録音環境(実際に音楽が録音された環境とは異なってもよい)を補償することで得られる。クライアントには複数の録音環境が与えられる。好ましい実施の形態によれば、以下の6つのシミュレートされた録音環境がクライアントにより選択される。すなわち、スタジオ(A,B)、ホール(A,B)、及びスタジアムである。例えば、スタジオ環境では初期の反響の改善がなされる。又は、シミュレートされたスタジアムではかなり長い残響時間を持たせるのに対して、シミュレートされたホール環境では、短い残響となる。ある意味では、ユーザは、どのように音楽を録音するかをシミュレートする「プロデューサ」になる。あるいは、シミュレートされた録音環境のアプリケーションは、ユーザの好みよりむしろ、音楽が録音された実際の環境にのみに基づくようにしてもよい。この場合、システムは録音から不快なアーティファクトを修正してもよく、ダウンロードされたファイル又はストリーム中のファイルは、適切な録音ルーム音響を特定するID3タグやMP3ファイルのようなタグを含んでもよい。
部屋シミュレータ592の出力は、カラオケ要素593に接続されている。カラオケ要素593には、両方のステレオチャンネルからのルーム・シミュレータからの入力がある。これらの左右のチャンネルの信号は比較され、両方のチャンネルで等しいエネルギーを持つ、声のような音の成分は、カラオケ効果を提供するために削除される。カラオケ要素593は元のステレオ信号を再導入しない点を除いて、以下に説明するように3D音質改善装置595と同じようにこれを行うことが好ましい。
カラオケ要素593の出力はワイド要素594に接続される。ワイド要素594では左右のチャンネルを比較し、知覚されたこれらの間の距離を変化させるために算術機能と時間遅れ機能とを2つのチャンネルに対して実行する。この効果により、音楽の広がりにおける知覚されたステレオ分解能を変化させる。広がりの質を改善させようとする他の試みにおいては、信号の低周波数成分の損失を招いたのに対して、ワイド要素594は、低周波数成分を実質的に変化させないで、この分解能を生み出すことができる。この効果をもたらす処理は、カリフォルニア州、サンフランシスコのドルビー・コーポレーションにより配布されたポジショニング・アルゴリズムである標準的なPL−2処理に組み込まれる。具体的には、左右のチャンネル間で相互作用を必要とするカラオケ要素593、ワイド要素594、及び3D音質改善装置595(以下に説明する)は、両方のチャンネルを結合して使用することでPL−2でのデコーディングを実行する。ワイド要素594の出力は、3D音質改善装置595に接続される。3D音質改善装置595は、ステレオ信号から「同一エネルギー」(コモン・モード)信号内容(普通はソロ音声及び楽器である)を削除し、それに時間遅れを持たせ、周波数領域関数と時間領域関数とを組み合わせを用いて生の信号と再混合する。これは、同一エネルギー素材の非局在化を行わずに、リスナーに対する音響ステージを広げることになる。
3D音質改善装置595の出力はレベリング増幅器596に接続される。次に、レベリング増幅器596は、AIレベル・コントロール597に接続される。AIレベル・コントロール597回路は、ピーク・イベントの期間オーディオレベルを低くし、ピーク・イベントが過ぎ去ると元に戻す働きをする。リスニング中又は録音時のサウンドの歪みを防止するために、人間工学的な設計により、感情を損なう楽器や音声のボリュームを下げる制御により常にボリュームを下げる。本質的に人間工学的シミュレートをすることによりAIレベル・コントロール597は、ピーク・イベントを特定するために、歪みや信号の過負荷についてデジタル信号を分析することでオーディオのレベルを急激に下げる。そして、ピーク・イベントが起こった後、好ましくないダイナミック端の損失と平坦なサウンドを招くようなオーディオ圧縮回路の「常時オン」の必要をなくして、元のボリューム設定値に戻す。
AIレベル・コントロール597の出力は、マスター化されたステレオ信号のダイナミックレンジを選択的に増大するために用いられるマスター・エキスパンダ598に接続される。マスター・エキスパンダ598からの出力は増幅器599に接続される。
マスター・エキスパンダ598はシステムの最終出力のボリュームを制御する。これにより、リスナーはスピーカ駆動回路やスピーカのオーバードライブの心配をせずに好きなだけボリュームを高く設定することができる。この特徴は、サンプルの歪みを監視することによりオーバードライブするスピーカのピーク・サウンド・レベルを検出する処理により実行される。好ましい実施の形態によれば、クリッピングの量を集計するファジー・ロジックがボリューム・レベルを減少させなければならない程度を決定するために用いられる。あるいは、この処理において、音楽の流れを見越し、スピーカがオーバードライブするサウンドレベルの到来を予測してもよい。このようなサウンドレベルが到来した場合あるいは到来することが予測される場合、実際に人が使う減衰対時間をシミュレートする非線形の減衰対時間曲線を用いて、マスター・ゲインのレベルを自動的に下げる。
マスター・エキスパンダ598は音質改善処理の最終段階であり、スピーカ駆動回路に接続されたチャンネル出力504に、改善された信号が送られる。スピーカ駆動回路は、プロセッサからの音質改善されたデジタル形式の信号をハードウエアのアナログ信号に変換し、必要な増幅を行いスピーカに接続する。
ここで説明したサウンドレベルの伸張により、元のオーディオ・ソースのレコーディングから先のどんなときに行ったオーディオ信号の圧縮であっても、オーディオ信号の圧縮に対する修正の手助けを行い、音楽のダイナミックレンジを拡大する。一般に、音楽の録音と混合には、録音媒体のダイナミックレンジが制限されていることを利用するために多くのトラックでのサウンドレベルの圧縮が含まれる。また、インターネットによる配信における帯域幅を減らすために、ある形式の圧縮がなされることもある。後者のような圧縮は実質的に受信コーディックにより取り外されるが、修正が不十分であったり、あるいはその音楽の「活気」又は他の主観的な音質を改善するために更なるエキスパンションが必要であったりするかもしれない。強調すべき帯域で異なった時定数及びエキスパンション・ファクターを有するデュナーミック処理特性を採用することが好ましい。
図5に示した種々の処理要素は、どんな処理過程もバイパスすることができ、各処理におけるパラメータを特定することができるマスター制御プログラムにより制御される。「スキン」はクライアントがパラメータと事前の設定値を調整するためのインターフェースである。すなわち、「スキン」は、リスナーのPC画面に表示される音質改善プログラムの視覚的な対話式部分である。フェーダー制御により、リスナーはシステムの各パラメータを設定することができ、「ラジオボタン」(すなわち、オン/オフ・スイッチ)により、前もって設定したパラメータのグループを選択することができる。改善パラメータは別々に調整してもよく、種々の事前の設定を選択してもよい。
システムは、個々の帯域プロセッサのパラメータを同時に調整する「ビッグネス(bigness)」制御を含んでもよい。「ビッグネス」パラメータの値が低い場合は、ダイナミック処理がほとんど行われず、サウンドレベルのダイナミックレンジは録音されたときの音楽のレンジと同等となる。「ビッグネス」パラメータの値が高い場合は、各帯域で処理されるデュナーミックが、録音された音楽のサウンドレベルのダイナミックレンジより増大する。
事前に設定されたパラメータのグループには、リスナーが決定するタイプと作りつけタイプの2つのタイプがある。リスナーはあらかじめ分類しておいたグループから事前の設定を選択することもできるし、作りつけ事前設定のメニューから選択することもできる。作りつけ事前設定は、帯域幅、コード化形式、リスナーのスピーカ、及び音楽のタイプを考慮して計画される。一旦リスナーが作りつけ事前設定を選択すると、リスナーは作り付け事前設定をカスタマイズするために個々のパラメータ又はパラメータのグループを調整することができる。調整されたパラメータのグループは、名前を付けて新しい事前設定として保存することができる。例えば、作りつけ事前設定が選択されると、リスナーは、引き続いて、作りつけ事前設定に適用することができる部屋補償パラメータのグループを選択することができる。
図6は、好ましい実施の形態による、3D改善装置のブロックダイアグラムである。他の要素と同様、この要素は左入力602と右入力604及び左出力650と右出力652を持つ。1つの混合器640は左出力650と関連付けられ、他の混合器642は右出力652と関連付けられる。左入力602に係る信号はローパスフィルター606とハイパスフィルター608を通り抜ける。同様に、右入力604に係る信号はローパスフィルター610とハイパスフィルター612を通り抜ける。ローパスフィルター606及び610の出力はそれぞれ増幅器622と増幅器628を通過し、これらの出力はそれぞれ混合器640と混合器642に入る。同様に、ハイパスフィルター608及び612の出力はそれぞれ増幅器624と増幅器626を通過し、これらの出力はそれぞれ混合器640と混合器642に入る。ハイパスフィルター608及び612の出力は加算器632で加算され増幅器634にはいる。増幅器634の出力は、混合器640に送られると共に、時間遅れ要素636にも送られ、その出力はさらに混合器642に送られる。
3D音質改善要素は、リスナーに拡張されたサウンドステージを提供するために適切に構成される。図11に基づき以下に説明する空間音質改善要素に似ている3D音質改善要素は、ステレオ信号から「同一エネルギー」(コモン・モード)信号内容(普通はソロ音声及び楽器である)を削除し、それに時間遅れを持たせ、周波数領域関数と時間領域関数とを組み合わせを用いて生の信号と再混合する。これは、同一エネルギー材料の非局在化を行わずに、リスナーに対する音響ステージを広げることになる。
図7は、好ましい実施の形態による、広角要素のブロックダイアグラムである。他の要素と同様、この要素は左入力702と右入力704及び左出力750と右出力752を持つ。1つの混合器740は左出力750と関連付けられ、他の混合器742は右出力752と関連付けられる。左入力702に係る信号はハイパスフィルター706とローパスフィルター708を通り抜ける。同様に、右入力704に係る信号はハイパスフィルター710とローパスフィルター712を通り抜ける。ローパスフィルター708及び712の出力はそれぞれ混合器740と混合器742に入る。同様に、ハイパスフィルター706及び710の出力はそれぞれ時間遅れ要素724及び726を通過し、これらの出力はそれぞれ混合器740と混合器742に入る。時間遅れ要素724により与えられる時間遅れは、時間遅れ要素726により与えられる時間遅れより大きいことが好ましい。例えば時間遅れ要素726に関する時間遅れが0.5〜30ミリセカンドとすることができるのに対して時間遅れ要素724に関する時間遅れが0.05〜2.0ミリセカンドとすることができることとする。
左右のチャンネルにおける高周波情報の望ましい時間差を、ハイパスフィルター706/710でこの情報を処理するときに、生成するように広角要素を構成することが好ましい。各々の時間遅れ要素724/726は、時間遅れに望ましい差異を与えるために調整することができる。現実的な実施の形態において時間遅れの差は、ハース効果(又は先行音効果)の範囲に入る、5ミリセカンドと22ミリセカンドとの間で、約20ミリセカンドとするのが好ましい。動作時、1つの時間遅れ要素は固定の遅れ値に設定し、他の時間遅れ要素は好ましいハース効果を得るために変化させる。
図8は、開示された方法/システムによる音質改善処理装置のもう1つの実施の形態を示すブロックダイアグラムである。図8に示されたシステムには、図4に示されたものと同じ要素が多く含まれ、上述したのと同様の動作をする。しかしながら、図8には、以下の追加要素があることに注目すべきである。すなわち、低音デュナーミック処理装置902、時間遅れ要素905,918,及び919、DFM壁シミュレータ909、オフセット装置907、波形発生装置915、ゲイン窓スレッシュホールド処理装置917、及び音声「s」検出回路918である。図8にはまたスピーカ917(付属するダイナミック・アンプ920を含む)とマイクロフォン922が示されている。低音デュナーミック処理装置902は、強弱のある低音を改善するために、可変時間遅れ回路と圧縮装置とエキスパンダーブロックと結合した特別なフィルターを具備する。壁シミュレータ909は、前掲の図について説明したのと同じ機能を実行する。X86と互換性のあるプロセッサ(PC及びそれに派生する装置)上で実行される実施形態において、波形発生装置915は、音のないときのインテルFPUの「非正規(denormal)」運転を防止するために用いられる。オフセット装置907は、AIデュナーミック圧縮装置901とAIデュナーミック伸張装置913巻での通信をさせるために用いられる。また、AIフェーダー及び歪み検出装置916はリスニング環境923を監視し、出力信号に適切なゲインレベルが適用されるようフィードバックを行うために用いることができる。これはフレッチャー・マンソンの参照表を通じて実行される。
図9〜16は、ユーザが再生するためのデジタル・オーディオ・ファイルを処理することのできるパーソナルコンピュータ又は他の装置のような、クライアント側の処理装置に組み込むことのできる本発明の様々な好ましい実施の形態の特徴を描いたものである。
図9は、好ましい実施の形態による、制限された帯域幅の音楽のクライアント側での改善に関する処理機能を描いたブロックダイアグラムである。実際の実施形態において、図9に示された構成900は、ハードウエア、ソフトウエア、ファームウエア、又はそれらのあらゆる組み合わせにより実現される。図9にはただ1つの処理チャンネルのみ示されているが、複数の処理チャンネルを採用してもよい。例えば、単一のチャンネル、モノラルのチャンネル、又はステレオチャンネルがここに記載されていても、必要に応じ、追加の機能とサウンド処理を行うためにここに記載されているチャンネルを複数採用してもよい。さらに、チャンネル内で、具体的な数の経路がここに記載されていても、本発明の精神の範囲内でもっと少数のあるいは多数の経路を用いてもよい。
さらに、以下に記載するデコーディングと音質改善処理はプロセッサ上を走るソフトウエアルーチンであることが好ましく、したがって、信号経路とはあるルーチンから他のルーチンへデータを移す一般的なプログラミング技術を意味する。したがって、好ましい実施形態を満足していても、信号路又は経路は物理的な接続を意味するものではない。しかしながら、現実の実施の形態においては個別の接続を用いてもよい。
音質改善処理は、受信コーディックから出力されるオーディオ信号とともに始まる。最初は、信号はチャンネル入力902を通って圧縮装置904に入る。圧縮装置904は、標準的なオーディオリミッタ、すなわち、大きな音の部分がダイナミックの欠如により下流側の処理で押しつぶされることを防止する処理機能であることが好ましい。サウンドレベルに応答して、圧縮装置904は、「ポンピング(pumping)」や「クリッピング(clipping)」のような彩色効果(coloring effect)をサウンドに与えるゲインを変化させる。制限をかけること又は伸張の結果により起こるゲインの変化は、しばしばリスナーに注目され「ポンピング」と呼ばれる。「クリッピング」はシステムが可能とする最大値を信号が越えるときに起こる。
圧縮装置904の出力は、複数の不連続の経路又は帯域に分割し、そのうちの少なくとも1つは全帯域の信号に対応する。好ましい実施の形態において、圧縮装置904の出力は4つの流れに入る。これらは、全帯域経路906、低音域経路908、中音域経路910、及び高音域経路912と呼ばれる。各経路は独立に処理されることが好ましい。全帯域経路906は出力ミキサー913に全帯域サウンドを届けるためにある。以下に説明する種々のふるいをかけられた帯域の処理と対照的に、全帯域経路906はサウンドレベルを伸張したものでないことが好ましい。低音域、中音域、及び高音域の経路908/910/912は信号にふるいをかけて重複のない周波数帯域にすることが好ましい。
経路はもっと多くしても少なくしてもよい。例えば、サブウーファーとして経路を追加してもよく、中間周波数帯域は2つの別々の中間周波数帯域に分けてもよい。代わりの実施の形態に用いる周波数帯域の数は非常に高く、フィルターは、ARBIフィルターによるものでもよい。例えば、圧縮装置904はダイナミックフィルタリング、パラメトリックフィルタリングの300のステレオチャンネルを持ったARBIフィルターでもよい。
処理の前に、全帯域、低音域、中音域、及び高音域の経路906/908/910/912の各々の入力は、それぞれ可変ゲイン増幅器914a〜dにより増幅される。実際の実施の形態においては、処理の基本概念900で採用されている可変ゲイン増幅器の各々は、−30dBから+25dBまで、調整分解能が0.1dBの調整可能なゲインを持つ。動作時、増幅器914の可変ゲインの設定値も含めて、処理基本概念における多数の設定及び/又は可変特性は、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。処理の後、全帯域、低音域、中音域、及び高音域の経路906/908/910/912は、可変増幅器916a−dにより増幅されミキサー913で混合される。
フィルターにより形成される各周波数帯域は、図9に示され、詳細を以下に記載した様々な処理要素により独立に処理される。各周波数帯域に対するプログラマブルな具体的なサウンドレベルのエキスバンド又は圧縮は、各低音域、中音域、及び高音域の経路908/910/912に含まれるダイナミックな処理要素により実行される。このような処理要素は、エキスパンダ及び/又は圧縮装置と共に様々なフィルターを具備することが好ましい。例えば、低音域経路908は、少なくともローパスフィルター918及び圧縮装置920を含むことが好ましい。中音域経路910は、少なくともバンドパスフィルター922及び圧縮装置924を含むことが好ましい。高音域経路912は、少なくともハイパスフィルター926及び圧縮装置928を含むことが好ましい。例示した実施の形態では、全帯域経路906は、圧縮装置930を含むがどんなフィルター要素も必要としない。各経路で用いられる処理要素は、他の設計的選択のみならず経路に関係する帯域の数とタイプにより変化することは評価されるべきである。
上述のように、各帯域の経路についての処理された信号はミキサー913の各入力となる。ミキサー913は4つの経路間での信号のバランスを取り、混合した信号932を選択可能な(すなわちバイパスできる)あるいは任意的な処理要素に送る。図9は、これらの処理要素の好ましい順序を示している。本発明の他の実施形態では、しかしながら、このような処理用を違った順序で用いてもよく、付加的な又は代わりの処理要素を採用してもよい。
例示した実施形態において、混合された信号932は、ステレオ波形中の単独の楽器又は音声素材の基本周波数に関連して周波数領域に付加的な彩色又はオーバートーン・アンバランシング(overtone unbalancing)を与えることなく音声や単独の楽器の音質改善に適切なように構成されている、ボーカル音質改善要素934への入力となる。ボーカル音質改善要素の一例を、図10を参照してさらに詳細に説明する。ボーカル音質改善要素934の出力は、次に(任意的に)サブウーファーと低音域周波数を強化するために高度にイコライズされた共鳴フィルターを通過する。このようなフィルターは、ハイ・シェルビングフィルター936、ローパスフィルター938及びハイパスフィルター940を具備することが好ましい。ハイ・シェルビングフィルター936は与えられた「クロスオーバ」周波数以上の周波数範囲を強調する。クロスオーバ部の「急峻さ」は「Q」又はフィルターのクォリティファクタを変えることにより調整できる。
フィルターされた出力は、リスナーに拡張されたサウンドステージをもたらすよう構成された空間改善要素942に入る。空間改善要素942は、ステレオ信号から「同一エネルギー」(コモン・モード)信号内容(普通はソロ音声及び楽器である)を削除し、それに時間遅れを持たせ、周波数領域関数と時間領域関数とを組み合わせを用いて生の信号と再混合する。これは、同一エネルギー素材の非局在化を行わずに、リスナーに対する音響ステージを広げることになる。
空間改善要素の一例を、図11と関連させて以下に詳細に説明する。例示した実施形態において、空間改善要素942の出力は壁シミュレータ要素944への入力となる。壁シミュレータ要素944は、実際のステージからの反響をシミュレートする時間遅れを生成するために、ディフューズド・フィールド・マトリックス(DFM)技術を用いる。このようなサウンドの反響環境をシミュレートすることで、共鳴による不快なピークを招くことなく、音楽に活力と残響を与えることができる。壁シミュレータ要素の一例を、図12と関連させて以下に詳細に説明する。
一般的なDFM技術は、調和振動と共鳴のない波の反射についての数論によるアルゴリズムを用いる。例えば、M. R. Schroeder, Springer-Verlag, Berlinの「Number Theory in Science and Communication」1986年、第2版の15.8節に記載された平方余剰と13.9節に記載された原始根は、この文脈に適用することができる。これらの一般的な技術は、しかしながら、部屋の「残響」をシミュレートする時間の長い反響を与えるのみである。早期に反射してくるサウンド、すなわち直接のサウンドから5から30ミリセカンド以内に反射するサウンドを提供するために、ディフューズド・フィールド・マトリックスDFM技術を用いることでSchroederによる方法を改良する、原始根の計算を適用することが好ましい。
壁シミュレータ要素944は、強い周期的な処理アーティファクト又は煩わしい周期的特徴を持つ不快な現象を破棄し、成形し又は取り除くための手助けをすることができる。このシミュレータ段階で用いられるDFM技術は、この処理要素の出力から入力へのフィードバックである再生信号を用いない。この処理の段階での制御パラメータには、大きさと壁からの距離が含まれる。
例示した実施形態において、壁シミュレータ944の出力は部屋シミュレータ946に入力する。壁シミュレータ要素の一例を、図13と関連させて以下にさらに詳細に説明する。部屋シミュレータ要素946は、自然な部屋に似た時間遅れと共鳴を生成させるために、DFM技術を用いる。DFM技術は、再生成を行う点を除いて、壁シミュレータ要素944で用いられるものと似ている。部屋シミュレータ要素946は、無味乾燥の音楽素材とぼんやりしたかすかなコーディックに起因する歪みを改善するために、残響と減衰又は残響なしのDFMを加えることができる。この処理段階における他のパラメータには、部屋の大きさ、部屋のアスペクト比、及びウエット/ドライミキサーが含まれる(ここで「ドライ」とはエフェクトの欠如を言い、「ウエット」とはエフェクトの使用を言う)。部屋シミュレータ要素946の他の用途は、リスナーのリスニング環境における貧弱な部屋の音響を補償するために用いることである。ドライ信号に自然な部屋又はステージの音響を付加するために用いられる上述と同じDFM技術は、リスナーの部屋の共鳴を弱め又はふるいをかけるために、及び、部屋で感知されたノイズレベルを減少させるために用いることもできる。
部屋シミュレータ946により計測され補償される、クライアント・サイト又はリスニング・ルームの質に基づき種々のフィルターを適用することができる。1つのフィルターは、多数の共鳴を有する伝達関数、R(ω)、に基づき、リスニング・ルームの音響を補償することができる。もし部屋にカーペットやカーテンやクッションのような柔らかい表面を持つものが多数ある場合には、部屋伝達関数R(ω)は高周波域で減衰するであろう。しかしながら、もしリスニング・ルームに固い表面を持つものが多数あれば、部屋の伝達関数R(ω)の高周波端でそれほど減衰はないであろう。
さらなる音質改善は、音楽が録音される環境又はシミュレートされた録音環境(実際に音楽が録音された環境とは異なってもよい)を補償することで得られる。クライアントには複数の録音環境が与えられる。好ましい実施の形態によれば、以下の10のシミュレートされた録音環境がクライアントにより選択される。すなわち、スタジオ、ジャズセッション、ナイトクラブ、ゲームスペース、バスジャム、劇場、ロックコンサート、ソニックワイド、シンフォニー、又は大聖堂である。例えば、スタジオ環境では初期の反響の改善がなされる(DFM)。又は、シミュレートされたスタジアムではかなり長い残響時間を持たせるのに対して、シミュレートされたホール環境では、短い残響となる。ある意味では、ユーザは、どのように音楽を録音するかをシミュレートする「プロデューサ」になる。あるいは、シミュレートされた録音環境のアプリケーションは、ユーザの好みよりむしろ、音楽が録音された実際の環境にのみに基づくようにしてもよい。この場合、システムは録音から不快なアーティファクトを修正してもよく、ダウンロードされたファイル又はストリーム中のファイルは、適切な録音ルーム音響を特定するID3タグやMP3ファイルのようなタグを含んでもよい。
部屋シミュレータ946の出力は、信号の低音域を強化するために適切に構成されたサブソニック改善要素948に接続されている。サブソニック改善要素の一例を、図14と関連させて以下にさらに詳細に説明する。
サブソニック改善要素948の出力は、自動予測ゲイン制御(AGC)要素950に接続されている。自動予測ゲイン制御(AGC)要素950は、全体の出力のダイナミックレンジを適切に制御するために構成されている。「予測」の語は、トランジエント又は「ポンピング」を出力にもたらすことなく、ゲインを滑らかに変化させるために十分な時間を制御増幅器に与える信号の遅れを意味する。この特性により、オーディオレベルはピーク時に下げられ、ピークが過ぎ去った後元に戻される。リスニング段階又は録音時、サウンドが歪まないようにするために、楽器や音声のボリューム制御を下方に動かすことにより、人であるエンジニアが常にボリュームを下げていた。原則的に人であるエンジニアをシミュレートすることにより、自動予測ゲイン制御(AGC)要素950は、ピーク・イベントを特定するために歪みをもたらすデジタル信号の流れ及び信号の過負荷を分析し、オーディオのレベルを下げる。そして、ピーク・イベントが起こった後、好ましくないダイナミック端の損失と平坦なサウンドを招くようなオーディオ圧縮回路の「常時オン」の必要をなくして、元のボリューム設定値に戻す。
予測AGC要素の一例を、図15と関連させて以下にさらに詳細に説明する。予測AGC要素950は、種々の処理要素により引き起こされる互いに異なる時間遅れ又はサーバ側での録音又は処理時に起こった互いに異なる時間遅れを補償する1以上の時間遅れ要素(図示せず)を含んでもよい。一般に、適切に整列させるための時間遅れはマイクロセカンドのオーダーである。
本例による実施の形態によれば、予測AGC要素950は、音質改善処理の最終段階であり、スピーカ駆動回路に接続されたチャンネル出力952に、改善された信号が送られる。スピーカ駆動回路は、プロセッサからの音質改善されたデジタル形式の信号をハードウエアのアナログ信号に変換し、必要な増幅を行いスピーカに接続する。
これらの(ミキサー913とチャンネル出力952間の)各処理要素の好ましい順序を図9に示す。現実の実施の形態では、しかしながら、特別のアプリケーションの必要性に適合させたり、特別なリスナーの要求に合わせたりするためのような要素を、異なった順序に並べてもよい。さらに、付加的な、及び/又は、代わりの処理要素を採用してもよい。
ここで説明したサウンドレベルの伸張により、元のオーディオ・ソースのレコーディングから先のどんなときに行ったオーディオ信号の圧縮であっても、オーディオ信号の圧縮に対する修正の手助けを行い、音楽のダイナミックレンジを拡大する。一般に、音楽の録音と混合には、録音媒体のダイナミックレンジが制限されていることを利用するために多くのトラックでのサウンドレベルの圧縮が含まれる。また、インターネットによる配信における帯域幅を減らすために、ある形式の圧縮がなされることもある。後者のような圧縮は実質的に受信コーディックにより取り外されるが、修正が不十分であったり、あるいはその音楽の「活気」又は他の主観的な音質を改善するために更なるエキスパンションが必要であったりするかもしれない。強調すべき帯域で異なった時定数及びエキスパンション・ファクターを有するデュナーミックを採用することが好ましい。
図9に示した種々の処理要素は、どんな処理過程もバイパスすることができ、各処理におけるパラメータを特定することができるマスター制御プログラムにより制御される。「スキン」はクライアントがパラメータと事前の設定値を調整するためのインターフェースである。すなわち、「スキン」は、リスナーのPC画面に表示される音質改善プログラムの視覚的な対話式部分である。フェーダー制御により、リスナーはシステムの各パラメータを設定することができ、「ラジオボタン」(すなわち、オン/オフ・スイッチ)により、前もって設定したパラメータのグループを選択することができる。改善パラメータは別々に調整してもよく、種々の事前の設定を選択してもよい。
システムは、個々の帯域プロセッサのパラメータを同時に調整する「ビッグネス(bigness)」制御を含んでもよい。「ビッグネス」パラメータの値が低い場合は、ダイナミック処理がほとんど行われず、サウンドレベルのダイナミックレンジは録音されたときの音楽のレンジと同等となる。「ビッグネス」パラメータの値が高い場合は、各帯域で処理されるデュナーミックが、録音された音楽のサウンドレベルのダイナミックレンジより増大する。
事前に設定されたパラメータのグループには、リスナーが決定するタイプと作りつけタイプの2つのタイプがある。リスナーはあらかじめ分類しておいたグループから事前の設定を選択することもできるし、作りつけ事前設定のメニューから選択することもできる。作りつけ事前設定は、帯域幅、コード化形式、リスナーのスピーカ、及び音楽のタイプを考慮して計画される。一旦リスナーが作りつけ事前設定を選択すると、リスナーは作り付け事前設定をカスタマイズするために個々のパラメータ又はパラメータのグループを調整することができる。調整されたパラメータのグループは、名前を付けて新しい事前設定として保存することができる。例えば、作りつけ事前設定が選択されると、リスナーは、引き続いて、作りつけ事前設定に適用することができる部屋補償パラメータのグループを選択することができる。
図10は、図9に示した構成とともに用いるのに適したボーカル音質改善要素1000の一例を示す概略図である。ボーカル音質改善要素1000は、深みと豊かさを与える第1の基本周波数に悪い影響を与えずに、録音時における音声を明瞭にする。動作時、ボーカル音質改善要素1000の多数の設定及び/又は可変特性は、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。
ボーカル音質改善要素1000はステレオ処理要素である。すなわち、左入力信号1002と右入力信号1004とを受け取り、対応する左出力信号1006と対応する右出力信号1008とを創り出す。左チャンネル入力信号1002は、左入力信号1002の絶対値を表す出力信号1012を生成する絶対値発生器1010に入力する。右チャンネル入力信号1004は、右入力信号1004の絶対値を表す出力信号1016を生成する絶対値発生器1014に入力する。言い換えれば、左右のチャンネル入力信号は、全波整流される。比較器1018は2つの出力信号1012/1016を受信し、この出力信号1016から出力信号1012を減算した信号を表す差信号1020を生成する。差信号1020の電圧は左右の入力の差に比例する。
生成された差電圧は第1トランジエントを除去するためにフィルターを通り、制御電圧になる。比較器1018の出力は可変抵抗器1022の1つの端に接続される。可変抵抗器1022の第2の端はノード1024に接続される(又は通信する)。他の可変抵抗器1026の第1の端もまたノード1024に接続される。可変抵抗器1026の第2の端は、可変キャパシタンス1028の第1の端に接続され、可変キャパシタンス1028の第2の端は、参照電圧つまり大地に接続される。可変抵抗器1022、可変抵抗器1026、及び、可変キャパシタンス1028は適切なレベルと適切なクロスオーバ周波数を与えるために独立に整定することができる。可変ローパスフィルターの構成に係るこれらの可変要素は、差信号1020をノード1024であらかじめ設定された適切な制御信号1029に調整する。
左入力信号1002はまた第1の電圧制御増幅器1030の入力となり、右入力信号1004はまた第2の電圧制御増幅器1032の入力となる。電圧制御増幅器の差特性により、左右の信号の振幅が等しくされる。制御信号1029は2つの電圧制御増幅器1030/1032のゲインを調整する。すなわち、電圧制御増幅器1030の出力信号1034は左入力信号1002を増幅されたものを示し、電圧制御増幅器1032の出力信号1036は右入力信号1004を増幅されたものを示す。これらの2つの出力信号1034/1036は、加算された出力信号1040を生成する加算器1038に入力される。加算器1038は、逆位相の素材を効果的に取り除き、合成された「ボーカル」又は「中央」チャンネルを生成する。これは、元の録音時多くのボーカルトラックは左右のチャンネルに同じエネルギーで混入されるという事実をうまく利用したものである。加算された出力信号1040は、適切な信号レベルを提供するために、可変ゲイン増幅器1042に入力する。増幅器1042の出力は、バンドパスフィルター処理1044により処理されてフィルターされた信号1046となる。バンドパスフィルター処理1044は、ボーカルの範囲外にある高音域及び低音域を除去する。
左入力信号1002はまた加算器1048の入力となり、右入力信号1004はまた加算器1050の入力となる。加算器1048は、左入力信号1002とフィルターされた信号1046の和を生成し、この和は左出力信号1006となる。加算器1050は、右入力信号1004とフィルターされた信号1046の和を生成し、この和は右出力信号1008となる。この和1048/1050はボーカル出力を元の左右のチャンネルの信号に混入し、かくして、音源素材中のボーカルが強調される。
空間改善要素は、ステレオ信号から共通に混合された素材を抜き取り、左チャンネルにそのまま戻し、右チャンネルには適切な時間遅れを持たせて戻すことにより、複雑な音場の音質改善を行う。低音域成分は処理前に元の信号から取り除かれ、「最終の」左右チャンネルのミキサーに再度入力され、このようにして、低周波数の低音域エネルギーが「除去」回路の効果を鈍らせることを防止している。図11は、図9に示された基本概念で用いられるのに適した、空間音質改善要素1100の一例を示した概念図である。動作時、空間音質改善要素1100における多数の設定及び/又は可変特性は、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。
空間音質改善要素1100はステレオ処理要素である。すなわち、左入力信号1102と右入力信号1104とを受け取り、対応する左出力信号1106と対応する右出力信号1108とを創り出す。1つのミキサー1110は左出力信号1106に対応し、他のミキサー1112は右出力信号1108に対応する。
左入力信号1102は、ローパスフィルター1114とハイパスフィルター1116とを通過する。例示した実施形態において、ローパスフィルター1114は、普通約300Hzに設定される可変カットオフ周波数のセカンドオーダーフィルターとして実現される。このフィルターは、空間音質改善要素をアンバランスにしないように、又は、好ましくないアーティファクトを発生しないように、低周波数成分を隔離するために用いられる。例示した実施形態において、ハイパスフィルター1116は、普通約300Hzに設定される可変カットオフ周波数のセカンドオーダーフィルターとして実現される。同様に、右入力信号は、ローパスフィルター1118とハイパスフィルター1120とを通過する。好ましい実施の形態において、ローパスフィルター1118の特性は、ローパスフィルター1114の特性と一致し、ハイパスフィルター1120の特性は、ハイパスフィルター1116の特性と一致する。
ローパスフィルター1114と1118の出力は各々可変ゲイン増幅器1122と可変ゲイン増幅器1124を通り、その出力は各々ミキサー1110とミキサー1112に入力する。同様に、ハイパスフィルター1116と1120の出力は各々可変ゲイン増幅器1126と可変ゲイン増幅器1128を通り、その出力は各々ミキサー1110とミキサー1112に入力する。実際の実施の形態においては、空間音質改善要素1100で採用されている可変ゲイン増幅器の各々は、−30dBから+25dBまで、調整分解能が0.1dBの調整可能なゲインを持つ。ハイパスフィルター1116及び1120は、減算器1130の入力としても使われる。減算器1130の出力は、ハイパスフィルター1116の出力からハイパスフィルター1120の出力を減算した出力を生成する。これが「除去された」信号を創る。減算器1130の出力は、次に、可変ゲイン増幅器1132に入力する。可変ゲイン増幅器1132の出力は、ミキサー1110のもう1つの入力として用いられると共に、時間遅れ要素1134の入力としても用いられる。
時間遅れ要素1134は、遅れ時間を0.05msと30ms(すなわち48kHzのサンプリング周波数で1から1440サンプル)となるよう設定される。動作時、具体的な遅れ時間は、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。この遅れ時間は、リスナーの左右の耳への距離に関して空間的な機能をシミュレートする。実際の実施形態において、時間遅れは約2.2msを越えてはいけない。1つの好ましい実施の形態において、時間遅れは約1.1msである。時間遅れ要素1134の出力はミキサー1112のもう1つの入力となる。
ミキサー1110は入力を結合する加算器として機能する。実際には、ミキシングすることは、もっと複雑な音場ともっと広いステレオイメージを持った変位を創る結果となる。このようにして、空間音質改善要素1100は、別々の左右のチャンネル成分を強調してこの成分を元の信号成分と混合する。ミキサー1112も同様の機能を行う。ミキサー1110の出力は、可変ゲイン増幅器1136の入力となり、この出力は、左出力信号1106となる。左右の出力信号1106/1108は、壁効果要素944(図9参照)のような基本概念に用いられる付加的な処理要素に送信される。
壁効果要素は、信号に人工的な早期の反響を付加するのに用いられ、演奏源の傍に反射面があるときの効果をシミュレートする。この要素では再生成は用いられない。実施形態の一例においては、信号経路は以下のようにまとめてもよい。
・反射面のいたるところに、初期の発生源を計算することにより、あらかじめ「タップ(tap)」ポイントを時間遅れラインに創っておく。
・信号は、好ましい反射面からの周波数応答を近似するためにローパスフィルターを通したものである。
・フィルターを通った信号は時間遅れラインに入る。
・時間遅れラインの下流側にあるあらかじめ定めたタップポイントで、時間遅れを持った信号が「引き出」される。引き出された値は、反射面に沿って点からの距離での空気による減衰効果を近似するため振幅を小さくして加算される。
・合成された「ウエット」信号は、ブロック出力を出力させるために、元の「ドライ」信号と一定比率で混合される。
図12は図9に示された基本概念で用いるのに適切な壁効果要素1210の一例を示す概念図である。壁効果要素1210は、実際のステージからの反響をシミュレートする時間遅れを生成するために、ディフューズド・フィールド・マトリックス(DFM)技術を用いる。このようなサウンドの反響環境をシミュレートすることで、共鳴による不快なピークを招くことなく、音楽に活力を加えることができ、あるいは音楽に残響のない「活気のある」音質を加えるために、ディフューズド・フィールド・マトリックスによるエネルギーを与えることができる。
一般的なDFM技術は、調和振動と共鳴のない波の反射についての数論によるアルゴリズムを用いる。例えば、M. R. Schroeder, Springer-Verlag, Berlinの「Number Theory in Science and Communication」1986年、第2版の15.8節に記載された平方余剰と13.9節に記載された原始根は、この文脈に適用することができる。これらの一般的な技術は、しかしながら、部屋の「残響」をシミュレートする時間の長い反響を与えるのみである。早期に反射してくるサウンド、すなわち直接のサウンドから5から30ミリセカンド以内に反射するサウンドを提供するために、ディフューズド・フィールド・マトリックスDFM技術を用いることでSchroederによる方法を改良する、原始根の計算を適用することが好ましい。
壁効果要素1210は、強い周期的な処理アーティファクト又は煩わしい周期的特徴を持つ不快な現象を破棄し、成形し又は取り除くための手助けをすることができる。このシミュレータ段階で用いられるDFM技術は、この処理要素の出力から入力へのフィードバックである再生信号を用いない。この処理の段階での制御パラメータには、大きさと壁からの距離が含まれる。
図12を参照して、ここで壁効果要素1210の装置を以下に説明する。単一チャンネルでの壁効果処理が図12に示されているが、ステレオ効果、2つのこのようなチャンネルに対しても使ってよいことがわかる。
チャンネルへの入力は、直接ウエット/ドライミキサーの一方の入力に入る経路と、フィルター、時間遅れ及び加算を行ない、その出力がウエット/ドライミキサーの他方の入力に入る経路の2つの経路に分かれる。壁効果要素1210の出力は、矢印1218で示すように、直接経路1212からの情報と処理がなされる経路1216からの情報とを異なる比率又は割合で出力するような調整を行うことができる。
経路1216に沿って、入力してきた各サンプルはローパスフィルター1222に入る。そしてフィルターされたサンプルは、周回遅延ライン1222に入る。図12から分かるように、n乗算器のタップは、加算を行うために、遅延ライン1222の異なった点に設けてよい。
Figure 0004817658
ここで、タップの数はx+1に等しく、D(n)は時間遅れを持ったサンプルnを表し、S(i)は出力に加える係数を表す。xの値は、実際の装置における適用可能な処理電力量により決まる。このようにして、D*Sの総和は乗算タップのすべての位置で計算される。動作の一部分として、乗算タップの位置指標は右にシフトされ、この位置指標は遅延ラインの終端を通り過ぎ、位置指標は遅延ライン1222の始点周辺で完了する。この加算動作の出力は総和「y」となり、ウエット/ドライミキサー1214の一方の入力に入力する。
図12で提供された壁効果要素1210の例において、周回遅延ラインの全長はサンプルレートFs=48kHzにおいて90msecであり、6個(x=5)の乗算タップがある。また、最長の反射(W)は、サンプルレートFs=48kHzにおいて30msec以下である。W軸の長さは壁効果の「大きさ」に影響を与える。また、壁効果の「混合」は、(記号的に)矢印にて示したウエット/ドライ比の設定機能を意味する。図12に示すように壁効果要素1210は、完全な畳み込みが行われないので有限インパルス応答フィルター(FIR)ではない。
壁効果要素1210の出力は部屋効果要素1310に入力させてもよい。
図13は、図9に示された基本概念で用いられるのに適した、部屋効果要素1310の一例を示した概念図である。図13を参照して、ここで、部屋効果要素1310の装置を以下に説明する。部屋効果要素の装置の1つのセクションを図13に示したが、2以上のこのようなセクションがステレオ又はマルチチャンネルの実施形態において用いられることを理解すべきである。
部屋効果要素1310は、DFM技術を用い、自然な部屋の音響に類似する時間遅れと共鳴をもたらす。DFM技術は、再生成を用いる点を除いて、壁効果要素1210で用いられるものに類似する。壁効果要素1210は、ドライな音楽素材とぼんやりしたかすかなコーディックに起因する歪みを改善するために、残響と減衰を加えることができる。この処理段階における他のパラメータには、部屋の大きさ、部屋のアスペクト比、及びウエット/ドライミキサーが含まれる。部屋効果要素1310は、本当の部屋環境における周囲の反響をシミュレートするために人工的な「遅延した」反響を付加するために用いられる。実施の形態による例では、8個のくし型フィルターを並列に接続したものと4個の全パスフィルターを直列に接続したものとの組み合わせを用いる。合成された反射の「ウエット」信号は、元の「ドライ」信号に定比で混合されて出力する。
さらなる音質改善は、音楽が録音される環境又はシミュレートされた録音環境(実際に音楽が録音された環境とは異なってもよい)を補償することで得られる。クライアントには複数の録音環境が与えられる。好ましい実施の形態によれば、以下の10のシミュレートされた録音環境がクライアントにより選択される。すなわち、スタジオ、ジャズセッション、ナイトクラブ、ゲームスペース、バスジャム、劇場、ロックコンサート、ソニックワイド、シンフォニー、又は大聖堂である。例えば、スタジオ環境では初期の反響の改善がなされる。又は、「大聖堂」ではかなり長い残響時間を持たせるのに対して、「ナイトクラブ」環境では、短い残響となる。ある意味では、ユーザは、どのように音楽を録音するかをシミュレートする「プロデューサ」になる。あるいは、シミュレートされた録音環境のアプリケーションは、ユーザの好みよりむしろ、音楽が録音された実際の環境にのみに基づくようにしてもよい。この場合、システムは録音から不快なアーティファクトを修正してもよく、ダウンロードされたファイル又はストリーム中のファイルは、適切な録音ルーム音響を特定するID3タグやMP3ファイルのようなタグを含んでもよい。
図13に示された部屋効果要素1310の装置は、各々くし型フィルター1314a‐hにより処理される複数の並列経路(本例では各々8個の経路1312a‐h)を採用する。これらの各くし型フィルター1314出力は、加算器1316で加算され、次いで、いくつかの全パスフィルター部1318,1320,1322,及び1324に入力する。各くし型フィルター1314は、従来の処理技術で普通に生じていた「金属的な」又は「小さな」アーティファクトの量を減らすための異なった改善量の残響を提供するためにパラメータ化される。実際の実施形態において、くし型フィルターと全パスフィルターは、好ましい出力信号を出力させるために経験のあるサウンドエンジニアが手で調整してもよい。
以下に部屋効果要素1310におけるサウンド信号の処理について説明する。この信号はサブソニック改善要素に入力する。
実施形態の一例によれば、サブソニック改善要素は信号の低音域改善のために可変Qローパスフィルターと圧縮装置との結合を用いる。サブソニック効果要素には、以下の特徴、及び/又は特性を持たせてもよい。
・周波数領域で平坦な又は「こぶのある」応答になるように、ローパスフィルターエッジ周波数及び「Q」はどちらも可変とする。
・圧縮装置は、時間に対する振幅を追跡することで低音域の信号の平均エネルギーを上げる。こうエネルギー成分は制限され、低エネルギー成分は増幅され、平均エネルギーを上げる。
・フィルターのかかった「ウエット」信号はゲイン制御がなされ、元の「ドライ」信号に加算されて、ブロック出力の可変制御を行う。
図14は、図9のサブソニック効果要素948の基本概念の機能ブロックを示す。図14において、単一のチャンネルが描かれているが、ステレオ表現のためには2つのセクションが使われることがわかる。本発明の好ましい実施の形態において、サブソニック効果機能1410は、2つの経路すなわち、(1)元の入力信号が保たれるフィルターも圧縮もされない経路1412と、(2)好ましくは各々ローパスフィルター1416と圧縮装置1418によりフィルターされ圧縮される経路1414に伝達されるチャンネル入力信号の結合したもので組み立てられる。これらの2つの信号は、サブソニック効果要素1410のために出力チャンネルに出力するために加算要素1420に示したように加算されることが好ましい。加算要素1420において、矢印1422は、チャンネル入力信号の低周波成分の量を改善又は減らすために、フィルターされない/圧縮されない信号に対するフィルターされる/圧縮される信号の比を選択可能なように操作されることを示している。
ローパスフィルター1416のフィルター特性と圧縮装置1418の特性とは、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。
上記に図9と関連して説明したように、予測AGC要素950は、予測自動ゲイン制御機能を提供する。この特性により、オーディオレベルはピーク時に下げられ、ピークが過ぎ去った後元に戻される。リスニング段階又は録音時、サウンドが歪まないようにするために、耳障りな楽器や音声のボリューム制御を下方に動かすことにより、人であるエンジニアが常にボリュームを下げていた。原則的に人であるエンジニアをシミュレートすることにより、自動予測ゲイン制御(AGC)要素950は、ピーク・イベントを特定するために歪みをもたらすデジタル信号の流れ及び信号の過負荷を分析し、オーディオのレベルを下げる。そして、ピーク・イベントが起こった後、好ましくないダイナミック端の損失と平坦なサウンドを招くようなオーディオ圧縮回路の「常時オン」の必要をなくして、元のボリューム設定値に戻す。実施形態の一例において、信号経路は以下のように要約される。
・信号は、周回遅延ラインに適用される。
・信号は全波整流され、その結果値は、「ターゲット」振幅に対して測定される(ターゲット振幅は好ましいダイナミックレンジに対する最大値を意味する)。
・整流された信号がターゲット値を越えたら、制御増幅器のゲインは、あらかじめ定めた「ネガティブランプ」値に従って減少してゆく。
・整流された信号がターゲット値より低い場合は、制御増幅器のゲインは、あらかじめ定めた「ポジティブランプ」値に従って増加してゆく。
・出力信号サンプルは遅延ラインの早い位置から取り出され、制御増幅器に適用される。増幅された信号はブロックの出力となる。
図15は、予測AGC要素950の装置を機能ブロックのレベルで示す。予測AGC要素950は機能ブロックのレベルで示されているので、当業者は、ここに書かれた詳細な説明を踏まえて、これらの機能がソフトウエア、ハードウエア、ファームウエア、又はこれらの組み合わせで、本発明の精神を損なうことなく認識できるであろう。さらに、図15では、単一のチャンネルが描かれているが、ステレオ表現のためには2つのセクションが使われるであろう。
予測AGC装置1510は図15に描かれており、チャンネンル入力信号は遅延ライン1512の入力で受信される。遅延ライン1512はデジタル遅延ラインが好ましく、サンプリング周波数が約48kHzで千(1000)サンプルのチャンネル入力を受け入れることができることが好ましい。遅延ライン1512の出力は電圧制御増幅器1514の入力となる。電圧制御増幅器の運転は、フィルター機能1516を遅延ライン1512殻のサンプルに適用することによって得られる信号レベルにより制御される。電圧制御増幅器1514の制御入力を標示するマイナス(−)記号で示されているとおり、フィルターされたサンプルレベルが増大すると、電圧制御増幅器1514のゲインは減少し、逆もまた同様とすることが好ましい。
フィルター機能1516はローパス機能であることが好ましく、遅延ライン1512の最初のブロックの出力とグランドのような参照電圧との間に接続されていて、可変抵抗1522と直列接続された可変キャパシタンス1520として図15に示されている。このように、カットオフ周波数を越える周波数はそれに比例して影響が小さくなるのに対して、ローパス機能1516のカットオフ周波数を下回る周波数は電圧制御増幅器1514のゲイン調整に最大の影響を与える。当業者に知られているとおり、フィルター機能1516における可変キャパシタンスと可変抵抗の設定はフィルター機能の周波数特性に影響を与える。動作時のこれらの設定については、本発明の動作に関連して実行されるここに記載された他の処理機能からの要求にしたがって決定してもよい。
予測AGC要素1510は、信号処理フローの出力端において、固有の時間遅れを与えることに注意すべきである。時間遅れ機能を処理フロー中のこの点に置くことは、信号フローの初期端の各チャンネルで時間遅れ要素を用いるのに比べて優れていることが本発明により見出された。このような構成の優位性の中でも、リスナーに届く前に波形の修正ができるバッファ機能が特筆される。
図16aは、図9の(コア処理と標示された)適応デュナーミックタイプの処理ブロックの装置の一例を示している。図16bは図16aのサウンド経路の時間応答特性を示したものである。
入力信号は、AI(人工知能)デュナーミック・プレ圧縮装置の入力1602で受け取られる。この信号は、フルレンジバッファ増幅器1612、ローパスバッファ増幅器1611、バンドパスバッファ増幅器1610、及び、ハイパスバッファ増幅器1609に等しく分配される。
フルレンジストリームはフルレンジストリーム圧縮装置1601に入り、レシオ、エンベロープアタック及びエンベロープリリースに関して時間領域の修正が行われ、最大ターゲットレベルが設定される。次に、信号は、バッファ増幅器1613に入り、次いで、加算増幅器1617に入る。
ローパスレンジストリームは、バッファ増幅器1611に入り、ローパスフィルター1605を経由してローパスストリーム増幅器1632に入り、レシオ、エンベロープアタック及びエンベロープリリースに関して時間領域の修正が行われ、最大ターゲットレベルが設定される。次に、信号は、バッファ増幅器1614に入り、次いで、加算増幅器1617に入る。
バンドパスストリーム又は中間パスストリームは、バッファ増幅器1610に入り、バンドパスフィルター1606を経由し、レシオ、エンベロープアタック及びエンベロープリリースに関して時間領域の修正が行われ、最大ターゲットレベルが設定される。次に、信号は、バッファ増幅器1615に入り、次いで、加算増幅器1617に入る。
ハイパスストリームは、バッファ増幅器1609に入り、ハイパスフィルター1607を経由し、レシオ、エンベロープアタック及びエンベロープリリースに関して時間領域の修正が行われ、最大ターゲットレベルが設定される。次に、信号は、バッファ増幅器1616に入り、次いで、加算増幅器1617に入る。全ストリーム、ローストリーム、中間ストリーム、及びハイストリームを付け加えることで、部屋環境(音圧)の低周波デュナーミックと中間レンジのサウンド(波形+音圧)と高周波サウンド(音響波形)とが結合してライブコンサートのリスナーの耳に与える実際のサウンドをシミュレートする。これらの波の総和により、必要なら過度の周波数における非線形性を除去するために周波数領域で正規化することのできる、時間領域での波形の組み合わせが創られる。
加算増幅器1617の出力1631は図9の音声改善ブロック934に入る。
公開された実施形態における一つの装置の実際の設定値が図16aに含まれている。これらの値から分かるように、各ストリーム中の圧縮装置ブロックに用いられるアタック、リリース、ゲインレシオ、及びターゲットレベルに明確な差異がある。上述のように、これらの各ストリームでの圧縮装置、フィルター、及びゲインブロックのパラメータの設定が異なっているのは、処理したサウンド信号に時間ビート又は思わぬ特性を生じさせようとするものである。
圧縮装置ブロックでのアタックパラメータは、サウンドレベルの増加率の変化させるためにどれだけ速くその経路が応答するかを決定する。アタックの設定を大きくすればするほど応答が速くなる。リリースパラメータは、圧縮装置の入力に適用するサウンド信号の下降に対して、圧縮装置の出力がどれだけ遅れるかを制御する。リリースの設定の大きさが大きいほど、遅れが大きくなる。ゲインレシオは、圧縮装置のターゲットレベルまでの入力信号対出力信号のエンベロープのダイナミック比である。ターゲットレベルは閾値として使われるのではなく、圧縮装置の出力として許容される(デジタル信号処理の意味において)最大のビット数として用いられる。
フィルターされないフルレンジストリーム経路[1612→1601→1613]の設定は全帯域を提供するためのものであり、サラウンディング環境のない舞台設定から期待されるサウンドの提供をシミュレートする高SPLを提供するためのものである。
ローストリーム経路[1611→1632→1614]の設定は低周波サウンドを扱うためのものであり、例えば、周囲から返ってくる中間周波又は高周波が非常に少ないような、「死んだ」環境から出てくることが期待されるサウンド特性をシミュレートするためのものである。
中間ストリーム経路[1610→1603→1615]の設定は中間周波サウンドを扱うためのものであり、「採点」ステージのような、もっと活気のある環境から出てくることが期待されるサウンド特性をシミュレートするためのものである。
ハイストリーム経路[1609→1607→1616]の設定は高周波サウンドを扱うためのものであり、「漆喰」壁のような、さらに活気のある環境から出てくることが期待されるサウンド特性をシミュレートするためのものである。
以下に図16aにおける各ストリームの通常のパラメータ設定の表を以下に記載する。
Figure 0004817658
満足できる動作を行うもう1つのパラメータ設定は、
Figure 0004817658
ここで図16bを参照すると、左側のグラフは、異なるサウンド経路又はサウンドストリームについての、アタック、リリース、ターゲットレベル、及びゲインレシオ間の関係を示している。また、ストリーム間の応答特性の時間との関係を見ることができる。最後に、シートの右側のグラフは、処理を結合した応答特性を示している。したがって、これらの曲線から、周囲のデュナーミックは、ローストリームサウンド経路、中間ストリームサウンド経路及びハイストリームサウンド経路の各々から提供され、直接サウンドデュナーミックはフルレンジストリーム経路から提供されることがわかる。
この実施の形態において、フルレンジのストリーム経路は直接サウンドを補強し、ローレンジのストリーム経路は音圧を補強し、中間レンジのストリーム経路は波形と圧力の両方を補強し、ハイレンジのストリーム経路は、波形を補強する。
これらのストリームの各々についてのグラフは、時間の関数としてのストリームにおける、アタック、リリース、ゲインレシオ、及びターゲットレベル間の違いを描いていることに注意すべきである。このように、フルレンジストリームのエンベロープは、示されたベースラインに対して最大のエネルギーレベルを持ち、他のストリームよりも、鋭い上昇時間と下降時間を持つ。各曲線の時間t1とt2の間の時間に関して、ハイストリームの経路は、そのエネルギーをt1とt2の間の中間部に集中させていることに注意すべきである。一方、ローレンジストリームのエネルギー分布は、t1とt2の間の多くの時間を占め、さらにt1の前の点及びt2を越える点にも拡がっている。
図16aの参照を続けて、好ましい実施の形態には「近接制御(proximity control)」機能が含まれ、これによりリスナーは直接サウンドステージと反射してきた(又はシミュレートされた)サウンドステージとの割合を調整することができる。近接制御機能は、フルレンジストリーム圧縮装置1601のゲイン比要素に調整装置を用意することにより実施の形態例に組み込むことができる。このゲイン比を増やすと、リスナーが聞く出力信号は、反射成分が少なくなり事実上より直接的になる。反対に、このゲイン比を減らすと、リスナーが聞く出力信号は、反射成分が多くなり事実上より間接的になる。実際の実施の形態においては、このゲイン比は公称レンジが1.2から2.5とする、0.8から5.0までのレンジを持つ。
好ましい実施の形態が添付図に示され前記詳細な説明に記載されているが、本発明は、開示された実施の形態に限定されるものでなく、特許請求の範囲に述べられ定義される発明及びそれと同等なものの思想から外れることなく多くの再構成、改造及び置き換えが可能であることは理解されるであろう。
添付図を考慮し詳細な説明と特許請求の範囲を参照することで本発明をさらに十分に理解することができよう。
好ましい実施の形態による、圧縮したオーディオデータの音質を改善させる先進的な技術のフローダイアグラムである。 好ましい実施の形態による、ネットワークのサーバ側での、音質を改善させる処理を示すブロックダイアグラムである。 好ましい実施の形態による、ネットワークのクライアント側での、音質を改善させる処理を示すブロックダイアグラムである。 他の好ましい実施の形態による、ネットワークのクライアント側での、音質を改善させる処理を示すブロックダイアグラムである。 好ましい実施の形態による、オーディオ信号の音質を改善させる処理機能を示すブロックダイアグラムである。 好ましい実施の形態による、制限された帯域幅の音楽のクライアント側での音質の改善に関係する処理機能を示すブロックダイアグラムである。 他の好ましい実施の形態による、オーディオ信号の質を改善させる処理機能を示すブロックダイアグラムである。 他の好ましい実施の形態による、オーディオ信号の質を改善させる処理機能を示すブロックダイアグラムである。 他の好ましい実施の形態による、オーディオ信号の質を改善させる処理機能を示すブロックダイアグラムである。 好ましい実施の形態による、制限された帯域幅の音楽のクライアント側での質の改善に関係する処理機能を示すブロックダイアグラムである。 図1に描かれた基本設計概念とともに用いるために適したボーカルの質を改善する要素の例を示す概念図である。 図10に描かれた基本設計概念とともに用いるために適した空間特性の質を改善する要素の例を示す概念図である。 図10に描かれた基本設計概念とともに用いるために適した壁効果の要素の例を示す概念図である。 図10に描かれた基本設計概念とともに用いるために適した部屋効果の要素の例を示す概念図である。 図10に描かれた基本設計概念とともに用いるために適したサブソニック効果の要素の例を示す概念図である。 図10に描かれた基本設計概念とともに用いるために適した予測AGCの要素の例を示す概念図である。 図10の動的適応タイプの処理ブロック(コア処理に分類される)の実施例を示す図である。 図16Aのサウンド経路の時間応答特性を示す図である。

Claims (11)

  1. オーディオ信号を改善するための方法であって、
    オーディオ信号を受信する段階と、
    前記オーディオ信号を不連続の帯域に対応する成分信号に分割する段階であって、該成分信号は全帯域幅成分信号、低音域成分信号、中音域成分信号、及び高音域成分信号からなることを特徴とする段階と、
    処理された信号成分を取得するために成分信号を個別の処理経路で処理する段階であって、該個別の処理経路には、サウンドレベルを伸張することなく全帯域幅成分信号を処理するための全帯域幅経路と、サウンドレベルを伸張して低音域成分信号を処理するための低音域経路と、サウンドレベルを伸張して中音域成分信号を処理するための中音域経路と、サウンドレベルを伸張して高音域成分信号を処理するための高音域経路とが含まれることを特徴とする段階と、
    前記処理された成分信号を1以上のチャンネルにおいて基準信号に統合する段階と、
    前記基準信号に付加的な後処理を行う段階と、
    を具備することを特徴とする、オーディオ信号を改善するための方法。
  2. 前記オーディオ信号は圧縮されたオーディオ信号であることを特徴とする請求項1に記載の方法。
  3. 前記後処理は、
    前記改善されたオーディオ信号の音場に奥行きと活力を与える3D/ライブ音質改善する段階と、
    前記改善されたオーディオ信号に拡散、残響、深み、再生、及び部屋減衰を与えるレコーディング環境シミュレーション段階と、
    前記改善されたオーディオ信号のボーカルを減少させるための音声削減段階と、
    前記改善されたオーディオ信号の音場に広いステレオの奥行きを付加する広いステレオ音質改善段階と、
    前記改善されたオーディオ信号の広いスペクトル形成をもたらすためのパラメトリック・イコライゼイション段階と、
    サブウーハ周波数とバス周波数とを強化するために前記改善されたオーディオ信号にフィルターをかける段階と、
    ステージからの反響をシミュレートする時間遅れを生じさせるための壁シミュレーション段階と、
    自然な部屋音響をシミュレートする時間遅れを生成するための部屋シミュレーション段階と、
    左右の信号チャンネルから同一エネルギー成分を除去するためのカラオケ改善段階と、
    ボーカル特性を明確にするボーカル改善段階と、
    前記改善されたオーディオ信号の低音域強化のためのサブソニック改善段階と、
    出力のダイナミックレンジを制御するための予測自動ゲイン制御段階と、
    のうちの少なくとも1つを具備することを特徴とする請求項1に記載の方法。
  4. 送信されたオーディオデータを改善するための方法であって、
    オーディオデータをデジタル的にフォーマットされた信号にコード化する段階と、
    失われること又は歪むことが予想される周波数及びデュナーミックをプリエンファシスして改善されたオーディオ信号とする、デジタル的にフォーマットされた信号を改善する段階と、
    前記改善されたオーディオ信号を圧縮して、改善され圧縮されたオーディオ信号とする段階であって、送信する前に前記改善されたオーディオ信号を圧縮する段階には、該オーディオ信号内のサウンドストリーム間の時間ビートを生成することでオーディオ信号を補正し、補正されたオーディオ信号とする段階と、前記補正されたオーディオ信号に反響成分を挿入する段階とが含まれることを特徴とする段階と、
    前記改善されたオーディオ信号をクライアント・サイトに送信する段階と、
    前記改善され圧縮されたオーディオ信号を伸張する段階と、
    前記改善されたオーディオ信号に含まれるデータをデコーディングして、デコーディングされたオーディオ信号とする段階と、
    失われること又は歪むことが予想される周波数及びデュナーミックをプリエンファシスすることで保存した周波数及びデュナーミックを復元するために前記デコーディングされたオーディオ信号を処理する段階と、
    を具備することを特徴とする、送信されたオーディオデータを改善するための方法。
  5. 前記補正する段階には、
    前記オーディオ信号に対して少なくとも第1のサウンドストリームと第2のサウンドストリームとを形成する段階と、
    前記第1のサウンドストリームと前記第2のサウンドストリームとの時間的整合性を維持した状態で、前記第2のサウンドストリーム中の前記オーディオ信号の特性を変化させる段階と、
    が含まれることを特徴とする請求項4に記載の方法。
  6. 前記形成する段階には、第1の一組のパラメータに従って前記第1のサウンドストリームのオーディオ信号を圧縮する段階が含まれ、
    前記変化させる段階には、
    前記第2のサウンドストリームのオーディオ信号にフィルターをかけ、フィルターされたオーディオ信号にする段階と、
    前記フィルターされたオーディオ信号を、前記第1の一組のパラメータとは異なる第2の一組のパラメータに従って圧縮する段階と、
    が含まれることを特徴とする請求項5に記載の方法。
  7. 選択された環境から放散されるサウンドの特性を持った前記第2のサウンドストリームからのオーディオ信号を変化させるために、前記第2の一組のパラメータを選択する段階が含まれることを特徴とする請求項6に記載の方法。
  8. 前記補正する段階には、
    フルレンジ・サウンドストリームとローレンジ・サウンドストリームと中間レンジ・サウンドストリームとハイレンジ・サウンドストリームとを形成する段階と、
    ローパスフィルターがかけられたオーディオ信号を得るために、ローレンジ・サウンドストリーム中の前記オーディオ信号にローパスフィルターをかける段階と、
    「デッド」環境のパラメータの組に従って前記ローパスフィルターがかけられたオーディオ信号を圧縮する段階と、
    バンドパスフィルターがかけられたオーディオ信号を得るために、中間レンジ・サウンドストリーム中の前記オーディオ信号にバンドパスフィルターをかける段階と、
    「スコアリング」環境のパラメータの組に従って前記バンドパスフィルターがかけられたオーディオ信号を圧縮する段階と、
    ハイパスフィルターがかけられたオーディオ信号を得るために、ハイレンジ・サウンドストリーム中の前記オーディオ信号にハイパスフィルターをかける段階と、
    「漆喰壁」環境のパラメータの組に従って前記ハイパスフィルターがかけられたオーディオ信号を圧縮する段階と、
    が含まれることを特徴とする請求項4に記載の方法。
  9. 前記デコーディングされたオーディオ信号を処理する段階には、
    前記オーディオ信号中のサウンドストリームのデュナーミックに偏差を生成することでオーディオ信号を補正し、補正されたオーディオ信号にする段階と、
    改善されたオーディオ信号を形成するために予測可能な環境特性を前記補正されたオーディオ信号に付加する段階と、
    前記改善されたオーディオ信号をリスナーに配信する段階と、
    が含まれることを特徴とする請求項4に記載の方法。
  10. さらに、リスナーに代わりのリスニング音場の制御性を提供するために、前記改善されたオーディオ信号に音場を改善する機能を挿入する段階を含むことを特徴とする請求項9に記載の方法。
  11. デジタル・オーディオ・ファイルを再生する装置であって、
    デジタル・オーディオ信号源と、
    前記デジタル・オーディオ信号源と結合された少なくとも1つのプロセッサであって、該少なくとも1つのプロセッサは、
    前記デジタル・オーディオ信号源からオーディオ信号を受信する段階と、
    前記オーディオ信号を不連続の帯域に対応する成分信号に分割する段階であって、該成分信号は全帯域幅成分信号、低音域成分信号、中音域成分信号、及び高音域成分信号からなることを特徴とする段階と、
    処理された成分信号を取得するために成分信号を個別の処理経路で処理する段階であって、該個別の処理経路には、サウンドレベルを伸張することなく全帯域幅成分信号を処理するための全帯域幅経路と、サウンドレベルを伸張して低音域成分信号を処理するための低音域経路と、サウンドレベルを伸張して中音域成分信号を処理するための中音域経路と、サウンドレベルを伸張して高音域成分信号を処理するための高音域経路とが含まれることを特徴とする段階と、
    前記処理された成分信号を1以上のチャンネルにおいて基準信号に統合する段階と、
    前記基準信号に付加的な後処理を行う段階と、
    を具備する方法を実行することを特徴とするプロセッサと、
    前記プロセッサに結合された1以上のスピーカ・ドライバであって、該1以上のスピーカ・ドライバは前記改善されたオーディオ信号の再生を行うための1以上のスピーカを駆動するために構成されていることを特徴とするスピーカ・ドライバと、
    を具備することを特徴とするデジタル・オーディオ・ファイルを再生する装置。
JP2004511932A 2002-06-05 2003-06-05 音響仮想現実エンジンおよび配信された音声改善のための新技術 Expired - Lifetime JP4817658B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38654102P 2002-06-05 2002-06-05
US60/386,541 2002-06-05
US47218003P 2003-05-20 2003-05-20
US60/472,180 2003-05-20
PCT/US2003/017788 WO2003104924A2 (en) 2002-06-05 2003-06-05 Acoustical virtual reality engine and advanced techniques for enhancing delivered sound

Publications (2)

Publication Number Publication Date
JP2005529520A JP2005529520A (ja) 2005-09-29
JP4817658B2 true JP4817658B2 (ja) 2011-11-16

Family

ID=29739907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004511932A Expired - Lifetime JP4817658B2 (ja) 2002-06-05 2003-06-05 音響仮想現実エンジンおよび配信された音声改善のための新技術

Country Status (7)

Country Link
US (1) US8676361B2 (ja)
EP (1) EP1532734A4 (ja)
JP (1) JP4817658B2 (ja)
KR (1) KR101118922B1 (ja)
CN (1) CN100481722C (ja)
CA (1) CA2488689C (ja)
WO (1) WO2003104924A2 (ja)

Families Citing this family (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7542815B1 (en) 2003-09-04 2009-06-02 Akita Blue, Inc. Extraction of left/center/right information from two-channel stereo sources
US7742832B1 (en) * 2004-01-09 2010-06-22 Neosonik Method and apparatus for wireless digital audio playback for player piano applications
JP2005223714A (ja) * 2004-02-06 2005-08-18 Sony Corp 音響収音装置、音響収音方法、記録媒体
JP2005223713A (ja) 2004-02-06 2005-08-18 Sony Corp 音響再生装置、音響再生方法
US8009837B2 (en) * 2004-04-30 2011-08-30 Auro Technologies Nv Multi-channel compatible stereo recording
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) * 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US9413321B2 (en) 2004-08-10 2016-08-09 Bongiovi Acoustics Llc System and method for digital signal processing
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US9281794B1 (en) 2004-08-10 2016-03-08 Bongiovi Acoustics Llc. System and method for digital signal processing
US8462963B2 (en) * 2004-08-10 2013-06-11 Bongiovi Acoustics, LLCC System and method for processing audio signal
US8565449B2 (en) * 2006-02-07 2013-10-22 Bongiovi Acoustics Llc. System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US8284955B2 (en) * 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
US7254243B2 (en) * 2004-08-10 2007-08-07 Anthony Bongiovi Processing of an audio signal for presentation in a high noise environment
US8687822B1 (en) * 2005-01-12 2014-04-01 Meyer Sound Laboratories, Incorporated Filtering system for equalizing a loudspeaker system
JP5046654B2 (ja) 2005-01-14 2012-10-10 パナソニック株式会社 スケーラブル復号装置及びスケーラブル復号方法
US7184557B2 (en) 2005-03-03 2007-02-27 William Berson Methods and apparatuses for recording and playing back audio signals
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
US20090296959A1 (en) * 2006-02-07 2009-12-03 Bongiovi Acoustics, Llc Mismatched speaker systems and methods
US11202161B2 (en) 2006-02-07 2021-12-14 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
US9195433B2 (en) 2006-02-07 2015-11-24 Bongiovi Acoustics Llc In-line signal processor
US10069471B2 (en) 2006-02-07 2018-09-04 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
US8705765B2 (en) * 2006-02-07 2014-04-22 Bongiovi Acoustics Llc. Ringtone enhancement systems and methods
US9615189B2 (en) 2014-08-08 2017-04-04 Bongiovi Acoustics Llc Artificial ear apparatus and associated methods for generating a head related audio transfer function
US9348904B2 (en) * 2006-02-07 2016-05-24 Bongiovi Acoustics Llc. System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US20090276210A1 (en) * 2006-03-31 2009-11-05 Panasonic Corporation Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof
JP4975376B2 (ja) * 2006-05-31 2012-07-11 パナソニック株式会社 音響再生システム
TWI311892B (en) * 2006-08-17 2009-07-01 High Tech Comp Corp Audio signal processing method and related device
TWI322945B (en) * 2006-09-18 2010-04-01 Quanta Comp Inc Audio data transmission system and audio data transmission method
US20080240448A1 (en) * 2006-10-05 2008-10-02 Telefonaktiebolaget L M Ericsson (Publ) Simulation of Acoustic Obstruction and Occlusion
US8005239B2 (en) * 2006-10-30 2011-08-23 Hewlett-Packard Development Company, L.P. Audio noise reduction
JP5048782B2 (ja) * 2006-11-30 2012-10-17 ボンジョビ、アンソニー デジタル信号処理のためのシステム及び方法
US8139487B2 (en) 2007-02-28 2012-03-20 Microsoft Corporation Strategies for selecting a format for data transmission based on measured bandwidth
CN101641965A (zh) * 2007-03-20 2010-02-03 日本电气株式会社 电子设备用声音处理***、方法以及便携电话终端
EP2248352B1 (en) 2008-02-14 2013-01-23 Dolby Laboratories Licensing Corporation Stereophonic widening
KR101230479B1 (ko) * 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
US20090232316A1 (en) * 2008-03-14 2009-09-17 Chieh-Hung Chen Multi-channel blend system for calibrating separation ratio between channel output signals and method thereof
US20100131417A1 (en) * 2008-11-25 2010-05-27 Hank Risan Enhancing copyright revenue generation
US20120010737A1 (en) * 2009-03-16 2012-01-12 Pioneer Corporation Audio adjusting device
US8699849B2 (en) * 2009-04-14 2014-04-15 Strubwerks Llc Systems, methods, and apparatus for recording multi-dimensional audio
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
KR101196410B1 (ko) * 2009-07-07 2012-11-01 삼성전자주식회사 Tv 설치타입에 기초한 자동 환경 설정방법 및 이를 적용한 tv
US20110035686A1 (en) * 2009-08-06 2011-02-10 Hank Risan Simulation of a media recording with entirely independent artistic authorship
US8674935B2 (en) * 2009-10-21 2014-03-18 Qualcomm Incorporated System delay mitigation in interactive systems
KR101106465B1 (ko) * 2009-11-09 2012-01-20 네오피델리티 주식회사 멀티밴드 drc 시스템의 게인 설정 방법 및 이를 이용한 멀티밴드 drc 시스템
KR101613684B1 (ko) * 2009-12-09 2016-04-19 삼성전자주식회사 음향 신호 보강 처리 장치 및 방법
TWM390014U (en) * 2010-01-14 2010-10-01 Phonic Corp Speaker box with feedback suppression capability and mixer
US20110317841A1 (en) * 2010-06-25 2011-12-29 Lloyd Trammell Method and device for optimizing audio quality
JP5532518B2 (ja) * 2010-06-25 2014-06-25 ヤマハ株式会社 周波数特性制御装置
US20130108073A1 (en) * 2010-07-09 2013-05-02 Bang & Olufsen A/S Method and apparatus for providing audio from one or more speakers
JP2012156649A (ja) * 2011-01-24 2012-08-16 Roland Corp 低音増強処理装置、楽器用スピーカ装置、および音響効果装置
BR112013031994A2 (pt) * 2011-06-13 2017-06-06 Venkata Chalapathy Krishnappa Narayana sistema de produção de som estéreo digital surround tridimensional natural a 360 graus
WO2012177572A2 (en) * 2011-06-24 2012-12-27 Beats Electronics, Llc Optimization method for audio playback systems
US8965774B2 (en) * 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
US20130178964A1 (en) * 2012-01-08 2013-07-11 Oliver Bergmann Audio system with adaptable audio output
US20130178963A1 (en) * 2012-01-08 2013-07-11 Oliver Bergmann Audio system with adaptable equalization
KR101676634B1 (ko) * 2012-08-31 2016-11-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 오브젝트―기반 오디오를 위한 반사된 사운드 렌더링
WO2014083569A1 (en) * 2012-11-29 2014-06-05 Ghose Anirvan A system for recording and playback for achieving standardization of loudness of soundtracks in cinemas
US9344828B2 (en) * 2012-12-21 2016-05-17 Bongiovi Acoustics Llc. System and method for digital signal processing
TWI635753B (zh) 2013-01-07 2018-09-11 美商杜比實驗室特許公司 使用向上發聲驅動器之用於反射聲音呈現的虛擬高度濾波器
US20150005661A1 (en) * 2013-02-22 2015-01-01 Max Sound Corporation Method and process for reducing tinnitus
US9060223B2 (en) * 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
US9247342B2 (en) 2013-05-14 2016-01-26 James J. Croft, III Loudspeaker enclosure system with signal processor for enhanced perception of low frequency output
US9148734B2 (en) * 2013-06-05 2015-09-29 Cochlear Limited Feedback path evaluation implemented with limited signal processing
US9398394B2 (en) 2013-06-12 2016-07-19 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9264004B2 (en) 2013-06-12 2016-02-16 Bongiovi Acoustics Llc System and method for narrow bandwidth digital signal processing
US9746385B2 (en) * 2013-06-12 2017-08-29 Honeywell International Inc. System and method for measuring varying parameters using adaptive signal conditioning
CN103369431B (zh) * 2013-07-18 2015-08-12 瑞声光电科技(常州)有限公司 发声***
TWI673707B (zh) * 2013-07-19 2019-10-01 瑞典商杜比國際公司 將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道
EP3025516B1 (en) 2013-07-22 2020-11-04 Harman Becker Automotive Systems GmbH Automatic timbre, loudness and equalization control
CN105453594B (zh) * 2013-07-22 2020-03-03 哈曼贝克自动***股份有限公司 自动音色控制
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
US9565497B2 (en) * 2013-08-01 2017-02-07 Caavo Inc. Enhancing audio using a mobile device
US9831843B1 (en) 2013-09-05 2017-11-28 Cirrus Logic, Inc. Opportunistic playback state changes for audio devices
US9397629B2 (en) 2013-10-22 2016-07-19 Bongiovi Acoustics Llc System and method for digital signal processing
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US9774342B1 (en) 2014-03-05 2017-09-26 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US9525940B1 (en) 2014-03-05 2016-12-20 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
EP2930958A1 (en) * 2014-04-07 2015-10-14 Harman Becker Automotive Systems GmbH Sound wave field generation
US9306588B2 (en) 2014-04-14 2016-04-05 Cirrus Logic, Inc. Switchable secondary playback path
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
US10639000B2 (en) 2014-04-16 2020-05-05 Bongiovi Acoustics Llc Device for wide-band auscultation
US9615813B2 (en) 2014-04-16 2017-04-11 Bongiovi Acoustics Llc. Device for wide-band auscultation
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
US10078636B2 (en) 2014-07-18 2018-09-18 International Business Machines Corporation Providing a human-sense perceivable representation of an aspect of an event
WO2016009863A1 (ja) * 2014-07-18 2016-01-21 ソニー株式会社 サーバ装置、およびサーバ装置の情報処理方法、並びにプログラム
US9564146B2 (en) 2014-08-01 2017-02-07 Bongiovi Acoustics Llc System and method for digital signal processing in deep diving environment
JP6554769B2 (ja) * 2014-08-29 2019-08-07 ヤマハ株式会社 音響信号処理装置
US9596537B2 (en) 2014-09-11 2017-03-14 Cirrus Logic, Inc. Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
CN104244121B (zh) * 2014-09-26 2019-09-17 广州市华维世电子科技有限公司 一种可改变声音风格的麦克风
US9503027B2 (en) 2014-10-27 2016-11-22 Cirrus Logic, Inc. Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator
WO2016100237A1 (en) * 2014-12-15 2016-06-23 Gary Fox Ultra-low distortion integrated loudspeaker system
US9638672B2 (en) 2015-03-06 2017-05-02 Bongiovi Acoustics Llc System and method for acquiring acoustic information from a resonating body
US9584911B2 (en) * 2015-03-27 2017-02-28 Cirrus Logic, Inc. Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses
US10063969B2 (en) * 2015-04-06 2018-08-28 Aftermaster, Inc. Microchip for audio enhancement processing
US20180367228A1 (en) * 2015-04-06 2018-12-20 Aftermaster, Inc. Audio processing unit
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
DE112016004394B4 (de) 2015-09-28 2023-02-16 Asahi Kasei Microdevices Corporation Heulunterdrückungsvorrichtung
WO2017087495A1 (en) 2015-11-16 2017-05-26 Bongiovi Acoustics Llc Surface acoustic transducer
US9621994B1 (en) 2015-11-16 2017-04-11 Bongiovi Acoustics Llc Surface acoustic transducer
US9955254B2 (en) 2015-11-25 2018-04-24 Cirrus Logic, Inc. Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system
JP2017118338A (ja) * 2015-12-24 2017-06-29 株式会社村田製作所 電力増幅モジュール
US9543975B1 (en) 2015-12-29 2017-01-10 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
AU2017208909B2 (en) * 2016-01-18 2019-01-03 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
CA3011694C (en) * 2016-01-19 2019-04-02 Boomcloud 360, Inc. Audio enhancement for head-mounted speakers
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
US9607626B1 (en) * 2016-03-28 2017-03-28 Amazon Technologies, Inc. Dynamically reconfigurable filter bank
US9749741B1 (en) * 2016-04-15 2017-08-29 Amazon Technologies, Inc. Systems and methods for reducing intermodulation distortion
US9847079B2 (en) * 2016-05-10 2017-12-19 Google Llc Methods and apparatus to use predicted actions in virtual reality environments
WO2017196928A1 (en) 2016-05-10 2017-11-16 Google Llc Volumetric virtual reality keyboard methods, user interface, and interactions
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10951985B1 (en) * 2016-07-01 2021-03-16 Gebre Waddell Method and system for audio critical listening and evaluation
US10545561B2 (en) 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9813814B1 (en) 2016-08-23 2017-11-07 Cirrus Logic, Inc. Enhancing dynamic range based on spectral content of signal
CN106328153B (zh) * 2016-08-24 2020-05-08 青岛歌尔声学科技有限公司 电子通信设备语音信号处理***、方法和电子通信设备
US9780800B1 (en) 2016-09-19 2017-10-03 Cirrus Logic, Inc. Matching paths in a multiple path analog-to-digital converter
US9762255B1 (en) 2016-09-19 2017-09-12 Cirrus Logic, Inc. Reconfiguring paths in a multiple path analog-to-digital converter
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
US11245375B2 (en) * 2017-01-04 2022-02-08 That Corporation System for configuration and status reporting of audio processing in TV sets
US10477314B2 (en) * 2017-03-20 2019-11-12 Bambu Tech, Inc. Dynamic audio enhancement using an all-pass filter
CN107016990B (zh) * 2017-03-21 2018-06-05 腾讯科技(深圳)有限公司 音频信号生成方法及装置
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
AT520176B1 (de) * 2017-07-10 2019-02-15 Isuniye Llc Verfahren zum Modifizieren eines Audiosignals
US10313820B2 (en) 2017-07-11 2019-06-04 Boomcloud 360, Inc. Sub-band spatial audio enhancement
CN107657962B (zh) * 2017-08-14 2020-06-12 广东工业大学 一种语音信号的喉声和气声识别与分离方法及***
US11087776B2 (en) * 2017-10-30 2021-08-10 Bose Corporation Compressive hear-through in personal acoustic devices
CN110097888B (zh) * 2018-01-30 2021-08-20 华为技术有限公司 人声增强方法、装置及设备
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
AU2019252524A1 (en) 2018-04-11 2020-11-05 Bongiovi Acoustics Llc Audio enhanced hearing protection system
US11527256B2 (en) * 2018-04-25 2022-12-13 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN112262429A (zh) * 2018-06-12 2021-01-22 哈曼国际工业有限公司 用于自适应量级车辆声音合成的***和方法
EP3811360A4 (en) * 2018-06-21 2021-11-24 Magic Leap, Inc. PORTABLE SYSTEM VOICE PROCESSING
US11616482B2 (en) * 2018-06-22 2023-03-28 Dolby Laboratories Licensing Corporation Multichannel audio enhancement, decoding, and rendering in response to feedback
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
CN118075651A (zh) * 2018-10-05 2024-05-24 奇跃公司 用于音频空间化的加重
CN111048107B (zh) * 2018-10-12 2022-09-23 北京微播视界科技有限公司 音频处理方法和装置
CN109714681A (zh) * 2019-01-03 2019-05-03 深圳市基准半导体有限公司 一种采样率自适应的数字音频3d和混音效果的装置及其实现方法
WO2020180719A1 (en) 2019-03-01 2020-09-10 Magic Leap, Inc. Determining input for speech processing engine
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
CN110931033B (zh) * 2019-11-27 2022-02-18 深圳市悦尔声学有限公司 一种麦克风内置耳机的语音聚焦增强方法
NO345732B1 (en) * 2020-01-28 2021-07-05 Trondheim Audio Devices As Method and device for processing an audio signal
US11917384B2 (en) 2020-03-27 2024-02-27 Magic Leap, Inc. Method of waking a device using spoken voice commands
CN111294367B (zh) * 2020-05-14 2020-09-01 腾讯科技(深圳)有限公司 音频信号后处理方法和装置、存储介质及电子设备
CN112924012A (zh) * 2021-01-25 2021-06-08 中航华东光电(上海)有限公司 一种密闭小空间声学参数测量方法
JP2022144497A (ja) * 2021-03-19 2022-10-03 ヤマハ株式会社 音信号処理方法および音信号処理装置
WO2023206332A1 (en) * 2022-04-29 2023-11-02 Intel Corporation Enhanced latency-adaptive viewport prediction for viewport-dependent content streaming

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6046629A (ja) * 1983-08-25 1985-03-13 Sansui Electric Co 信号伝送方式
JPS6054538A (ja) * 1983-09-05 1985-03-29 Sansui Electric Co 信号伝送方式
US4633483A (en) * 1983-03-31 1986-12-30 Sansui Electric Co., Ltd. Near-instantaneous companding PCM involving accumulation of less significant bits removed from original data
WO2001050459A1 (en) * 1999-12-31 2001-07-12 Octiv, Inc. Techniques for improving audio clarity and intelligibility at reduced bit rates over a digital network
JP2002159099A (ja) * 2000-11-20 2002-05-31 Matsushita Electric Ind Co Ltd 音場制御装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3539725A (en) * 1968-07-12 1970-11-10 Ibm Automatic frequency shaping network
US4396806B2 (en) * 1980-10-20 1998-06-02 A & L Ventures I Hearing aid amplifier
NL8300671A (nl) * 1983-02-23 1984-09-17 Philips Nv Automatisch egalisatiesysteem met dtf of fft.
US4747142A (en) * 1985-07-25 1988-05-24 Tofte David A Three-track sterophonic system
FR2638048B1 (fr) * 1988-10-14 1994-06-10 Dupret Lefevre Sa Labo Audiolo Appareil electronique de traitement d'un signal sonore
US5420929A (en) * 1992-05-26 1995-05-30 Ford Motor Company Signal processor for sound image enhancement
KR0139176B1 (ko) 1992-06-30 1998-06-15 김광호 다해상도 선형왜곡 보상방법 및 그 장치
JP3308055B2 (ja) * 1993-08-24 2002-07-29 パイオニア株式会社 ディジタル・グラフィックイコライザ
US6091824A (en) * 1997-09-26 2000-07-18 Crystal Semiconductor Corporation Reduced-memory early reflection and reverberation simulator and method
CN1257270A (zh) 1998-11-10 2000-06-21 Tdk株式会社 数字音频记录和再现装置
US6240379B1 (en) 1998-12-24 2001-05-29 Sony Corporation System and method for preventing artifacts in an audio data encoder device
US6198416B1 (en) * 1999-04-16 2001-03-06 Scott R. Velazquez Linearity error compensator
US6721337B1 (en) 1999-08-24 2004-04-13 Ibiquity Digital Corporation Method and apparatus for transmission and reception of compressed audio frames with prioritized messages for digital audio broadcasting
EP1133157A3 (en) 1999-12-28 2004-10-27 Sony Corporation Image commercial transactions system and method, image transfer system and method, image distribution system and method, display device and method
US6606388B1 (en) * 2000-02-17 2003-08-12 Arboretum Systems, Inc. Method and system for enhancing audio signals
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4633483A (en) * 1983-03-31 1986-12-30 Sansui Electric Co., Ltd. Near-instantaneous companding PCM involving accumulation of less significant bits removed from original data
JPS6046629A (ja) * 1983-08-25 1985-03-13 Sansui Electric Co 信号伝送方式
JPS6054538A (ja) * 1983-09-05 1985-03-29 Sansui Electric Co 信号伝送方式
WO2001050459A1 (en) * 1999-12-31 2001-07-12 Octiv, Inc. Techniques for improving audio clarity and intelligibility at reduced bit rates over a digital network
JP2002159099A (ja) * 2000-11-20 2002-05-31 Matsushita Electric Ind Co Ltd 音場制御装置

Also Published As

Publication number Publication date
CN1672325A (zh) 2005-09-21
WO2003104924A2 (en) 2003-12-18
EP1532734A4 (en) 2008-10-01
US8676361B2 (en) 2014-03-18
US20060098827A1 (en) 2006-05-11
CA2488689A1 (en) 2003-12-18
AU2003251403A1 (en) 2003-12-22
CN100481722C (zh) 2009-04-22
KR20050043800A (ko) 2005-05-11
JP2005529520A (ja) 2005-09-29
KR101118922B1 (ko) 2012-06-29
WO2003104924A3 (en) 2004-11-25
EP1532734A2 (en) 2005-05-25
CA2488689C (en) 2013-10-15

Similar Documents

Publication Publication Date Title
JP4817658B2 (ja) 音響仮想現実エンジンおよび配信された音声改善のための新技術
US20200267491A1 (en) Systems and methods for processing audio signals based on user device parameters
JP5956994B2 (ja) 拡散音の空間的オーディオの符号化及び再生
US7277767B2 (en) System and method for enhanced streaming audio
US8036767B2 (en) System for extracting and changing the reverberant content of an audio input signal
KR20070065401A (ko) 오디오 데이터를 처리하는 시스템 및 방법, 프로그램구성요소, 및 컴퓨터-판독가능 매체
US8213636B2 (en) Method and a system for reconstituting low frequencies in audio signal
JP2002524996A (ja) 低周波オーディオエンハンスメントシステム
KR20020043617A (ko) 음향 보정 장치
JPH11504478A (ja) ステレオ増強システム
US6865430B1 (en) Method and apparatus for the distribution and enhancement of digital compressed audio
WO2002074013A2 (en) A method of modifying low frequency components of a digital audio signal
AU2003251403B2 (en) Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
WO2007004397A1 (ja) 音響信号処理装置、音響信号処理方法、音響信号処理プログラムおよびコンピュータに読み取り可能な記録媒体
TW200407027A (en) Advanced technique for enhancing delivered sound
Canfer Music Technology in Live Performance: Tools, Techniques, and Interaction
JP3876595B2 (ja) 音声信号発生方法、音声信号発生装置および記録媒体
Clarke I LOVE IT LOUD!
Watts Sound recording today

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090304

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091013

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091020

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091106

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091208

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110418

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110425

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110518

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110616

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110715

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4817658

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term