JP7314427B2 - オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置 - Google Patents

オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置 Download PDF

Info

Publication number
JP7314427B2
JP7314427B2 JP2022569007A JP2022569007A JP7314427B2 JP 7314427 B2 JP7314427 B2 JP 7314427B2 JP 2022569007 A JP2022569007 A JP 2022569007A JP 2022569007 A JP2022569007 A JP 2022569007A JP 7314427 B2 JP7314427 B2 JP 7314427B2
Authority
JP
Japan
Prior art keywords
audio data
volume
playback
music
dialog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022569007A
Other languages
English (en)
Other versions
JP2023518119A (ja
Inventor
シンドラー,クリスティアン
シュミット,マルテ
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2023518119A publication Critical patent/JP2023518119A/ja
Application granted granted Critical
Publication of JP7314427B2 publication Critical patent/JP7314427B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4318Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Otolaryngology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Description

関連出願への相互参照
本願は、以下の優先権出願の優先権を主張する:2020年5月15日に出願された米国仮出願第63/025,479号(参照番号D18144USP1)および2020年5月15日に出願された欧州特許出願第20174974.4号(参照番号D18144EP)。これらは参照により本明細書に組み込まれる。
技術
本開示は、概括的には、再生装置上のオーディオ・データの再生中のダイアログ了解性(intelligibility)を改善するための方法に関し、より詳細には、再生のためのボリューム値に基づいて決定されるボリューム混合比に基づく、ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを含むオーディオ・データの混合に関する。本開示は、さらに、オーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置およびそれぞれのコンピュータ・プログラム・プロダクトに関する。
いくつかの実施形態はその開示を特に参照して本明細書に記載されるが、本開示は、そのような使用分野に限定されず、より広い文脈において適用可能であることが理解されるであろう。
本開示を通じた背景技術のいかなる議論も、かかる技術が広く知られている、または当該技術分野における技術常識の一部をなすことの自認であるとは決して考えられるべきではない。
映画、シリーズもの、スポーツ放送、エンターテインメント番組、ニュース等のメディア・コンテンツは、通例、ビデオ・データおよび関連するオーディオ・データから構成される。メディア・コンテンツのタイプに依存して、これらのオーディオ・データは、音楽および/またはエフェクト・オーディオ・データと同様に、ダイアログ・オーディオ・データを含んでいてもよい。これらのオーディオ・データは、通例、サウンド・プレミックスの形で頒布される。しかしながら、現在のところ、このサウンド・プレミックスを消費者側で変更することは不可能であり、貧弱なサウンド再生につながる可能性がある。たとえば、映画の場合、サウンド・プレミックスが、私的な環境ではなく映画館の環境を考慮して生成されていた場合、ダイアログ・トラックは、過度に大音量の音楽およびエフェクト・トラックに鑑み比較的バランスが悪いと知覚されることがある。
よって上記に鑑み、音楽およびエフェクト・オーディオ・トラックに関連して、ダイアログ・オーディオ・トラックの再生ボリュームを柔軟かつ個別に調整することを許容する方法および装置が必要とされている。特に、音楽およびエフェクト・オーディオ・トラックとは独立して、ダイアログ・オーディオ・トラックの利得を自動的に調整できることが望ましい。
本開示の第1の側面によれば、再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善するための方法が提供され、ここで、オーディオ・データは、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含んでいてもよい。本方法は、(a)再生のためのボリューム値を音圧レベルにマッピングすることによって再生のためのボリューム値に基づいて音圧レベルの関数としてボリューム混合比を決定するステップを含んでいてもよく、ボリューム混合比は、音楽およびエフェクト・オーディオ・データの少なくとも一方のボリュームに対するダイアログ・オーディオ・データのボリュームの比を指す。本方法は、さらに、(b)前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽オーディオ・データおよびエフェクト・オーディオ・データのうちの前記少なくとも一方とを混合するステップを含んでいてもよい。また、本方法は、(c)再生のために前記混合されたオーディオ・データを出力するステップを含んでいてもよい。
上述のように構成されて、本方法は、メディア・コンテンツを再生する装置の現在の再生ボリュームに基づいて、メディア・コンテンツにおけるダイアログ・トラックの再生ボリュームを自動的に調整することを許容する。この文脈では、音楽およびエフェクト・オーディオ・データに対するダイアログ・オーディオ・データのボリューム混合比は、(絶対的な)再生ボリュームの増加に伴って低下する可能性がある。
いくつかの実施形態では、ステップ(b)において、前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽オーディオ・データおよびエフェクト・オーディオ・データのうちの前記少なくとも一方とを混合することは、少なくとも前記ダイアログ・オーディオ・データに利得を適用することを含むことができる。
いくつかの実施形態では、ステップ(a)において、再生のためのボリューム値は音圧レベルにマッピングされてもよく、体積混合比は、前記音圧レベルの関数として決定されてもよい。ボリューム混合比と音圧レベル(SPL)との関係は線形であってもよく、ボリューム混合比は音圧レベルの増加に伴って線形に減少してもよい。
いくつかの実施形態では、ステップ(a)において、再生のためのボリューム値は、再生装置のボリューム値設定に基づいてもよい。この構成は、絶対的な再生ボリュームに依存して、ダイアログ了解性を柔軟かつ個別に調整することを許容する。
いくつかの実施形態では、ボリューム値設定は、ユーザー定義値であってもよい。この構成は、ユーザーの好みの現在の絶対再生ボリュームに関連して、ダイアログ了解性を調整することを許容する。
いくつかの実施形態では、ステップ(a)において、ボリューム混合比は、周囲音圧レベルに基づいてさらに決定されてもよい。この構成により、再生装置が置かれる個々の環境条件、たとえば、室内の障害物もしくは部屋の全体的なデザインから帰結する騒音の多い背景またはエフェクトをさらに考慮することができる(環境認識/部屋補償)。
いくつかの実施形態では、周囲音圧レベルは、一つまたは複数のマイクロフォンによる測定に基づいて決定されてもよい。
いくつかの実施形態では、ステップ(a)の前に、本方法はさらに以下を含んでいてもよい:
(i)圧縮されたオーディオ・データを含むビットストリームを受領する段階と;
(ii)コア・デコーダによって、前記圧縮されたオーディオ・データをコア・デコードし、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを提供する段階。
いくつかの実施形態では、ステップ(i)において、受領されたビットストリームは、オーディオ・コンテンツ・タイプに関する情報をさらに含んでいてもよく、ステップ(a)において、ボリューム混合比はさらに、前記オーディオ・コンテンツ・タイプに基づいて決定されてもよい。この構成は、サウンド混合がさまざまなコンテンツ・タイプについて異なる可能性があることを考慮することによってダイアログ了解性をさらに調整することを可能にする。たとえば、映画の場合、ダイアログ・トラックは、スポーツ放送やニュース番組の場合ほどは目立たないことがある。有利には、オーディオ・コンテンツ・タイプは、再生装置によって受領されるビットストリームに含まれるメタデータを介して信号伝達されてもよい。
いくつかの実施形態では、オーディオ・コンテンツ・タイプは、映画のオーディオ・コンテンツ、ニュース番組のオーディオ・コンテンツ、スポーツ放送のオーディオ・コンテンツ、およびエピソード編成オーディオ・コンテンツのうちの一つまたは複数を含んでいてもよい。
いくつかの実施形態では、本方法は、さらに、圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供することを含んでいてもよい。この構成では、解析は、ダイアログ、音楽およびエフェクト・オーディオ・データの間の区別を含むことができるだけでなく、上述のコンテンツ・タイプの決定をも含むことができる。
本開示の第2の側面によれば、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置が提供される。メディア再生システムは、(a)再生のためのボリューム値を音圧レベルにマッピングすることによって再生のためのボリューム値に基づいて音圧レベルの関数としてボリューム混合比を決定するためのオーディオ・プロセッサを含んでいてもよく、ボリューム混合比は、音楽およびエフェクト・オーディオ・データの少なくとも一方のボリュームに対するダイアログ・オーディオ・データのボリュームの比を指す。メディア再生システムは、さらに、(b)前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽オーディオ・データおよびエフェクト・オーディオ・データのうちの前記少なくとも一方とを混合する混合器を含んでいてもよい。また、メディア再生システムは、(c)再生のために前記混合されたオーディオ・データを出力するためのコントローラを含んでいてもよい。
いくつかの実施形態では、混合器は、少なくとも前記ダイアログ・オーディオ・データに利得を適用するようにさらに構成されていてもよい。
いくつかの実施形態では、オーディオ・プロセッサは、音圧レベルの関数としてボリューム混合比を決定するために、再生のためのボリューム値を音圧レベルにマッピングするように構成されてもよい。
いくつかの実施形態では、再生装置は、ユーザーのボリューム値設定を受領するためのユーザー・インターフェースをさらに含んでいてもよく、再生のための前記ボリューム値は、前記ボリューム値設定に基づいてもよい。
いくつかの実施形態では、再生装置は、周囲音圧レベルを決定するための一つまたは複数のマイクロフォンをさらに含んでいてもよく、オーディオ・プロセッサは、前記周囲音圧レベルにさらに基づいて前記ボリューム混合比を決定するように構成されてもよい。
いくつかの実施形態では、再生装置はさらに、(i)圧縮されたオーディオ・データを含むビットストリームを受領するための受領器を含んでいてもよい。また、再生装置はさらに、(ii)圧縮されたオーディオ・データをコア・デコードし、ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供するためのコア・デコーダとをさらに含んでいてもよい。
いくつかの実施形態では、コア・デコーダは、さらに、圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データのうちの前記少なくとも一方とを提供するように構成されてもよい。
本開示の第3の側面によれば、処理能力を有する装置に、再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善する方法を実行させるように適応された命令を備えたコンピュータ・プログラム・プロダクトが提供される。
ここで、添付の図面を参照して、あくまでも例として、本開示の例示的実施形態が記述される。
再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善する方法の例を示す。オーディオ・データは、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを含んでいてもよい。 ダイアログ・オーディオ・データと、音楽およびエフェクト(M&E)オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置の例を示す。 ダイアログ・オーディオ・データと、音楽およびエフェクト(M&E)オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置のさらなる例を示す。 オーディオ・データの、音楽およびエフェクト・オーディオ・データの和に対する比と、音圧レベルとの間の相関の例を示す。 処理能力を有する装置の例を示す。
オーディオ・データの再生中のダイアログ了解性
再生装置でのオーディオ・データの再生中、観察される一般的な問題は、サウンド・プレミックスがしばしば、良好なサウンド再生のためには不十分であることである。たとえば、映画がテレビで再生されるが、サウンド混合は映画館環境のために作成されていた場合、音楽や効果が大きすぎると知覚されるため、ダイアログ了解性が不十分になることがある。同様に、たとえば、ユーザーの聴覚に障害がある場合、特に、ダイアログ了解性が影響されることがある。再生環境の設計も、再生中のダイアログの不十分な知覚を増す可能性がある。
本明細書に記載される方法および装置は、音楽およびエフェクト・オーディオ・データに対するダイアログ・オーディオ・データのボリューム混合比に基づいて、音楽およびエフェクト・オーディオ・データの少なくとも一方をさらに含むオーディオ・データの再生中のダイアログ・オーディオ・データの了解性を改善することを可能にする。特に、ダイアログ・オーディオ・データの利得が、前記ボリューム混合比に基づいて自動的に調整されることができる。
オーディオ・データ再生中のダイアログ了解性を改善する方法
図1の例を参照すると、再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善するための方法が示されており、ここで、オーディオ・データは、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含みうる。ステップS101では、再生のためのボリューム値に基づいてボリューム混合比が決定される。
ある実施形態では、再生のためのボリューム値が音圧レベルにマッピングされてもよく、ボリューム混合比は前記音圧レベルの関数として決定されてもよい。ボリューム混合比は、音楽およびエフェクト・オーディオ・データの少なくとも一方のボリューム(の和)に対する、ダイアログ・オーディオ・データのボリュームの比を指しうる。
図4の例に例示されているように、音楽およびエフェクト・オーディオ・データ(M&E)に対するダイアログ・オーディオ・データのボリューム混合比201は、線形関係203に従ってもよく、音圧レベル202の増加とともに線形に減少しうる。この関係は、音圧レベルの関数としてボリューム混合比を決定するための較正曲線として使用されてもよい。この目的のために、ボリューム混合比および音圧レベルのそれぞれの値は、一つまたは複数のルックアップテーブルに格納されてもよい。次いで、図2または図3の例に示されるようなメディア再生システムのオーディオ・プロセッサが、現在の音圧レベルに依存してそれぞれのボリューム混合比を決定するために、該一つまたは複数のルックアップテーブルにアクセスしてもよい。
さらに、ある実施形態では、ステップS101において、再生のためのボリューム値は、再生装置のボリューム値設定に基づいてもよい。ボリューム混合比は、前記ボリューム値設定によって示されるボリューム値に直接基づいて決定されてもよい。代替的または追加的に、前記ボリューム値設定によって示されるボリューム値は、上述のように音圧レベルにマッピングされてもよい。ボリューム値設定は、あらかじめ決定された設定であってもよいが、ある実施形態では、ボリューム値設定は、ユーザー定義値であってもよい。よって、再生装置のユーザーは、自身のニーズに適合する再生のために現在のボリューム値を選択することができ、ボリューム混合比は、このユーザー定義のボリューム値に基づいて直接、および/またはこの値を音圧レベルにマッピングすることによって、決定されうる。
代替的または追加的に、ステップS101において、ボリューム混合比はさらに、周囲音圧レベルに基づいて決定されてもよい。周囲音圧レベルは、一般に、再生装置の環境内の任意の周囲音を指すことができる。周囲音は、再生されるオーディオ・データの知覚に影響する、再生環境における任意の背景ノイズおよび/または任意の条件を含みうるが、これらに限定されない。周囲音圧レベルは、任意の考えられる方法で決定されうるが、ある実施形態では、周囲音圧レベルは、一つまたは複数のマイクロフォンによる測定に基づいて決定されうる。前記一つまたは複数のマイクロフォンは、再生装置内に実装されてもよいし、あるいは再生装置に接続された外部マイクロフォンであってもよい。
ステップS101の前に、ある実施形態では、本方法は、(i)圧縮されたオーディオ・データを含むビットストリームを受領するステップと;(ii)コア・デコーダによって、圧縮されたオーディオ・データをコア・デコードし、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供するステップとをさらに含んでいてもよい。これは、本方法が、圧縮されていないオーディオ・データ、または圧縮されたオーディオ・データの両方に適用可能でありうるという事実を説明することができる。ある実施形態では、圧縮されたオーディオ・データが解析されて、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供してもよい。これは、デコーダ側でもダイアログ検出を実行することを許容しうる。ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供するために、ダイアログ・オーディオ・データはさらに、圧縮されたオーディオ・データをコア・デコードする前または後のいずれか抽出されうる。
代替的または追加的に、圧縮されたオーディオ・データがたとえばAC-4のようなフォーマットである場合には、ダイアログ・オーディオ・データはデコーダによって抽出されなくてもよいが、メタデータが受信されたビットストリームに含まれていて、そこから抽出されてもよい。次いで、メタデータが、決定されたボリューム混合比に基づいてダイアログ了解性を改善するために使用されうる。換言すれば、メタデータは、送信された「完全な」オーディオ・データ内のある種の周波数帯域をブーストするために使用されうる。
あるさらなる実施形態では、前述のステップ(i)において、受領されたビットストリームは、オーディオ・コンテンツ・タイプに関する情報をさらに含んでいてもよく、その場合、ステップS101において、ボリューム混合比はさらに、オーディオ・コンテンツ・タイプに基づいて決定されてもよい。オーディオ・コンテンツ・タイプはまた、それぞれのメタデータを介してビットストリーム内で信号伝達されてもよい。たとえば、ニュース番組やスポーツ放送では、たとえば映画と比較して、ダイアログがより顕著、または明瞭である場合があるので、オーディオ・コンテンツ・タイプを考慮することは、異なるサウンド混合を考慮したダイアログ了解性の改善を許容しうる。ある実施形態では、オーディオ・コンテンツ・タイプは、映画のオーディオ・コンテンツ、ニュース番組のオーディオ・コンテンツ、スポーツ放送のオーディオ・コンテンツ、およびエピソード編成(episodic)オーディオ・コンテンツのうちの一つまたは複数を含んでいてもよい。
再び図1の例を参照すると、ステップS102において、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とが、ボリューム混合比に基づいて混合される。ある実施形態では、ステップS102において、前記ボリューム混合比に基づいてダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを混合することは、少なくともダイアログ・オーディオ・データに利得を適用することを含みうる。再生中の音楽およびエフェクト・オーディオ・データのうちの前記少なくとも一方のボリュームに対してダイアログ・オーディオ・データのボリュームをさらにバランスさせるために、それぞれの利得は、音楽およびエフェクト・オーディオ・データのうちの前記少なくとも一方にも適用されてもよい。
ステップS103では、混合されたオーディオ・データが次いで、再生のために出力される。オーディオ・データの再生は、任意の考えられる方法で容易にすることができ、限定されない。しかしながら、再生のために混合されたオーディオ・データを出力することは、混合されたオーディオ・データのレンダリングをも含んでいてもよい。図1においてステップS103とステップS101を連結する矢印によって示されているように、再生ボリュームが変化しうる場合はいつでもダイアログ了解性を連続的に調整するために、記載される方法のステップのシーケンスは繰り返されてもよい。
メディア再生システムを実装した再生装置
図2および図3の例を参照すると、再生装置100は、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システム101を実装していることが示されている。メディア再生システム101は、再生のためのボリューム値に基づいてボリューム混合比を決定するためのオーディオ・プロセッサ103を含む。
ある実施形態では、オーディオ・プロセッサ103は、音圧レベルの関数としてボリューム混合比を決定するために、再生のためのボリューム値を、ボリューム値‐SPLマッピング・ユニット105において、音圧レベル(SPL)にマッピングするように構成されてもよい。
図2の例に示されるように、ある実施形態では、再生装置100は、ユーザーのボリューム値設定を受領するためのユーザー・インターフェース106をさらに含んでいてもよい。ユーザーによって設定したボリューム値は、音圧レベルの関数としてボリューム混合比を決定するために、ボリューム値‐SPLマッピング・ユニット105に入力されてもよい。代替的または追加的に、ボリューム値‐SPLマッピング・ユニット105はバイパスされてもよく、ボリューム混合比はユーザーによって設定されたボリューム値に基づいて直接決定されてもよい。
ある実施形態では、再生装置100は、周囲音圧レベルを決定するための一つまたは複数のマイクロフォン(図示せず)をさらに含んでいてもよい。この場合、オーディオ・プロセッサ103は、さらに前記周囲音圧レベルに基づいて、ボリューム混合比を決定するように構成されてもよい。
再び図2の例を参照すると、メディア再生システム101は、上述したように、決定されたボリューム混合比に基づいて、ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの少なくとも一方とを混合するための混合器102をさらに含む。
ある実施形態では、混合器102は、少なくともダイアログ・オーディオ・データに利得を適用するようにさらに構成されてもよい。
メディア再生システム101は、さらに、再生108のために混合オーディオ・データを出力するためのコントローラを含む。たとえば、3.0チャネル・ミックスの場合、中央チャネルは、ダイアログのみを含んでいてもよい。この場合、混合器102によって出力された最終的なサウンド混合の結果として、中央チャネル・ボリュームのみが変化させられてもよい。
ある実施形態では、再生装置100は、圧縮されたオーディオ・データ107を含むビットストリームを受領するための受領器をさらに含んでいてもよい。次いで、メディア再生システム101は、圧縮されたオーディオ・データをコア・デコードし、ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの少なくとも一方とを提供するためのコア・デコーダ104を含んでいてもよい。図2の例を参照すると、ある実施形態では、コア・デコーダ104は、さらに、圧縮されたオーディオ・データを解析して、ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供するように構成されてもよい。これは、デコーダ側でもダイアログ検出を実行することを許容しうる。ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データのうちの少なくとも一方とを提供するために、コア・デコーダ104は、圧縮されたオーディオ・データをコア・デコードする前または後のいずれかで、ダイアログ・オーディオ・データを抽出するようにさらに構成されてもよい。図3の例を参照すると、代替的または追加的に、圧縮されたオーディオ・データがたとえばAC-4のようなフォーマットである場合には、ダイアログ・オーディオ・データはコア・デコーダ104によって抽出されなくてもよく、メタデータが受領されるビットストリームに含まれていてもよく、コア・デコーダ104は、圧縮されたオーディオ・データをコア・デコードすることに加えて、受領されたビットストリームからメタデータを抽出するように構成されてもよい。次いで、混合器102は、メタデータを使用して、決定されたボリューム混合比に基づいてダイアログ了解性を改善するように構成されてもよい。換言すれば、混合器102は、送信された「完全な」オーディオ・データ内のある種の周波数帯域をブーストするためにメタデータを使用するように構成されてもよい。図3では、コア・デコーダ104および混合器102はメディア再生システムの個々のエンティティとして記述されているが、混合器102およびコア・デコーダ104は、デコーダの一部であってもよく、本明細書で説明した方法がそれぞれの再生装置に実装されたデコーダによって実行されてもよいことに留意されたい。
本明細書に記載された方法は、上述のようなメディア再生システムを実装した再生装置によって実行されてもよいが、代替的または追加的に、前記方法は、処理能力301、302を有する装置300に前記方法を実行させるように適応された命令を有するコンピュータ・プログラム・プロダクトとして実装されてもよいことに留意されたい。そのような装置は、図5に例示的に示される。
解釈
特に断らない限り、以下の議論から明らかなように、本開示を通じて、「処理」、「計算」、「決定」、「解析」などの用語を使用する議論は、物理量、たとえば電子的な量として表現されたデータを操作および/または変換して物理量として同様に表現された他のデータにする、コンピュータまたはコンピューティングシステム、または類似の電子装置の動作および/またはプロセスを指すことが理解される。
同様に、用語「プロセッサ」は、電子データを他の電子データに変換するために電子データを処理する任意の装置または装置の一部を指してもよい。「コンピュータ」または「計算機」または「コンピューティングプラットフォーム」は、一つまたは複数のプロセッサを含みうる。
上述したように、本明細書に記載される方法は、処理能力を有する装置に上記方法を実行させるように適応された命令を有するコンピュータ・プログラム・プロダクトとして実装されてもよい。行われるべきアクションを指定する一組の命令(逐次的またはその他)を実行することができる任意のプロセッサが含まれる。よって、1つの例は、一つまたは複数のプロセッサを含みうる典型的な処理システムであってもよい。各プロセッサは、CPU、グラフィックス処理ユニット、テンソル処理ユニット、およびプログラマブルDSPユニットのうちの一つまたは複数を含んでいてもよい。処理システムはさらに、メインRAMおよび/または静的RAMおよび/またはROMを含むメモリサブシステムを含んでいてもよい。構成要素間で通信するためのバス・サブシステムが含まれてもよい。処理システムは、さらに、ネットワークによって結合されたプロセッサを有する分散処理システムであってもよい。処理システムがディスプレイを必要とする場合、そのようなディスプレイ、たとえば、液晶ディスプレイ(LCD)、たとえばOLED(有機発光ダイオード)ディスプレイまたは陰極線管(CRT)ディスプレイを含む任意の種類の発光ダイオードディスプレイ(LED)が含まれてもよい。手動データ入力が必要とされる場合、処理システムは、キーボードなどの英数字入力ユニットの一つまたは複数、マウスなどのポインティング制御装置などの入力装置をも含んでいてもよい。処理システムは、ディスクドライブユニットのような記憶システムをも含みうる。処理システムは、サウンド出力装置、たとえば、一つまたは複数のラウドスピーカーまたはイヤホンポート、およびネットワークインターフェース装置を含んでいてもよい。
コンピュータ・プログラム・プロダクトは、たとえば、ソフトウェアであってもよい。ソフトウェアは、さまざまな仕方で実装されうる。ソフトウェアは、ネットワークインターフェース装置を介してネットワークを通じて送信または受信されてもよく、またはキャリア媒体を介して配送されてもよい。キャリア媒体は、不揮発性媒体、揮発性媒体、および伝送媒体を含みうるが、これらに限定されない。不揮発性媒体は、たとえば、光ディスク、磁気ディスク、および光磁気ディスクを含むことができる。揮発性媒体は、メインメモリのようなダイナミックメモリを含んでいてもよい。伝送媒体は、バス・サブシステムを構成するワイヤを含む、同軸ケーブル、銅線および光ファイバーを含んでいてもよい。伝送媒体は、電波および赤外線データ通信の間に発生されるような、音波または光波の形態をとってもよい。よって、たとえば、「キャリア媒体」という用語は、固体メモリ、光および磁気媒体に具現化されたコンピュータ・プロダクト;少なくとも1つのプロセッサまたは一つまたは複数のプロセッサによって検出可能な伝搬信号を担い、実行時に方法を実装する命令のセットを表す媒体;および前記一つまたは複数のプロセッサの少なくとも1つのプロセッサによって検出可能な伝搬信号を担い、命令の前記セットを表す、ネットワーク内の伝送媒体を含むが、これらに限定されないと解釈される。
実行されるべき方法がいくつかの要素、たとえば、いくつかのステップを含む場合、特に別段の記載がない限り、かかる要素の順序付けは暗示されないことに留意されたい。
論じられた方法のステップは、ある例示的実施形態においては、記憶装置に記憶された命令(コンピュータ読み取り可能コード)を実行する処理(たとえばコンピュータ)システムの適切なプロセッサ(単数または複数)によって実行されることが理解されよう。また、本開示は、いかなる特定の実装またはプログラミング技法にも限定されず、本明細書に記載される機能を実装するための任意の適切な技法を用いて実装されうることも理解されるであろう。本開示は、いかなる特定のプログラミング言語またはオペレーティング・システムにも限定されない。
本開示を通して「一つの実施形態」、「いくつかの実施形態」または「ある実施形態」への言及は、その実施形態に関連して記載される特定の特徴が本開示の少なくとも1つの実施形態に含まれることを意味する。よって、本開示を通じた随所における「一実施形態において」、「いくつかの実施形態において」または「ある実施形態において」という句の出現は、必ずしもすべてが同じ実施形態を指すわけではない。さらに、特定の特徴は、本開示から当業者には明らかなように、一つまたは複数の実施形態において、任意の適切な仕方で組み合わされてもよい。
特許請求の範囲および本明細書中の説明において、有する、構成される、または含むという用語の任意のものは、少なくとも挙げられている要素/特徴を含むが、他のものを除外しない開放的な用語である。よって、特許請求の範囲において使用される場合、有する/含むという用語は、列挙される手段、要素、またはステップに限定されるものとして解釈されるべきではない。本明細書で使用される、含む、含んでいる、または包含するという用語の任意のものは、少なくとも挙げられている要素/特徴を含むが、他のものを除外しない開放的な用語である。よって、従って、含むは、有すると同義であり、かつ、有することを意味する。
本開示の例示的実施形態の上述の説明では、開示の流れをよくし、さまざまな発明的側面の一つまたは複数の理解を助ける目的で、本開示のさまざまな特徴が時として単一の例示的実施形態、図面、またはその説明にまとめられていることが理解されるべきである。しかしながら、この開示方法は、請求項が各請求項において明示的に記載されているよりも多くの特徴を必要とするという意図を反映するものと解釈されるべきではない。むしろ、以下の特許請求の範囲が反映するように、発明的側面は、単一の上記の開示された例示的実施形態のすべての特徴よりも少ないものにある。よって、明細書に続く請求項は、各請求項が本開示の別個の例示的実施形態として自立するように、本明細書に明示的に組み込まれる。
さらに、本明細書に記載されるいくつかの例示的実施形態は、他の例示的実施形態に含まれるいくつかの特徴を含むが他の特徴は含まないが、異なる例示的実施形態の特徴の組み合わせは、当業者に理解されるように、本開示の範囲内であり、異なる例示的な実施形態をなすことが意図されている。たとえば、以下の請求項では、請求項に記載された例示的実施形態の任意のものが、任意の組み合わせで使用できる。
本明細書に提供される説明において、多数の個別的な詳細が記載されている。しかしながら、本開示の例示的実施形態は、これらの特定の詳細なしに実施されうることが理解される。他方では、周知の方法、装置構造および技法は、この記述の理解を不明瞭にしないために詳細には示されていない。
よって、本開示の最良の態様であると考えられるものが記載されているが、当業者は、開示の精神から逸脱することなく、他のさらなる修正がなされうることを認識し、本開示の範囲内にはいるすべてのそのような変更および修正を請求することが意図される。たとえば、本開示の範囲内に記載される方法にステップが追加され、または削除されてもよい。
本発明のさまざまな側面は、以下の箇条書き例示的実施形態(enumerated example embodiment、EEE)から理解されうる。
〔EEE1〕
再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善するための方法であって、前記オーディオ・データは、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含み、当該方法は:
(a)再生のためのボリューム値に基づいてボリューム混合比を決定するステップと;
(b)前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを混合するステップと;
(c)混合されたオーディオ・データを再生のために出力するステップとを含む、
方法。
〔EEE2〕
ステップ(b)において、前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを混合することは、少なくとも前記ダイアログ・オーディオ・データに利得を適用することを含む、EEE1に記載の方法。
〔EEE3〕
ステップ(a)において、再生のための前記ボリューム値は音圧レベルにマッピングされ、前記体積混合比は、前記音圧レベルの関数として決定される、EEE1または2に記載の方法。
〔EEE4〕
ステップ(a)において、再生のための前記ボリューム値は、前記再生装置のボリューム値設定に基づき;任意的に
前記ボリューム値設定は、ユーザー定義値である、
EEE1ないし3のうちいずれか一項に記載の方法。
〔EEE5〕
ステップ(a)において、前記ボリューム混合比はさらに、周囲音圧レベルに基づいて決定され;任意的に
前記周囲音圧レベルは、一つまたは複数のマイクロフォンによる測定に基づいて決定される、
EEE1ないし4のうちいずれか一項に記載の方法。
〔EEE6〕
ステップ(a)の前に、当該方法はさらに:
(i)圧縮されたオーディオ・データを含むビットストリームを受領し;
(ii)コア・デコーダによって、前記圧縮されたオーディオ・データをコア・デコードし、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供することを含む、
EEE1ないし5のうちいずれか一項に記載の方法。
〔EEE7〕
ステップ(i)において、受領されたビットストリームは、オーディオ・コンテンツ・タイプに関する情報をさらに含み、ステップ(a)において、前記ボリューム混合比はさらに、前記オーディオ・コンテンツ・タイプに基づいて決定され;任意的に
前記オーディオ・コンテンツ・タイプは、映画のオーディオ・コンテンツ、ニュース番組のオーディオ・コンテンツ、スポーツ放送のオーディオ・コンテンツ、およびエピソード編成オーディオ・コンテンツのうちの一つまたは複数を含む、
EEE6に記載の方法。
〔EEE8〕
当該方法は、さらに、前記圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供することを含む、EEE6または7に記載の方法。
〔EEE9〕
ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置であって、前記メディア再生システムは:
(a)再生のためのボリューム値に基づいてボリューム混合比を決定するためのオーディオ・プロセッサと;
(b)前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽オーディオ・データおよびエフェクト・オーディオ・データの前記少なくとも一方とを混合する混合器と;
(c)混合されたオーディオ・データを再生のために出力するためのコントローラとを含む、
再生装置。
〔EEE10〕
前記混合器は、少なくとも前記ダイアログ・オーディオ・データに利得を適用するようにさらに構成されている;および/または
前記オーディオ・プロセッサは、前記音圧レベルの関数として前記ボリューム混合比を決定するために、再生のための前記ボリューム値を音圧レベルにマッピングするように構成されている、
EEE9に記載の再生装置。
〔EEE11〕
当該再生装置は、ユーザーのボリューム値設定を受領するためのユーザー・インターフェースをさらに含み、再生のための前記ボリューム値は、前記ボリューム値設定に基づく、EEE9または10に記載の再生装置。
〔EEE12〕
前記再生装置は、周囲音圧レベルを決定するための一つまたは複数のマイクロフォンをさらに含み、前記オーディオ・プロセッサは、前記周囲音圧レベルにさらに基づいて前記ボリューム混合比を決定するように構成されている、EEE9ないし11のうちいずれか一項に記載の再生装置。
〔EEE13〕
当該再生装置はさらに、
(i)圧縮されたオーディオ・データを含むビットストリームを受領するための受領器と;
(ii)前記圧縮されたオーディオ・データをコア・デコードし、前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供するためのコア・デコーダとをさらに含む、
EEE9ないし12のうちいずれか一項に記載の再生装置。
〔EEE14〕
前記コア・デコーダは、さらに、前記圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供するように構成されている、EEE13に記載の再生装置。
〔EEE15〕
処理能力を有する装置に、EEE1ないし8のうちいずれか一項に記載の方法を実行させるように適応された命令を備えたコンピュータ・プログラム・プロダクト。

Claims (15)

  1. 再生装置上でのオーディオ・データの再生中のダイアログ了解性を改善するための方法であって、前記オーディオ・データは、ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含み、当該方法は:
    再生のためのボリューム値を音圧レベルにマッピングすることによって再生のためのボリューム値に基づいて音圧レベルの関数としてボリューム混合比を決定するステップであって、前記ボリューム混合比は、音楽およびエフェクト・オーディオ・データの前記少なくとも一方のボリュームに対する前記ダイアログ・オーディオ・データのボリュームの比を指す、ステップと;
    前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを混合するステップと;
    混合されたオーディオ・データを再生のために出力するステップとを含む、
    方法。
  2. 前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを混合することは、少なくとも前記ダイアログ・オーディオ・データに利得を適用することを含む、請求項1に記載の方法。
  3. 再生のための前記ボリューム値は、前記再生装置のボリューム値設定に基づき、任意的に、前記ボリューム値設定は、ユーザー定義値である、請求項1または2に記載の方法。
  4. 前記ボリューム混合比はさらに、周囲音圧レベルに基づいて決定される、請求項1ないしのうちいずれか一項に記載の方法。
  5. 前記周囲音圧レベルは、一つまたは複数のマイクロフォンによる測定に基づいて決定される、請求項に記載の方法。
  6. 前記ボリューム混合比を決定する前に、当該方法はさらに:
    圧縮されたオーディオ・データを含むビットストリームを受領し;
    コア・デコーダによって、前記圧縮されたオーディオ・データをコア・デコードし、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供することを含む、
    請求項1ないしのうちいずれか一項に記載の方法。
  7. 受領されたビットストリームは、オーディオ・コンテンツ・タイプに関する情報をさらに含み、前記ボリューム混合比はさらに、前記オーディオ・コンテンツ・タイプに基づいて決定され
    任意的に、前記オーディオ・コンテンツ・タイプは、映画のオーディオ・コンテンツ、ニュース番組のオーディオ・コンテンツ、スポーツ放送のオーディオ・コンテンツ、およびエピソード編成オーディオ・コンテンツのうちの一つまたは複数を含む、
    請求項に記載の方法。
  8. 当該方法は、さらに、前記圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供することを含む、請求項6または7に記載の方法。
  9. ダイアログ・オーディオ・データと、音楽およびエフェクト・オーディオ・データの少なくとも一方とを含むオーディオ・データの再生中のダイアログ了解性を改善するためのメディア再生システムを実装した再生装置であって、前記メディア再生システムは:
    再生のためのボリューム値を音圧レベルにマッピングすることによって再生のためのボリューム値に基づいて音圧レベルの関数としてボリューム混合比を決定するためのオーディオ・プロセッサであって、前記ボリューム混合比は、音楽およびエフェクト・オーディオ・データの前記少なくとも一方のボリュームに対する前記ダイアログ・オーディオ・データのボリュームの比を指す、オーディオ・プロセッサと;
    前記ボリューム混合比に基づいて前記ダイアログ・オーディオ・データと音楽オーディオ・データおよびエフェクト・オーディオ・データの前記少なくとも一方とを混合する混合器と;
    混合されたオーディオ・データを再生のために出力するためのコントローラとを含む、
    再生装置。
  10. 前記混合器は、少なくとも前記ダイアログ・オーディオ・データに利得を適用するようにさらに構成されている、請求項に記載の再生装置。
  11. 当該再生装置は、ユーザーのボリューム値設定を受領するためのユーザー・インターフェースをさらに含み、再生のための前記ボリューム値は、前記ボリューム値設定に基づく、請求項9または10に記載の再生装置。
  12. 前記再生装置は、周囲音圧レベルを決定するための一つまたは複数のマイクロフォンをさらに含み、前記オーディオ・プロセッサは、前記周囲音圧レベルにさらに基づいて前記ボリューム混合比を決定するように構成されている、請求項ないし11のうちいずれか一項に記載の再生装置。
  13. 当該再生装置はさらに、
    圧縮されたオーディオ・データを含むビットストリームを受領するための受領器と;
    前記圧縮されたオーディオ・データをコア・デコードし、前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供するためのコア・デコーダとをさらに含む、
    請求項ないし12のうちいずれか一項に記載の再生装置。
  14. 前記コア・デコーダは、さらに、前記圧縮されたオーディオ・データを解析して、前記ダイアログ・オーディオ・データと音楽およびエフェクト・オーディオ・データの前記少なくとも一方とを提供するように構成されている、請求項13に記載の再生装置。
  15. 処理能力を有する装置に、請求項1ないしのうちいずれか一項に記載の方法を実行させるように適応された命令を備えたコンピュータ・プログラム・プロダクト。
JP2022569007A 2020-05-15 2021-05-12 オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置 Active JP7314427B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063025479P 2020-05-15 2020-05-15
US63/025,479 2020-05-15
EP20174974.4 2020-05-15
EP20174974 2020-05-15
PCT/EP2021/062619 WO2021228935A1 (en) 2020-05-15 2021-05-12 Method and device for improving dialogue intelligibility during playback of audio data

Publications (2)

Publication Number Publication Date
JP2023518119A JP2023518119A (ja) 2023-04-27
JP7314427B2 true JP7314427B2 (ja) 2023-07-25

Family

ID=75825813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022569007A Active JP7314427B2 (ja) 2020-05-15 2021-05-12 オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置

Country Status (5)

Country Link
US (1) US20230238016A1 (ja)
EP (1) EP3935636B1 (ja)
JP (1) JP7314427B2 (ja)
CN (1) CN115668372A (ja)
WO (1) WO2021228935A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001238299A (ja) 2000-02-22 2001-08-31 Victor Co Of Japan Ltd 放送受信装置
JP2001245237A (ja) 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
WO2010076850A1 (ja) 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2017212732A (ja) 2016-05-24 2017-11-30 日本放送協会 チャンネル数変換装置およびプログラム
JP2020067531A (ja) 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA00010027A (es) * 1998-04-14 2004-03-10 Hearing Enhancement Co Llc Control de volumen ajustable por el usuario, que se adapta al alcance del oido.
US7415120B1 (en) * 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
JP2010515290A (ja) * 2006-09-14 2010-05-06 エルジー エレクトロニクス インコーポレイティド ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース
US9578436B2 (en) * 2014-02-20 2017-02-21 Bose Corporation Content-aware audio modes
US20160315722A1 (en) * 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001238299A (ja) 2000-02-22 2001-08-31 Victor Co Of Japan Ltd 放送受信装置
JP2001245237A (ja) 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
WO2010076850A1 (ja) 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2017212732A (ja) 2016-05-24 2017-11-30 日本放送協会 チャンネル数変換装置およびプログラム
JP2020067531A (ja) 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置

Also Published As

Publication number Publication date
US20230238016A1 (en) 2023-07-27
CN115668372A (zh) 2023-01-31
WO2021228935A1 (en) 2021-11-18
JP2023518119A (ja) 2023-04-27
EP3935636A1 (en) 2022-01-12
EP3935636B1 (en) 2022-12-07

Similar Documents

Publication Publication Date Title
US11563411B2 (en) Metadata for loudness and dynamic range control
US11270713B2 (en) Methods and systems for rendering object based audio
RU2526746C1 (ru) Микширование аудиопотока с нормализацией диалогового уровня
US20170098452A1 (en) Method and system for audio processing of dialog, music, effect and height objects
US10354670B2 (en) Efficient DRC profile transmission
US8242942B2 (en) System and method to modify a metadata parameter
US9332373B2 (en) Audio depth dynamic range enhancement
JP2020039181A (ja) 多様な再生環境のためのダイナミックレンジ制御
KR101061129B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
JP6701465B1 (ja) 伝送に関知しない呈示ベースのプログラム・ラウドネス
JP7314427B2 (ja) オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置
Mehta et al. Personalized and immersive broadcast audio
Moerman Loudness in TV Sound
CA3241847A1 (en) Method and apparatus for processing of audio data
Sugimoto et al. Real time audio encoding/decoding system using MPEG-H 3D Audio toward advancement of terrestrial broadcasting technology
Ehret et al. Loudness Management in the Blu-ray Disc Ecosystem in the Context of Today’s Playback Environments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230113

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230712

R150 Certificate of patent or registration of utility model

Ref document number: 7314427

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150