JP2017073811A - 等化器コントローラおよび制御方法 - Google Patents
等化器コントローラおよび制御方法 Download PDFInfo
- Publication number
- JP2017073811A JP2017073811A JP2016230947A JP2016230947A JP2017073811A JP 2017073811 A JP2017073811 A JP 2017073811A JP 2016230947 A JP2016230947 A JP 2016230947A JP 2016230947 A JP2016230947 A JP 2016230947A JP 2017073811 A JP2017073811 A JP 2017073811A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- type
- term
- short
- confidence value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 210
- 230000005236 sound signal Effects 0.000 claims abstract description 164
- 238000009499 grossing Methods 0.000 claims abstract description 64
- 230000007774 longterm Effects 0.000 claims description 117
- 230000007704 transition Effects 0.000 claims description 54
- 230000000694 effects Effects 0.000 claims description 23
- 230000009471 action Effects 0.000 claims description 19
- 230000033764 rhythmic process Effects 0.000 claims description 15
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 3
- 239000003623 enhancer Substances 0.000 abstract description 42
- 230000006872 improvement Effects 0.000 abstract description 22
- 238000012545 processing Methods 0.000 description 62
- 238000003672 processing method Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 41
- 230000003595 spectral effect Effects 0.000 description 40
- 230000008569 process Effects 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000008859 change Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 230000001427 coherent effect Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 13
- 230000002596 correlated effect Effects 0.000 description 13
- 230000007423 decrease Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 230000006399 behavior Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000004907 flux Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000011435 rock Substances 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000006854 communication Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 206010019133 Hangover Diseases 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 1
- 102100034761 Cilia- and flagella-associated protein 418 Human genes 0.000 description 1
- 101100439214 Homo sapiens CFAP418 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/12—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/46—Volume control
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/005—Tone control or bandwidth control in amplifiers of digital signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/036—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal of musical genre, i.e. analysing the style of musical pieces, usually for selection, filtering or classification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
- G10H2210/301—Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/075—Musical metadata derived from musical analysis or for use in electrophonic musical instruments
- G10H2240/081—Genre classification, i.e. descriptive metadata for classification or selection of musical pieces according to style
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
Abstract
Description
本願は2013年3月26日に出願された中国特許出願第201310100401.X号および2013年4月11日に出願された米国仮特許出願第61/811,058号およびの優先権を主張するものである。これら出願はここに参照によってその全体において組み込まれる。
本願は概括的にはオーディオ信号処理に関する。詳細には、本願の実施形態はオーディオ分類および処理、特にダイアログ向上器、サラウンド仮想化器、ボリューム平準化器および等化器の制御のための装置および方法に関する。
第一部:オーディオ処理装置および方法
1.1節 オーディオ型
1.2節 オーディオ型の信頼値および分類器の構成
1.3節 オーディオ型の信頼値の平滑化
1.4節 パラメータ調整
1.5節 パラメータ平滑化
1.6節 オーディオ型の遷移
1.7節 実施形態の組み合わせおよび応用シナリオ
1.8節 オーディオ処理方法
第二部:ダイアログ向上器コントローラおよび制御方法
2.1節 ダイアログ向上のレベル
2.2節 向上させるべき周波数帯域の決定のための閾値
2.3節 背景レベルへの調整
2.4節 実施形態の組み合わせおよび応用シナリオ
2.5節 ダイアログ向上器制御方法
第三部:サラウンド仮想化器コントローラおよび制御方法
3.1節 サラウンド・ブースト量
3.2節 開始周波数
3.3節 実施形態の組み合わせおよび応用シナリオ
3.4節 サラウンド仮想化器制御方法
第四部:ボリューム平準化器コントローラおよび制御方法
4.1節 情報性および干渉性のコンテンツ型
4.2節 種々のコンテキストにおけるコンテンツ型
4.3節 コンテキスト型
4.4節 実施形態の組み合わせおよび応用シナリオ
4.5節 ボリューム平準化器制御方法
第五部:等化器コントローラおよび制御方法
5.1節 コンテンツ型に基づく制御
5.2節 音楽における優勢な源の確からしさ
5.3節 等化器プリセット
5.4節 コンテキスト型に基づく制御
5.5節 実施形態の組み合わせおよび応用シナリオ
5.6節 等化器制御方法
第六部:オーディオ分類器および分類方法
6.1節 コンテンツ型分類に基づくコンテキスト分類器
6.2節 長期的特徴の抽出
6.3節 短期的特徴の抽出
6.4節 実施形態の組み合わせおよび応用シナリオ
6.5節 オーディオ分類方法
第七部:VoIP分類器および分類方法
7.1節 短期的セグメントに基づくコンテキスト分類
7.2節 VoIP発話およびVoIPノイズを使った分類
7.3節 平滑化ゆらぎ
7.4節 実施形態の組み合わせおよび応用シナリオ
7.5節 VoIP分類方法。
図1は、再生時にオーディオ・コンテンツに基づく改善されたパラメータでの少なくとも一つのオーディオ改善装置の自動的な構成設定をサポートするコンテンツ適応的なオーディオ処理装置100の概括的なフレームワークを示している。これは三つの主要なコンポーネントを有する:オーディオ分類器200、調整ユニット300、オーディオ改善装置400である。
さまざまな種類のオーディオ改善装置を適正に制御するために、本願はさらに、オーディオ型の新たな構成を提供する。ただし、従来技術におけるオーディオ型も本願で適用可能である。
オーディオ分類器200は、硬判定結果を出力してもよく、あるいは調整ユニット300はオーディオ分類器200の結果を硬判定結果と見なしてもよい。硬判定についてでも、複数のオーディオ型がオーディオ・セグメントに割り当てられることができる。たとえば、オーディオ・セグメントは、発話および短期的音楽の混合信号でありうるので、「発話」および「短期的音楽」の両方によってラベル付けされることができる。得られたラベルは、オーディオ改善装置(単数または複数)400を操縦するために直接使われることができる。簡単な例は、発話が存在するときにダイアログ向上器402を有効にし、発話が存在しないときにオフにするというものである。しかしながら、この硬判定方法は、注意深い平滑化方式(後述)なしの場合には、あるオーディオ型から別のオーディオ型への遷移点においていくらかの不自然さを導入することがある。
任意的に、各オーディオ・セグメントがあらかじめ定義されたオーディオ型に分類された後、追加的なステップは、ある型から別の型への急激なジャンプを避け、オーディオ改善装置におけるパラメータのよりなめらかな推定をするために、時間軸に沿って分類結果を平滑化するというものである。たとえば、長い抜粋が、VoIPとして分類された一つだけのセグメントを除いて映画的メディアと分類されると、急激なVoIP判定は、平滑化によって映画的メディアに修正されることができる。
ここで、tは現在の時間(現在のオーディオ・セグメント)、t−1は最後の時間(最後のオーディオ・セグメント)、βは重み、confおよびsmoothConfはそれぞれ平滑化の前および後の信頼値(confidence value)である。
調整ユニット300は、オーディオ分類器200からの得られた結果に基づいてオーディオ改善装置(単数または複数)400についての適正なパラメータを推定または調整するよう設計される。コンテンツ型またはコンテキスト型のいずれかをまたは合同判定のために両方を使って、異なるオーディオ改善装置について異なる調整アルゴリズムが設計されてもよい。たとえば、映画的メディアおよび長期的音楽のようなコンテキスト型情報では、上述したようなプリセットが自動的に選択され、対応するコンテンツに適用されることができる。利用可能なコンテンツ型情報を用いて、各オーディオ改善装置のパラメータは、後述する部において示されるように、より細かい仕方で調整されることができる。コンテンツ型情報およびコンテキスト情報はさらに、長期的および短期的情報をバランスさせるために、調整ユニット300において合同で使われることができる。特定のオーディオ改善装置についての特定の調整アルゴリズムは、別個の調整ユニットと見なされてもよい。あるいは、異なる調整アルゴリズムがまとめて連合した調整ユニットと見なされてもよい。
1.3節では、急激な変化を避け、よってオーディオ改善装置のパラメータの急激な変化を避けるためにオーディオ型の信頼値を平滑化することを論じた。他の措置も可能である。一つは、オーディオ型に基づいて調整されるパラメータを平滑化することであり、本節で論じる。他方は、オーディオ分類器および/または調整ユニットを、オーディオ分類器の結果の変化を遅らせるよう構成することであり、これについては1.6節で論じる。
図9および図10を参照して、オーディオ型の急激な変化を避け、よってオーディオ改善装置のパラメータの急激な変化を避けるためのもう一つの方式が記述される。
ここで、HangCntは残存継続時間または閾値であり、CおよびDは用途の要求に基づいて設定されることのできる二つのパラメータであり、通例、Cは負、Dは正の値である。
上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
上記の実施形態におけるオーディオ処理装置を記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。ただし、これらの方法はオーディオ処理装置を記述する過程において開示されているものの、これらの方法は必ずしも記載されるコンポーネントを採用するものではなく、必ずしもそうしたコンポーネントによって実行されるのではない。たとえば、オーディオ処理装置の実施形態は、部分的または完全にハードウェアおよび/またはファームウェアを用いて実現されてもよく、一方、以下で論じるオーディオ処理方法は、オーディオ処理装置のハードウェアおよび/またはファームウェアを採用してもよいが、完全にコンピュータ実行可能プログラムによって実現されてもよい。
オーディオ改善装置の一例はダイアログ向上器(DE)である。これは、特に聴力が低下しつつある高齢者のために、再生時にオーディオを断続的にモニタリングし、ダイアログの存在を検出し、ダイアログの明瞭性および了解性を高める(ダイアログを聞いて理解しやすくする)ためにダイアログを向上させることをねらいとする。ダイアログが存在するかどうかを検出するほか、ダイアログが存在し、よって(動的スペクトル再均衡化(dynamic spectral rebalancing)を用いて)相応して向上される場合、了解性に最も重要な周波数も検出される。例示的なダイアログ向上方法が特許文献1に呈示されている。その全体はここに参照によって組み込まれる。
ダイアログ向上のレベルに関わるとき、調整ユニット300Aは、ダイアログ向上器のダイアログ向上のレベルを、発話の信頼値と正に相関させるよう構成されていてもよい。追加的または代替的に、レベルは、他のコンテンツ型の信頼値に負に相関させられてもよい。こうして、ダイアログ向上のレベルは発話信頼度に(線形または非線形に)比例するように設定されることができる。よって、ダイアログ向上は、音楽および背景音(効果音)のような非発話信号についてはそれほど効果的ではない。
ダイアログ向上器の作動の間、各周波数帯域について、向上される必要があるかどうかを判定するための閾値(通例、エネルギーまたはラウドネス閾値)がある。すなわち、それぞれのエネルギー/ラウドネス閾値より上の周波数帯域が向上される。それらの閾値を調整するために、調整ユニット300Aは、閾値を、短期的音楽および/またはノイズおよび/または背景音の信頼値と正に相関させるおよび/または閾値を発話の信頼値と負に相関させるよう構成されていてもよい。たとえば、発話信頼度が高ければ、より信頼できる発話検出を想定して閾値を下げることができ、より多くの周波数帯域が向上されることを許容する。他方、音楽信頼値が高ければ、閾値を高くすることができ、より少数の周波数帯域が向上されるようにする(よってアーチファクトをより少なくする)。
ダイアログ向上器におけるもう一つのコンポーネントは、図15に示されるような最小追跡ユニット4022である。これは、(SNR推定および2.2節で述べた周波数帯域閾値推定のために)オーディオ信号における背景レベルを推定するために使われる。これは、オーディオ・コンテンツ型の信頼値に基づいて調整されることもできる。たとえば、発話信頼値が高い場合、最小追跡ユニットは、背景レベルを現在の最小に設定するのにより自信を持つことができる。音楽信頼度が高い場合には、背景レベルはその現在の最小よりはやや高く設定されることができ、あるいは別の仕方では現在の最小と現在フレームのエネルギーとの、現在の最小に大きな重みをかけた重み付き平均に設定されることができる。ノイズおよび背景信頼度が高い場合には、背景レベルは現在の最小値よりずっと高く設定されることができ、あるいは別の仕方では、現在の最小と現在フレームのエネルギーとの、現在の最小に小さな重みをかけた重み付き平均に設定されることができる。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
第一部と同様に、上記の実施形態におけるダイアログ向上器コントローラを記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
サラウンド仮想化器は、サラウンドサウンド信号(マルチチャネル5.1および7.1など)がPCの内部スピーカーを通じてまたはヘッドフォンを通じてレンダリングされることを可能にする。すなわち、内蔵ラップトップ・スピーカーまたはヘッドフォンのようなステレオ装置を用いて、仮想的にサラウンド効果を生成し、消費者のために映画館の体験を提供するのである。サラウンド仮想化器では、マルチチャネル・オーディオ信号に関連付けられたさまざまなスピーカー位置からくる音の耳への到来をシミュレートするために、通例、頭部伝達関数(HRTF: Head Related Transfer Function)が利用される。
サラウンド・ブースト量に関わるとき、調整ユニット300Bは、サラウンド仮想化器404のサラウンド・ブースト量を、ノイズおよび/または背景および/または発話の信頼値と正に相関させるおよび/またはサラウンド・ブースト量を短期的音楽の信頼値と負に相関させるよう構成されていてもよい。
SB∝(1−Confmusic) (5)
ここで、SBはサラウンド・ブースト量、Confmusicは短期的音楽の信頼値である。
SB∝(1−Confmusic)*Confspeech α (6)
ここで、Confspeechは発話の信頼値であり、αは指数の形の重み付け係数であり、1〜2の範囲にあってもよい。この公式は、サラウンド・ブースト量は純粋な発話(高い発話信頼度および低い音楽信頼度)についてのみ高くなることを示す。
SB∝Confspeech (7)
さまざまな変形が同様にして設計できる。特に、ノイズまたは背景音について、公式(5)ないし(7)と同様の公式が構築されてもよい。さらに、それら四つのコンテンツ型の効果は任意の組み合わせにおいて一緒に考慮されてもよい。そのような状況において、ノイズおよび背景は周囲音であり、大きなブースト量をもってもより安全である。発話は、話者が通例はスクリーンの前方に座ると想定して、中程度のブースト量をもつことができる。したがって、調整ユニット300Bは、サラウンド・ブースト量を、コンテンツが型発話よりも、ノイズおよび/または背景の信頼値と、より正に相関させるよう構成されていてもよい。
他のパラメータも開始周波数のようなサラウンド仮想化器において修正されることができる。一般に、オーディオ信号中の高周波数成分は空間的にレンダリングされるのに、より好適である。たとえば、音楽では、ベースがより多くのサラウンド効果をもつようにレンダリングされると、おかしく聞こえる。よって、特定のオーディオ信号について、サラウンド仮想化器は、それより上の成分が空間的にレンダリングされ、それより下の成分が保持される周波数閾値を決定する必要がある。周波数閾値は開始周波数である。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
第一部と同様に、上記の実施形態におけるサラウンド仮想化器コントローラを記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
異なるオーディオ源または同じオーディオ源の異なるピースのボリュームは時に大きく変化する。ユーザーがボリュームを頻繁に調整しなければならないので、これはわずらわしい。ボリューム平準化器(VL: Volume Leveler)は再生時のオーディオ・コンテンツのボリュームを調整し、ターゲット・ラウドネス値に基づいて時間軸上でほとんど一貫しているようにすることをねらいとする。例示的なボリューム平準化器は特許文献2、特許文献3、特許文献4に記載されている。これら三つの文書はここに全体において参照によって組み込まれる。
上述したように、ボリューム平準化器の制御との関連で、オーディオ・コンテンツ型は情報性のコンテンツ型および干渉性のコンテンツ型として分類されうる。
調整ユニット300Cは、ボリューム平準化器の動的利得をオーディオ信号の情報性コンテンツ型と正に相関させ、ボリューム平準化器の動的利得をオーディオ信号の干渉性コンテンツ型と負に相関させるよう構成されてもよい。
GainControl∝1−Confnoise (10)
のように、ノイズ信頼値(Confnoise)の減少関数に比例するよう設定されることができる。
GainControl∝(1−Confnoise)・(1−Confbkg) (11)
上記の公式においては、ノイズおよび背景音の両方が望まれないので、GainControlはノイズの信頼値および背景の信頼値によって等しく影響される。これは、ノイズおよび背景音が同じ重みをもつと見なしうる。状況に依存して、両者は異なる重みをもってもよい。たとえば、ノイズおよび背景音の信頼値(またはそれらの1との差)に異なる係数または異なる指数(αおよびγ)を与えてもよい。すなわち、公式(11)は
GainControl∝(1−Confnoise)α・(1−Confbkg)γ (12)
または
GainControl∝(1−Confnoise α)・(1−Confbkg γ) (13)
と書き直されてもよい。
GainControl∝1−max(Confnoise,Confbkg) (14)
公式(11)(およびその諸変形)および公式(14)の両方は、ノイズ信号および背景音信号についての小さな利得を示し、ボリューム平準化器のもとの挙動は、(発話および音楽信号におけるように)ノイズ信頼値および背景信頼値の両方が小さくGainControlが1に近いときにのみ保持される。
GainControl∝1−Confnoise・(1−Confspeech) (15)
として考慮することができる。この館数を用いると、小さなGainControlが得られるのは、高いノイズ信頼度および低い発話信頼度をもつ信号(たとえば純粋なノイズ)についてのみであり、発話信頼度が高い場合にはGainControlは1に近くなる(よってボリューム平準化器のもとの挙動を保持する)。より一般には、あるコンテンツ型(Confnoiseなど)の重みが少なくとも一つの他のコンテンツ型(Confspeechなど)をもって修正されうると見なされることができる。上記の公式(15)において、発話の信頼度はノイズの信頼度の重み係数を変化させると見なされることができる(公式(12)および(13)における重みに比べると別の種類の重み)。換言すれば、公式(10)ではConfnoiseの係数が1と見なされることができ、一方、公式(15)では、いくつかの他のオーディオ型(発話などだがそれに限られない)がノイズの信頼値の重要性に影響する。よって、Confnoiseの重みが発話の信頼値によって修正されると言うことができる。本開示のコンテキストにおいて、用語「重み」はこれを含むように解釈される。すなわち、値の重要性を示すが、必ずしも規格化されていない。1.4節が参照されてもよい。
ここで、αおよびγは二つの重みである。これらは、平準器パラメータを修正するためにより大きく反応することが期待される場合にはより小さく設定されることができる。
公式(10)〜(16)における上記の制御関数は、ノイズ、背景音、短期的音楽および発話のようなオーディオ・コンテンツ型の信頼値を考慮に入れるが、映画的メディアおよびVoIPなど、音がどこからくるかのオーディオ・コンテキストは考慮しない。同じオーディオ・コンテンツ型が、たとえば背景音について、異なるオーディオ・コンテキストでは異なる仕方で処理される必要があることがありうる。背景音は、自動車エンジン、爆発および拍手など、さまざまな音を含む。VoIPでは意味がないかもしれないが、映画的メディアでは重要であることがある。これは、関心のあるオーディオ・コンテキストが識別され、異なるオーディオ・コンテキストについて異なる制御関数が設計される必要があることを示している。
GainControl∝1−max(Confnoise,Confbkg)
else
GainControl∝1−Confnoise (17)
すなわち、VoIPコンテキストでは、ノイズおよび背景音は干渉性コンテンツ型と見なされ、一方、非VoIPコンテキストでは、背景音は情報性コンテンツ型と見なされる。
GainControl∝1−max(Confnoise,Confbkg)
else
GainControl∝1−Confnoise・(1−Confspeech) (18)
ここで、発話は情報性コンテンツ型として強調される。
GainControl∝1−Confnoise・(1−max(Confspeech,Confmusic) (19)
と拡張できる。
コンテキスト型は、ノイズのようなわずらわしい音がブーストされすぎるのを避けるようボリューム平準化器を制御するために直接使われることもできる。たとえば、VoIP信頼値が、ボリューム平準化器を、その信頼値が高いときに感度を低くするよう操縦するために使われることができる。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。たとえば、4.1節ないし4.3節において述べた解決策の任意の二つ以上が互いと組み合わされてもよい。そして、これらの組み合わせの任意のものが、第一部〜第三部および後述する他の部において記載または含意されている任意の実施形態とさらに組み合わされてもよい。
第一部と同様に、上記の実施形態におけるボリューム平準化器コントローラを記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
等化は、通例、音楽信号に適用されて、「トーン」または「音色」として知られるそのスペクトル・バランスを調整または修正する。伝統的な等化器は、ある種の楽器を強調したりまたは望まれない音を除去したりするために、ユーザーが個々の周波数帯域における周波数応答(利得)の全体的なプロファイル(曲線または形状)を構成設定できるようにする。ウィンドウズ・メディア・プレーヤーのような一般的な音楽プレーヤーは、種々のジャンルの音楽の最良の聴取経験を得るために、各周波数帯域における利得を調整するためのグラフィック・イコライザーを提供し、ロック、ラップ、ジャズおよびフォークのような種々の音楽ジャンルについての等化器プリセットの集合をも提供する。ひとたびプリセットが選択され、プロファイルが設定されたら、プロファイルが手動で修正されるまで、同じ等化利得が信号に対して適用される。
一般に、音楽、発話、背景音およびノイズのような一般的なオーディオ・コンテンツ型について、等化器は異なるコンテンツ型に対して異なるように設定されるべきである。伝統的なセットアップと同様に、等化器は、自動的に音楽信号に対して有効にされるが、発話に対しては無効にされることができる。あるいはより連続的な仕方で、音楽信号に対しては高い等化レベルを、発話信号に対しては低い等化レベルを設定することができる。このようにして、等化器の等化レベルは異なるオーディオ・コンテンツについて自動的に設定されることができる。
Leq∝Confmusic (20)
または
Leq∝1−Confspeech (21)
として使用されることができる。ここで、Leqは等化レベルっであり、ConfmusicおよびConfspeechは音楽および発話の信頼値を表わす。
Leq=Confmusic(1−Confspeech α) (22)
ここで、発話信頼値は、頻繁に起こりうる、音楽信号における0でない発話信頼値を扱うために、α乗される。上記の公式を用いれば、等化は、発話成分のない純粋な音楽信号に対してはフルに適用される(1に等しいレベルで)。第一部で述べたように、αはコンテンツ型の重要性に基づく重み付け係数と見なされてもよく、典型的には1ないし2に設定されることができる。
優勢な源をもつ音楽が高い等化レベルを適用されることを避けるために、等化レベルはさらに、音楽片が優勢な源を含むかどうかを示す信頼値Confdomに相関させられてもよい。たとえば、
Leq=1−Confdom (23)。
Leq=Confmusic(1−Confspeech)(1−Confdom) (24)
とすることである。
オーディオ・コンテンツ型の信頼値に基づいて等化レベルを適応的に調整することのほか、種々のオーディオ・コンテンツについて、そのジャンル、楽器または他の特性に依存して、適切な等化プロファイルまたは所望されるスペクトル・バランス・プリセットが自動的に選ばれることもできる。同じジャンルをもつ、同じ楽器を含むまたは同じ音楽特性をもつ音楽は同じ等化プロファイルまたは所望されるスペクトル・バランス・プリセットを共有することができる。
Peq=Pc* (26)
として、最良のマッチしたクラスターの対応するプロファイルを割り当てることである。ここで、Peqは推定される等化プロファイルまたは所望されるスペクトル・バランス・プリセットであり、c*は最良のマッチした音楽クラスター(優勢なオーディオ型)のインデックスであり、これは最も高い信頼値をもつクラスターを拾うことによって得られる。
これまでの節では、さまざまなコンテンツ型に焦点を当てている。本節で論じるさらなる実施形態では、代替的または追加的にコンテキスト型が考慮されてもよい。
Leq∝ConfMUSIC (29)
または
Leq∝1−ConfMOVIE (30)
ここで、Leqは等化レベル、ConfMUSICおよびConfMOVIEは長期的音楽および映画的メディアの信頼値を表わす。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
第一部と同様に、上記の実施形態における等化器コントローラを記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
1.1節および1.2節で述べたように、さまざまな階層レベルのコンテンツ型およびコンテキスト型を含む本願で論じられるオーディオ型は、機械学習ベースの方法を含め何らかの既存の分類方式を用いて分類または識別されることができる。この部および次の部では、本願は、これまでの部で言及されたコンテキスト型を分類するための分類器および方法のいくつかの新規な側面を提案する。
これまでの部で述べたように、オーディオ分類器200は、オーディオ信号のコンテンツ型を識別するおよび/またはオーディオ信号のコンテキスト型を識別するために使われる。したがって、オーディオ分類器200は、オーディオ・コンテンツ分類器202および/またはオーディオ・コンテキスト分類器204を有していてもよい。オーディオ・コンテンツ分類器202および/またはオーディオ・コンテキスト分類器204を実装するための既存の技法を採用するとき、両分類器は互いから独立でありうるが、いくつかの特徴を共有していてもよく、よって該特徴を抽出するためのいくつかの方式を共有していてもよい。
図24に示されるように、ある実施形態では、統計量抽出器2042のみが、短期的分類器2024の結果から長期的特徴を抽出するために使用される。長期的特徴として、次のうちの少なくとも一つが統計量抽出器2042によって計算されてもよい:分類されるべき長期的セグメント内の短期的セグメントの短期的オーディオ型の信頼値の平均および分散、短期的セグメントの重要度によって重み付けされた前記平均および分散、各短期的オーディオ型の出現頻度および分類されるべき長期的セグメント内の種々の短期的オーディオ型の間の遷移の頻度。
図24および図27に示されるように、短期的特徴抽出器2022は、短期的特徴として、次の特徴のうちの少なくとも一つを、各短期的オーディオ・セグメントから直接抽出するよう構成されていてもよい:リズム特性、中断/ミュート特性および短期的オーディオ品質特徴。
a)推定された背景ノイズ・レベル、スペクトル明瞭性などを含む静的なSNR特性
b)スペクトル・レベル偏差、スペクトル・レベル範囲、相対ノイズ・フロアなどを含むセグメントSNR特性
c)ピッチ平均、発話セクション・レベル変動、発話レベルなどを含む基本的発話記述子
d)ロボット化(robotization)、ピッチ・クロス・パワー(pitch cross power)などを含む声道特性。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
第一部と同様に、上記の実施形態におけるオーディオ分類器を記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
第六部では、少なくとも部分的にはコンテンツ型分類の結果に基づいてオーディオ信号をオーディオ・コンテキスト型に分類するための新規なオーディオ分類器が提案されている。第六部で論じた実施形態において、長期的特徴は、数秒ないし数十秒の長さの長期的セグメントから抽出される。よって、オーディオ・コンテキスト分類は長いレイテンシーを引き起こしうる。オーディオ・コンテキストがリアルタイムでまたはほぼリアルタイムでたとえば短期的セグメント・レベルにおいて分類されうることが望まれる。
したがって、図34に示されるように、オーディオ信号の短期的セグメントのコンテンツ型を同定するためのオーディオ・コンテンツ分類器202Aと、少なくとも部分的には前記オーディオ・コンテンツ分類器によって識別されたコンテンツ型に基づいて短期的セグメントのコンテキスト型を識別するオーディオ・コンテキスト分類器204Aとを有するオーディオ分類器200Aが提供される。
本願のこの側面は、短い判断レイテンシーのために現在の短期的セグメントを分類することを要求されるVoIP/非VoIP分類システムにおいて特に有用である。
急速な揺動〔ゆらぎ〕を避けるために、もう一つの解決策は、オーディオ・コンテンツ分類器によって決定される信頼値を平滑化することである。したがって、図37に示されるように、型平滑化ユニット203Aがオーディオ分類器200Aに含まれてもよい。先に論じた四つのVoIP関係のコンテンツ型のそれぞれの信頼値について、1.3節で論じた平滑化方式が採用されてもよい。
ここで、v(t)は時刻tにおける平滑化されたVoIP発話信頼値であり、v(t−1)は最後の時点における平滑化されたVoIP発話信頼値であり、voipSpeechConfは平滑化前の現在時刻tにおけるVoIP発話信頼度であり、αは重み付け係数である。
第一部と同様に、上記で論じたすべての実施形態およびその変形は、そのいかなる組み合わせにおいて実装されてもよく、異なる部/実施形態において言及されるが同じまたは同様の機能をもついかなる構成要素も同じまたは別個の構成要素として実装されてもよい。
第一部と同様に、上記の実施形態におけるオーディオ分類器を記述する過程で、いくつかのプロセスまたは方法も開示されていることは明らかである。以下では、これらの方法の概要が与えられるが、上記ですでに論じた詳細の一部は繰り返さない。
〔態様1〕
オーディオ信号のオーディオ型を連続的に識別するオーディオ分類器と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する調整ユニットとを有する、
等化器コントローラ。
〔態様2〕
前記オーディオ分類器が前記オーディオ信号を、対応する信頼値をもつ複数のオーディオ型に分類するよう構成されており、前記調整ユニットが、前記複数のオーディオ型の重要性に基づいて前記複数のオーディオ型の前記信頼値を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、態様1記載の等化器コントローラ。
〔態様3〕
前記オーディオ分類器が前記オーディオ信号を、対応する信頼値をもつ複数のオーディオ型に分類するよう構成されており、前記調整ユニットが、前記信頼値に基づいて前記複数のオーディオ型の効果を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、態様1記載の等化器コントローラ。
〔態様4〕
前記調整ユニットが、前記信頼値に基づいて少なくとも一つの優勢なオーディオ型を考慮するよう構成されている、態様3記載の等化器コントローラ。
〔態様5〕
前記調整ユニットによって調整される前記等化器のあるパラメータについて、現時点で前記調整ユニットによって決定されるパラメータ値を、過去のパラメータ値に基づいて平滑化するパラメータ平滑化ユニットをさらに有する、態様1記載の等化器コントローラ。
〔態様6〕
前記パラメータ平滑化ユニットは、現時点で前記調整ユニットによって決定されるパラメータ値と最後の時点での平滑化されたパラメータ値との重み付けされた和を計算することによって、現在の平滑化されたパラメータ値を決定するよう構成されている、態様5記載の等化器コントローラ。
〔態様7〕
前記重み付けされた和を計算するための重みが、前記オーディオ信号のオーディオ型に基づいて適応的に変更される、態様6記載の等化器コントローラ。
〔態様8〕
前記重み付けされた和を計算するための重みが、あるオーディオ型から別のオーディオ型への異なる遷移対に基づいて適応的に変更される、態様6記載の等化器コントローラ。
〔態様9〕
前記重み付けされた和を計算するための重みが、前記調整ユニットによって決定される前記パラメータ値の増加または減少トレンドに基づいて適応的に変更される、態様6記載の等化器コントローラ。
〔態様10〕
前記オーディオ分類器が、前記オーディオ信号のコンテンツ型を識別するためのオーディオ・コンテンツ分類器を有しており、
前記調整ユニットが、等化レベルを短期的音楽の信頼値と正に相関させるおよび/または等化レベルを発話の信頼値と負に相関させるよう構成されている、
態様1ないし9のうちいずれか一項記載の等化器コントローラ。
〔態様11〕
前記オーディオ分類器が、前記オーディオ信号のコンテキスト型を識別するためのオーディオ・コンテキスト分類器を有しており、
前記調整ユニットが、等化レベルを長期的音楽の信頼値と正に相関させるおよび/または等化レベルを映画的メディアおよび/またはゲームの信頼値と負に相関させるよう構成されている、
態様1ないし9のうちいずれか一項記載の等化器コントローラ。
〔態様12〕
前記オーディオ分類器が、前記オーディオ信号のコンテンツ型を識別するためのオーディオ・コンテンツ分類器を有しており、
前記調整ユニットが、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
態様1ないし9のうちいずれか一項記載の等化器コントローラ。
〔態様13〕
前記調整ユニットが、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
態様10または11記載の等化器コントローラ。
〔態様14〕
前記調整ユニットが、前記短期的音楽についての信頼値がある閾値より大きいときに、優勢な源のある/ない前記短期的音楽を考慮するよう構成されている、態様13記載の等化器コントローラ。
〔態様15〕
前記オーディオ分類器が、前記オーディオ信号のコンテンツ型を識別するためのオーディオ・コンテンツ分類器を有しており、
前記調整ユニットが、等化レベルを背景音の信頼値と正に相関させるおよび/または等化レベルをノイズの信頼値と負に相関させるよう構成されている、
態様1ないし9のうちいずれか一項記載の等化器コントローラ。
〔態様16〕
前記調整ユニットが、各オーディオ型に等化レベルおよび/または等化プロファイルおよび/またはスペクトル・バランス・プリセットを割り当てるよう構成されている、態様1ないし9のうちいずれか一項記載の等化器コントローラ。
〔態様17〕
前記オーディオ分類器が、前記オーディオ信号を、短期的音楽、発話、背景音およびノイズのうちの少なくとも一つを含む短期的コンテンツ型に分類するオーディオ・コンテンツ分類器を有する、態様16記載の等化器コントローラ。
〔態様18〕
前記短期的音楽が少なくとも一つの音楽クラスターを含む、態様17記載の等化器コントローラ。
〔態様19〕
前記少なくとも一つの音楽クラスターが、ジャンル・ベースのクラスターおよび/または楽器ベースのクラスターおよび/または音楽のリズム、テンポ、音色および/または
他の任意の音楽的属性に基づいて分類された音楽クラスターを含む、
態様18記載の等化器コントローラ。
〔態様20〕
前記オーディオ分類器が、前記オーディオ信号を、映画的メディア、長期的音楽、VoIPおよびゲームのうちの少なくとも一つを含む長期的コンテキスト型に分類するオーディオ・コンテキスト分類器を有する、態様16記載の等化器コントローラ。
〔態様21〕
態様1ないし20のうちいずれか一項記載の等化器コントローラを有するオーディオ再生装置。
〔態様22〕
リアルタイムでオーディオ信号のオーディオ型を識別する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含む、
等化器制御方法。
〔態様23〕
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記複数のオーディオ型の重要性に基づいて前記複数のオーディオ型の前記信頼値を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、態様22記載の等化器制御方法。
〔態様24〕
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記信頼値に基づいて前記複数のオーディオ型の効果を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、態様22記載の等化器制御方法。
〔態様25〕
前記調整する動作が、前記信頼値に基づいて少なくとも一つの優勢なオーディオ型を考慮するよう構成されている、態様24記載の等化器制御方法。
〔態様26〕
前記調整する動作によって調整される前記等化器のあるパラメータについて、現時点で前記調整する動作によって決定されるパラメータ値を、過去のパラメータ値に基づいて平滑化することをさらに含む、態様22記載の等化器制御方法。
〔態様27〕
前記平滑化する動作は、現時点で前記調整する動作によって決定されるパラメータ値と最後の時点での平滑化されたパラメータ値との重み付けされた和を計算することによって、現在の平滑化されたパラメータ値を決定するよう構成されている、態様26記載の等化器制御方法。
〔態様28〕
前記重み付けされた和を計算するための重みが、前記オーディオ信号のオーディオ型に基づいて適応的に変更される、態様27記載の等化器制御方法。
〔態様29〕
前記重み付けされた和を計算するための重みが、あるオーディオ型から別のオーディオ型への異なる遷移対に基づいて適応的に変更される、態様27記載の等化器制御方法。
〔態様30〕
前記重み付けされた和を計算するための重みが、前記調整する動作によって決定される前記パラメータ値の増加または減少トレンドに基づいて適応的に変更される、態様27記載の等化器制御方法。
〔態様31〕
前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作が、等化レベルを短期的音楽の信頼値と正に相関させるおよび/または等化レベルを発話の信頼値と負に相関させるよう構成されている、
態様22ないし30のうちいずれか一項記載の等化器制御方法。
〔態様32〕
前記オーディオ型を識別する動作が、前記オーディオ信号のコンテキスト型を識別することを含み、
前記調整する動作が、等化レベルを長期的音楽の信頼値と正に相関させるおよび/または等化レベルを映画的メディアおよび/またはゲームの信頼値と負に相関させるよう構成されている、
態様22ないし30のうちいずれか一項記載の等化器制御方法。
〔態様33〕
前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
態様22ないし30のうちいずれか一項記載の等化器制御方法。
〔態様34〕
前記調整する動作が、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
態様31または32記載の等化器制御方法。
〔態様35〕
前記調整する動作が、前記短期的音楽についての信頼値がある閾値より大きいときに、優勢な源のある/ない前記短期的音楽を考慮するよう構成されている、態様34記載の等化器制御方法。
〔態様36〕
前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作が、等化レベルを背景音の信頼値と正に相関させるおよび/または等化レベルをノイズの信頼値と負に相関させるよう構成されている、
態様22ないし30のうちいずれか一項記載の等化器制御方法。
〔態様37〕
前記調整する動作が、各オーディオ型に等化レベルおよび/または等化プロファイルおよび/またはスペクトル・バランス・プリセットを割り当てるよう構成されている、態様22ないし30のうちいずれか一項記載の等化器制御方法。
〔態様38〕
前記オーディオ型を識別する動作が、前記オーディオ信号を、短期的音楽、発話、背景音およびノイズのうちの少なくとも一つを含む短期的コンテンツ型に分類することを含む、態様37記載の等化器制御方法。
〔態様39〕
前記短期的音楽が少なくとも一つの音楽クラスターを含む、態様38記載の等化器制御方法。
〔態様40〕
前記少なくとも一つの音楽クラスターが、ジャンル・ベースのクラスターおよび/または楽器ベースのクラスターおよび/または音楽のリズム、テンポ、音色および/または他の任意の音楽的属性に基づいて分類された音楽クラスターを含む、態様39記載の等化器制御方法。
〔態様41〕
前記オーディオ型を識別する動作が、前記オーディオ信号を、映画的メディア、長期的音楽、VoIPおよびゲームのうちの少なくとも一つを含む長期的コンテキスト型に分類することを含む、態様37記載の等化器制御方法。
〔態様42〕
プロセッサによって実行されると該プロセッサが等化器制御方法を実行できるようにするコンピュータ・プログラム命令が記録されたコンピュータ可読媒体であって、前記等化器制御方法は、
リアルタイムでオーディオ信号のオーディオ型を識別する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含む、
コンピュータ可読媒体。
Claims (21)
- リアルタイムでオーディオ信号のオーディオ型を識別するようオーディオ信号を分類する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含む、
等化器制御方法であって、
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記複数のオーディオ型の重要性に基づいて前記複数のオーディオ型の前記信頼値を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、等化器制御方法。 - リアルタイムでオーディオ信号のオーディオ型を識別するようオーディオ信号を分類する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含む、
等化器制御方法であって、
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記信頼値に基づいて前記複数のオーディオ型の効果を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、等化器制御方法。 - 前記調整する動作が、前記信頼値に基づいて少なくとも一つの優勢なオーディオ型を考慮するよう構成されている、請求項2記載の等化器制御方法。
- 前記調整する動作によって調整される前記等化器のあるパラメータについて、現時点で前記調整する動作によって決定されるパラメータ値を、過去のパラメータ値に基づいて平滑化することをさらに含む、請求項1記載の等化器制御方法。
- 前記平滑化する動作は、現時点で前記調整する動作によって決定されるパラメータ値と最後の時点での平滑化されたパラメータ値との重み付けされた和を計算することによって、現在の平滑化されたパラメータ値を決定するよう構成されている、請求項4記載の等化器制御方法。
- 前記重み付けされた和を計算するための重みが、前記オーディオ信号のオーディオ型に基づいて適応的に変更される、請求項5記載の等化器制御方法。
- 前記重み付けされた和を計算するための重みが、あるオーディオ型から別のオーディオ型への異なる遷移対に基づいて適応的に変更される、請求項5記載の等化器制御方法。
- 前記重み付けされた和を計算するための重みが、前記調整する動作によって決定される前記パラメータ値の増加または減少トレンドに基づいて適応的に変更される、請求項5記載の等化器制御方法。
- 前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作が、等化レベルを短期的音楽の信頼値と正に相関させるおよび/または等化レベルを発話の信頼値と負に相関させるよう構成されている、
請求項1記載の等化器制御方法。 - 前記オーディオ型を識別する動作が、前記オーディオ信号のコンテキスト型を識別することを含み、
前記調整する動作が、等化レベルを長期的音楽の信頼値と正に相関させるおよび/または等化レベルを映画的メディアおよび/またはゲームの信頼値と負に相関させるよう構成されている、
請求項1記載の等化器制御方法。 - 前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作が、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
請求項1記載の等化器制御方法。 - 前記調整する動作が、等化レベルを優勢な源のない短期的音楽の信頼値と正に相関させるおよび/または等化レベルを優勢な源のある短期的音楽の信頼値と負に相関させるよう構成されている、
請求項9記載の等化器制御方法。 - 前記調整する動作が、前記短期的音楽についての信頼値がある閾値より大きいときに、優勢な源のある/ない前記短期的音楽を考慮するよう構成されている、請求項2記載の等化器制御方法。
- 前記オーディオ型を識別する動作が、前記オーディオ信号のコンテンツ型を識別することを含み、
前記調整する動作が、等化レベルを背景音の信頼値と正に相関させるおよび/または等化レベルをノイズの信頼値と負に相関させるよう構成されている、
請求項1記載の等化器制御方法。 - 前記調整する動作が、各オーディオ型に等化レベルおよび/または等化プロファイルおよび/またはスペクトル・バランス・プリセットを割り当てるよう構成されている、請求項2記載の等化器制御方法。
- 前記オーディオ型を識別する動作が、前記オーディオ信号を、短期的音楽、発話、背景音およびノイズのうちの少なくとも一つを含む短期的コンテンツ型に分類することを含む、請求項15記載の等化器制御方法。
- 前記短期的音楽が少なくとも一つの音楽クラスターを含む、請求項16記載の等化器制御方法。
- 前記少なくとも一つの音楽クラスターが、ジャンル・ベースのクラスターおよび/または楽器ベースのクラスターおよび/または音楽のリズム、テンポ、音色および/または他の任意の音楽的属性に基づいて分類された音楽クラスターを含む、請求項17記載の等化器制御方法。
- 前記オーディオ型を識別する動作が、前記オーディオ信号を、映画的メディア、長期的音楽、VoIPおよびゲームのうちの少なくとも一つを含む長期的コンテキスト型に分類することを含む、請求項15記載の等化器制御方法。
- 一つまたは複数のプロセッサによって実行されると等化器制御方法を実行する命令をもつ非一時的なコンピュータ可読媒体であって、前記等化器制御方法は、
リアルタイムでオーディオ信号のオーディオ型を識別するようオーディオ信号を分類する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含み、
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記複数のオーディオ型の重要性に基づいて前記複数のオーディオ型の前記信頼値を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、
コンピュータ可読媒体。 - 一つまたは複数のプロセッサによって実行されると等化器制御方法を実行する命令をもつコンピュータ可読媒体であって、前記等化器制御方法は、
リアルタイムでオーディオ信号のオーディオ型を識別するようオーディオ信号を分類する段階と;
識別されたオーディオ型の信頼値に基づいて連続的な仕方で等化器を調整する段階とを含み、
前記オーディオ信号が、対応する信頼値をもつ複数のオーディオ型に分類され、前記調整する動作が、前記信頼値に基づいて前記複数のオーディオ型の効果を重み付けすることを通じて前記複数のオーディオ型の少なくともいくつかを考慮するよう構成されている、
コンピュータ可読媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310100401.XA CN104079247B (zh) | 2013-03-26 | 2013-03-26 | 均衡器控制器和控制方法以及音频再现设备 |
CN201310100401.X | 2013-03-26 | ||
US201361811058P | 2013-04-11 | 2013-04-11 | |
US61/811,058 | 2013-04-11 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505490A Division JP6053984B2 (ja) | 2013-03-26 | 2014-03-17 | 等化器コントローラおよび制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017073811A true JP2017073811A (ja) | 2017-04-13 |
JP6325640B2 JP6325640B2 (ja) | 2018-05-16 |
Family
ID=51600326
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505490A Active JP6053984B2 (ja) | 2013-03-26 | 2014-03-17 | 等化器コントローラおよび制御方法 |
JP2016230947A Active JP6325640B2 (ja) | 2013-03-26 | 2016-11-29 | 等化器コントローラおよび制御方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505490A Active JP6053984B2 (ja) | 2013-03-26 | 2014-03-17 | 等化器コントローラおよび制御方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US9621124B2 (ja) |
EP (2) | EP3232567B1 (ja) |
JP (2) | JP6053984B2 (ja) |
CN (1) | CN104079247B (ja) |
ES (1) | ES2630398T3 (ja) |
HK (1) | HK1244110A1 (ja) |
WO (1) | WO2014160548A1 (ja) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9380383B2 (en) | 2013-09-06 | 2016-06-28 | Gracenote, Inc. | Modifying playback of content using pre-processed profile information |
US9716958B2 (en) | 2013-10-09 | 2017-07-25 | Voyetra Turtle Beach, Inc. | Method and system for surround sound processing in a headset |
US9792952B1 (en) * | 2014-10-31 | 2017-10-17 | Kill the Cann, LLC | Automated television program editing |
US9729118B2 (en) | 2015-07-24 | 2017-08-08 | Sonos, Inc. | Loudness matching |
US9949057B2 (en) | 2015-09-08 | 2018-04-17 | Apple Inc. | Stereo and filter control for multi-speaker device |
JPWO2017061218A1 (ja) * | 2015-10-09 | 2018-07-26 | ソニー株式会社 | 音響出力装置、音響生成方法及びプログラム |
CN105263086A (zh) * | 2015-10-27 | 2016-01-20 | 小米科技有限责任公司 | 均衡器的调节方法、装置和智能音箱 |
WO2017079334A1 (en) | 2015-11-03 | 2017-05-11 | Dolby Laboratories Licensing Corporation | Content-adaptive surround sound virtualization |
EP3465681A1 (en) * | 2016-05-26 | 2019-04-10 | Telefonaktiebolaget LM Ericsson (PUBL) | Method and apparatus for voice or sound activity detection for spatial audio |
CN106601268B (zh) * | 2016-12-26 | 2020-11-27 | 腾讯音乐娱乐(深圳)有限公司 | 一种多媒体数据处理方法及装置 |
US9860644B1 (en) | 2017-04-05 | 2018-01-02 | Sonos, Inc. | Limiter for bass enhancement |
CN110249320A (zh) * | 2017-04-28 | 2019-09-17 | 惠普发展公司有限责任合伙企业 | 利用使用音频持续时间的机器学习模型进行的音频分类 |
US11386913B2 (en) | 2017-08-01 | 2022-07-12 | Dolby Laboratories Licensing Corporation | Audio object classification based on location metadata |
CN107526568A (zh) * | 2017-08-18 | 2017-12-29 | 广东欧珀移动通信有限公司 | 音量调节方法、装置、终端设备及存储介质 |
JP6812381B2 (ja) * | 2018-02-08 | 2021-01-13 | 日本電信電話株式会社 | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム |
US11929091B2 (en) | 2018-04-27 | 2024-03-12 | Dolby Laboratories Licensing Corporation | Blind detection of binauralized stereo content |
EP3785453B1 (en) * | 2018-04-27 | 2022-11-16 | Dolby Laboratories Licensing Corporation | Blind detection of binauralized stereo content |
CN110610702B (zh) * | 2018-06-15 | 2022-06-24 | 惠州迪芬尼声学科技股份有限公司 | 以自然语言声控均衡器的方法及计算器可读存储介质 |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
CN112384976A (zh) * | 2018-07-12 | 2021-02-19 | 杜比国际公司 | 动态eq |
CN109273010B (zh) * | 2018-08-21 | 2020-08-11 | 深圳市声扬科技有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
US10855241B2 (en) | 2018-11-29 | 2020-12-01 | Sony Corporation | Adjusting an equalizer based on audio characteristics |
WO2020247892A1 (en) * | 2019-06-07 | 2020-12-10 | Dts, Inc. | System and method for adaptive sound equalization in personal hearing devices |
JP7258228B2 (ja) * | 2019-08-27 | 2023-04-14 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応的平滑化を使用したダイアローグの拡張 |
US10798484B1 (en) | 2019-11-26 | 2020-10-06 | Gracenote, Inc. | Methods and apparatus for audio equalization based on variant selection |
US11481628B2 (en) | 2019-11-26 | 2022-10-25 | Gracenote, Inc. | Methods and apparatus for audio equalization based on variant selection |
KR20210086086A (ko) | 2019-12-31 | 2021-07-08 | 삼성전자주식회사 | 음악 신호 이퀄라이저 및 이퀄라이징 방법 |
EP3889958A1 (en) * | 2020-03-31 | 2021-10-06 | Moodagent A/S | Dynamic audio playback equalization using semantic features |
US20240038258A1 (en) * | 2020-08-18 | 2024-02-01 | Dolby Laboratories Licensing Corporation | Audio content identification |
CN112185325A (zh) * | 2020-10-12 | 2021-01-05 | 上海闻泰电子科技有限公司 | 音频播放风格调节方法、装置、电子设备及存储介质 |
CN112967732B (zh) * | 2021-02-25 | 2023-10-03 | 北京百度网讯科技有限公司 | 调整均衡器的方法、装置、设备和计算机可读存储介质 |
CN115691543A (zh) * | 2021-07-28 | 2023-02-03 | 哈曼国际工业有限公司 | 用于声学***的自适应均衡方法及*** |
TWI781714B (zh) * | 2021-08-05 | 2022-10-21 | 晶豪科技股份有限公司 | 用以等化輸入訊號以產生等化器輸出訊號的方法以及參數等化器 |
US11673064B2 (en) * | 2021-09-28 | 2023-06-13 | Sony Interactive Entertainment Inc. | Vocal collision queue |
CN114171048A (zh) * | 2021-11-30 | 2022-03-11 | 雷欧尼斯(北京)信息技术有限公司 | 一种室内多位置频域音频均衡方法、装置及设备 |
CN115334349B (zh) * | 2022-07-15 | 2024-01-02 | 北京达佳互联信息技术有限公司 | 音频处理方法、装置、电子设备及存储介质 |
SE2251320A1 (en) * | 2022-11-11 | 2024-05-12 | Audiodo Ab Publ | A method of calibration of a weighing arrangement and Roger MARTINSON, LIMHAMN, SE Peter FRANSSON, MALMÖ, SE |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08250944A (ja) * | 1995-03-13 | 1996-09-27 | Nippon Telegr & Teleph Corp <Ntt> | 自動音量制御方法およびこの方法を実施する装置 |
JPH1117472A (ja) * | 1997-06-20 | 1999-01-22 | Fujitsu General Ltd | 音声装置 |
JP2005229544A (ja) * | 2004-02-16 | 2005-08-25 | Yamaha Corp | 音量制御装置 |
JP2007208407A (ja) * | 2006-01-31 | 2007-08-16 | Toshiba Corp | 情報処理装置、およびそのサウンド制御方法 |
JP2008521046A (ja) * | 2004-11-23 | 2008-06-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声データ処理装置及び方法、コンピュータプログラム要素並びにコンピュータ可読媒体 |
JP2009503568A (ja) * | 2005-07-22 | 2009-01-29 | ソフトマックス,インコーポレイテッド | 雑音環境における音声信号の着実な分離 |
JP2010016483A (ja) * | 2008-07-01 | 2010-01-21 | Victor Co Of Japan Ltd | 音声信号補正装置 |
JP2010288119A (ja) * | 2009-06-12 | 2010-12-24 | Sony Corp | 信号処理装置、信号処理方法 |
JP2012134842A (ja) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | 音質制御装置、音質制御方法及び音質制御用プログラム |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07106883A (ja) | 1993-10-01 | 1995-04-21 | Matsushita Electric Ind Co Ltd | デジタル音量調整装置およびデジタルミキシング装置 |
US5666430A (en) * | 1995-01-09 | 1997-09-09 | Matsushita Electric Corporation Of America | Method and apparatus for leveling audio output |
US20050091066A1 (en) * | 2003-10-28 | 2005-04-28 | Manoj Singhal | Classification of speech and music using zero crossing |
GB2413745A (en) * | 2004-04-30 | 2005-11-02 | Axeon Ltd | Classifying audio content by musical style/genre and generating an identification signal accordingly to adjust parameters of an audio system |
US20050251273A1 (en) * | 2004-05-05 | 2005-11-10 | Motorola, Inc. | Dynamic audio control circuit and method |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
JP2006171458A (ja) | 2004-12-16 | 2006-06-29 | Sharp Corp | 音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体 |
WO2006072856A2 (en) * | 2005-01-04 | 2006-07-13 | Koninklijke Philips Electronics N.V. | An apparatus for and a method of processing reproducible data |
CU23572A1 (es) | 2006-03-31 | 2010-09-30 | Ct Ingenieria Genetica Biotech | Composición farmacéutica que comprende la proteína nmb0938 |
NO345590B1 (no) | 2006-04-27 | 2021-05-03 | Dolby Laboratories Licensing Corp | Audioforsterkningsregulering ved bruk av spesifikk lydstyrkebasert hørehendelsesdeteksjon |
KR100832360B1 (ko) * | 2006-09-25 | 2008-05-26 | 삼성전자주식회사 | 음원 재생기에서의 이퀄라이저 조정 방법 및 그 시스템 |
US20100046765A1 (en) * | 2006-12-21 | 2010-02-25 | Koninklijke Philips Electronics N.V. | System for processing audio data |
BRPI0807703B1 (pt) | 2007-02-26 | 2020-09-24 | Dolby Laboratories Licensing Corporation | Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador |
ES2377719T3 (es) | 2007-07-13 | 2012-03-30 | Dolby Laboratories Licensing Corporation | Procesamiento de audio utilizando un análisis de escenas auditivas y oblicuidad espectral. |
US20100319015A1 (en) * | 2009-06-15 | 2010-12-16 | Richard Anthony Remington | Method and system for removing advertising content from television or radio content |
CN102195581A (zh) * | 2010-03-18 | 2011-09-21 | 承景科技股份有限公司 | 数字音频信号的音量调整方法 |
US20120294459A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function |
JP5426608B2 (ja) | 2011-05-31 | 2014-02-26 | 東京瓦斯株式会社 | 異常検出装置および異常検出方法 |
CN102982804B (zh) * | 2011-09-02 | 2017-05-03 | 杜比实验室特许公司 | 音频分类方法和*** |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9305559B2 (en) * | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
EP2936485B1 (en) * | 2012-12-21 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
US9344815B2 (en) * | 2013-02-11 | 2016-05-17 | Symphonic Audio Technologies Corp. | Method for augmenting hearing |
-
2013
- 2013-03-26 CN CN201310100401.XA patent/CN104079247B/zh active Active
-
2014
- 2014-03-17 EP EP17164545.0A patent/EP3232567B1/en active Active
- 2014-03-17 US US14/780,485 patent/US9621124B2/en active Active
- 2014-03-17 ES ES14724216.8T patent/ES2630398T3/es active Active
- 2014-03-17 EP EP14724216.8A patent/EP2979359B1/en active Active
- 2014-03-17 WO PCT/US2014/030663 patent/WO2014160548A1/en active Application Filing
- 2014-03-17 JP JP2016505490A patent/JP6053984B2/ja active Active
-
2016
- 2016-11-29 JP JP2016230947A patent/JP6325640B2/ja active Active
-
2017
- 2017-02-15 US US15/433,486 patent/US10044337B2/en active Active
-
2018
- 2018-03-12 HK HK18103383.9A patent/HK1244110A1/zh unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08250944A (ja) * | 1995-03-13 | 1996-09-27 | Nippon Telegr & Teleph Corp <Ntt> | 自動音量制御方法およびこの方法を実施する装置 |
JPH1117472A (ja) * | 1997-06-20 | 1999-01-22 | Fujitsu General Ltd | 音声装置 |
JP2005229544A (ja) * | 2004-02-16 | 2005-08-25 | Yamaha Corp | 音量制御装置 |
JP2008521046A (ja) * | 2004-11-23 | 2008-06-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声データ処理装置及び方法、コンピュータプログラム要素並びにコンピュータ可読媒体 |
JP2009503568A (ja) * | 2005-07-22 | 2009-01-29 | ソフトマックス,インコーポレイテッド | 雑音環境における音声信号の着実な分離 |
JP2007208407A (ja) * | 2006-01-31 | 2007-08-16 | Toshiba Corp | 情報処理装置、およびそのサウンド制御方法 |
JP2010016483A (ja) * | 2008-07-01 | 2010-01-21 | Victor Co Of Japan Ltd | 音声信号補正装置 |
JP2010288119A (ja) * | 2009-06-12 | 2010-12-24 | Sony Corp | 信号処理装置、信号処理方法 |
JP2012134842A (ja) * | 2010-12-22 | 2012-07-12 | Toshiba Corp | 音質制御装置、音質制御方法及び音質制御用プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP2979359B1 (en) | 2017-05-03 |
EP2979359A1 (en) | 2016-02-03 |
US20170230024A1 (en) | 2017-08-10 |
JP6325640B2 (ja) | 2018-05-16 |
CN104079247A (zh) | 2014-10-01 |
EP3232567B1 (en) | 2019-10-23 |
JP6053984B2 (ja) | 2016-12-27 |
US9621124B2 (en) | 2017-04-11 |
JP2016519493A (ja) | 2016-06-30 |
CN104079247B (zh) | 2018-02-09 |
HK1244110A1 (zh) | 2018-07-27 |
WO2014160548A1 (en) | 2014-10-02 |
US10044337B2 (en) | 2018-08-07 |
EP3232567A1 (en) | 2017-10-18 |
US20160056787A1 (en) | 2016-02-25 |
ES2630398T3 (es) | 2017-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6896135B2 (ja) | ボリューム平準化器コントローラおよび制御方法 | |
JP6325640B2 (ja) | 等化器コントローラおよび制御方法 | |
JP6921907B2 (ja) | オーディオ分類および処理のための装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6325640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |