JP5149968B2 - スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 - Google Patents
スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 Download PDFInfo
- Publication number
- JP5149968B2 JP5149968B2 JP2010528297A JP2010528297A JP5149968B2 JP 5149968 B2 JP5149968 B2 JP 5149968B2 JP 2010528297 A JP2010528297 A JP 2010528297A JP 2010528297 A JP2010528297 A JP 2010528297A JP 5149968 B2 JP5149968 B2 JP 5149968B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- ambience
- speech
- implemented
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000012545 processing Methods 0.000 title description 10
- 239000003607 modifier Substances 0.000 claims abstract description 28
- 230000002238 attenuated effect Effects 0.000 claims abstract description 18
- 230000003595 spectral effect Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 102000010970 Connexin Human genes 0.000 claims 1
- 108050001175 Connexin Proteins 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 13
- 230000005236 sound signal Effects 0.000 description 26
- 230000001629 suppression Effects 0.000 description 18
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000036961 partial effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 235000009508 confectionery Nutrition 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 108010066082 tartrate-sensitive acid phosphatase Proteins 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Dot-Matrix Printers And Others (AREA)
- Color Television Systems (AREA)
- Time-Division Multiplex Systems (AREA)
Description
その結果、話す人がスクリーンに見られるときに、対応するスピーチは、ユーザーの前方に置かれるべきである。
Claims (23)
- 入力信号(12)の多数の入力チャンネル信号より多い多数の出力チャンネル信号を含むマルチチャンネル信号(10)を生成するための装置であって、前記多数の入力チャンネル信号は1以上であり、前記装置は、
少なくとも直接チャンネル信号とスピーチ部分を含む少なくともアンビエンスチャンネル信号とを提供するためにスピーチ部分を含む前記入力信号をアップミックスするためのアップミキサ(14)、
前記スピーチ部分が発生する、前記入力信号、前記直接チャンネル信号または前記アンビエンスチャンネル信号のセクションを検出するためのスピーチ検出器(18)、
前記スピーチ部分が減衰されまたは除去されている修正されたアンビエンスチャンネル信号を得るために、前記スピーチ検出器(18)によって検出されたセクションに対応する前記アンビエンスチャンネル信号のセクションを修正するための信号修正器(20)であって、前記直接チャンネル信号において前記セクションは、より少ない程度に減衰されまたは少しも減衰されない、信号修正器、および
前記直接チャンネルおよび前記修正されたアンビエンスチャンネル信号を用いる再生スキームでスピーカ信号を出力するためのスピーカ信号出力手段(22)であって、前記スピーカ信号は前記出力チャンネル信号である、スピーカ信号出力手段を含む、装置。 - 前記スピーカ信号出力手段(22)は、それぞれの直接チャンネルがそれ自体のスピーカにマップされうりさらにあらゆるアンビエンスチャンネル信号がそれ自体のスピーカにマップされうる直接/アンビエンススキームに従って作動するために実装され、前記スピーカ信号出力手段(22)は、前記直接チャンネルではなくて、前記アンビエンスチャンネル信号だけを、前記再生スキームでリスナーの後方のスピーカのためのスピーカ信号にマップするために実装される、請求項1に記載の装置。
- 前記スピーカ信号出力手段(22)は、それぞれの直接チャンネル信号がその位置に応じて1つまたはいくつかのスピーカにマップされるイン・バンドスキームに従って作動するために実装され、さらに、前記スピーカ信号出力手段(22)は、スピーカのためのスピーカ出力信号を得るために、前記アンビエンスチャンネル信号および前記直接チャンネルまたはスピーカのために決定される前記アンビエンスチャンネル信号または前記直接チャンネルの部分を加えるために実装される、請求項1に記載の装置。
- 前記スピーカ信号出力手段は、前記再生スキームでリスナーの前方に置かれうる少なくとも3チャンネルのためのスピーカ信号を提供しさらに前記再生スキームで前記リスナーの後方に置かれうる少なくとも2チャンネルを生成するために実装される、請求項1ないし請求項3のいずれかに記載の装置。
- 前記スピーチ検出器(18)は、時間的にブロックごとに作動し、さらに、時間的ブロックのための周波数バンドを検出するために周波数選択的にバンドごとそれぞれの時間的ブロックを分析するために実装され、さらに
前記信号修正器(20)は、前記スピーチ検出器(18)によって検出されたバンドに対応する、前記アンビエンスチャンネル信号のそのような時間的ブロックにおいて周波数バンドを修正するために実装される、請求項1ないし請求項4のいずれかに記載の装置。 - 前記信号修正器は、前記アンビエンスチャンネル信号または前記スピーチ検出器(18)によって検出された時間間隔において前記アンビエンスチャンネル信号の部分を減衰するために実装され、さらに
前記アップミキサ(14)および前記スピーカ信号出力手段(22)は、同じ時間間隔がより少ない程度に減衰されまたは少しも減衰されないように、前記少なくとも1つの直接チャンネルを生成するために実装され、その結果、前記直接チャンネルは、再生されるときに、前記修正されたアンビエンスチャンネル信号においてスピーチ成分より強く知覚することができるスピーチ成分を含む、請求項1ないし請求項5のいずれかに記載の装置。 - 前記信号修正器(20)は、前記スピーチ検出器(18)がスピーチ部分がある時間間隔を検出したときに前記少なくとも1つのアンビエンスチャンネル信号をハイパスフィルタリングにかけるために実装され、前記ハイパスフィルタのカットオフ周波数は、400Hzおよび3500Hz間にある、請求項1ないし請求項6のいずれかに記載の装置。
- 前記スピーチ検出器(18)は、スピーチ信号成分の時間的発生を検出するために実装され、さらに
前記信号修正器(20)は、前記スピーチ信号成分の基本周波数を発見し、さらに、
前記修正されたアンビエンスチャンネル信号または前記修正された入力信号を得るために、前記アンビエンスチャンネル信号または前記入力信号においてトーンを前記基本周波数および高調波で選択的に減衰(43)するために実装される、請求項1ないし請求項7のいずれかに記載の装置。 - 前記スピーチ検出器(18)は、周波数バンドごとのスピーチ内容の尺度を発見するために実装され、さらに
前記信号修正器(20)は、前記尺度に従って前記アンビエンスチャンネル信号の対応するバンドを減衰ファクタによって減衰(72a、72b)するために実装され、より高い尺度はより高い減衰ファクタをもたらし、より低い尺度はより低い減衰ファクタをもたらす、請求項1ないし請求項8のいずれかに記載の装置。 - 前記信号修正器(20)は、
前記アンビエンス信号をスペクトル表現に変換するための時間周波数ドメイン変換器(70)、
前記スペクトル表現を周波数選択的に可変的に減衰するための減衰器(72a、72b)、および
前記修正されたアンビエンスチャンネル信号を得るために、時間ドメインにおいて前記可変的に減衰されたスペクトル表現を変換するための周波数時間ドメイン変換器(73)を含む、請求項9に記載の装置。 - 前記スピーチ検出器(18)は、
分析信号のスペクトル表現を提供するための時間周波数ドメイン変換器(42)、
前記分析信号のバンドごとの1つまたはいくつかの特徴(71a、71b)を計算するための手段、および
前記バンドごとの1つまたはいくつかの特徴の結合に基づいてスピーチ内容の尺度を計算するための手段(80)を含む、請求項9または請求項10に記載の装置。 - 前記信号修正器(20)は、スペクトル平坦度(SFM)または4Hzの変調エネルギー(4HzME)を特徴として計算するために実装される、請求項11に記載の装置。
- 前記スピーチ検出器(18)は、前記アンビエンスチャンネル信号(18c)を分析するために実装され、さらに、前記信号修正器(20)は、前記アンビエンスチャンネル信号(16)を修正するために実装される、請求項1ないし請求項12のいずれかに記載の装置。
- 前記スピーチ検出器(18)は、前記入力信号(18a)を分析するために実装され、さらに、前記信号修正器(20)は、前記スピーチ検出器(18)から制御情報(18d)に基づいて前記アンビエンスチャンネル信号(16)を修正するために実装される、請求項1ないし請求項12のいずれかに記載の装置。
- 前記スピーチ検出器(18)は、前記入力信号(18a)を分析するために実装され、さらに、前記信号修正器(20)は、前記スピーチ検出器(18)から制御情報(18d)に基づいて前記入力信号を修正するために実装され、さらに、前記アップミキサ(14)は、前記修正された入力信号に基づいて前記修正されたアンビエンスチャンネル信号(16´)を発見するために実装されるアンビエンスチャンネル抽出器を含み、前記アップミキサ(14)は、前記信号修正器(20)の入力で前記入力信号(12)に基づいて前記直接チャンネル信号(15)を発見するためにさらに実装される、請求項1ないし請求項12のいずれかに記載の装置。
- 前記スピーチ検出器(18)は、前記入力信号(18a)を分析するために実装され、さらに、スピーチ分析器(30)が、前記入力信号をスピーチ分析にかけるために備えられ、さらに
前記信号修正器(20)は、前記スピーチ検出器(18)から制御情報(18d)に基づいてさらに前記スピーチ分析器(30)からスピーチ分析情報(18e)に基づいて前記アンビエンスチャンネル信号(16)を修正するために実装される、請求項1ないし請求項12のいずれかに記載の装置。 - 前記アップミキサ(14)は、マトリクスデコーダとして実装される、請求項1ないし請求項16のいずれかに記載の装置。
- 前記アップミキサ(14)は、アップミックス情報をさらに送信することはないが、前記入力信号(12)だけに基づいて、前記直接チャンネル信号(15)または前記アンビエンスチャンネル信号(16)を生成するブラインドアップミキサとして実装される、請求項1ないし請求項17のいずれかに記載の装置。
- 前記アップミキサ(14)は、前記直接チャンネル信号(15)または前記アンビエンスチャンネル信号(16)を生成するために、前記入力信号(12)の統計的分析を実行するために実装される、請求項1ないし請求項18のいずれかに記載の装置。
- 前記入力信号は、1チャンネルを含むモノラル信号であり、さらに、前記出力信号は、2以上のチャンネル信号を含むマルチチャンネル信号である、請求項1ないし請求項19のいずれかに記載の装置。
- 前記アップミキサ(14)は、入力信号として2つのステレオチャンネル信号を含むステレオ信号を得るために実装され、さらに、前記アップミキサ(14)は、前記ステレオチャンネル信号の相互相関計算に基づいて前記アンビエンスチャンネル信号(16)を実現するためにさらに実装される、請求項1ないし請求項19のいずれかに記載の装置。
- 入力信号(12)の多数の入力チャンネル信号より多い多数の出力チャンネル信号を含むマルチチャンネル信号(10)を生成する方法であって、前記多数の入力チャンネル信号は1以上であり、前記方法は、
少なくとも直接チャンネル信号と少なくともアンビエンスチャンネル信号とを提供するために前記入力信号をアップミックスするステップ(14)、
スピーチ部分が発生する、前記入力信号、前記直接チャンネル信号または前記アンビエンスチャンネル信号のセクションを検出するステップ(18)、
前記スピーチ部分が減衰されまたは除去されている修正されたアンビエンスチャンネル信号を得るために、前記検出するステップ(18)において検出されたセクションに対応する前記アンビエンスチャンネル信号のセクションを修正するステップ(20)であって、前記直接チャンネル信号において前記セクションは、より小さい程度に減衰されまたは少しも減衰されない、修正するステップ、および
前記直接チャンネルおよび前記修正されたアンビエンスチャンネル信号を用いる再生スキームでスピーカ信号を出力するステップ(22)であって、前記スピーカ信号は前記出力チャンネル信号である、出力するステップを含む、方法。 - コンピュータ上で実行されるときに、請求項22に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102007048973.2 | 2007-10-12 | ||
DE102007048973A DE102007048973B4 (de) | 2007-10-12 | 2007-10-12 | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
PCT/EP2008/008324 WO2009049773A1 (de) | 2007-10-12 | 2008-10-01 | Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011501486A JP2011501486A (ja) | 2011-01-06 |
JP5149968B2 true JP5149968B2 (ja) | 2013-02-20 |
Family
ID=40032822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010528297A Active JP5149968B2 (ja) | 2007-10-12 | 2008-10-01 | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 |
Country Status (16)
Country | Link |
---|---|
US (1) | US8731209B2 (ja) |
EP (1) | EP2206113B1 (ja) |
JP (1) | JP5149968B2 (ja) |
KR (1) | KR101100610B1 (ja) |
CN (1) | CN101842834B (ja) |
AT (1) | ATE507555T1 (ja) |
AU (1) | AU2008314183B2 (ja) |
BR (1) | BRPI0816638B1 (ja) |
CA (1) | CA2700911C (ja) |
DE (2) | DE102007048973B4 (ja) |
ES (1) | ES2364888T3 (ja) |
HK (1) | HK1146424A1 (ja) |
MX (1) | MX2010003854A (ja) |
PL (1) | PL2206113T3 (ja) |
RU (1) | RU2461144C2 (ja) |
WO (1) | WO2009049773A1 (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5577787B2 (ja) * | 2009-05-14 | 2014-08-27 | ヤマハ株式会社 | 信号処理装置 |
US20110078224A1 (en) * | 2009-09-30 | 2011-03-31 | Wilson Kevin W | Nonlinear Dimensionality Reduction of Spectrograms |
TWI459828B (zh) | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
JP5299327B2 (ja) * | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
JP5598536B2 (ja) * | 2010-03-31 | 2014-10-01 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
US9082412B2 (en) | 2010-06-11 | 2015-07-14 | Panasonic Intellectual Property Corporation Of America | Decoder, encoder, and methods thereof |
EP2661746B1 (en) * | 2011-01-05 | 2018-08-01 | Nokia Technologies Oy | Multi-channel encoding and/or decoding |
EP2523473A1 (en) | 2011-05-11 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an output signal employing a decomposer |
JP5057535B1 (ja) | 2011-08-31 | 2012-10-24 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
KR101803293B1 (ko) | 2011-09-09 | 2017-12-01 | 삼성전자주식회사 | 입체 음향 효과를 제공하는 신호 처리 장치 및 신호 처리 방법 |
US9280984B2 (en) | 2012-05-14 | 2016-03-08 | Htc Corporation | Noise cancellation method |
RU2635884C2 (ru) * | 2012-09-12 | 2017-11-16 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для предоставления улучшенных характеристик направленного понижающего микширования для трехмерного аудио |
JP6054142B2 (ja) * | 2012-10-31 | 2016-12-27 | 株式会社東芝 | 信号処理装置、方法およびプログラム |
WO2014112792A1 (ko) * | 2013-01-15 | 2014-07-24 | 한국전자통신연구원 | 사운드 바를 위한 오디오 신호 처리 장치 및 방법 |
MY179136A (en) * | 2013-03-05 | 2020-10-28 | Fraunhofer Ges Forschung | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP3503095A1 (en) | 2013-08-28 | 2019-06-26 | Dolby Laboratories Licensing Corp. | Hybrid waveform-coded and parametric-coded speech enhancement |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
US10176818B2 (en) * | 2013-11-15 | 2019-01-08 | Adobe Inc. | Sound processing using a product-of-filters model |
KR101808810B1 (ko) * | 2013-11-27 | 2017-12-14 | 한국전자통신연구원 | 음성/무음성 구간 검출 방법 및 장치 |
CN104683933A (zh) | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
WO2015104447A1 (en) * | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
JP6274872B2 (ja) * | 2014-01-21 | 2018-02-07 | キヤノン株式会社 | 音処理装置、音処理方法 |
WO2016019130A1 (en) | 2014-08-01 | 2016-02-04 | Borne Steven Jay | Audio device |
US20160071524A1 (en) * | 2014-09-09 | 2016-03-10 | Nokia Corporation | Audio Modification for Multimedia Reversal |
CN104409080B (zh) * | 2014-12-15 | 2018-09-18 | 北京国双科技有限公司 | 语音端点检测方法和装置 |
JP6434165B2 (ja) * | 2015-03-27 | 2018-12-05 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 前面ラウドスピーカによって個別の三次元音響を達成する、車内再生のためのステレオ信号を処理する装置および方法 |
CN106205628B (zh) | 2015-05-06 | 2018-11-02 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
WO2017136573A1 (en) * | 2016-02-02 | 2017-08-10 | Dts, Inc. | Augmented reality headphone environment rendering |
EP3465681A1 (en) * | 2016-05-26 | 2019-04-10 | Telefonaktiebolaget LM Ericsson (PUBL) | Method and apparatus for voice or sound activity detection for spatial audio |
WO2018001493A1 (en) * | 2016-06-30 | 2018-01-04 | Huawei Technologies Duesseldorf Gmbh | Apparatuses and methods for encoding and decoding a multichannel audio signal |
CN106412792B (zh) * | 2016-09-05 | 2018-10-30 | 上海艺瓣文化传播有限公司 | 对原立体声文件重新进行空间化处理并合成的***及方法 |
CA3117645C (en) * | 2016-09-19 | 2023-01-03 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
EP3382704A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
BR112020010819A2 (pt) | 2017-12-18 | 2020-11-10 | Dolby International Ab | método e sistema para tratar transições locais entre posições de escuta em um ambiente de realidade virtual |
WO2020163624A1 (en) | 2019-02-06 | 2020-08-13 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
KR102164306B1 (ko) * | 2019-12-31 | 2020-10-12 | 브레인소프트주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
CN114630057B (zh) * | 2022-03-11 | 2024-01-30 | 北京字跳网络技术有限公司 | 确定特效视频的方法、装置、电子设备及存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03236691A (ja) | 1990-02-14 | 1991-10-22 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH07110696A (ja) | 1993-10-12 | 1995-04-25 | Mitsubishi Electric Corp | 音声再生装置 |
JP3412209B2 (ja) | 1993-10-22 | 2003-06-03 | 日本ビクター株式会社 | 音響信号処理装置 |
DE69942521D1 (de) * | 1998-04-14 | 2010-08-05 | Hearing Enhancement Co Llc | Vom benutzer einstellbare lautstärkensteuerung zur höranpassung |
US6928169B1 (en) * | 1998-12-24 | 2005-08-09 | Bose Corporation | Audio signal processing |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
JP4463905B2 (ja) | 1999-09-28 | 2010-05-19 | 隆行 荒井 | 音声処理方法、装置及び拡声システム |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7177808B2 (en) * | 2000-11-29 | 2007-02-13 | The United States Of America As Represented By The Secretary Of The Air Force | Method for improving speaker identification by determining usable speech |
US20040086130A1 (en) * | 2002-05-03 | 2004-05-06 | Eid Bradley F. | Multi-channel sound processing systems |
US7567845B1 (en) * | 2002-06-04 | 2009-07-28 | Creative Technology Ltd | Ambience generation for stereo signals |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
RU2005135648A (ru) * | 2003-04-17 | 2006-03-20 | Конинклейке Филипс Электроникс Н.В. (Nl) | Генерация аудиосигналов |
US8311809B2 (en) | 2003-04-17 | 2012-11-13 | Koninklijke Philips Electronics N.V. | Converting decoded sub-band signal into a stereo signal |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP2007028065A (ja) | 2005-07-14 | 2007-02-01 | Victor Co Of Japan Ltd | サラウンド再生装置 |
US20090252339A1 (en) | 2005-09-22 | 2009-10-08 | Pioneer Corporation | Signal processing device, signal processing method, signal processing program, and computer readable recording medium |
JP4940671B2 (ja) | 2006-01-26 | 2012-05-30 | ソニー株式会社 | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム |
WO2007096792A1 (en) * | 2006-02-22 | 2007-08-30 | Koninklijke Philips Electronics N.V. | Device for and a method of processing audio data |
KR100773560B1 (ko) * | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
DE102006017280A1 (de) | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
-
2007
- 2007-10-12 DE DE102007048973A patent/DE102007048973B4/de active Active
-
2008
- 2008-10-01 JP JP2010528297A patent/JP5149968B2/ja active Active
- 2008-10-01 AU AU2008314183A patent/AU2008314183B2/en active Active
- 2008-10-01 CA CA2700911A patent/CA2700911C/en active Active
- 2008-10-01 WO PCT/EP2008/008324 patent/WO2009049773A1/de active Application Filing
- 2008-10-01 PL PL08802737T patent/PL2206113T3/pl unknown
- 2008-10-01 EP EP08802737A patent/EP2206113B1/de active Active
- 2008-10-01 MX MX2010003854A patent/MX2010003854A/es active IP Right Grant
- 2008-10-01 KR KR1020107007771A patent/KR101100610B1/ko active IP Right Grant
- 2008-10-01 BR BRPI0816638-2A patent/BRPI0816638B1/pt active IP Right Grant
- 2008-10-01 CN CN2008801112350A patent/CN101842834B/zh active Active
- 2008-10-01 US US12/681,809 patent/US8731209B2/en active Active
- 2008-10-01 DE DE502008003378T patent/DE502008003378D1/de active Active
- 2008-10-01 RU RU2010112890/08A patent/RU2461144C2/ru active
- 2008-10-01 ES ES08802737T patent/ES2364888T3/es active Active
- 2008-10-01 AT AT08802737T patent/ATE507555T1/de active
-
2011
- 2011-01-12 HK HK11100278.0A patent/HK1146424A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
EP2206113B1 (de) | 2011-04-27 |
DE102007048973B4 (de) | 2010-11-18 |
KR101100610B1 (ko) | 2011-12-29 |
DE502008003378D1 (de) | 2011-06-09 |
AU2008314183A1 (en) | 2009-04-23 |
MX2010003854A (es) | 2010-04-27 |
RU2461144C2 (ru) | 2012-09-10 |
WO2009049773A1 (de) | 2009-04-23 |
KR20100065372A (ko) | 2010-06-16 |
JP2011501486A (ja) | 2011-01-06 |
HK1146424A1 (en) | 2011-06-03 |
ATE507555T1 (de) | 2011-05-15 |
CA2700911A1 (en) | 2009-04-23 |
CN101842834A (zh) | 2010-09-22 |
BRPI0816638B1 (pt) | 2020-03-10 |
CN101842834B (zh) | 2012-08-08 |
ES2364888T3 (es) | 2011-09-16 |
AU2008314183B2 (en) | 2011-03-31 |
EP2206113A1 (de) | 2010-07-14 |
US20100232619A1 (en) | 2010-09-16 |
PL2206113T3 (pl) | 2011-09-30 |
US8731209B2 (en) | 2014-05-20 |
CA2700911C (en) | 2014-08-26 |
BRPI0816638A2 (pt) | 2015-03-10 |
DE102007048973A1 (de) | 2009-04-16 |
RU2010112890A (ru) | 2011-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
US10685638B2 (en) | Audio scene apparatus | |
KR101569032B1 (ko) | 오디오 신호의 디코딩 방법 및 장치 | |
KR101341523B1 (ko) | 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법 | |
JP4664431B2 (ja) | アンビエンス信号を生成するための装置および方法 | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
US9743215B2 (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
JP2002078100A (ja) | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 | |
KR101710544B1 (ko) | 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120228 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5149968 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |