JP5051782B2 - 音声合成と空間化との結合方法 - Google Patents
音声合成と空間化との結合方法 Download PDFInfo
- Publication number
- JP5051782B2 JP5051782B2 JP2008558857A JP2008558857A JP5051782B2 JP 5051782 B2 JP5051782 B2 JP 5051782B2 JP 2008558857 A JP2008558857 A JP 2008558857A JP 2008558857 A JP2008558857 A JP 2008558857A JP 5051782 B2 JP5051782 B2 JP 5051782B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- parameter
- source
- frequency
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
- G10H2210/301—Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Telephone Set Structure (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Golf Clubs (AREA)
Description
a)振幅を示す少なくとも一つのパラメータを各ソースに割り当てる段階と、
b)複数のチャンネルへの符号化を実行する空間化段階であって、各振幅パラメータは、空間利得で乗算されるよう複製され、各空間利得は、一方では符号化チャンネルに関して決定され、他方では空間化されるソースに関して決定される、段階と、
c)符号化チャンネル毎に全てのソースに前記乗算されたパラメータの合計を適用することによって、各符号化チャンネルに、利得により乗算されたパラメータをまとめてグループ化する段階と、
d)各符号化チャンネルに適用されるパラメータ合成段階と
を具備する方法を提案する。
−p1g1 1、...、pigi 1、...、pNgN 1は第1の符号化チャンネルのパラメータpg 1にまとめてグループ化され
−p1g1 M、...、pigi M、...、pNgN Mは第Mの符号化チャンネルのパラメータpg Mにまとめてグループ化され、指数記号gは、用語“グローバル”を意味する。
pm i,k=gm i・pi,k、mは1からMまで変化
−Ymはm番目の球面調和関数であり
−θi及びδiはそれぞれ、ソースSiに対する所望の方位角及び位置である。
SSm(n)=IFFT(SSm(ω))
SSm g(n)=(SSm*Fgm)(n)
SSm d(n)=(SSm*Fdm)(n)
SSm g(ω)=SSm(ω).Fgm(ω)
SSm d(ω)=SSm(ω).Fdm(ω)
Sg(n)=IFFT(Sg(ω))
Sd(n)=IFFT(Sd(ω))
Claims (7)
- 関連する空間位置の複数の音声ソースを一緒に合成及び空間化するための方法であって、
a)振幅を示す少なくとも一つのパラメータ(pi)を各ソースに割り当てる段階と、
b)複数のチャンネルへの符号化を実行する空間化段階であって、各振幅パラメータ(pi)は、空間利得(gi m)で乗算されるよう複製され、各空間利得は、一方では符号化チャンネルに関して決定され、他方では空間化されるソース(Si)に関して決定される、段階と、
c)符号化チャンネル毎に全てのソース(Si)に前記乗算されたパラメータ(pi m)の合計を適用することによって、各符号化チャンネルに、利得により乗算されたパラメータ(pi m)をまとめてグループ化(R)する段階と、
d)各符号化チャンネルに適用されるパラメータ合成段階(SYNTH(1)、...、SYNTH(M))と
を具備することを特徴とする方法。 - a)各ソース(Si)は、周波数要素(fk)の振幅を各々示す複数のパラメータ(pi,k)が割り当てられ、
b)周波数要素(fk)を示す各振幅パラメータ(pi,k)は、空間利得(gi m)で乗算されるよう複製され、各空間利得は、一方では符号化チャンネルに関して決定され、他方では空間化されるソース(Si)に関して決定され、
c)各符号化チャンネルにおいて、周波数要素(fk)に各々関連付けられたサブチャンネルに、利得(gi m)によるパラメータ(pi,k)の積を周波数要素毎にまとめてグループ化する
ことを特徴とする請求項1に記載の方法。 - d1)周波数要素(fk)に関連付けられた各サブチャンネルの出力を、前記周波数要素(fk)に対応する周波数上で中央に置かれたスペクトル包絡線(envk)によって乗算する過程と、
d2)過程d1)から求まる積を、周波数要素(fk)にわたる合計によってまとめてグループ化する過程と
によって合成が各チャンネルで行われ、空間的に符号化及び合成された、各チャンネルから導かれた信号(ssm)を過程d2)の次に求めることを特徴とする請求項2に記載の方法。 - 空間化は、アンビオフォニック符号化により行われ、ソースに割り当てられる振幅を示すパラメータは、球面調和振幅(Ym)に対応することを特徴とする請求項1〜3のうち何れか1項に記載の方法。
- 関連する空間位置の複数の音声ソースを一緒に合成及び空間化するための方法であって、
a)振幅を示す少なくとも一つのパラメータ(p i )を各ソースに割り当てる段階と、
b)複数のチャンネルへの符号化を実行する空間化段階であって、各振幅パラメータ(p i )は、空間利得(g i m )で乗算されるよう複製され、各空間利得は、一方では符号化チャンネルに関して決定され、他方では空間化されるソース(S i )に関して決定される、段階と、
c)符号化チャンネル毎に全てのソース(S i )に前記乗算されたパラメータ(p i m )の合計を適用することによって、各符号化チャンネルに、利得により乗算されたパラメータ(p i m )をまとめてグループ化(R)する段階と、
d)各符号化チャンネルに適用されるパラメータ合成段階(SYNTH(1)、...、SYNTH(M))とを具備し、
a′)各ソース(S i )は、周波数要素(f k )の振幅を各々示す複数のパラメータ(p i,k )が割り当てられ、
b′)周波数要素(f k )を示す各振幅パラメータ(p i,k )は、空間利得(g i m )で乗算されるよう複製され、各空間利得は、一方では符号化チャンネルに関して決定され、他方では空間化されるソース(S i )に関して決定され、
c′)各符号化チャンネルにおいて、周波数要素(f k )に各々関連付けられたサブチャンネルに、利得(g i m )によるパラメータ(p i,k )の積を周波数要素毎にまとめてグループ化する方法であって、
d1)周波数要素(f k )に関連付けられた各サブチャンネルの出力を、前記周波数要素(f k )に対応する周波数上で中央に置かれたスペクトル包絡線(env k )によって乗算する過程と、
d2)過程d1)から求まる積を、周波数要素(f k )にわたる合計によってまとめてグループ化する過程と
によって合成が各チャンネルで行われ、空間的に符号化及び合成された、各チャンネルから導かれた信号(ss m )を過程d2)の次に求める方法であって、
空間化は、アンビオフォニック符号化により行われ、ソースに割り当てられる振幅を示すパラメータは、球面調和振幅(Y m )に対応し、
アンビオフォニック符号化から復号化へ切換えてバイノーラル空間化モードで再生するために、過程d2)の後に各チャンネルから導かれる積の結果に対して、処理が周波数領域で直接適用されることを特徴とする、方法。 - 中央ユニットの、若しくは端末のメモリに、及び/又は前記中央ユニットのドライブと特に協働する取り外し可能媒体に記憶され、及び/又は通信ネットワークを介してダウンロード可能であり、請求項1〜5のうち何れか1項に記載の方法を実行するための命令を含むことを特徴とするコンピュータプログラム製品。
- 空間化された合成音声を生成し、プロセッサを特に具備し、請求項6に記載のコンピュータプログラム製品の命令を記憶するワーキングメモリをさらに具備することを特徴とするモジュール。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0602170 | 2006-03-13 | ||
FR0602170 | 2006-03-13 | ||
PCT/FR2007/050868 WO2007104877A1 (fr) | 2006-03-13 | 2007-03-01 | Synthese et spatialisation sonores conjointes |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009530883A JP2009530883A (ja) | 2009-08-27 |
JP5051782B2 true JP5051782B2 (ja) | 2012-10-17 |
Family
ID=37400911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008558857A Active JP5051782B2 (ja) | 2006-03-13 | 2007-03-01 | 音声合成と空間化との結合方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8059824B2 (ja) |
EP (1) | EP1994526B1 (ja) |
JP (1) | JP5051782B2 (ja) |
AT (1) | ATE447224T1 (ja) |
DE (1) | DE602007002993D1 (ja) |
ES (1) | ES2335246T3 (ja) |
PL (1) | PL1994526T3 (ja) |
WO (1) | WO2007104877A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8786852B2 (en) | 2009-12-02 | 2014-07-22 | Lawrence Livermore National Security, Llc | Nanoscale array structures suitable for surface enhanced raman scattering and methods related thereto |
US9395304B2 (en) | 2012-03-01 | 2016-07-19 | Lawrence Livermore National Security, Llc | Nanoscale structures on optical fiber for surface enhanced Raman scattering and methods related thereto |
US9788135B2 (en) | 2013-12-04 | 2017-10-10 | The United States Of America As Represented By The Secretary Of The Air Force | Efficient personalization of head-related transfer functions for improved virtual spatial audio |
JP2019530312A (ja) * | 2016-10-04 | 2019-10-17 | オムニオ、サウンド、リミテッドOmnio Sound Limited | ステレオ展開技術 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2679689B1 (fr) * | 1991-07-26 | 1994-02-25 | Etat Francais | Procede de synthese de sons. |
JPH08502867A (ja) | 1992-10-29 | 1996-03-26 | ウィスコンシン アラムニ リサーチ ファンデーション | 指向性音を作る方法及び装置 |
US5596644A (en) | 1994-10-27 | 1997-01-21 | Aureal Semiconductor Inc. | Method and apparatus for efficient presentation of high-quality three-dimensional audio |
FR2782228B1 (fr) | 1998-08-05 | 2001-05-25 | Ct Scient Tech Batiment Cstb | Dispositif de simulation sonore et procede pour realiser un tel dispositif |
FR2847376B1 (fr) * | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
FI118247B (fi) * | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
FR2851879A1 (fr) * | 2003-02-27 | 2004-09-03 | France Telecom | Procede de traitement de donnees sonores compressees, pour spatialisation. |
WO2005069272A1 (fr) * | 2003-12-15 | 2005-07-28 | France Telecom | Procede de synthese et de spatialisation sonores |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
EP2112652B1 (en) * | 2006-07-07 | 2012-11-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for combining multiple parametrically coded audio sources |
JP5021809B2 (ja) * | 2007-06-08 | 2012-09-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | アンビエンス信号成分とマトリックスデコードされた信号成分とを制御可能に結合することによるサラウンドサウンドオーディオチャンネルのハイブリッド導出 |
-
2007
- 2007-03-01 EP EP07731685A patent/EP1994526B1/fr active Active
- 2007-03-01 DE DE602007002993T patent/DE602007002993D1/de active Active
- 2007-03-01 WO PCT/FR2007/050868 patent/WO2007104877A1/fr active Application Filing
- 2007-03-01 ES ES07731685T patent/ES2335246T3/es active Active
- 2007-03-01 JP JP2008558857A patent/JP5051782B2/ja active Active
- 2007-03-01 PL PL07731685T patent/PL1994526T3/pl unknown
- 2007-03-01 US US12/225,097 patent/US8059824B2/en active Active
- 2007-03-01 AT AT07731685T patent/ATE447224T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US8059824B2 (en) | 2011-11-15 |
ATE447224T1 (de) | 2009-11-15 |
DE602007002993D1 (de) | 2009-12-10 |
EP1994526A1 (fr) | 2008-11-26 |
US20090097663A1 (en) | 2009-04-16 |
EP1994526B1 (fr) | 2009-10-28 |
WO2007104877A1 (fr) | 2007-09-20 |
JP2009530883A (ja) | 2009-08-27 |
PL1994526T3 (pl) | 2010-03-31 |
ES2335246T3 (es) | 2010-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4944902B2 (ja) | バイノーラルオーディオ信号の復号制御 | |
Carpentier et al. | Twenty years of Ircam Spat: looking back, looking forward | |
KR101010464B1 (ko) | 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성 | |
JP4921470B2 (ja) | 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置 | |
KR20110002491A (ko) | 바이노럴 오디오 신호들의 복호화 | |
AU2017210021B2 (en) | Synthesis of signals for immersive audio playback | |
US9264838B2 (en) | System and method for variable decorrelation of audio signals | |
WO2007080225A1 (en) | Decoding of binaural audio signals | |
JP5051782B2 (ja) | 音声合成と空間化との結合方法 | |
CN111466123A (zh) | 用于会议的子带空间处理和串扰消除*** | |
KR20080078907A (ko) | 양 귀 오디오 신호들의 복호화 제어 | |
WO2007080224A1 (en) | Decoding of binaural audio signals | |
MX2008008424A (es) | Decodificacion de señales de audio binaurales | |
MX2008008829A (en) | Decoding of binaural audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120619 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5051782 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |