JP5158098B2 - 音声ミキシング装置および方法ならびに多地点会議サーバ - Google Patents
音声ミキシング装置および方法ならびに多地点会議サーバ Download PDFInfo
- Publication number
- JP5158098B2 JP5158098B2 JP2009552439A JP2009552439A JP5158098B2 JP 5158098 B2 JP5158098 B2 JP 5158098B2 JP 2009552439 A JP2009552439 A JP 2009552439A JP 2009552439 A JP2009552439 A JP 2009552439A JP 5158098 B2 JP5158098 B2 JP 5158098B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- unit
- audio
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 37
- 230000005236 sound signal Effects 0.000 claims abstract description 412
- 238000005070 sampling Methods 0.000 claims abstract description 186
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 238000001514 detection method Methods 0.000 claims description 41
- 238000004891 communication Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1827—Network arrangements for conference optimisation or adaptation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/567—Multimedia conference systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Description
サンプリング周波数別に設けられた複数のミキシング処理部と、
前記複数のミキシング処理部に入力された複数の音声信号のうちから、話者の音声を含む話者音声信号を少なくとも一つ選択する話者検出部と、を有し、
前記複数のミキシング処理部のそれぞれは、
自処理部に入力された同一サンプリング周波数の音声信号のうち、前記話者検出部にて選択された話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のミキシング処理部で処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた第1の加算音声信号を前記他のミキシング処理部に供給し、
自処理部で生成した前記第1の加算音声信号と、前記他のミキシング処理部から供給される、自処理部で処理可能なサンプリング周波数への変換がなされた前記第1の加算音声信号とを加算して第2の加算音声信号を生成する、ことを特徴とする。
サンプリング周波数が異なる複数の音声信号をミキシングする音声信号ミキシング方法であって、
前記複数の音声信号のうちから話者の音声を含む話者音声信号を少なくとも一つ選択する第1のステップと、
前記複数の音声信号をサンプリング周波数別に分類したグループ毎に、前記第1のステップで選択された同一サンプリング周波数の話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のグループで処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた音声信号を前記他のグループに割り当てる第2のステップと、
前記グループ毎に、自グループで生成した前記第1の加算音声信号と、前記他のグループから自グループに割り当てられた、サンプリング周波数の変換がなされた前記第1の加算信号とを加算して第2の加算音声信号を生成する第3のステップと、を含むことを特徴とする。
前記複数の通信端末から受信した複数の音声信号をサンプリング周波数別に分類する信号分類部と、
サンプリング周波数別に設けられ、前記信号分類部から供給される同一サンプリング周波数の音声信号をミキシングする複数のミキシング処理部と、
前記複数のミキシング処理部に入力された複数の音声信号のうちから話者の音声を含む話者音声信号を少なくとも一つ選択する話者検出部と、を有し、
前記複数のミキシング処理部のそれぞれは、
自処理部に入力された同一サンプリング周波数の音声信号のうち、前記話者検出部にて選択された話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のミキシング処理部で処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた第1の加算音声信号を前記他のミキシング処理部に供給し、
自処理部で生成した前記第1の加算音声信号と、前記他のミキシング処理部から供給される、自処理部で処理可能なサンプリング周波数への変換がなされた前記第1の加算音声信号とを加算して第2の加算音声信号を生成する、ことを特徴とする。
400 話者検出部
101〜10n、201〜20n、301〜30n 音声信号入力端子
111〜11n、211〜21n、311〜31n パワー計算部
121〜12n、221〜22n、321〜32n 音声信号切替部
131〜13k グループ信号加算部
141〜14k-1、121〜12k-1、131〜13k-1 サンプリング変換部
151〜15k 全信号加算部
161〜16n、261〜26n、361〜36n 信号減算部
171〜17n、271〜27n、371〜37n 符号化部
401〜40k 共通符号化部
181〜18n、281〜28n、381〜38n 音声信号切替部
191〜19n、291〜29n、391〜39n 音声信号出力端子
ミキシング処理部11は、音声信号入力端子101〜10n、パワー計算部111〜11n、音声信号切替部121〜12n、グループ信号加算部131、サンプリング変換部141〜14k-1、全信号加算部151、信号減算部161〜16n、符号化部171〜17n、共通符号化部401、音声信号切替部181〜18n、および音声信号出力端子191〜19nを有する。
但し、L=160
パワー計算部111によるパワー計算と同様に、パワー計算部112〜11nも、音声信号入力端子102〜10nから供給される入力音声信号のパワーを計算する。パワー計算部111〜11nの各パワー計算値は、話者検出部400に供給される。
ミキシング処理部12は、音声信号入力端子201〜20n、パワー計算部211〜21n、音声信号切替部221〜22n、グループ信号加算部132、サンプリング変換部241〜24k-1、全信号加算部152、信号減算部261〜26n、符号化部271〜27n、共通符号化部402、音声信号切替部281〜28n、および音声信号出力端子291〜29nを有する。
ミキシング処理部1kは、音声信号入力端子301〜30n、パワー計算部311〜31n、音声信号切替部321〜32n、グループ信号加算部13k、サンプリング変換部341〜34k-1、全信号加算部15k、信号減算部361〜36n、符号化部371〜37n、共通符号化部40k、音声信号切替部381〜38n、および音声信号出力端子391〜39nを有する。
Claims (11)
- サンプリング周波数別に設けられた複数のミキシング処理部と、
前記複数のミキシング処理部に入力された複数の音声信号のうちから、話者の音声を含む話者音声信号を少なくとも一つ選択する話者検出部と、を有し、
前記複数のミキシング処理部のそれぞれは、
自処理部に入力された同一サンプリング周波数の音声信号のうち、前記話者検出部にて選択された話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のミキシング処理部で処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた第1の加算音声信号を前記他のミキシング処理部に供給し、
自処理部で生成した前記第1の加算音声信号と、前記他のミキシング処理部から供給される、自処理部で処理可能なサンプリング周波数への変換がなされた前記第1の加算音声信号とを加算して第2の加算音声信号を生成する、音声ミキシング装置。 - 前記複数のミキシング処理部のそれぞれは、前記話者検出部にて選択された話者音声信号毎に、前記第2の加算音声信号から該話者音声信号を差し引いた減算音声信号を生成し、該減算音声信号を符号化する、請求の範囲第1項に記載の音声ミキシング装置。
- 前記複数のミキシング処理部のそれぞれは、自処理部に入力された同一サンプリング周波数の音声信号のうち、前記話者音声信号以外の音声信号のそれぞれについて、該音声信号を符号化する代わりに、前記第2の加算音声信号を符号化する、請求の範囲第1項または第2項に記載の音声ミキシング装置。
- 前記話者検出部は、信号レベルが基準値以上の音声信号を前記話者音声信号として選択する、請求の範囲第1項乃至第3のいずれか1項に記載の音声ミキシング装置。
- 前記話者検出部は、前記複数のミキシング処理部に入力された複数の音声信号のうちから、予め指定された話者に関する音声信号を選択する、請求の範囲第1項乃至第3項のいずれか1項に記載の音声ミキシング装置。
- 前記複数のミキシング処理部のそれぞれは、予め定められた高域成分を有する擬似音声信号を前記第2の加算音声信号に加える、請求の範囲第1項乃至第3項のいずれか1項に記載の音声ミキシング装置。
- 前記話者検出部は、前記複数のミキシング処理部のそれぞれにおいて、入力された音声信号のうちのサンプリング周波数が最も高い入力信号を少なくとも選択する、請求の範囲第1項乃至第3項のいずれか1項に記載の音声ミキシング装置。
- 前記複数のミキシング処理部のそれぞれは、
前記話者検出部にて選択された話者音声信号を加算して前記第1の加算音声信号を生成するグループ信号加算部と、
前記グループ信号加算部にて生成された前記第1の加算音声信号と、前記他のミキシング処理部から供給される、自処理部での処理が可能なサンプリング周波数への変換がなされた前記第1の加算音声信号とを加算して前記第2の加算音声信号を生成する全信号加算部と、
前記同一サンプリング周波数の入力音声信号毎に設けられ、該入力音声信号が第1の入力として供給され、前記全信号加算部で生成された前記第2の加算音声信号が第2の入力として供給され、該第2の入力から該第1の入力を減算する複数の信号減算器と、
前記複数の信号減算器から出力された音声信号をそれぞれ符号化する複数の符号化部と、
前記全信号加算部で生成された前記第2の加算音声信号を符号化する共通符号化部と、を有し、
前記話者検出部にて選択された話者音声信号については、前記複数の符号化部のうちの対応する符号化部による符号化が行われ、前記話者音声信号以外の音声信号については、前記共通符号化部による符号化が行われる、請求の範囲第1項乃至第7項のいずれか1項に記載の音声ミキシング装置。 - 前記共通符号化部は、前記第2の加算音声信号の予測符号化を行うための情報を保持し、
前記複数の符号化部のそれぞれは、前記共通符号化部から自符号化部への切り替わりの際に、前記共通符号化部に保持された情報を参照して、前記話者音声信号の予測符号化を行う、請求の範囲第8項に記載の音声ミキシング装置。 - サンプリング周波数が異なる複数の音声信号をミキシングする音声信号ミキシング方法であって、
前記複数の音声信号のうちから話者の音声を含む話者音声信号を少なくとも一つ選択する第1のステップと、
前記複数の音声信号をサンプリング周波数別に分類したグループ毎に、前記第1のステップで選択された同一サンプリング周波数の話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のグループで処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた音声信号を前記他のグループに割り当てる第2のステップと、
前記グループ毎に、自グループで生成した前記第1の加算音声信号と、前記他のグループから自グループに割り当てられた、サンプリング周波数の変換がなされた前記第1の加算信号とを加算して第2の加算音声信号を生成する第3のステップと、を含む、音声ミキシング方法。 - 複数の通信端末とネットワークを介して接続される多地点会議サーバであって、
前記複数の通信端末から受信した複数の音声信号をサンプリング周波数別に分類する信号分類部と、
サンプリング周波数別に設けられ、前記信号分類部から供給される同一サンプリング周波数の音声信号をミキシングする複数のミキシング処理部と、
前記複数のミキシング処理部に入力された複数の音声信号のうちから話者の音声を含む話者音声信号を少なくとも一つ選択する話者検出部と、を有し、
前記複数のミキシング処理部のそれぞれは、
自処理部に入力された同一サンプリング周波数の音声信号のうち、前記話者検出部にて選択された話者音声信号を加算して第1の加算音声信号を生成し、該第1の加算音声信号のサンプリング周波数を他のミキシング処理部で処理可能なサンプリング周波数に変換し、該サンプリング周波数の変換がなされた第1の加算音声信号を前記他のミキシング処理部に供給し、
自処理部で生成した前記第1の加算音声信号と、前記他のミキシング処理部から供給される、自処理部で処理可能なサンプリング周波数への変換がなされた前記第1の加算音声信号とを加算して第2の加算音声信号を生成する、多地点会議サーバ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009552439A JP5158098B2 (ja) | 2008-02-04 | 2009-01-28 | 音声ミキシング装置および方法ならびに多地点会議サーバ |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008023977 | 2008-02-04 | ||
JP2008023977 | 2008-02-04 | ||
JP2009552439A JP5158098B2 (ja) | 2008-02-04 | 2009-01-28 | 音声ミキシング装置および方法ならびに多地点会議サーバ |
PCT/JP2009/051301 WO2009098974A1 (ja) | 2008-02-04 | 2009-01-28 | 音声ミキシング装置および方法ならびに多地点会議サーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009098974A1 JPWO2009098974A1 (ja) | 2011-05-26 |
JP5158098B2 true JP5158098B2 (ja) | 2013-03-06 |
Family
ID=40952052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009552439A Expired - Fee Related JP5158098B2 (ja) | 2008-02-04 | 2009-01-28 | 音声ミキシング装置および方法ならびに多地点会議サーバ |
Country Status (5)
Country | Link |
---|---|
US (1) | US8509460B2 (ja) |
EP (1) | EP2226995A4 (ja) |
JP (1) | JP5158098B2 (ja) |
CN (1) | CN101926160A (ja) |
WO (1) | WO2009098974A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915736B (zh) * | 2012-10-16 | 2015-09-02 | 广东威创视讯科技股份有限公司 | 混音处理方法和混音处理*** |
GB2524984B (en) * | 2014-04-08 | 2018-02-07 | Acano (Uk) Ltd | Audio mixer |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63314946A (ja) * | 1987-06-17 | 1988-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声加算方式 |
JPH1075310A (ja) * | 1996-08-29 | 1998-03-17 | Nec Corp | 多地点テレビ会議システム |
JP2000069179A (ja) * | 1998-08-19 | 2000-03-03 | Sony Corp | 多地点会議装置及びその方法並びに多地点会議用端末装置 |
JP2005229259A (ja) * | 2004-02-12 | 2005-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2102857C (en) * | 1992-12-31 | 1998-06-23 | Alexander Feiner | Technique for reducing echoes in conference communications |
JPH0775310A (ja) | 1993-08-31 | 1995-03-17 | Secoh Giken Inc | 5相のリラクタンス電動機 |
US5768263A (en) * | 1995-10-20 | 1998-06-16 | Vtel Corporation | Method for talk/listen determination and multipoint conferencing system using such method |
JP3157116B2 (ja) | 1996-03-29 | 2001-04-16 | 三菱電機株式会社 | 音声符号化伝送システム |
JP3592879B2 (ja) | 1997-02-20 | 2004-11-24 | 京セラ株式会社 | 音声情報通信システム及び多地点制御装置 |
JPH11213558A (ja) | 1998-01-27 | 1999-08-06 | Toshiba Corp | 音声データ処理装置およびコンピュータシステム並びに音声データ処理方法 |
JP2000175170A (ja) * | 1998-12-04 | 2000-06-23 | Nec Corp | 多地点テレビ会議システム及びその通信方法 |
US6956828B2 (en) * | 2000-12-29 | 2005-10-18 | Nortel Networks Limited | Apparatus and method for packet-based media communications |
US6889182B2 (en) | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
US20030021429A1 (en) * | 2001-07-30 | 2003-01-30 | Ratcliff David D. | On-the-fly configurable audio processing machine |
US7409056B2 (en) * | 2002-12-16 | 2008-08-05 | Broadcom Corporation | Switchboard for dual-rate single-band communication system |
JP2005020639A (ja) | 2003-06-30 | 2005-01-20 | Nec Engineering Ltd | 衛星を利用した多地点テレビ会議システム |
JP4250578B2 (ja) * | 2004-09-07 | 2009-04-08 | 株式会社リコー | 音声オーディオ装置 |
CN100524467C (zh) * | 2006-07-17 | 2009-08-05 | 深圳市迪威新软件技术有限公司 | 会议电视***的回声处理方法 |
-
2009
- 2009-01-28 EP EP09709365A patent/EP2226995A4/en not_active Withdrawn
- 2009-01-28 CN CN2009801029396A patent/CN101926160A/zh active Pending
- 2009-01-28 WO PCT/JP2009/051301 patent/WO2009098974A1/ja active Application Filing
- 2009-01-28 JP JP2009552439A patent/JP5158098B2/ja not_active Expired - Fee Related
- 2009-01-28 US US12/811,119 patent/US8509460B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63314946A (ja) * | 1987-06-17 | 1988-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声加算方式 |
JPH1075310A (ja) * | 1996-08-29 | 1998-03-17 | Nec Corp | 多地点テレビ会議システム |
JP2000069179A (ja) * | 1998-08-19 | 2000-03-03 | Sony Corp | 多地点会議装置及びその方法並びに多地点会議用端末装置 |
JP2005229259A (ja) * | 2004-02-12 | 2005-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
EP2226995A4 (en) | 2012-01-11 |
CN101926160A (zh) | 2010-12-22 |
US8509460B2 (en) | 2013-08-13 |
JPWO2009098974A1 (ja) | 2011-05-26 |
US20100296675A1 (en) | 2010-11-25 |
EP2226995A1 (en) | 2010-09-08 |
WO2009098974A1 (ja) | 2009-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101036965B1 (ko) | 음성 믹싱 방법 및 그 방법을 이용하는 다지점 회의 서버와 컴퓨터 판독가능 기록 매체 | |
JP6887995B2 (ja) | セカンダリチャンネルを符号化するためにプライマリチャンネルのコーディングパラメータを使用するステレオ音声信号を符号化するための方法およびシステム | |
JP5158099B2 (ja) | 音声ミキシング装置および方法ならびに多地点会議サーバ | |
EP2158753B1 (en) | Selection of audio signals to be mixed in an audio conference | |
JP5158098B2 (ja) | 音声ミキシング装置および方法ならびに多地点会議サーバ | |
US9961209B2 (en) | Codec selection optimization | |
Côté et al. | Speech communication | |
Valin et al. | Requirements for an Internet Audio Codec | |
Chinna Rao et al. | Real-time implementation and testing of VoIP vocoders with asterisk PBX using wireshark packet analyzer | |
CN112951252A (zh) | 一种lc3音频码流的混音方法、装置、介质及设备 | |
Lamblin et al. | ITU-T G. 722.1 annex C: the first ITU-T superwideband audio coder | |
Valin et al. | RFC 6366: Requirements for an Internet Audio Codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5158098 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |