JP5773124B2 - 信号分析制御及び信号制御のシステム、装置、方法及びプログラム - Google Patents

信号分析制御及び信号制御のシステム、装置、方法及びプログラム Download PDF

Info

Publication number
JP5773124B2
JP5773124B2 JP2010509159A JP2010509159A JP5773124B2 JP 5773124 B2 JP5773124 B2 JP 5773124B2 JP 2010509159 A JP2010509159 A JP 2010509159A JP 2010509159 A JP2010509159 A JP 2010509159A JP 5773124 B2 JP5773124 B2 JP 5773124B2
Authority
JP
Japan
Prior art keywords
signal
information
unit
analysis
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010509159A
Other languages
English (en)
Other versions
JPWO2009131066A1 (ja
Inventor
嶋田 修
修 嶋田
野村 俊之
俊之 野村
昭彦 杉山
昭彦 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010509159A priority Critical patent/JP5773124B2/ja
Publication of JPWO2009131066A1 publication Critical patent/JPWO2009131066A1/ja
Application granted granted Critical
Publication of JP5773124B2 publication Critical patent/JP5773124B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

本発明は、信号分析制御及び信号制御のシステム、装置、方法及びプログラムに関する。
複数の音源が所望音声と背景雑音とから構成される入力信号の背景雑音を抑圧するシステムとして、雑音抑圧システム(以下、ノイズサプレッサという。)が知られている。ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムである。一般的に、ノイズサプレッサは、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、入力信号から雑音成分の推定パワースペクトルを差し引く。これにより、所望の音声信号に混在する雑音が抑圧される。さらに、これらのノイズサプレッサは、雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用される。このようなノイズサプレッサに関連する技術としては、例えば、特許文献1に記載されている技術がある。(以下、第一の関連技術という。)
通常、第一の関連技術のノイズサプレッサは、通信に利用される場合、符号化器の前処理として機能する。ノイズサプレッサの出力は符号化されて、通信路を伝送される。受信部では、信号が復号されて可聴信号が生成される。第一の関連技術のノイズサプレッサは、1入力の雑音抑圧システムであり、一般的に、抑圧しきれずに残留する残留雑音と、出力される強調音声の歪はトレードオフの関係にある。残留雑音を減らすと歪が増え、歪を減らすと残留雑音が増える。それぞれの利用者によって、残留雑音と歪のバランスの最適状態は異なる。しかし、ノイズサプレッサが符号化器の前にある、すなわち送信部にある構成では、利用者は残留雑音と歪のバランスを自分の好みに合うように調整することができない。
この問題を解決する構成として、非特許文献1に開示された図40に示される受信側ノイズサプレッサが知られている。(以下、第二の関連技術という。)第二の関連技術の構成は、送信部ではなく受信部に雑音抑圧部9501が含まれている。雑音抑圧部9501は、復号器から入力された信号に対する雑音抑圧処理を行う。このため、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができる。
特開2002−204175号公報 2007年1月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・コンシューマー・エレクトロニクス、6.1−4、第2号(IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 6.1-4, JAN, 2007)
上述の第一の関連技術では、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができないという問題がある。この問題を解決する手段として、上述の第二の関連技術がある。
しかし、第二の関連技術では、第一の関連技術で送信部が行っていた雑音抑圧処理を受信部が行うため、受信部の演算量が増大するという問題がある。さらに、第二の関連技術では、受信部にノイズサプレッサ以外の重要な機能があるときには、ノイズサプレッサ機能を組み込むことができない、あるいはノイズサプレッサ機能を組み込むことにより他の機能を組み込むことができないという問題がある。これは、一般的に受信部の総演算量に制約があるためである。また、受信部(または再生部)の演算量が多く、音質や受信機機能の制限による利便性の低下を引き起こす。さらに、第一の関連技術及び第二の関連技術の構成も、音声と背景雑音の分離を目的としており、一般的な信号の分離には適用できないという問題がある。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、少ない演算量で受信部を構成でき、あらゆる種類の入力信号に対して入力信号を構成する要素ごとに独立に制御することのできる信号分析制御システムを提供することである。
上記課題を解決する本発明は、複数の構成要素を少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受信し、前記複数の構成要素は音声と背景雑音を含み、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音独立に制御することを特徴とする信号制御方法である。
上記課題を解決する本発明は、複数の構成要素を少なくとも一方が含む第一の信号と第二の信号と、前記構成要素がどの信号から生成するかを表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成し、前記第一の信号と前記第二の信号と前記分析制御情報と前記構成要素情報を送信し、前記複数の構成要素は音声と背景雑音を含むことを特徴とする信号分析方法である。
上記課題を解決する本発明は、複数の構成要素を少なくとも一方が含む第一の信号と第二の信号と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受け、前記複数の構成要素は音声と背景雑音を含み、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成し、前記第一の信号と前記第二の信号と前記構成要素情報と前記分析制御情報とを受信し、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を独立に制御することを特徴とする信号分析制御方法である。
上記課題を解決する本発明は、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受信し、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音独立に制御する信号制御部を備えることを特徴とする信号制御装置である。
上記課題を解決する本発明は、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素を前記信号のいずれから生成するかを表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成する構成要素情報生成部と、前記第一の信号と前記第二の信号と前記分析制御情報と前記構成要素情報を送信する送信部とを備えることを特徴とする信号分析装置である。
上記課題を解決する本発明は、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成する構成要素情報生成部と、前記第一の信号と前記第二の信号と前記分析制御情報と前記構成要素情報を受信する受信部と、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音独立に制御する信号制御部とを備えることを特徴とする信号分析制御システムである。
上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受信する処理と、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受ける処理と、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成する構成要素情報生成処理と、前記第一の信号と前記第二の信号と前記分析制御情報と前記構成要素情報を送信する送信処理とを実行させることを特徴とする信号分析プログラムである。
上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素をどの信号から生成するかを表す情報を含む分析制御情報と、を受ける処理と、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間のエネルギ比を表す構成要素情報を生成する構成要素情報生成処理と、前記第一の信号と前記第二の信号と前記分析制御情報と前記構成要素情報を受信する受信処理と前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号分析制御プログラムである。
本発明は、送信部で信号の分析を行うので、受信部において信号分析に係る演算量を削減することが出来る。
本発明の第一から第八の実施の形態を示すブロック図である。 符号化部100の第一の構成例である。 符号化部100の第二の構成例である。 符号化部100の第三の構成例である。 復号部150の構成例である。 信号分析部101の構成例である。 信号制御部151の構成例である。 分析情報計算部121の第一の構成例である。 信号処理部172の第一の構成例である。 信号処理部172の第二の構成例である。 信号処理部172の第三の構成例である。 信号処理部172の第四の構成例である。 分析情報計算部121の第二の構成例である。 信号処理部172の第五の構成例である。 信号処理部172の第六の構成例である。 信号処理部172の第七の構成例である。 分析情報計算部121の第三の構成例である。 信号処理部172の第八の構成例である。 分析情報計算部121の第四の構成例である。 信号処理部172の第九の構成例である。 分析情報計算部121の第五の構成例である。 信号処理部172の第十の構成例である。 信号処理部172の第十一の構成例である。 信号処理部172の第十二の構成例である。 信号処理部172の第十三の構成例である。 分析情報計算部121の第六の構成例である。 信号処理部172の第十四の構成例である。 信号処理部172の第十五の構成例である。 信号処理部172の第十六の構成例である。 分析情報計算部121の第七の構成例である。 信号処理部172の第十七の構成例である。 分析情報計算部121の第八の構成例である。 信号処理部172の第十八の構成例である。 本発明の第九の実施の形態を示すブロック図である。 本発明の第十の実施の形態を示すブロック図である。 信号制御情報に対する係数補正下限値の倍率の関係を示す図である。 信号制御情報に対する修正係数補正下限値の関係を示す図である。 信号制御情報と目的音存在確率に対する係数補正下限値の倍率の関係を示す図である。 信号制御情報と目的音存在確率に対する修正係数補正下限値の関係を示す図である。 本発明に関連する例を示すブロック図である。
10 送信部
15 受信部
100 符号化部
101 信号分析部
102 多重化部
110, 111, 114, 120, 121, 171 変換部
112, 115 量子化部
113, 116 ダウンミックス部
122 分析情報計算部
150 復号部
151 出力信号生成部
152 分離部
160 逆量子化部
161, 173 逆変換部
172 信号制御部
200 信号間情報計算部
201, 202, 206, 207, 209, 210, 212, 213 抑圧係数計算部
203, 307 ゲイン逆変換部
204, 208, 211, 214, 220, 221, 222, 223 分析情報符号化部
205 スイッチ
300, 312, 316, 317, 320, 321, 322, 323 分析情報復号部
301, 304 レンダリング制御情報分離部
302, 303 レンダリング部
305, 313 ゲイン補正部
306 ゲイン変換部
308, 309, 314 サブゲイン補正部
310, 315 サブゲイン下限値修正部
311 サブゲイン下限値推定部
1300, 1301 コンピュータ
本発明の信号分析制御システムの実施の形態について図面を参照して詳細に説明する。
<第一の実施の形態>
図1を参照し、本発明の信号分析制御システムの第一の実施の形態について詳細に説明する。本発明の信号分析制御システムは、送信部10と受信部15とが伝送路を介して接続された構成である。送信部10は、複数音源から構成される入力信号を複数受信し、伝送信号を出力する。伝送信号は、伝送路を介して、受信部15に入力される。受信部15は、伝送信号を受信し、複数または1つの出力信号を出力する。また、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。なお、図1において入力信号の個数は簡単のため第一及び第二の入力信号の2個として説明する。
送信部10は、符号化部100、信号分析部101及び多重化部102から構成される。複数の入力信号、第一及び第二の入力信号は、符号化部100及び信号分析部101に入力される。各入力信号の少なくとも1つの入力信号は、複数の構成要素を含んでいる。信号分析部101は、第一及び第二の入力信号と分析制御情報とを受ける。そして、信号分析部101は、分析制御情報に基づいて各入力信号を分析して、入力信号を構成する構成要素に関する構成要素情報を算出する。信号分析部101は、構成要素情報と分析制御情報を符号化した分析符号化情報を出力する。分析制御情報は、各構成要素と入力信号との関係を示す情報を含んでいる。構成要素と入力信号との関係を示す情報は、構成要素をどの入力信号から生成するかを表す従属関係情報を含んでいてもよい。さらに、分析制御情報は、各構成要素の分類に関する情報を含んでいる。例えば、分類に関する情報として、目的音と背景音との分類、音声と音楽との分類、音楽に含まれる楽器毎の分類などを含んでもよい。構成要素情報は、例えば、入力信号に含まれる各構成要素間のエネルギ比、位相差、コヒーレンスなどを含んでいてもよい。
信号分析部101は、分析符号化情報を多重化部102に出力する。符号化部100は、複数の入力信号のそれぞれを符号化する。符号化部100は、それぞれの入力信号に対する信号符号化情報を多重化部102に出力する。多重化部102は、符号化部100から入力される信号符号化情報と信号分析部101から入力される分析符号化情報とを多重化する。多重化部102は、多重化された信号を伝送信号として伝送路に出力する。
受信部15は、復号部150、出力信号生成部151及び分離部152から構成される。まず、伝送信号は分離部152に入力される。分離部152は、伝送信号を信号符号化情報と分析符号化情報に分離する。続いて、分離部152は、信号符号化情報を復号部150に、分析符号化情報を出力信号生成部151にそれぞれ出力する。復号部150は、信号符号化情報を復号し、復号信号を生成する。そして、復号部150は、復号信号を出力信号生成部151に出力する。出力信号生成部151は、分離部152から受信した分析符号化情報と再生制御情報とに基づいて、復号部150から受けた復号信号を構成要素ごとに操作する。出力信号生成部151は、操作された信号を出力信号として出力する。出力信号生成部151は構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作してもよい。また、入力信号に含まれる構成要素は音源であってもよい。このとき、信号制御部151は構成要素に対応した音源ごとに操作する。再生制御情報は、信号制御情報またはレンダリング情報を含んでも良い。
信号制御情報は、入力信号の各構成要素を周波数成分毎に制御する情報である。つまり、信号制御情報は、構成要素間の関係を制御する情報である。例えば、構成要素が目的音と背景音とである場合に、信号制御情報は目的音及び背景音のエネルギレベルを変更するための情報である。信号制御情報は、利用者によって外部から入力されることとしてもよい。例えば、外部から入力される信号制御情報としては、受信部に予め登録されていた利用者の嗜好などの個人情報、受信部の動作状態(スピーカをオフにしてあるなどの外部環境情報を含む)、受信部の種類や形式、電源や電池の利用状態や残量、アンテナの種類や状態(折りたたまれているなどの形状、向きなど)がある。また、信号制御情報は、別の形式で自動的に獲得されることとしてもよい。信号制御情報は、受信部内部または近傍に設置されたセンサを経由して、自動的に獲得されることとしてもよい。例えば、自動的に獲得される信号制御情報として、外部雑音量、明るさ、時間帯、地理的な位置、気温、映像との同期情報、カメラを通じたバーコード情報などを用いてもよい。
レンダリング情報は、入力信号に含まれる複数の構成要素を複数の出力チャネルにそれぞれ出力するための情報である。つまり、レンダリング情報は、構成要素と出力信号との関係を周波数成分毎に表した情報である。例えば、レンダリング情報は、復号信号に混合されている各構成要素の定位情報を含んでいても良い。レンダリング情報は、音像をぼかしたりして定位感を操作するための情報を含んでいてもよい。レンダリング情報を利用することにより、構成要素ごとに各出力チャネルへの出力信号を制御することができる。各構成要素は、特定の1つの出力チャネル(例えばスピーカ)から出力してもよいし、複数の出力チャネルに分配して出力してもよい。例えば、構成要素が目的音と背景音である場合には目的音を特定の出力チャネルのみから出力し、背景音をその他の出力チャネルから出力することにより、目的音は明確に定位させ、環境音により臨場感を向上させることができる。
続いて、図2を参照して、符号化部100の第一の構成例を詳細に説明する。符号化部100は、複数の入力信号、第一及び第二の入力信号を受信し、信号符号化情報を出力する。符号化部100は、変換部110、111と量子化部112とから構成される。第一の入力信号が変換部110に入力される。第二の入力信号が変換部111に入力される。変換部110は、第一の入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部110は、第一の変換信号を量子化部112に出力する。変換部111は、第二の入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部111は、第二の変換信号を量子化部112に出力する。そして、量子化部112は、第一の変換信号と第二の変換信号を量子化し、信号符号化情報として出力する。
変換部110、111は、複数の入力信号サンプルをまとめて、1ブロックを構成し、このブロックに対して周波数変換を適用する。周波数変換の例としては、フーリエ変換、コサイン変換、KL(カルーネンレーベ)変換などが知られている。これらの変換の具体的な演算に関連する技術及びその性質は、非特許文献2(1990年、「ディジタル・コーディング・オブ・ウェーブフォームス」、プレンティス・ホール (DIGITAL CODING OF WAVEFORMS, PRINCIPLES AND APPLICATIONS TO SPEECH AND VIDEO, PRENTICE-HALL, 1990.))に開示されている。
変換部110、111はまた、1ブロックの入力信号サンプルを窓関数で重み付けした結果に対して、前述の変換を適用することができる。このような窓関数としては、ハミング、ハニング(ハン)、ケイザー、ブラックマンなどの窓関数が知られている。また、さらに複雑な窓関数を用いることもできる。これらの窓関数に関連する技術は、非特許文献3(1975年、「ディジタル・シグナル・プロセシング」、プレンティス・ホール (DIGITAL SIGNAL PROCESSING, PRENTICE-HALL, 1975.))及び非特許文献4(1993年、「マルチレートシステムズ・アンド・フィルタバンクス」、プレンティス・ホール (MULTIRATE SYSTEMS AND FILTER BANKS, PRENTICE-HALL, 1993.))に開示されている。
変換部110、111が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容してもよい。例えば、ブロック長の30%のオーバラップを適用する場合には、あるブロックに属する信号サンプルの最後30%は、次のブロックに属する信号サンプルの最初30%として複数のブロックで重複して用いられる。オーバラップを有するブロック化と変換に関連する技術は、非特許文献2に開示されている。
さらに、変換部110、111は、帯域分割フィルタバンクで構成してもよい。帯域分割フィルタバンクは、複数の帯域通過フィルタから構成される。帯域分割フィルタバンクは、受信した入力信号を複数の周波数帯域に分割して、量子化部112に出力する。帯域分割フィルタバンクの各周波数帯域は等間隔であってもよいし、不等間隔であってもよい。不等間隔に帯域分割することによって、低域では狭帯域に分割して時間分解能を低く、高域では広い帯域に分割して時間分解能を高くすることができる。不等間隔分割の代表例には、低域に向かって帯域が逐次半分になるオクターブ分割や人間の聴覚特性に対応した臨界帯域分割などがある。帯域分割フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
量子化部112は、入力された信号の冗長性を除去し、符号化信号を出力する。冗長性を除去する方法としては、入力された信号の相関が最小となるように制御する。さらに、マスキング効果などの聴覚特性を利用し、聴覚上認知されない信号成分を除去してもよい。量子化方法としては、線形量子化、非線形量子化などの量子化方法が知られている。量子化された信号は、ハフマン符号化などを用いてさらに、冗長性を取り除くことができる。
次に、図3を参照して、符号化部100の第二の構成例を詳細に説明する。符号化部100は、複数の入力信号、第一及び第二の入力信号を受信し、信号符号化情報を出力する。符号化部100は、ダウンミックス部113、変換部114と量子化部115とから構成される。第一の入力信号と第二の入力信号とがダウンミックス部113に入力される。ダウンミックス部113は第一の入力信号と第二の入力信号とからダウンミックス信号を生成し、ダウンミックス信号を変換部114に出力する。変換部114は、ダウンミックス信号を周波数成分に分解し、ダウンミックス変換信号を生成する。変換部114は、ダウンミックス変換信号を量子化部115に出力する。そして、量子化部115は、ダウンミックス変換信号を量子化し、信号符号化情報として出力する。変換部114は変換部110、111と同様な処理を用いることができるため、説明を省略する。また、量子化部115は量子化部112と同様な処理を用いることができるため、説明を省略する。
ダウンミックス部113におけるダウンミックス処理では、例えば、第一の入力信号と第二の入力信号とを加算しても良いし、第一の入力信号と第二の入力信号との位相差を補償してから加算しても良い。ダウンミックス部113を用いることにより、第二の構成例は、第一の構成例に対して変換部に係わる処理量を減らすことが出来る。さらに、量子化対象となる信号がダウンミックスされた信号となり、第一の構成例よりも信号符号化情報の情報量を減らすことが出来る。
次に、図4を参照して、符号化部100の第三の構成例を詳細に説明する。符号化部100は、複数の入力信号、第一及び第二の入力信号を受信し、信号符号化情報を出力する。符号化部100は、変換部110、111とダウンミックス部116と量子化部115とから構成される。第一の入力信号が変換部110に入力される。第二の入力信号が変換部111に入力される。変換部110は、第一の入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部110は、第一の変換信号をダウンミックス部116に出力する。変換部111は、第二の入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部111は、第二の変換信号をダウンミックス部116に出力する。ダウンミックス部116は第一の変換信号と第二の変換信号とからダウンミックス変換信号を算出し、ダウンミックス変換信号を量子化部115に出力する。そして、量子化部115は、ダウンミックス変換信号を量子化し、信号符号化情報として出力する。
ダウンミックス部114におけるダウンミックス処理では、例えば、第一の変換信号と第二の変換信号とを周波数毎に加算しても良いし、周波数毎に異なるエネルギ補正あるいは位相差補償を第一の変換信号と第二の変換信号とに施してから加算しても良い。第三の構成例は、ダウンミックス処理を周波数領域で行うため、第二の構成例に比べて、詳細なダウンミックス処理が実現できる。また、第二の構成例と同様に、第三の構成例も、量子化対象となる信号がダウンミックスされた信号となり、第一の構成例よりも信号符号化情報の情報量を減らすことが出来る。
図5を参照して、復号部150の構成例を詳細に説明する。復号部150は、信号符号化情報を受信し、復号信号を出力する。復号部150は、逆量子化部160と逆変換部161とから構成される。逆量子化部160は、受信した各周波数の信号符号化情報を逆量子化し、複数の周波数成分から構成される複数または1つの復号変換信号を生成する。そして、逆量子化部160は、復号変換信号を逆変換部161に出力する。逆変換部161は、復号変換信号を逆変換して、復号信号を生成する。そして逆変換部161は、復号信号を出力する。なお、復号信号は、符号化部の構成として図2の第一の構成例を用いた場合は、第一の入力信号と第二の入力信号とが多重化された信号となる。図3の第二の構成例、あるいは、図4の第三の構成例の場合はダウンミックス信号となる。
逆変換部161が適用する逆変換は、変換部110が適用する変換に対応する逆変換が選択されることが望ましい。例えば、変換部110が、複数の入力信号サンプルをまとめて1ブロックを構成し、このブロックに対して周波数変換を適用するときには、逆変換部161は同一数のサンプルに対して対応する逆変換を適用する。また、変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容する場合には、これに対応して、逆変換部161は逆変換後の信号に対して同一のオーバラップを適用する。さらに、変換部110を帯域分割フィルタバンクで構成するときには、逆変換部161を帯域合成フィルタバンクで構成する。帯域合成フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
図2及び図5の符号化部100と復号部150 の説明では、内部に変換部を含む変換符号化を想定して説明したが、パルス符号変調(PCM)、適応差分パルス符号変調(ADPCM)、さらにCELPなどに代表される分析合成符号化を適用してもよい。PCM/ADPCMに関連する技術は非特許文献2に開示されている。また、CELPに関連する技術は非特許文献5(1985年3月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・アクースティック・スピーチ・アンド・シグナル・プロセシング、25.1.1、(IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 25.1.1, MAR, 1985, pp.937-940) 937〜940ページ)に開示されている。
また、符号化部100は、符号化処理を行わずに入力信号をそのまま多重化部102へ出力し、復号部150は、復号処理を行わずに復号信号をそのまま信号制御部151に出力してもよい。この構成により、符号化・復号処理に伴う信号の歪をなくすことができる。さらに、無歪の圧縮・伸張処理を符号化部100および復号部150で行うように構成してもよい。この構成により、出力信号生成部151は、入力信号に歪を生じさせることなく復号信号を受信することができる。
図6を参照し、信号分析部101の構成例を詳細に説明する。信号分析部101は、複数の入力信号、第一及び第二の入力信号を受信し、分析符号化情報を出力する。信号分析部101は、変換部120、121と分析情報計算部122とから構成される。第一の入力信号が変換部120に入力される。第二の入力信号が変換部121に入力される。変換部120は、受信した第一の入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部120は、第一の変換信号を分析情報計算部122に出力する。変換部121は、受信した第二の入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部121は、第二の変換信号を分析情報計算部122に出力する。分析情報計算部122は、第一の変換信号と第二の変換信号を分析制御情報に基づいて構成要素に分解し、各変換信号を構成する構成要素に関する構成要素情報を算出する。分析制御情報は、各構成要素と入力信号との関係を示す情報を含んでいる。構成要素と入力信号との関係を示す情報は、構成要素をどの入力信号から生成するかを表す従属関係情報を含んでいてもよい。さらに、分析制御情報は、各構成要素の分類に関する情報を含んでいる。例えば、分類に関する情報として、目的音と背景音との分類、音声と音楽との分類、音楽に含まれる楽器毎の分類などを含んでもよい。そして、分析情報計算部122は、構成要素情報と分析制御情報を符号化して分析符号化情報を算出し、分析符号化情報を出力する。また、分析情報計算部122は、第一および第二の変換信号を複数の構成要素から構成される構成要素群に分解し、構成要素情報を計算してもよい。変換部120、121における変換の方式に関しては、変換部110、111における変換の方式を用いてもよい。
図7を参照して、出力信号生成部151の構成例を詳細に説明する。出力信号生成部151は、復号信号と分析符号化情報とを受信し、出力信号を出力する。出力信号生成部151は、変換部171、信号制御部172及び逆変換部173から構成される。変換部171は、受信した復号信号を周波数成分に分解し、復号変換信号を生成する。変換部171は、復号変換信号を信号制御部172に出力する。信号制御部172は、分析符号化情報と再生制御情報とに基づいて、復号変換信号を構成する音源に対応した構成要素毎に制御し、複数の構成要素間の関係を変更し、出力変換信号を生成する。そして、信号制御部172は、出力変換信号を逆変換部173に出力する。また、信号制御部172は、複数の構成要素から構成される構成要素群に分解し、複数の構成要素間の関係を変更してもよい。逆変換部173は、出力変換信号を逆変換し、出力信号を生成する。そして、逆変換部173は出力信号を出力する。逆変換部173における逆変換の方式に関しては、逆変換部161における逆変換の方式を用いることが出来る。
以下、より詳細な説明のために、2個の入力信号を例として、第二の入力信号のみが複数の構成要素、目的音と背景音とから構成される場合を説明する。なお、第一の入力信号あるいは第二の入力信号のどちらか一方に対し、構成要素情報の分析を行っても良い。また、第一及び第二の入力信号の両方に対して構成要素情報の分析を行っても良い。第一及び第二の入力信号に対する構成要素情報の分析は、分析制御情報により制御される。
信号分析部101は、第一の入力信号と、目的音と背景音とから構成される第二の入力信号と分析制御情報とを受信し、第二の入力信号に対して目的音と背景音との関係を表す抑圧係数を計算する。さらに、信号分析部101は、第一の入力信号と第二の入力信号との関係を表す信号間情報を生成する。信号分析部101は、抑圧係数と信号間情報とから構成要素情報を生成し、構成要素情報と分析制御情報とを符号化し、分析符号化情報として多重化部102に出力する。抑圧係数は、構成要素を制御するために入力信号に作用される情報である。入力信号が目的音と背景音とから構成される場合、抑圧係数は背景音を抑圧するために入力信号に作用される情報である。また、出力信号生成部151は、分析符号化情報と復号信号とを受信し、分析符号化情報から構成要素情報を導出して、第一の入力信号と、第二の入力信号を構成する目的音と背景音とを制御して出力信号を生成し、出力する。
続いて、図8を参照して、分析情報計算部122の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報とを受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部201、202とゲイン逆変換部203と分析情報符号化部204とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205とゲイン逆変換部203と分析情報符号化部204とに入力される。
信号間情報計算部200は、第一の変換信号と第二の変換信号とを受信し、第一の変換信号と第二の変換信号とのエネルギ比、位相差、コヒーレンスなどを、信号間情報として生成する。エネルギ比、位相差、コヒーレンスは分析区間内の平均値、区間最大値、区間最小値などを用いても良い。信号間情報計算部200は、信号間情報をゲイン逆変換部203に出力する。
スイッチ205は、分析制御情報に基づき、第一の変換信号と第二の変換信号とを抑圧係数計算部201、202に出力する。図8では、一例として、分析制御情報に基づき、第二の変換信号に対してのみ抑圧係数を算出するよう制御している例を記載している。
抑圧係数計算部201、202はそれぞれに入力された第一または第二の変換信号から背景音の推定を行い、背景音推定結果に基づき背景音を抑圧するための抑圧係数を算出する。背景音推定結果は、背景音の振幅絶対値やエネルギ、背景音と入力信号との振幅比やエネルギ比であってもよい。また、背景音推定結果は、背景音の振幅絶対値、エネルギ、背景音と入力信号との振幅比、エネルギ比のそれぞれの平均値、区間最大値、区間最小値であってもよい。抑圧係数計算部201、202は、それぞれ算出した抑圧係数をゲイン逆変換部203に出力する。なお、スイッチ205より変換信号が入力されない場合は、抑圧係数計算部201、202は、抑圧係数をゲイン逆変換部203に出力しなくても良いし、抑圧係数を1として出力しても良い。抑圧係数の計算方法に関連する技術としては、非特許文献6(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号、(IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO. 6, PP. 1109-1121, Dec. 1984) 1109〜1121ページ)に開示されている最小平均二乗誤差短時間スペクトル振幅に基づく方法(MMSE STSA)、非特許文献7(1985年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第33巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.33, NO. 2, PP. 443-445, Apr. 1985) 443〜445ページ)に開示されている最小平均二乗誤差対数スペクトル振幅に基づく方法(MMSE LSA)、非特許文献8(2005年7月、ユーラシップ・ジャーナル・オン・アプライド・シグナル・プロセシング、第2005巻、第7号、 (EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, VOLUME 2005, Issue 7, JUL, 2005, pp.1110-1126.)1110〜1126ページ)に開示されている最尤スペクトル振幅推定に基づく方法などを用いてもよい。
ゲイン逆変換部203は、信号間情報と抑圧係数と分析制御情報とを受信し、構成要素情報に算出する。ゲイン逆変換部203は構成要素情報を分析情報符号化部204に出力する。構成要素情報は、例えば、抑圧係数をSG(1),SG(2)、信号間情報を構成するエネルギ比をG(1),G(2)とすると、構成要素情報を構成するゲインは、数1のように算出される。
Figure 0005773124
ここで、g()は構成要素情報を構成するゲインを表す。本実施例では分析制御情報により第一の変換信号に対して抑圧係数が算出されないため、SG(1)=1としてg(1),g(2)を算出してもよい。この場合、g(1)=G(1),g(2)=0となる。なお、信号間情報としてエネルギ比以外に位相差、コヒーレンスなどが存在する場合、構成要素情報として、ゲインg()に加えて位相差とコヒーレンスを組み合わせてもよい。
分析情報符号化部204は、受信した構成要素情報と分析制御情報とを符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、構成要素情報と分析制御情報の冗長性を除去することが出来る。また、分析情報符号化部204は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、構成要素情報と分析制御情報を分析符号化情報として出力してもよい。
図9を参照して、信号制御部172の第一の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部300とレンダリング制御情報分離部301とレンダリング部302とから構成される。復号変換信号はレンダリング部302に入力され、分析符号化情報は分析情報復号部300に入力され、再生制御情報はレンダリング制御情報分離部301に入力される。
分析情報復号部300は、受信した分析符号化情報から構成要素情報と分析制御情報を復号し、構成要素情報と分析制御情報とをレンダリング部302に出力する。構成要素情報と分析制御情報が符号化されていないときには、分析情報復号部300は、復号処理を行わず、構成要素情報と分析制御情報を直接出力する。
レンダリング制御情報分離部301は、受信した再生制御情報からレンダリング情報を分離する。レンダリング制御情報分離部301はレンダリング情報をレンダリング部302に出力する。再生制御情報にレンダリング制御情報しか含まれていない場合は、再生制御情報、すなわちレンダリング情報はレンダリング部302に入力される。なお、レンダリング情報は復号変換信号を構成する構成要素と出力変換信号との関係を周波数成分毎に表した情報であり、信号間のエネルギ差、時間差や相関などを用いて表すことができる。レンダリング情報の一例として非特許文献9(2007年、アイエスオー/アイイシー 23003-1:2007 パート1 エムペグ サラウンド、(ISO/IEC 23003-1:2007 Part 1 MPEG Surround))に開示された情報が知られている。
レンダリング部302は、構成要素情報と分析制御情報とレンダリング情報とを用いて、復号変換信号を構成する音源に対応した構成要素毎に制御する。そして、レンダリング部302は、複数の構成要素間の関係を変更し、出力変換信号を生成する。レンダリング部302は、まず、複数の構成要素間の関係を変更するための出力生成パラメータを、構成要素情報と分析制御情報とレンダリング情報とから算出する。次に、レンダリング部302は出力生成パラメータを用いて、復号変換信号から出力変換信号を生成する。
出力生成パラメータ算出の具体的な例を説明する。周波数帯域fの各周波数成分に対応した出力生成パラメータをW(f)とし、レンダリング情報をU(f)とし、構成要素情報内のゲインをg(k,p,f), k=1,2,…,K,p=1,2,…,Pとすると、出力生成パラメータW(f)は、
Figure 0005773124
と表せる。ここで、Kは構成要素数であり、分析制御情報から定まる。また、Pは復号変換信号のチャネル数である。さらに、数2の行列H(f)の行方向の順番と行列U(f)の列方向の順番は、分析制御情報に含まれる構成要素と入力信号との依存関係により制御される。これにより、所望の構成要素を制御することが可能となる。
出力生成パラメータW(f)を用いて、復号変換信号から出力変換信号を算出する方法として、非特許文献9に開示された方法が知られている。非特許文献9に開示されているMPEG Surroundデコーダを用いた場合、出力生成パラメータW(f)をMPEG Surroundデコーダに出力されるデータストリームとして用いる。なお、MPEG Surroundデコーダ内で使用する出力生成パラメータW(f)をデータストリームに変換することなく出力してもよい。非特許文献9に開示されている方法では、ある周波数帯域fにおける復号変換信号の周波数成分をXp(f), p=1,2,…,P(Pは復号信号のチャネル数)、出力信号の周波数成分をVq(f), q=1,2,…,Q(Qは出力信号のチャネル数)とし、
Figure 0005773124
Figure 0005773124
とすると、レンダリング部の動作は、V(f)=W(f)×X(f)となる。
次に、図10を参照して、信号制御部172の第二の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部300とレンダリング部303とレンダリング制御情報分離部304とゲイン補正部305とから構成される。信号制御部172の第一の構成例を示す図9と比較すると、ゲイン補正部305が追加されていることと、レンダリング制御情報分離部304とレンダリング部303の動作が異なる。復号変換信号はレンダリング部303に入力され、分析符号化情報は分析情報復号部300に入力され、再生制御情報はレンダリング制御情報分離部304に入力される。
分析情報復号部300は、受信した分析符号化情報から構成要素情報と分析制御情報を復号し、構成要素情報と分析制御情報とをゲイン補正部305に出力する。構成要素情報と分析制御情報が符号化されていないときには、分析情報復号部300は、復号処理を行わず、構成要素情報と分析制御情報を直接出力する。
レンダリング制御情報分離部304は、受信した再生制御情報からレンダリング情報と信号制御情報を分離する。レンダリング制御情報分離部304はレンダリング情報をレンダリング部303に出力し、信号制御情報をゲイン補正部305に出力する。
ゲイン補正部305は、受信した信号制御情報と分析制御情報とを用いて、構成要素情報を構成するゲインを補正し、補正ゲインを含む構成要素情報をレンダリング部303に出力する。ゲイン補正の具体例として、目的音を制御するための信号制御情報を数5のようにA (f)とし、補正ゲインをH’(f)とすると、ゲイン補正の動作はH’(f)=A(f)×H(f)となる。
Figure 0005773124
ここで、a(k,f)はk番目の構成要素を制御する変数である。行列A(f)は構成要素数Kとして、KxKの対角行列となる。さらに、行列A(f)の対角要素の順番は、分析制御情報に含まれる構成要素と入力信号との依存関係により制御される。依存関係に応じて、信号制御情報を表す行列A(f)の順番を制御することにより、所望の構成要素を制御することが可能となる。
レンダリング部303は、構成要素情報とレンダリング情報とを用いて、復号変換信号を構成する音源に対応した構成要素毎に制御し、複数の構成要素間の関係を変更し、出力変換信号を生成する。レンダリング部303は、まず、複数の構成要素間の関係を変更するための出力生成パラメータを、構成要素情報を構成する補正ゲインと、レンダリング情報とから算出する。次に、レンダリング部303は出力生成パラメータを用いて、復号変換信号から出力変換信号を算出する。出力生成パラメータは、W(f)=U(f)×H’(f)として算出される。また、出力変換信号はV(f)=W(f)×X(f)として算出される。
次に、図11を参照して、信号制御部172の第三の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部300とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部308とから構成される。信号制御部172の第二の構成例を示す図10と比較すると、ゲイン補正部305が、ゲイン変換部306とゲイン逆変換部307とサブゲイン補正部308とに置換されている。復号変換信号はレンダリング部303に入力され、分析符号化情報は分析情報復号部300に入力され、再生制御情報はレンダリング制御情報分離部304に入力される。分析情報復号部300とレンダリング部303とレンダリング制御情報分離部304は第二の構成例と同様であるため、説明を省略する。なお、分析情報復号部300の出力である構成要素情報はゲイン変換部306に出力され、分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部308とに出力される。レンダリング制御情報分離部304の出力である信号制御情報はサブゲイン補正部308に出力される。
ゲイン変換部306は、分析制御情報を用いて、構成要素情報から信号間情報と抑圧係数とを生成する。ゲイン変換部306は、信号間情報をゲイン逆変換部307に出力し、抑圧係数をサブゲイン補正部308に出力する。構成要素情報から信号間情報と抑圧係数とへの変換は、数1の逆変換に相当し、抑圧係数をSG(m)、信号間情報を構成するエネルギ比をG(m)とすると、数6のように表される。
Figure 0005773124
ここで、g()は構成要素情報を構成するゲインを表す。kは構成要素のインデックスであり、mは入力信号のインデックスである。kmはm番目の入力信号を構成する目的音の構成要素インデックスである。k、m、kmは構成要素と入力信号との依存関係を表す分析制御情報から導出される。なお、k∈mはm番目の入力信号を構成する全ての構成要素のインデックスを表す。本実施例では、入力信号の数は2個とし、図8に示すように、第一の入力信号に対して抑圧係数が算出されないため、信号間情報を構成するエネルギ比及び抑圧係数は、
Figure 0005773124
となる。なお、本例の場合、m=2である第二の入力信号を構成する目的音の構成要素インデックスはk=3である。
サブゲイン補正部308は、受信した信号制御情報と分析制御情報とを用いて、抑圧係数を補正し、補正抑圧係数をゲイン逆変換部307に出力する。補正抑圧係数の算出の具体例として、目的音の大きさを制御するための信号制御情報をB(m)とし、補正抑圧係数をSG’(m)とすると、SG’(m)=B(m)×SG(m)としてもよい。ここで、mは入力信号のインデックスである。本実施例では、第一の入力信号に対して抑圧係数を算出していないため、信号制御情報による補正は対象としない。第一の入力信号に対しても抑圧係数を算出する場合は、第一の入力信号の抑圧係数に対しても同様の補正を行うことが出来る。各入力信号が複数の構成要素に分解されているなどの情報は分析制御情報により導出される。
ゲイン逆変換部307は、信号間情報と補正抑圧係数と分析制御情報とを受信し、補正ゲインを算出し、補正ゲインを含む構成要素情報を算出する。補正ゲインの算出方法は、図8を用いて説明したゲイン逆変換部203と同様に数1に基づく。さらに、各入力信号に対する補正ゲインの総和を補正前のゲインの総和と同じになるように修正しても良い。この修正において、目的音の補正抑圧係数SG’(m)と背景音の係数1-SG’(m)の総和が1となることを利用して補正ゲインを修正することができる。ゲイン逆変換部307は、構成要素情報をレンダリング部303に出力する。
次に、図12を参照して、信号制御部172の第四の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部300とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とサブゲイン下限値推定部311から構成される。信号制御部172の第三の構成例を示す図11と比較すると、サブゲイン補正部308が、サブゲイン補正部309とサブゲイン下限値修正部310とサブゲイン下限値推定部311とに置換されている。復号変換信号はレンダリング部303に入力され、分析符号化情報は分析情報復号部300に入力され、再生制御情報はレンダリング制御情報分離部304に入力される。分析情報復号部300とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とは第三の構成例と同様であるため、説明を省略する。なお、分析情報復号部300の出力である分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310に出力される。レンダリング制御情報分離部304の出力である信号制御情報はサブゲイン下限値修正部310に出力される。ゲイン変換部306の出力である抑圧係数はサブゲイン補正部309とサブゲイン下限値推定部311とに出力される。
サブゲイン下限値推定部311は、受信した抑圧係数から抑圧係数を補正するための補正値を推定する。補正値は、係数補正下限値であってもよい。以下、補正値が係数補正下限値である場合について、説明する。サブゲイン下限値推定部311は、係数補正下限値をサブゲイン補正部309とサブゲイン下限値修正部310に出力する。係数補正下限値は、抑圧係数の下限値を表している。一般的に、抑圧係数が小さくなりすぎると、背景音抑圧後に発生する信号歪が増加する。そこで、係数補正下限値を用いることにより、信号歪の過剰な増加を避けることができる。係数補正下限値は、あらかじめ特定の値をメモリに記憶しておいてもよいし、抑圧係数に応じて計算しても良い。また、係数補正下限値は、メモリに記憶された複数の値から適切な値が選択されてもよい。係数補正下限値は、背景音推定結果が小さいときに小さくなるように設定されても良い。背景音推定結果が小さいときは、入力信号において目的音が支配的であることを表している。これは、背景音推定結果が小さいときは、構成要素の操作において、歪が生じにくいためである。以下では、係数補正下限値を抑圧係数から推定する方法について詳細に説明する。
係数補正下限値を推定する第一の方法例としては、抑圧係数を周波数方向に平滑化した値を係数補正下限値とする方法が用いられても良い。例えば、ある時刻nにおける周波数fの抑圧係数をSG(n,f),f=0,…,F-1とする。なお、抑圧係数は入力信号毎に算出されるが、簡単のため、入力信号を区別するインデックスはつけないこととする。このとき、数8のように係数補正下限値L(f),f=0,…,F-1が算出される。
Figure 0005773124
ここで、Fは周波数方向の抑圧係数の数であり、max(x,y)はxとyの大きい方を表す。T1(n,f)とT2(n,f)は中間パラメータであり、a(f), b(f), c(f)はそれぞれ平滑化のためのパラメータであり、0から1の値をとる。なお、a(f), b(f), c(f)は周波数方向に一定の値としても良い。例えば、a(f)=0.8, b(f)=0.7, c(f)=0.2と設定する。
係数補正下限値の推定に関する第二の方法例として、抑圧係数SG(n,f)の周波数方向の移動平均を用いることができる。この場合、係数補正下限値は
Figure 0005773124
となる。ここで、w(m)は移動平均の重みであり、w(m)の総和が1となるように設定することができる。c(f)は平滑化のためのパラメータであり、0から1の値をとる。なお、c(f)は周波数方向に一定の値としても良い。例えば、c(f)=0.2と設定する。
また、係数補正下限値推定の第三の方法例として、抑圧係数SG(n,f)を時間及び周波数方向、あるいは、どちらか一方向にグループ化し、各グループ内の抑圧係数の最小値あるいは平均値を当該グループの係数補正下限値としても良い。周波数方向のグループ化は人間の聴覚特性にあわせ、低周波数帯域は少ない数の抑圧係数をグループ化し、高周波数帯域は多くの数の抑圧係数をグループ化してもよい。このグループ化は予め設定しておいてもよいし、抑圧係数に応じて計算しても良い。
さらに、上記第一乃至第三の方法例によって算出された係数補正下限値を時間方向に平滑化しても良い。
サブゲイン下限値修正部310は、信号制御情報を用いて係数補正下限値を修正し、修正係数補正下限値をサブゲイン補正部309に出力する。以下、係数補正下限値の修正方法を説明する。抑圧係数が小さい場合、背景音を強力に抑圧されるが、同時に目的音の一部も抑圧され、歪が含まれるようになる。つまり、一般に、残留背景音と出力信号歪との大きさはトレードオフの関係にあり、小さな残留背景音と小さな出力信号歪とを同時に満たすことはできない。このため、過小な抑圧係数を用いると出力される目的音に含まれる歪が増加する。そこで、係数補正下限値で抑圧係数の最小値を保証し、出力信号における歪の最大値を一定の範囲に収める必要がある。そこで、過剰な抑圧による出力信号歪の増加を避けるためにある程度の残留背景音を許容する、若しくは、十分小さな残留背景音のために過剰な抑圧による出力信号歪を許容するかのどちらかを受け入れる必要がある。係数補正下限値はこのトレードオフを制御するために用いられている。従って、係数補正下限値を信号制御情報により修正することにより、残留背景音と出力信号歪の大きさとのトレードオフを制御することができる。このような構成により、信号制御情報により抑圧係数を制御し、容易に背景音と歪とを制御することができる。
本構成例において、例えば、信号制御情報として許容される残留背景音の大きさが入力されてもよい。この場合、許容される残留背景音の大きさから係数補正下限値の倍率を生成し、係数補正下限値の倍率を係数補正下限値に乗算することにより係数補正下限値を修正しても良い。この場合の信号制御情報に対する係数補正下限値の倍率の関係の一例を図36に示す。図36は、信号制御情報が大きい場合に係数補正下限値の倍率が大きくなる、右肩上がりの特性を有している。係数補正下限値の倍率が大きい場合は、係数補正下限値は増幅されて利用される。このために、より大きな係数補正下限値を用いたことと等価になる。すなわち、より大きな残留雑音を許容し、出力信号歪を小さくする。反対に、係数補正下限値の倍率が大きい場合には、係数補正下限値の効果は弱められる。これは、より強力な抑圧が実行されることを意味する。図36において、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪は最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音は最小になる。
係数補正下限値の修正に関する他の方法の例として、係数補正下限値の倍率を使用せずに、入力された信号制御情報に対して、直接、係数補正下限値を修正しても良い。例えば、信号制御情報として許容される残留背景音の大きさが入力される場合、信号制御情報に対する修正係数補正下限値の関係の一例を図37に示す。図37は、信号制御情報が大きい場合に修正係数補正下限値が大きくなる、右肩上がりの特性を有している。さらに、信号制御情報が中間値(図37の例では、信号制御値が0.5)の場合、修正係数補正下限値と係数補正下限値とは等しくなる特性を有している。これにより、信号制御情報をその中間値から増減させた場合に、修正係数補正下限値も係数補正下限値から増減する対応関係が得られ、信号制御情報による簡易な制御が実現できる。図37も図36と同様に、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪を最小が最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音を最小になる。
サブゲイン補正部309は、係数補正下限値と修正係数補正下限値を用いて、抑圧係数を補正し、補正抑圧係数をゲイン逆変換部307に出力する。補正抑圧係数を生成する方法を詳細に説明する。係数補正下限値と抑圧係数を比較し、係数補正下限値と抑圧係数が同じ値ならば、サブゲイン補正部309は補正抑圧係数として修正係数補正下限値を出力する。一方、係数補正下限値と抑圧係数が同じ値でない場合、サブゲイン補正部309は、抑圧係数と修正係数補正下限値のうち値が大きい方を補正抑圧係数として出力する。他の方法として、係数補正下限値と抑圧係数との比較をしない特許文献1に開示されている方法を用いてもよい。特許文献1に開示されている方法は、抑圧係数と修正係数補正下限値とを比較する方法である。抑圧係数が修正係数補正下限値より大きい場合は、サブゲイン補正部309は補正抑圧係数として抑圧係数を出力する。また、抑圧係数が修正係数補正下限値より小さい場合は、サブゲイン補正部309は補正抑圧係数として修正係数補正下限値を出力する。
以上説明したように、本発明の第一の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。さらに、分析制御情報に含まれる各構成要素の分類に関する情報を利用することにより、各構成要素に対し分類に応じた制御が可能となる。例えば、構成要素が目的音と背景音とである場合、目的音には目的音に応じた制御、背景音には背景音に応じた制御が可能となる。構成要素の分類に応じた制御により、より所望の出力信号を得ることができる。また、入力信号と各構成要素との関係を表す情報と各構成要素の分類に関する情報とを用いることにより、各構成要素に対して正確な制御を行うことが可能になる。例えば、目的音と背景音とを含む第一及び第二の信号があった場合、第一の信号に含まれる背景音を第二の信号に含まれる目的音に対して抑圧するといった処理、対応関係の正しくない構成要素に対する不正確な制御を排除することができる。
<第二の実施の形態>
本発明の第二の実施の形態について説明する。第二の実施の形態は第一の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。
図13を参照して、分析情報計算部122の第二の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部206、207とゲイン逆変換部203と分析情報符号化部208とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205とゲイン逆変換部203と分析情報符号化部208とに入力される。図8を用いて説明した分析情報計算部122の第一の構成例と比較すると、抑圧係数計算部201、202が抑圧係数計算部206、207に置換され、分析情報符号化部204が分析情報符号化部208に置換されている。信号間情報計算部200とゲイン逆変換部203とスイッチ205とは図8と同様であるため、説明を省略する。
抑圧係数計算部206、207はそれぞれに入力された第一または第二の変換信号から背景音の推定を行い、背景音推定結果に基づき背景音を抑圧するための抑圧係数と目的音存在確率とを算出する。目的音存在確率は、入力信号中に目的音がどの程度含まれているかを表している。例えば、目的音存在確率は、目的音と背景音の振幅やパワーの比によって表すことができる。目的音存在確率として、目的音と背景音の振幅やパワーの比が用いられてもよい。また、目的音存在確率として、目的音と背景音の振幅やパワーの比の短時間平均、最大値、最小値などが用いられても良い。抑圧係数計算部206、207は抑圧係数をゲイン逆変換部203に出力し、目的音存在確率を分析情報符号化208に出力する。抑圧係数の計算方法として、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術などを用いてもよい。目的音存在確率の計算方法は、特許文献1に開示されている方法を用いてもよい。なお、目的音存在確率を逐次計算する代わりに、メモリに固定値を記憶しておき、これを逐次読み出して利用してもよい。また、スイッチ205より変換信号が入力されない場合は、抑圧係数と目的音存在確率を出力しなくても良いし、抑圧係数と目的音存在確率とを1として出力しても良い。
分析情報符号化部208は、受信した構成要素情報と分析制御情報と目的音存在確率を符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、構成要素情報と分析制御情報と目的音存在確率の冗長性を除去することが出来る。また、分析情報符号化部208は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、構成要素情報と分析制御情報と目的音存在確率を分析符号化情報として出力してもよい。
図14を参照して、信号制御部172の第五の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部312とゲイン補正部313とレンダリング制御情報分離部304とレンダリング部303とから構成される。復号変換信号はレンダリング部303に入力され、分析符号化情報は分析情報復号部312に入力され、再生制御情報はレンダリング制御情報分離部304に入力される。図10を用いて説明した信号制御部172の第二の構成例と比較すると、分析情報復号部300が分析情報復号部312に置換され、ゲイン補正部305がゲイン補正部313に置換されている。レンダリング制御情報分離部304とレンダリング部303とは図10と同様であるため、説明を省略する。
分析情報復号部312は、受信した分析符号化情報から構成要素情報と分析制御情報と目的音存在確率とを復号し、構成要素情報と分析制御情報と目的音存在確率とをゲイン補正部313に出力する。構成要素情報と分析制御情報と目的音存在確率が符号化されていないときには、分析情報復号部312は、復号処理を行わず、構成要素情報と分析制御情報と目的音存在確率を直接出力する。
ゲイン補正部313は、受信した信号制御情報と分析制御情報と目的音存在確率とを用いて、構成要素情報を構成するゲインを補正し、補正ゲインを含む構成要素情報をレンダリング部303に出力する。ゲイン補正の具体例として、数5で表される目的音を制御するための信号制御情報A (f)を目的音存在確率を用いて修正し、修正した信号制御情報とゲインから補正ゲインを算出しても良い。これにより、目的音存在確率に応じて構成要素を構成するゲインを制御することが可能となる。
次に、図15を参照して、信号制御部172の第六の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部312とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部314とから構成される。図11を用いて説明した信号制御部172の第三の構成例と比較すると、分析情報復号部300が分析情報復号部312に置換され、サブゲイン補正部308がサブゲイン補正部314に置換されている。レンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とは図11と同様であるため、説明を省略する。また、分析情報復号部312は図14の第五の構成例と同様であるため、説明を省略する。なお、分析情報復号部312の出力である目的音存在確率はサブゲイン補正部314に出力され、分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部314に出力され、構成要素情報はゲイン変換部306に出力される。
サブゲイン補正部314は、受信した信号制御情報と分析制御情報と目的音存在確率を用いて、抑圧係数を補正し、補正抑圧係数をゲイン逆変換部307に出力する。補正抑圧係数の算出の具体例として、目的音の大きさを制御するための信号制御情報を、目的音存在確率を用いて修正し、修正した信号制御情報B'(m)と抑圧係数SG(m)とから、補正抑圧係数SG’(m)を、SG’(m)=B’(m)×SG(m)として算出してもよい。ここで、mは入力信号のインデックスである。本例では、第一の入力信号に対して抑圧係数を算出していないため、信号制御情報による補正は対象としない。第一の入力信号に対しても抑圧係数を算出する場合は、第一の入力信号の抑圧係数に対しても同様の補正を行うことが出来る。各入力信号が複数の構成要素に分解されているなどの情報は分析制御情報により導出される。
次に、図16を参照して、信号制御部172の第七の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部312とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とサブゲイン下限値推定部311から構成される。図12を用いて説明した信号制御部172の第四の構成例と比較すると、分析情報復号部300が分析情報復号部312に置換され、サブゲイン下限値修正部310がサブゲイン下限値修正部315に置換されている。レンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値推定部311とは図12と同様であるため、説明を省略する。また、分析情報復号部312は図14の第五の構成例と同様であるため、説明を省略する。なお、分析情報復号部312の出力である目的音存在確率はサブゲイン下限値修正部315に出力され、分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315に出力され、構成要素情報はゲイン変換部306に出力される。
サブゲイン下限値修正部315は、信号制御情報と目的音存在確率を用いて係数補正下限値を修正し、修正係数補正下限値をサブゲイン補正部309に出力する。第四の構成例のサブゲイン下限値修正部310では信号制御情報により係数補正下限値を修正していたが、本構成は信号制御情報と目的音存在確率とにより係数補正下限値を修正する点が異なる。
第四の構成例のサブゲイン下限値修正部310の説明で述べたように、係数補正下限値を信号制御情報により修正することにより、残留背景音と出力信号歪の大きさとのトレードオフを制御することができる。さらに、このトレードオフは信号の特性、すなわち信号の主成分が音声であるか背景音であるかによって異なるため、目的音存在確率を用いることにより信号特性に適した制御が可能となる。より具体的には、目的音存在確率に基づいて、音声区間では低歪を優先した抑圧を、非音声区間では低残留背景音を優先した抑圧を行うことにより、背景音区間における小さな残留背景音と音声区間とにおける小さな出力信号歪を両立することができる。
本構成例では、例えば、信号制御情報として許容される残留背景音の大きさが入力されてもよい。この場合、許容される残留背景音の大きさから係数補正下限値の倍率を生成し、目的音存在確率に応じて係数補正下限値の倍率の生成方法を切り替える。そして、生成された係数補正下限値の倍率を係数補正下限値に乗算することにより係数補正下限値を修正しても良い。この場合の信号制御情報に対する係数補正下限値の倍率の関係の一例を図38に示す。図38を図36と比較すると、図38は、目的音存在確率に対応して複数の特性が存在する点が異なる。目的音存在確率を固定の値にすると、図38は図36と同等になる。すなわち、図38の特性は、図36の特性を目的音存在確率に応じて変化させたものである。図38も図36と同様に、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪を最小が最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音を最小になる。
係数補正下限値の修正に関する他の方法として、係数補正下限値の倍率を使用せずに、入力された信号制御情報に対して、直接、係数補正下限値を修正しても良い。例えば、信号制御情報として許容される残留背景音の大きさが入力される場合、信号制御情報に対する修正係数補正下限値の関係の一例を図39に示す。図39を図37と比較すると、図39は、目的音存在確率に対応して複数の特性が存在する点が異なる。目的音存在確率を固定の値にすると、図39は図37と同等になる。すなわち、図39の特性は、図37の特性を目的音存在確率に応じて変化させたものである。図39も図37と同様に、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪を最小が最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音を最小になる。
以上説明したように、本発明の第二の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。さらに、分析制御情報に含まれる各構成要素の分類に関する情報を利用することにより、各構成要素に対し分類に応じた制御が可能となる。例えば、構成要素が目的音と背景音とである場合、目的音には目的音に応じた制御、背景音には背景音に応じた制御が可能となる。各構成要素の分類に応じた制御により、より所望の出力信号を得ることができる。また、目的音存在確率を用いることにより信号特性に適した制御により、信号歪と残留背景音との関係を所望のバランス関係にすることができる。目的音存在確率を用いることにより、より品質の良い出力信号を得ることが可能となる。
<第三の実施の形態>
本発明の第三の実施の形態について説明する。第三の実施の形態は第一の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。
図17を参照して、分析情報計算部122の第三の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部209、210とゲイン逆変換部203と分析情報符号化部211とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205とゲイン逆変換部203と分析情報符号化部211とに入力される。図8を用いて説明した分析情報計算部122の第一の構成例と比較すると、抑圧係数計算部201、202が抑圧係数計算部209、210に置換され、分析情報符号化部204が分析情報符号化部211に置換されている。信号間情報計算部200とゲイン逆変換部203とスイッチ205とは図8と同様であるため、説明を省略する。
抑圧係数計算部209、210は、それぞれに入力された第一または第二の変換信号から背景音の推定を行い、背景音推定結果に基づき背景音を抑圧するための抑圧係数と、抑圧係数を補正するための補正値を算出する。補正値は、係数補正下限値であってもよい。以下、補正値を係数補正下限値として説明する。抑圧係数計算部209、210は抑圧係数をゲイン逆変換部203に出力し、係数補正下限値を分析情報符号化211に出力する。抑圧係数の計算方法として、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術などを用いてもよい。係数補正下限値の計算方法は、特許文献1に開示されている方法を用いてもよい。なお、係数補正下限値を逐次計算する代わりに、メモリに固定値を記憶しておき、これを逐次読み出して利用してもよい。また、スイッチ205より変換信号が入力されない場合は、抑圧係数と係数補正下限値を出力しなくても良いし、抑圧係数を1として出力しても良い。
分析情報符号化部211は、受信した構成要素情報と分析制御情報と係数補正下限値を符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、構成要素情報と分析制御情報と係数補正下限値の冗長性を除去することが出来る。また、分析情報符号化部211は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、構成要素情報と分析制御情報と係数補正下限値を分析符号化情報として出力してもよい。
図18を参照して、信号制御部172の第八の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部316とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とから構成される。図12を用いて説明した信号制御部172の第四の構成例と比較すると、分析情報復号部300が分析情報復号部316に置換され、サブゲイン下限値推定部311がない。レンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とは図12と同様であるため、説明を省略する。
分析情報復号部316は、受信した分析符号化情報から構成要素情報と分析制御情報と係数補正下限値とを復号し、構成要素情報をゲイン変換部306に出力し、係数補正下限値はサブゲイン補正部309とサブゲイン下限値修正部310に出力し、分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310に出力する。構成要素情報と分析制御情報と係数補正下限値が符号化されていないときには、分析情報復号部316は、復号処理を行わず、構成要素情報と分析制御情報と係数補正下限値を直接出力する。
以上説明したように、本発明の第三の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。
<第四の実施の形態>
本発明の第四の実施の形態について説明する。第四の実施の形態は第一の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。
図19を参照して、分析情報計算部122の第四の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部212、213とゲイン逆変換部203と分析情報符号化部214とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205とゲイン逆変換部203と分析情報符号化部214とに入力される。図8を用いて説明した分析情報計算部122の第一の構成例と比較すると、抑圧係数計算部201、202が抑圧係数計算部212、213に置換され、分析情報符号化部204が分析情報符号化部214に置換されている。信号間情報計算部200とゲイン逆変換部203とスイッチ205とは図8と同様であるため、説明を省略する。
抑圧係数計算部212、213は、それぞれに入力された第一または第二の変換信号から背景音の推定を行い、背景音推定結果に基づき背景音を抑圧するための抑圧係数と目的音存在確率と抑圧係数を補正するための補正値とを算出する。補正値は、係数補正下限値であってもよい。以下、補正値を係数補正下限値として説明する。抑圧係数計算部212、213は抑圧係数をゲイン逆変換部203に出力し、目的音存在確率と係数補正下限値とを分析情報符号化214に出力する。抑圧係数の計算方法として、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術などを用いてもよい。目的音存在確率と係数補正下限値の計算方法は、特許文献1に開示されている方法を用いてもよい。なお、目的音存在確率と係数補正下限値を逐次計算する代わりに、メモリに固定値を記憶しておき、これを逐次読み出して利用してもよい。また、スイッチ205より変換信号が入力されない場合は、抑圧係数と目的音存在確率と係数補正下限値を出力しなくても良いし、抑圧係数と目的音存在確率を1として出力しても良い。
分析情報符号化部214は、受信した構成要素情報と分析制御情報と目的音存在確率と係数補正下限値を符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、構成要素情報と分析制御情報と目的音存在確率と係数補正下限値との冗長性を除去することが出来る。また、分析情報符号化部214は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、構成要素情報と分析制御情報と目的音存在確率と係数補正下限値とを分析符号化情報として出力してもよい。
図20を参照して、信号制御部172の第九の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部317とレンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とから構成される。図16を用いて説明した信号制御部172の第七の構成例と比較すると、分析情報復号部312が分析情報復号部317に置換され、サブゲイン下限値推定部311がない。レンダリング部303とレンダリング制御情報分離部304とゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とは図16と同様であるため、説明を省略する。
分析情報復号部317は、受信した分析符号化情報から構成要素情報と分析制御情報と目的音存在確率と係数補正下限値とを復号し、構成要素情報をゲイン変換部306に出力し、目的音存在確率はサブゲイン下限値修正部315に出力し、係数補正下限値はサブゲイン補正部309とサブゲイン下限値修正部315に出力し、分析制御情報はゲイン変換部306とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315に出力する。構成要素情報と分析制御情報と目的音存在確率と係数補正下限値が符号化されていないときには、分析情報復号部317は、復号処理を行わず、構成要素情報と分析制御情報と目的音存在確率と係数補正下限値を直接出力する。
以上説明したように、本発明の第四の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。さらに、分析制御情報に含まれる各構成要素の分類に関する情報を利用することにより、各構成要素に対し分類に応じた制御が可能となる。例えば、構成要素が目的音と背景音とである場合、目的音には目的音に応じた制御、背景音には背景音に応じた制御が可能となる。各構成要素の分類に応じた制御により、より所望の出力信号を得ることができる。また、目的音存在確率を用いることにより信号特性に適した制御により、信号歪と残留背景音との関係を所望のバランス関係にすることができる。目的音存在確率を用いることにより、より品質の良い出力信号を得ることが可能となる。
<第五の実施の形態>
本発明の第五の実施の形態について説明する。第五の実施の形態は第一の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。本実施の形態は第一の実施の形態と比べて分析符号化情報の構成が異なることを特徴とする。
図21を参照して、分析情報計算部122の第五の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部201、202と分析情報符号化部220とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205と分析情報符号化部220とに入力される。図8を用いて説明した分析情報計算部122の第一の構成例と比較すると、分析情報符号化部204が分析情報符号化部220に置換され、ゲイン逆変換部203がない。信号間情報計算部200と抑圧係数計算部201、202とスイッチ205とは図8と同様であるため、説明を省略する。なお、信号間情報計算部200の出力である信号間情報と、抑圧係数計算部201、202の出力である抑圧係数は分析情報符号化部220に出力される。
分析情報符号化部220は、受信した信号間情報と分析制御情報と抑圧係数を符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、信号間情報と分析制御情報と抑圧係数との冗長性を除去することが出来る。また、分析情報符号化部220は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、信号間情報と分析制御情報と抑圧係数とを分析符号化情報として出力してもよい。
図22を参照して、信号制御部172の第十の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部320とレンダリング部302とレンダリング制御情報分離部301とゲイン逆変換部307とから構成される。図9を用いて説明した信号制御部172の第一の構成例と比較すると、分析情報復号部300が分析情報復号部320に置換され、ゲイン逆変換部307が追加されている。レンダリング部302とレンダリング制御情報分離部301とは図9と同様であるため、説明を省略する。また、ゲイン逆変換部307は図11と同様であるため、説明を省略する。
分析情報復号部320は、受信した分析符号化情報から信号間情報と分析制御情報と抑圧係数を復号し、信号間情報と抑圧係数をゲイン逆変換部307に出力し、分析制御情報はゲイン逆変換部307とレンダリング部302に出力する。信号間情報と分析制御情報と抑圧係数が符号化されていないときには、分析情報復号部320は、復号処理を行わず、信号間情報と分析制御情報と抑圧係数を直接出力する。
次に、図23を参照して、信号制御部172の第十一の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部320とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とゲイン補正部305とから構成される。図10を用いて説明した信号制御部172の第二の構成例と比較すると、分析情報復号部300が分析情報復号部320に置換され、ゲイン逆変換部307が追加されている。レンダリング部303とレンダリング制御情報分離部304とゲイン補正部305とは図10と同様であるため、説明を省略する。また、分析情報復号部320とゲイン逆変換部307は図22と同様であるため、説明を省略する。なお、分析情報復号部320の出力である分析制御情報はゲイン逆変換部307とゲイン補正部305に出力される。
次に、図24を参照して、信号制御部172の第十二の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部320とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部308とから構成される。図11を用いて説明した信号制御部172の第三の構成例と比較すると、分析情報復号部300が分析情報復号部320に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部308とは図11と同様であるため、説明を省略する。また、分析情報復号部320は図22と同様であるため、説明を省略する。なお、分析情報復号部320の出力である分析制御情報はゲイン逆変換部307とサブゲイン補正部308に出力される。
次に、図25を参照して、信号制御部172の第十三の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部320とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とサブゲイン下限値推定部311とから構成される。図12を用いて説明した信号制御部172の第四の構成例と比較すると、分析情報復号部300が分析情報復号部320に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とサブゲイン下限値推定部311とは図12と同様であるため、説明を省略する。また、分析情報復号部320は図22と同様であるため、説明を省略する。なお、分析情報復号部320の出力である分析制御情報はゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310に出力され、抑圧係数はサブゲイン下限値推定部311に出力される。
以上説明したように、本発明の第五の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。
<第六の実施の形態>
本発明の第六の実施の形態について説明する。第六の実施の形態は第二の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。本実施の形態は第二の実施の形態と比べて分析符号化情報の構成が異なることを特徴とする。
図26を参照して、分析情報計算部122の第六の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報とを受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部206、207と分析情報符号化部221とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205と分析情報符号化部221とに入力される。図13を用いて説明した分析情報計算部122の第二の構成例と比較すると、分析情報符号化部208が分析情報符号化部221に置換され、ゲイン逆変換部203がない。信号間情報計算部200と抑圧係数計算部206、207とスイッチ205とは図13と同様であるため、説明を省略する。なお、信号間情報計算部200の出力である信号間情報と、抑圧係数計算部206、207の出力である抑圧係数と目的音存在確率は分析情報符号化部221に出力される。
分析情報符号化部221は、受信した信号間情報と分析制御情報と抑圧係数と目的音存在確率とを符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、信号間情報と分析制御情報と抑圧係数と目的音存在確率との冗長性を除去することが出来る。また、分析情報符号化部221は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、信号間情報と分析制御情報と抑圧係数と目的音存在確率とを分析符号化情報として出力してもよい。
次に、図27を参照して、信号制御部172の第十四の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部321とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とゲイン補正部313とから構成される。図14を用いて説明した信号制御部172の第五の構成例と比較すると、分析情報復号部312が分析情報復号部321に置換され、ゲイン逆変換部307が追加されている。レンダリング部303とレンダリング制御情報分離部304とゲイン補正部313とは図14と同様であるため、説明を省略する。また、ゲイン逆変換部307は図11と同様であるため、説明を省略する。
分析情報復号部321は、受信した分析符号化情報から信号間情報と分析制御情報と抑圧係数と目的音存在確率とを復号し、信号間情報と抑圧係数をゲイン逆変換部307に出力し、分析制御情報はゲイン逆変換部307とゲイン補正部313に出力し、目的音存在確率はゲイン補正部313に出力する。信号間情報と分析制御情報と抑圧係数と目的音存在確率とが符号化されていないときには、分析情報復号部321は、復号処理を行わず、信号間情報と分析制御情報と抑圧係数と目的音存在確率とを直接出力する。
次に、図28を参照して、信号制御部172の第十五の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部321とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部314とから構成される。図15を用いて説明した信号制御部172の第六の構成例と比較すると、分析情報復号部312が分析情報復号部321に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部314とは図15と同様であるため、説明を省略する。また、分析情報復号部321は図27と同様であるため、説明を省略する。なお、分析情報復号部321の出力である分析制御情報はゲイン逆変換部307とサブゲイン補正部314に出力され、信号間情報はゲイン逆変換部307に出力され、抑圧係数と目的音存在確率はサブゲイン補正部314に出力される。
次に、図29を参照して、信号制御部172の第十六の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部321とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とサブゲイン下限値推定部311とから構成される。図16を用いて説明した信号制御部172の第七の構成例と比較すると、分析情報復号部312が分析情報復号部321に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とサブゲイン下限値推定部311とは図16と同様であるため、説明を省略する。また、分析情報復号部321は図27と同様であるため、説明を省略する。なお、分析情報復号部321の出力である分析制御情報はゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315に出力され、抑圧係数はサブゲイン補正部309とサブゲイン下限値推定部311に出力され、目的音存在確率はサブゲイン下限値修正部315に出力される。
以上説明したように、本発明の第六の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。さらに、分析制御情報に含まれる各構成要素の分類に関する情報を利用することにより、各構成要素に対し分類に応じた制御が可能となる。例えば、構成要素が目的音と背景音とである場合、目的音には目的音に応じた制御、背景音には背景音に応じた制御が可能となる。各構成要素の分類に応じた制御により、より所望の出力信号を得ることができる。また、目的音存在確率を用いることにより信号特性に適した制御により、信号歪と残留背景音との関係を所望のバランス関係にすることができる。目的音存在確率を用いることにより、より品質の良い出力信号を得ることが可能となる。
<第七の実施の形態>
本発明の第七の実施の形態について説明する。第七の実施の形態は第三の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。本実施の形態は第三の実施の形態と比べて分析符号化情報の構成が異なることを特徴とする。
図30を参照して、分析情報計算部122の第七の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部209、210と分析情報符号化部222とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205と分析情報符号化部222とに入力される。図17を用いて説明した分析情報計算部122の第三の構成例と比較すると、分析情報符号化部211が分析情報符号化部222に置換され、ゲイン逆変換部203がない。信号間情報計算部200と抑圧係数計算部209、210とスイッチ205とは図17と同様であるため、説明を省略する。なお、信号間情報計算部200の出力である信号間情報と、抑圧係数計算部206、207の出力である抑圧係数と係数補正下限値は分析情報符号化部222に出力される。
分析情報符号化部222は、受信した信号間情報と分析制御情報と抑圧係数と係数補正下限値とを符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、信号間情報と分析制御情報と抑圧係数と係数補正下限値との冗長性を除去することが出来る。また、分析情報符号化部222は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、信号間情報と分析制御情報と抑圧係数と係数補正下限値とを分析符号化情報として出力してもよい。
図31を参照して、信号制御部172の第十七の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部322とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とから構成される。図18を用いて説明した信号制御部172の第八の構成例と比較すると、分析情報復号部316が分析情報復号部322に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310とは図18と同様であるため、説明を省略する。
分析情報復号部322は、受信した分析符号化情報から信号間情報と分析制御情報と抑圧係数と係数補正下限値とを復号し、分析制御情報はゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部310に出力し、抑圧係数はサブゲイン補正部309に出力し、係数補正下限値はサブゲイン補正部309とサブゲイン下限値修正部310に出力する。信号間情報と分析制御情報と抑圧係数と係数補正下限値とが符号化されていないときには、分析情報復号部322は、復号処理を行わず、信号間情報と分析制御情報と抑圧係数と係数補正下限値とを直接出力する。
以上説明したように、本発明の第七の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。
<第八の実施の形態>
本発明の第八の実施の形態について説明する。第八の実施の形態は第四の実施の形態と比べて、分析情報計算部122と信号制御部172の動作が異なる。重複する部分の説明は省略する。本実施の形態は第四の実施の形態と比べて分析符号化情報の構成が異なることを特徴とする。
図32を参照して、分析情報計算部122の第八の構成例を詳細に説明する。分析情報計算部122は、第一の変換信号と第二の変換信号と分析制御情報を受信し、分析符号化情報を出力する。分析情報計算部122は、信号間情報計算部200と抑圧係数計算部212、213と分析情報符号化部223とスイッチ205とから構成される。第一の変換信号と第二の変換信号とは、信号間情報計算部200とスイッチ205に入力される。分析制御情報はスイッチ205と分析情報符号化部223とに入力される。図19を用いて説明した分析情報計算部122の第四の構成例と比較すると、分析情報符号化部214が分析情報符号化部223に置換され、ゲイン逆変換部203がない。信号間情報計算部200と抑圧係数計算部212、213とスイッチ205とは図19と同様であるため、説明を省略する。なお、信号間情報計算部200の出力である信号間情報と、抑圧係数計算部212、213の出力である抑圧係数と係数補正下限値と目的音存在確率は分析情報符号化部223に出力される。
分析情報符号化部223は、受信した信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率を符号化し、符号化結果を分析符号化情報として出力する。符号化については、すでに量子化部112に関して説明した内容と同様の方法を用いてもよい。符号化により、信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率との冗長性を除去することが出来る。また、分析情報符号化部223は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率とを分析符号化情報として出力してもよい。
図33を参照して、信号制御部172の第十八の構成例を詳細に説明する。信号制御部172は、復号変換信号と分析符号化情報と再生制御情報とを受信し、出力変換信号を出力する。信号制御部172は、分析情報復号部323とレンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とから構成される。図20を用いて説明した信号制御部172の第九の構成例と比較すると、分析情報復号部317が分析情報復号部323に置換され、ゲイン変換部306がない。レンダリング部303とレンダリング制御情報分離部304とゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315とは図20と同様であるため、説明を省略する。
分析情報復号部323は、受信した分析符号化情報から信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率を復号し、分析制御情報はゲイン逆変換部307とサブゲイン補正部309とサブゲイン下限値修正部315に出力し、抑圧係数はサブゲイン補正部309に出力し、目的音存在確率はサブゲイン下限値修正部315に出力し、係数補正下限値はサブゲイン補正部309とサブゲイン下限値修正部315に出力する。信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率とが符号化されていないときには、分析情報復号部323は、復号処理を行わず、信号間情報と分析制御情報と抑圧係数と係数補正下限値と目的音存在確率とを直接出力する。
以上説明したように、本発明の第八の実施の形態によれば、送信部から出力される分析符号化情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。また、送信部の入力信号が複数個存在する場合にも、分析制御情報に含まれる入力信号と各構成要素との関係を表す情報を利用することにより、入力信号を構成する複数の構成要素のそれぞれに対し、他の入力信号の構成要素とは独立に制御できる。さらに、分析制御情報に含まれる各構成要素の分類に関する情報を利用することにより、各構成要素に対し分類に応じた制御が可能となる。例えば、構成要素が目的音と背景音とである場合、目的音には目的音に応じた制御、背景音には背景音に応じた制御が可能となる。各構成要素の分類に応じた制御により、より所望の出力信号を得ることができる。また、目的音存在確率を用いることにより信号特性に適した制御により、信号歪と残留背景音との関係を所望のバランス関係にすることができる。目的音存在確率を用いることにより、より品質の良い出力信号を得ることが可能となる。
<第九の実施の形態>
図34を参照して、本発明の第九の実施の形態を説明する。第一の実施の形態乃至第八の実施の形態まで、一方向通信のみを考慮してきた。すなわち、端末に内蔵された送信部から、別の端末に内蔵された受信部との間での通信について説明してきた。第九の実施の形態は、双方向の通信を考慮し、一台の送受信端末に本発明を適用した送信部と受信部との両方を内蔵しているものである。ここで送信部と受信部との両方を内蔵する本発明を適応した端末としては、第一の実施の形態乃至第八の実施の形態のいずれかの送信部および受信部を組み合わせて用いてもよい。本発明の第九の実施の形態では、送信部と受信部との両方を持つことにより、テレビ会議端末や携帯電話などの双方向通信に利用した際に、本発明の効果が得られる。
放送など、一方向の音声通信が行われる場合にも本発明の信号分析制御システムを適用することができる。放送局の送信端末は、例えば、少なくとも図1に示される送信部10を有すればよい。放送局とは、放送免許を持つ放送局のみならず、多地点テレビ会議のメイン会場など、音声を送信し、受信をほとんど行わない地点を含む。この場合の送信端末には、本発明の第一の実施の形態乃至第八の実施の形態における送信部のいずれを用いてもよい。
また、受信のみを行う地点においても、本発明の信号分析制御システムを適用することができる。受信のみを行う地点における受信端末では、例えば、少なくとも図1に示される受信部15を有すればよい。この受信端末には、本発明の第一の実施の形態乃至第六の実施の形態における受信部のいずれを用いてもよい。
<第十の実施の形態>
図35を参照して、本発明の第十の実施の形態に基づく信号処理装置を詳細に説明する。本発明の第十の実施の形態は、プログラム制御により動作するコンピュータ1300、1301から構成される。コンピュータは、中央処理装置、プロセッサ、データ処理装置のいずれでもよい。
コンピュータ1300は、第一の実施の形態乃至第九の実施の形態のいずれかに係る処理を行い、入力信号を受け伝送信号を出力するためのプログラムに基づき動作する。一方、コンピュータ1301は、第一の実施の形態乃至第九の実施の形態のいずれかに係る処理を行い、伝送信号を受け、出力信号を出力するためのプログラムに基づき動作する。なお、第九の実施の形態で説明した送信部および受信部を両方もつ場合、送信処理と受信処理を同一のコンピュータを用いて処理を実行してもよい。
上記で説明してきた第一の実施の形態乃至第十の実施の形態では、送信部、伝送路、受信部の動作として説明してきたが、それぞれ、録音部、蓄積媒体、再生部と置き換えてもよい。たとえば、図1に示す送信部10は、伝送信号をビットストリームとして蓄積媒体に出力し、蓄積媒体にビットストリームを記録してもよい。また、受信部15は、蓄積媒体に記録されているビットストリームを取出し、ビットストリームを復号して処理を行うことにより出力信号を生成してもよい。
このように、上述した実施の形態は、送信部で信号の分析を行うので、受信部において信号分析に係る演算量を削減することが出来る。また、上述した実施の形態は、送信部で得られた信号分析情報に基づいて、受信部で複数構成要素からから構成される入力信号を構成要素ごとに制御することができる。さらに、入力信号が1つではなく、複数個の入力信号が入力される場合、各入力信号と各入力信号に含まれる構成要素との関係を利用することにより、各入力信号を構成する複数の構成要素を、他の入力信号の構成要素とは独立に制御できる。
以上の如く、本発明の第1の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記構成要素間の関係を表す構成要素情報と、前記構成要素と前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする信号制御方法である。
また、本発明の第2の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第3の態様は、上記態様において、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受け、前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第4の態様は、上記態様において、前記複数の構成要素間の関係を表す信号制御情報を受け、前記分析制御情報と前記信号制御情報とに基づいて前記構成要素情報を補正し、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第5の態様は、上記態様において、前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と、前記複数の構成要素の一部を抑圧するための抑圧係数とを生成し、前記信号制御情報に基づいて、前記抑圧係数を補正し、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、前記構成要素情報を補正し、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第6の態様は、上記態様において、前記抑圧係数の下限値を生成し、前記前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正し、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、前記構成要素情報を補正し、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第7の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成することを特徴とする信号分析方法である。
また、本発明の第8の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第9の態様は、上記態様において、前記第一の信号と前記第二の信号とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と前記複数の構成要素の一部を抑圧するための抑圧係数とを生成し、前記分析情報と前記信号間情報と前記抑圧係数とに基づいて、前記構成要素情報を生成することを特徴とする。
また、本発明の第10の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成し、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする信号分析制御方法である。
また、本発明の第11の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第12の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記構成要素間の関係を表す構成要素情報と、前記構成要素と前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御する信号制御部を備えることを特徴とする信号制御装置である。
また、本発明の第13の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第14の態様は、上記態様において、前記信号制御部は、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受け、前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第15の態様は、上記態様において、前記複数の構成要素間の関係を表す信号制御情報を受け、前記分析制御情報と前記信号制御情報とに基づいて、前記構成要素情報を補正する構成要素情報補正部を備え、前記信号制御部は、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第16の態様は、上記態様において、前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と前記複数の構成要素の一部を抑圧するための抑圧係数とを生成する構成要素生成部と、前記信号制御情報に基づいて前記抑圧係数を補正する抑圧係数補正部と、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素補正部とを備え、前記信号制御部は、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第17の態様は、上記態様において、前記抑圧係数の下限値を生成する抑圧係数下限値生成部と、前記前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正する抑圧係数補正部とを備え、前記構成要素情報補正部は、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて構成要素情報を生成し、前記信号制御部は、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第18の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成する構成要素情報生成部を備えることを特徴とする信号分析装置である。
また、本発明の第19の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第20の態様は、上記態様において、前記第一の信号と前記第二の信号とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報を生成する信号間情報生成部と、前記第一の信号と前記第二の信号とに基づいて前記複数の構成要素の一部を抑圧するための抑圧係数を生成する抑圧係数生成部と、を備え、前記構成要素情報生成部は、前記分析情報と前記信号間情報と前記抑圧係数とに基づいて、前記構成要素情報を生成することを特徴とする。
また、本発明の第21の態様は、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受け、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成する構成要素情報生成部と、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御する信号制御部とを備えることを特徴とする信号分析制御システムである。
また、本発明の第22の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第23の態様は、コンピュータに、第一の信号と、複数の構成要素を含む第二の信号と、前記構成要素間の関係を表す構成要素情報と、前記構成要素と前記第二の信号との関係を表す情報を含む分析制御情報と、を受ける処理と、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、本発明の第24の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第25の態様は、上記態様において、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受ける処理を含み、前記信号制御処理において、前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第26の態様は、上記態様において、前記複数の構成要素間の関係を表す信号制御情報を受ける処理と、前記分析制御情報と前記信号制御情報とに基づいて、前記構成要素情報を補正する構成要素情報補正処理と、を含み、前記信号制御処理において、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第27の態様は、上記態様において、前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と前記複数の構成要素の一部を抑圧するための抑圧係数とを生成する抑圧係数生成処理と、前記信号制御情報に基づいて、前記抑圧係数を補正する抑圧係数補正処理と、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素情報補正処理と、を含み、前記信号制御処理において、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第28の態様は、上記態様において、前記抑圧係数の下限値を生成する抑圧係数下限値生成処理と、前記前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正する抑圧係数補正処理と、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素情報補正処理と、を含み、前記信号制御処理において、前記補正された構成要素情報と前記レンダリング信号とに基づいて、前記第一の信号または前記第二の信号を制御することを特徴とする。
また、本発明の第29の態様は、コンピュータに、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受ける処理と、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成する構成要素情報生成処理とを実行させることを特徴とする信号分析プログラムである。
また、本発明の第30の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
また、本発明の第31の態様は、上記態様において、前記第一の信号と前記第二の信号とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報を生成する信号間情報生成処理と、前記第一の信号と前記第二の信号とに基づいて、前記複数の構成要素の一部を抑圧するための抑圧係数とを生成する抑圧係数生成処理と、を含み、前記構成要素情報生成処理は、前記分析情報と前記信号間情報と前記抑圧係数とに基づいて、前記構成要素情報を生成することを特徴とする。
また、本発明の第32の態様は、コンピュータに、第一の信号と、複数の構成要素を含む第二の信号と、前記第二の信号との関係を表す情報を含む分析制御情報と、を受ける処理と、前記第一の信号と前記第二の信号と前記分析制御情報とに基づいて、前記構成要素間の関係を表す構成要素情報を生成する構成要素情報生成処理と、前記構成要素情報と前記分析制御情報とに基づいて、前記第一の信号または前記第二の信号を制御する信号制御処理とを実行させることを特徴とする信号分析制御プログラムである。
また、本発明の第33の態様は、上記態様において、前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする。
以上好ましい実施の形態及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び態様に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
本出願は、2008年4月21日に出願された日本出願特願2008−80461号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、信号分析又は制御を行う装置、信号分析又は制御をコンピュータに実現するためのプログラムといった用途に適用できる。

Claims (15)

  1. 複数の構成要素を少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素を前記第一の信号と第二の信号のいずれから生成するかを表す情報を含む分析制御情報と、を受信し、
    前記構成要素と出力信号との関係を周波数成分毎に表し、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受け、
    前記複数の構成要素は音声と背景雑音を含み、
    前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする信号制御方法。
  2. 前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする請求項1に記載の信号制御方法。
  3. 音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、
    前記分析制御情報と前記信号制御情報とに基づいて前記構成要素情報を補正し、
    前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項1又は請求項2に記載の信号制御方法。
  4. 前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と、前記複数の構成要素の一部を抑圧するための抑圧係数とを生成し、
    前記信号制御情報に基づいて、前記抑圧係数を補正し、
    前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、前記構成要素情報を補正し、
    前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項に記載の信号制御方法。
  5. 前記抑圧係数の下限値を生成し、
    前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正し、
    前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、前記構成要素情報を補正し、
    前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項に記載の信号制御方法。
  6. 音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素を前記第一の信号と第二の信号のいずれから生成するかを表す情報を含む分析制御情報と、を受信し、
    前記構成要素と出力信号との関係を周波数成分毎に表し、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受け、
    前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する信号制御部を備える
    ことを特徴とする信号制御装置。
  7. 前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする請求項に記載の信号制御装置。
  8. 音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、前記分析制御情報と前記信号制御情報とに基づいて、前記構成要素情報を補正する構成要素情報補正部を備え、
    前記信号制御部は、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項6又は請求項7に記載の信号制御装置。
  9. 前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と前記複数の構成要素の一部を抑圧するための抑圧係数とを生成する構成要素生成部と、
    前記信号制御情報に基づいて前記抑圧係数を補正する抑圧係数補正部と、
    前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素補正部と
    を備え、
    前記信号制御部は、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項に記載の信号制御装置。
  10. 前記抑圧係数の下限値を生成する抑圧係数下限値生成部と、
    前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正する抑圧係数補正部と
    を備え、
    前記構成要素情報補正部は、前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて構成要素情報を生成し、
    前記信号制御部は、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項に記載の信号制御装置。
  11. コンピュータに、
    音声と背景雑音を含む複数の構成要素を、少なくとも一方が含む第一の信号と第二の信号と、前記構成要素間のエネルギ比を表す構成要素情報と、前記構成要素を前記第一の信号と第二の信号のいずれから生成するかを表す情報を含む分析制御情報と、を受信する処理と、
    前記構成要素と出力信号との関係を周波数成分毎に表し、前記構成要素を複数の出力チャネルに出力するためのレンダリング情報を受ける処理と、
    前記構成要素情報と前記分析制御情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する信号制御処理と
    を実行させる
    ことを特徴とする信号制御プログラム。
  12. 前記分析制御情報は、前記複数の構成要素のそれぞれの分類を表す情報を含むことを特徴とする請求項11に記載の信号制御プログラム。
  13. 音声と背景雑音のエネルギレベルを変更する信号制御情報を受ける処理と、
    前記分析制御情報と前記信号制御情報とに基づいて、前記構成要素情報を補正する構成要素情報補正処理と、
    を含み、
    前記信号制御処理において、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項11又は請求項12に記載の信号制御プログラム。
  14. 前記構成要素情報と前記信号制御情報とに基づいて、前記第一の信号と前記第二の信号との関係を示す信号間情報と前記複数の構成要素の一部を抑圧するための抑圧係数とを生成する抑圧係数生成処理と、
    前記信号制御情報に基づいて、前記抑圧係数を補正する抑圧係数補正処理と、
    前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素情報補正処理と、
    を含み、
    前記信号制御処理において、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の背景雑音を制御する
    ことを特徴とする請求項13に記載の信号制御プログラム。
  15. 前記抑圧係数の下限値を生成する抑圧係数下限値生成処理と、
    前記抑圧係数の下限値と前記信号制御情報とに基づいて、前記抑圧係数を補正する抑圧係数補正処理と、
    前記信号間情報と前記補正された抑圧係数と前記分析制御情報とに基づいて、構成要素情報を補正する構成要素情報補正処理と、
    を含み、
    前記信号制御処理において、前記補正された構成要素情報と前記レンダリング情報とに基づいて、前記第一の信号または前記第二の信号の音声と背景雑音を独立に制御する
    ことを特徴とする請求項14に記載の信号制御プログラム。
JP2010509159A 2008-04-21 2009-04-17 信号分析制御及び信号制御のシステム、装置、方法及びプログラム Active JP5773124B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010509159A JP5773124B2 (ja) 2008-04-21 2009-04-17 信号分析制御及び信号制御のシステム、装置、方法及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008110754 2008-04-21
JP2008110754 2008-04-21
JP2010509159A JP5773124B2 (ja) 2008-04-21 2009-04-17 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
PCT/JP2009/057735 WO2009131066A1 (ja) 2008-04-21 2009-04-17 信号分析制御及び信号制御のシステム、装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2009131066A1 JPWO2009131066A1 (ja) 2011-08-18
JP5773124B2 true JP5773124B2 (ja) 2015-09-02

Family

ID=41216802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010509159A Active JP5773124B2 (ja) 2008-04-21 2009-04-17 信号分析制御及び信号制御のシステム、装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US8509092B2 (ja)
JP (1) JP5773124B2 (ja)
WO (1) WO2009131066A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10362433B2 (en) 2016-09-23 2019-07-23 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
US8917774B2 (en) * 2010-06-30 2014-12-23 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
US8755432B2 (en) 2010-06-30 2014-06-17 Warner Bros. Entertainment Inc. Method and apparatus for generating 3D audio positioning using dynamically optimized audio 3D space perception cues
EP2817802B1 (en) 2012-02-24 2016-12-07 Dolby International AB Audio processing
EP3311558B1 (en) * 2015-06-16 2020-08-12 Dolby Laboratories Licensing Corporation Post-teleconference playback using non-destructive audio transport
US10013995B1 (en) * 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
KR20240066906A (ko) 2022-11-08 2024-05-16 주식회사 온코드바이오 퀴놀린 아마이드 구조를 갖는 이소인돌리논 유도체 및 이의 용도
KR20240066904A (ko) 2022-11-08 2024-05-16 주식회사 온코드바이오 아릴시클로알킬아마이드 구조를 갖는 이소인돌리논 유도체 및 이의 용도

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006084639A (ja) * 2004-09-15 2006-03-30 Nippon Hoso Kyokai <Nhk> 音声スペクトル推定装置および音声スペクトル推定プログラム
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP3858668B2 (ja) * 2001-11-05 2006-12-20 日本電気株式会社 ノイズ除去方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
JP4163294B2 (ja) * 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法
US6463414B1 (en) * 1999-04-12 2002-10-08 Conexant Systems, Inc. Conference bridge processing of speech in a packet network environment
JP4489931B2 (ja) * 2000-11-15 2010-06-23 株式会社日立国際電気 地上デジタルtv放送伝送方法及び地上デジタルtv放送システム
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
ATE332003T1 (de) * 2002-04-22 2006-07-15 Koninkl Philips Electronics Nv Parametrische beschreibung von mehrkanal-audio
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
EP1783745B1 (en) * 2004-08-26 2009-09-09 Panasonic Corporation Multichannel signal decoding
JP2006222838A (ja) * 2005-02-14 2006-08-24 Matsushita Electric Ind Co Ltd 情報処理システム
JP5191886B2 (ja) * 2005-06-03 2013-05-08 ドルビー ラボラトリーズ ライセンシング コーポレイション サイド情報を有するチャンネルの再構成
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
CN101411063B (zh) * 2006-03-28 2011-11-23 艾利森电话股份有限公司 滤波器自适应频率分辨率
JP5435204B2 (ja) * 2006-07-03 2014-03-05 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
KR101056325B1 (ko) * 2006-07-07 2011-08-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 복수의 파라미터적으로 코딩된 오디오 소스들을 결합하는 장치 및 방법
CN101911183A (zh) * 2008-01-11 2010-12-08 日本电气株式会社 信号分析控制、信号分析、信号控制***、装置以及程序
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
JP2000330597A (ja) * 1999-05-20 2000-11-30 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP3858668B2 (ja) * 2001-11-05 2006-12-20 日本電気株式会社 ノイズ除去方法及び装置
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006084639A (ja) * 2004-09-15 2006-03-30 Nippon Hoso Kyokai <Nhk> 音声スペクトル推定装置および音声スペクトル推定プログラム
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10362433B2 (en) 2016-09-23 2019-07-23 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Also Published As

Publication number Publication date
US20110019761A1 (en) 2011-01-27
WO2009131066A1 (ja) 2009-10-29
US8509092B2 (en) 2013-08-13
JPWO2009131066A1 (ja) 2011-08-18

Similar Documents

Publication Publication Date Title
JP5773124B2 (ja) 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
KR102636424B1 (ko) 스테레오 사운드 신호의 좌측 및 우측 채널들을 디코딩하는 방법 및 시스템
EP1906706B1 (en) Audio decoder
EP3118849B1 (en) Encoding device, decoding device, and method thereof
US9734835B2 (en) Voice decoding apparatus of adding component having complicated relationship with or component unrelated with encoding information to decoded voice signal
WO2010005050A1 (ja) 信号分析装置、信号制御装置及びその方法と、プログラム
SE527670C2 (sv) Naturtrogenhetsoptimerad kodning med variabel ramlängd
US10553223B2 (en) Adaptive channel-reduction processing for encoding a multi-channel audio signal
JP2008216720A (ja) 信号処理の方法、装置、及びプログラム
JP5282906B2 (ja) 多地点接続装置、信号分析及び装置と、その方法及びプログラム
JP5668923B2 (ja) 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5425067B2 (ja) 音響信号復号装置および音響信号復号装置におけるバランス調整方法
WO2010082471A1 (ja) 音響信号復号装置及びバランス調整方法
JP5556175B2 (ja) 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
WO2009087923A1 (ja) 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
JP2004302493A (ja) オーディオ復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150218

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150616

R150 Certificate of patent or registration of utility model

Ref document number: 5773124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150