JP5668923B2 - 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム - Google Patents

信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム Download PDF

Info

Publication number
JP5668923B2
JP5668923B2 JP2010502815A JP2010502815A JP5668923B2 JP 5668923 B2 JP5668923 B2 JP 5668923B2 JP 2010502815 A JP2010502815 A JP 2010502815A JP 2010502815 A JP2010502815 A JP 2010502815A JP 5668923 B2 JP5668923 B2 JP 5668923B2
Authority
JP
Japan
Prior art keywords
signal
analysis information
information
suppression coefficient
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010502815A
Other languages
English (en)
Other versions
JPWO2009113516A1 (ja
Inventor
野村 俊之
俊之 野村
嶋田 修
修 嶋田
昭彦 杉山
昭彦 杉山
宝珠山 治
治 宝珠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010502815A priority Critical patent/JP5668923B2/ja
Publication of JPWO2009113516A1 publication Critical patent/JPWO2009113516A1/ja
Application granted granted Critical
Publication of JP5668923B2 publication Critical patent/JP5668923B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/12Arrangements providing for calling or supervisory signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Systems (AREA)

Description

本発明は、複数の音源から構成される入力信号を、信号に含まれる構成要素ごとに制御するための信号分析および信号制御の方法、装置、並びにコンピュータプログラムに関する。
複数の音源が所望音声と背景雑音とから構成される入力信号の背景雑音を抑圧するシステムとして、雑音抑圧システム(以下、ノイズサプレッサという。)が知られている。ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムである。一般的に、ノイズサプレッサは、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、入力信号から雑音成分の推定パワースペクトルを差し引く。これにより、所望の音声信号に混在する雑音が抑圧される。さらに、これらのノイズサプレッサは、雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用される。このようなノイズサプレッサに関連する技術としては、例えば、特許文献1に記載されている技術がある(以下、第一の関連技術という。)。
通常、第一の関連技術ノイズサプレッサは、通信に利用される場合、符号化器の前処理として機能する。ノイズサプレッサの出力は符号化されて、通信路を伝送される。受信部では、信号が復号されて可聴信号が生成される。第一の関連技術の1入力の雑音抑圧システムでは、一般的に、抑圧しきれずに残留する残留雑音と、出力される強調音声の歪はトレードオフの関係にある。残留雑音を減らすと歪が増え、歪を減らすと残留雑音が増える。それぞれの利用者によって、残留雑音と歪のバランスの最適状態は異なる。しかし、ノイズサプレッサが符号化器の前にある、すなわち送信部にある構成では、利用者は残留雑音と歪のバランスを自分の好みに合うように調整することができない。
この問題を解決する構成として、非特許文献1に開示された図35に示される受信側ノイズサプレッサが知られている。(以下、第二の関連技術という。)第二の関連技術の構成は、送信部ではなく受信部に雑音抑圧部9501が含まれている。雑音抑圧部9501は、復号器から入力された信号に対する雑音抑圧処理を行う。このため、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができる。
特開2002−204175号公報 2007年1月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・コンシューマー・エレクトロニクス、6.1−4、第2号(IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 6.1-4, JAN, 2007)
上述の第一の関連技術では、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができないという問題がある。この問題を解決する手段として、上述の第二の関連技術がある。
しかし、第二の関連技術では、第一の関連技術で送信部が行っていた雑音抑圧処理を受信部が行うため、受信部の演算量が増大するという問題がある。さらに、第二の関連技術では、受信部にノイズサプレッサ以外の重要な機能があるときには、ノイズサプレッサ機能を組み込むことができない、あるいはノイズサプレッサ機能を組み込むことにより他の機能を組み込むことができないという問題がある。これは、一般的に受信部の総演算量に制約があるためである。また、受信部(または再生部)の演算量が多く、音質や受信機機能の制限による利便性の低下を引き起こす。さらに、第一の関連技術及び第二の関連技術の構成も、音声と背景雑音の分離を目的としており、一般的な信号の分離には適用できないという問題がある。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、少ない演算量で受信部を構成でき、あらゆる種類の入力信号に対して入力信号を構成する要素ごとに独立に制御することのできる技術を提供することにある。
上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、前記補正値に基づいて前記分析情報の抑圧係数を補正し、前記補正された分析情報に基づいて、前記信号の音声と背景雑音独立に制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と、音声と背景雑音のエネルギレベルを変更する信号制御情報とを受信し、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、前記補正値に基づいて前記分析情報の抑圧係数を補正し、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の音声と背景雑音独立に制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報と前記レンダリング情報とに基づいて、前記信号の音声と背景雑音独立に制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と信号制御情報と前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、前記補正値に基づいて前記分析情報の抑圧係数を補正し、前記補正された分析情報と前記信号制御情報と前記レンダリング情報とに基づいて、前記音声と背景雑音独立に制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成し、前記補正値に基づいて前記分析情報の抑圧係数を補正し、前記補正された分析情報に基づいて、前記信号の音声と背景雑音独立に制御することを特徴とする信号分析制御方法である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、前記補正された分析情報に基づいて、前記信号の音声と背景雑音独立に制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の音声と背景雑音独立に制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音を制御するための抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、前記補正値に基づいて前記分析情報の抑圧係数を補正する分析情報補正部と、前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報を受け、前記補正された分析情報と前記レンダリング情報とに基づいて、前記信号の音声と背景雑音独立に制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音を制御するための抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、音声と背景雑音のエネルギレベルを変更する信号制御情報と前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、前記補正された分析情報と前記信号制御情報と前記レンダリング情報とに基づいて前記信号の音声と背景雑音独立に制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部とを含み、前記信号制御装置は、前記多重化信号を受信し、当該多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、前記補正値に基づいて前記分析情報の抑圧係数を補正する分析情報補正部と、前記補正された分析情報に基づいて前記信号の音声と背景雑音独立に制御する信号処理部とを含むことを特徴とする信号分析制御システムである。
また、上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、前記補正された分析情報に基づいて、前記信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報を受け、前記補正された分析情報と前記レンダリング情報とに基づいて、前記信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報を受け、前記補正された分析情報と前記レンダリング情報とに基づいて、前記信号の音声と背景雑音独立に制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、コンピュータに、音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号を受信し、当該多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、前記補正された分析情報に基づいて、前記信号の音声と背景雑音独立に制御する信号分析処理とを実行させることを特徴とする信号分析制御プログラムである。
上述した手段によれば、本発明は、送信部で信号の分析を行うので、受信部において信号分析に係る演算量を削減することが出来る。さらに、本発明は、送信部で得られた信号分析情報に基づいて、受信部で複数構成要素からから構成される入力信号を構成要素ごとに制御することができる。
本発明の第一の実施の形態を示すブロック図 符号化部100の構成例 復号部150の構成例 信号分析部101の構成例 信号制御部151の構成例 分析情報計算部121の構成例 信号処理部172の第一の構成例 信号処理部172の第二の構成例 本発明の第二の実施の形態を示すブロック図 信号制御部350の構成例 信号処理部360の第一の構成例 背景音情報修正部460の第一の構成例 背景音情報修正部460の第二の構成例 背景音情報修正部460の第三の構成例 信号処理部360の第二の構成例 信号処理部360の第三の構成例 信号処理部360の第三の構成例 本発明の第三の実施の形態を示すブロック図 出力信号生成部550の構成例 構成要素情報変換部563の構成例 本発明の第四の実施の形態を示すブロック図 出力信号生成部750の構成例 構成要素情報変換部760の構成例 本発明の第五の実施の形態を示すブロック図 信号分析部900の構成例 分析情報計算部911の構成例 本発明の第六の実施の形態を示すブロック図 符号化部1100の構成例 信号分析部1101の構成例 復号部1150の構成例 信号制御部1151の構成例 本発明の第七の実施の形態を示すブロック図 本発明の第八の実施の形態を示すブロック図 信号制御情報に対する係数補正下限値の倍率の関係を示す図 関連例を示すブロック図
符号の説明
1 送受信部
10, 13, 90 送信部
15, 18, 35, 55, 75 受信部
100, 1100 符号化部
101, 900, 1101 信号分析部
102 多重化部
110, 120, 171, 920 変換部
111 量子化部
121, 911 分析情報計算部
150, 1150 復号部
151, 350, 1151 信号制御部
152 分離部
160 逆量子化部
161, 173 逆変換部
172, 360 信号処理部
200, 1020 背景音推定部
2011 抑圧係数計算部
251, 470 乗算器
460 抑圧係数修正部
2610, 2611 係数補正下限値推定部
2620 抑圧係数補正部
4630 係数補正下限値修正部
471 比較部
472 指定背景音制御部
473 スイッチ
550, 750 出力信号生成部
563, 760 構成要素情報変換部
562 レンダリング部
651, 851 構成要素パラメータ生成部
652 レンダリング情報生成部
910 量子化雑音計算部
1300, 1301 コンピュータ
2021 抑圧係数符号化部
本発明の信号分析制御システムの実施の形態について図面を参照して詳細に説明する。
図1を参照し、本発明の信号分析制御システムの第一の実施の形態について説明する。本発明の信号分析制御システムは、送信部10と受信部15とが伝送路を介して接続された構成である。送信部10は、複数音源から構成される入力信号を受信し、伝送信号を出力する。伝送信号は、伝送路を介して、受信部15に入力される。受信部15は、伝送信号を受信し、出力信号を出力する。また、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。
送信部10は、符号化部100、信号分析部101及び多重化部102から構成される。入力信号は、符号化部100及び信号分析部101に入力される。入力信号は、複数の構成要素を含んでいてもよい。信号分析部101は、前記構成要素に基づいて分析情報を算出する。分析情報は、入力信号に含まれる各構成要素間の関係を表す構成要素情報を含んでいてもよい。信号分析部101は、分析情報を多重化部102に出力する。符号化部100は、入力信号を符号化する。符号化部100は、符号化信号を多重化部102に出力する。多重化部102は、符号化部100から入力される符号化信号と信号分析部101から入力される分析情報とを多重化する。多重化部102は、多重化された信号を伝送信号として伝送路に出力する。
受信部15は、復号部150、信号制御部151及び分離部152から構成される。まず、伝送信号は分離部152に入力される。分離部152は、伝送信号を主信号と分析情報に分離する。続いて、分離部152は、主信号を復号部150に、分析情報を信号制御部151にそれぞれ出力する。復号部150は、主信号を復号し、復号信号を生成する。そして、復号部150は、復号信号を信号制御部151に出力する。信号制御部151は、分離部152から受信した分析情報に基づいて、復号部150から受けた復号信号を、構成要素ごとに操作する。信号制御部151は、操作された信号を出力信号として出力する。信号制御部151は構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作してもよい。また、入力信号に含まれる構成要素は音源であってもよい。このとき、信号制御部151は構成要素に対応した音源ごとに操作する。
続いて、図2を参照して、符号化部100の構成例を詳細に説明する。符号化部100は、入力信号を受信し、符号化信号を出力する。符号化部100は、変換部110と量子化部111とから構成される。まず、入力信号が、変換部110に入力される。次に、変換部110は、入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部110は、第一の変換信号を量子化部111に出力する。そして、量子化部111は、第一の変換信号を量子化し、符号化信号として出力する。
変換部110は、複数の入力信号サンプルをまとめて、1ブロックを構成し、このブロックに対して周波数変換を適用する。周波数変換の例としては、フーリエ変換、コサイン変換、KL(カルーネンレーベ)変換などが知られている。これらの変換の具体的な演算に関連する技術及びその性質は、非特許文献2(1990 年、「ディジタル・コーディング・オブ・ウェーブフォームス」、プレンティス・ホール (DIGITAL CODING OF WAVEFORMS, PRINCIPLES AND APPLICATIONS TO SPEECH AND VIDEO, PRENTICE-HALL, 1990.))に開示されている。
変換部110はまた、1ブロックの入力信号サンプルを窓関数で重み付けした結果に対して、前述の変換を適用することができる。このような窓関数としては、ハミング、ハニング(ハン)、ケイザー、ブラックマンなどの窓関数が知られている。また、さらに複雑な窓関数を用いることもできる。これらの窓関数に関連する技術は、非特許文献3(1975 年、「ディジタル・シグナル・プロセシング」、プレンティス・ホール (DIGITAL SIGNAL PROCESSING, PRENTICE-HALL, 1975.))及び非特許文献4(1993 年、「マルチレートシステムズ・アンド・フィルタバンクス」、プレンティス・ホール (MULTIRATE SYSTEMS AND FILTER BANKS, PRENTICE-HALL, 1993.))に開示されている。
変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容してもよい。例えば、ブロック長の30%のオーバラップを適用する場合には、あるブロックに属する信号サンプルの最後30%は、次のブロックに属する信号サンプルの最初30%として複数のブロックで重複して用いられる。オーバラップを有するブロック化と変換に関連する技術は、非特許文献2に開示されている。
さらに、変換部110は、帯域分割フィルタバンクで構成してもよい。帯域分割フィルタバンクは、複数の帯域通過フィルタから構成される。帯域分割フィルタバンクは、受信した入力信号を複数の周波数帯域に分割して、量子化部111に出力する。帯域分割フィルタバンクの各周波数帯域は等間隔であってもよいし、不等間隔であってもよい。不等間隔に帯域分割することによって、低域では狭帯域に分割して時間分解能を低く、高域では広い帯域に分割して時間分解能を高くすることができる。不等間隔分割の代表例には、低域に向かって帯域が逐次半分になるオクターブ分割や人間の聴覚特性に対応した臨界帯域分割などがある。帯域分割フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
量子化部111は、入力された信号の冗長性を除去し、符号化信号を出力する。冗長性を除去する方法としては、入力された信号の相関が最小となるように制御する。さらに、マスキング効果などの聴覚特性を利用し、聴覚上認知されない信号成分を除去してもよい。量子化方法としては、線形量子化、非線形量子化などの量子化方法が知られている。量子化された信号は、ハフマン符号化などを用いてさらに、冗長性を取り除くことができる。
図3を参照して、復号部150の構成例を詳細に説明する。復号部150は、主信号を受信し、復号信号を出力する。復号部150は、逆量子化部160と逆変換部161とから構成される。逆量子化部160は、受信した各周波数の主信号を逆量子化し、複数の周波数成分から構成される第一の変換信号を生成する。そして、逆量子化部160は、第一の変換信号を逆変換部161に出力する。逆変換部161は、第一の変換信号を逆変換して、復号信号を生成する。そして逆変換部161は、復号信号を出力する。
逆変換部161が適用する逆変換は、変換部110が適用する変換と対応する逆変換が選択されることが望ましい。例えば、変換部110が、複数の入力信号サンプルをまとめて1ブロックを構成し、このブロックに対して周波数変換を適用するときには、逆変換部161は同一数のサンプルに対して対応する逆変換を適用する。また、変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容する場合には、これに対応して、逆変換部161は逆変換後の信号に対して同一のオーバラップを適用する。さらに、変換部110を帯域分割フィルタバンクで構成するときには、逆変換部161を帯域合成フィルタバンクで構成する。帯域合成フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
図2及び図3の符号化部100と復号部150 の説明では、内部に変換部を含む変換符号化を想定して説明したが、パルス符号変調(PCM)、適応差分パルス符号変調(ADPCM)、さらにCELPなどに代表される分析合成符号化を適用してもよい。PCM/ADPCMに関連する技術は非特許文献2に開示されている。また、CELPに関連する技術は非特許文献5(1985年3月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・アクースティック・スピーチ・アンド・シグナル・プロセシング、25.1.1、 (IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 25.1.1, MAR, 1985, pp.937-940) 937〜940ページ)に開示されている。
また、符号化部100は、符号化処理を行わずに入力信号をそのまま多重化部102へ出力し、復号部150は、復号処理を行わずに主信号をそのまま信号制御部151に入力してもよい。この構成により、符号化・復号処理に伴う信号の歪をなくすことができる。さらに、無歪の圧縮・伸張処理を符号化部100および復号部150で行うように構成してもよい。この構成により、信号制御部151は、入力信号に歪を生じさせることなく復号信号を受信することができる。
図4を参照し、信号分析部101の構成例を詳細に説明する。信号分析部101は、入力信号を受信し、分析情報を出力する。信号分析部101は、変換部120と分析情報計算部121とから構成される。変換部120は、受信した入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部120は、第二の変換信号を分析情報計算部121に出力する。分析情報計算部121は、第二の変換信号を構成要素に分解し、複数の構成要素間の関係を表す分析情報を生成する。このとき、構成要素は、音源に対応していてもよい。そして、分析情報計算部121は、分析情報を出力する。分析情報には、構成要素を制御する情報である構成要素制御情報を含んでいてもよい。また、分析情報計算部121は、第二の変換信号を複数の構成要素から構成される構成要素群に分解し、分析情報を計算してもよい。信号分析部101は、分析情報に冗長性があるときには、分析情報を符号化してもよい。これにより、分析情報の冗長性を最小化することが出来る。変換部120における変換の方式に関しては、変換部110における変換の方式を用いてもよい。
図5を参照して、信号制御部151の構成例を詳細に説明する。信号制御部151は、復号信号と分析情報とを受信し、出力信号を出力する。信号制御部151は、変換部171、信号処理部172及び逆変換部173から構成される。変換部171は、受信した復号信号を周波数成分に分解し、第二の変換信号を生成する。変換部171は、第二の変換信号を信号処理部172に出力する。信号処理部172は、第二の変換信号を、分析情報に基づいて音源に対応した構成要素を制御し、複数の構成要素間の関係を変更し、修正復号信号を生成する。そして、信号処理部172は、修正復号信号を逆変換部173に出力する。また、信号処理部172は、複数の構成要素から構成される構成要素群に分解し、複数の構成要素間の関係を変更してもよい。分析情報計算部121において分析情報が符号化されている場合には、信号処理部172は復号処理を行ってから上記の処理を行う。逆変換部173は、修正復号信号を逆変換し、出力信号を生成する。そして、逆変換部173は出力信号を出力する。逆変換部173における逆変換の方式に関しては、逆変換部161における逆変換の方式を用いることが出来る。
以下、複数の構成要素から構成される入力信号の一例として、目的音と背景音とから構成される入力信号を用いてより詳細に説明する。信号分析部101は、目的音と背景音とから構成される入力信号を受信し、目的音と背景音との関係を表す抑圧係数情報を計算し、分析情報として多重化部102に出力する。抑圧係数情報は、背景音を抑圧するために目的音と背景音とから構成される入力信号に作用される情報である。また、信号制御部151は、抑圧係数情報と復号信号とを受信し、目的音と背景音を制御して出力信号を生成し、出力する。
続いて、図6を参照して、分析情報計算部121の構成例を詳細に説明する。分析情報計算部121は、第二の変換信号を受信し、分析情報として抑圧係数情報を出力する。分析情報計算部121は、背景音推定部200と抑圧係数計算部2011と抑圧係数符号化部2021から構成される。
背景音推定部200は、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。背景音推定部200は、背景音推定結果を抑圧係数計算部2011に出力する。背景音推定結果としては、背景音の振幅絶対値やエネルギ、背景音と入力信号との振幅比やエネルギ比及びこれらの平均値、区間最大値、区間最小値などがある。
抑圧係数計算部2011は、第二の変換信号と背景音推定結果とを用いて、背景音を抑圧するための抑圧係数を計算する。そして、抑圧係数計算部2011は、抑圧係数を抑圧係数符号化部2021に出力する。抑圧係数の計算方法に関連する技術としては、非特許文献6(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号、(IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO. 6, PP. 1109-1121, Dec. 1984) 1109〜1121ページ)に開示されている最小平均二乗誤差短時間スペクトル振幅に基づく方法(MMSE STSA)、非特許文献7(1985年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第33巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.33, NO. 2, PP. 443-445, Apr. 1985) 443〜445ページ)に開示されている最小平均二乗誤差対数スペクトル振幅に基づく方法(MMSE LSA)、非特許文献8(2005年7月、ユーラシップ・ジャーナル・オン・アプライド・シグナル・プロセシング、第2005巻、第7号、 (EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, VOLUME 2005, Issue 7, JUL, 2005, pp.1110-1126.)1110〜1126ページ)に開示されている最尤スペクトル振幅推定に基づく方法などを用いてもよい。
抑圧係数符号化部2021は、抑圧係数を符号化し、符号化結果を抑圧係数情報として出力する。符号化については、すでに量子化部111に関して説明した内容と同様の方法を用いてもよい。符号化により、抑圧係数の冗長性を除去することが出来る。また、抑圧係数符号化部2021は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、抑圧係数を抑圧係数情報として出力してもよい。
図7を参照して、信号処理部172の第一の構成例を詳細に説明する。信号処理部172は、第二の変換信号と、分析情報として抑圧係数情報を受信し、修正復号信号を出力する。信号処理部172は、抑圧係数復号部260と係数補正下限値推定部2610と抑圧係数補正部2620と乗算器251とから構成される。
抑圧係数復号部260は、受信した抑圧係数情報から抑圧係数を復号し、抑圧係数を係数補正下限値推定部2610と抑圧係数補正部2620に出力する。抑圧係数が符号化されていないときには、抑圧係数復号部260は、復号処理を行わず、抑圧係数を直接出力する。
係数補正下限値推定部2610は、抑圧係数から抑圧係数を補正する補正値を推定する。補正値は、係数補正下限値であってもよい。以下、補正値を係数補正下限値として説明する。係数補正下限値推定部2610は、係数補正下限値を抑圧係数補正部2620に出力する。係数補正下限値は、抑圧係数の下限値を表している。一般的に、抑圧係数が小さくなりすぎると、背景音抑圧後に発生する信号歪が増加する。そこで、係数補正下限値を用いることにより、信号歪の過剰な増加を避けることができる。係数補正下限値は、あらかじめ特定の値をメモリに記憶しておいてもよいし、抑圧係数に応じて計算しても良い。このような計算には、メモリに記憶された複数の値から適切な値を選択する操作も含む。係数補正下限値は、背景音推定結果が小さいときに小さくなるように設定すると良い。背景音推定結果が小さいときは、入力信号において目的音が支配的であることを表し、構成要素の操作において歪を生じにくいためである。以下では、係数補正下限値を抑圧係数から推定する方法について詳細に説明する。
係数補正下限値を推定する第一の方法としては、抑圧係数を周波数方向に平滑化した値を係数補正下限値とする方法が用いられても良い。例えば、ある時刻nにおける周波数fの抑圧係数をG(n,f),f=0,…,F-1とする。このとき、数1のように係数補正下限値L(f),f=0,…,F-1が算出される。
Figure 0005668923
ここで、Fは周波数方向の抑圧係数の数であり、max(x,y)はxとyの大きい方を表す。T1(n,f)とT2(n,f)は中間パラメータであり、a(f), b(f), c(f)はそれぞれ平滑化のためのパラメータであり、0から1の値をとる。なお、a(f), b(f), c(f)は周波数方向に一定の値としても良い。例えば、a(f)=0.8, b(f)=0.7, c(f)=0.2と設定する。
係数補正下限値の推定に関する第二の方法として、抑圧係数G(n,f)の周波数方向の移動平均を用いることができる。この場合、係数補正下限値は、
Figure 0005668923
となる。ここで、w(m)は移動平均の重みであり、w(m)の総和が1となるように設定することができる。c(f)は平滑化のためのパラメータであり、0から1の値をとる。なお、c(f)は周波数方向に一定の値としても良い。例えば、c(f)=0.2と設定する。
また、係数補正下限値推定の第三の方法として、抑圧係数G(n,f)を時間及び周波数方向、あるいは、どちらか一方向にグループ化し、各グループ内の抑圧係数の最小値あるいは平均値を当該グループの係数補正下限値としても良い。周波数方向のグループ化は人間の聴覚特性にあわせ、低周波数帯域は少ない数の抑圧係数をグループ化し、高周波数帯域は多くの数の抑圧係数をグループ化することができる。このグループ化は予め設定しておいてもよいし、抑圧係数に応じて計算しても良い。
係数補正下限値推定の第四の方法として、抑圧係数を信号対背景音比に変換した後、信号対背景音比から係数補正下限値を算出することができる。以下、抑圧係数を信号対背景音比に変換する具体的な手順について説明する。なお、簡略のため抑圧係数G(n,f)の時間及び周波数方向のインデックスn,fを省略し、Gとする。信号対背景音比の推定値をR、入力信号をX、目的音をS、背景音をN、背景音推定値をNハットとすると、次の関係が成立する。
Figure 0005668923
Figure 0005668923
Figure 0005668923
この定義によるRは、背景音が雑音であるときに、事前信号対雑音比(事前SNR)として知られている。Nハット=Nとして、式[数3]と[数4]を[数5]に代入すると、
Figure 0005668923

を得る。
また、信号対背景音比Rの定義として、[数5]の代わりに
Figure 0005668923
を用いる場合、Nハット=Nとして、[数3]と[数4]を[数7]に代入し、SとNが無相関であるとすると、
Figure 0005668923
を得る。この定義による信号対背景音比Rは、背景音が雑音であるときに、事後信号対雑音比(事後SNR)として知られている。[数6]あるいは[数8]を用いて信号対背景音比を抑圧係数から計算することが出来る。
信号対背景音比から係数補正下限値を計算する方法は、特許文献1に開示されている方法を用いてもよい。まず、信号対背景音比を時間及び周波数方向、あるいは、どちらか一方向にグループ化し、各グループ内の信号対背景音比の平均値が当該グループの平均信号対背景音比として算出される。その後、平均信号対背景音比に応じて予め設定した係数補正下限値が算出される。さらに、周波数方向のグループ化は人間の聴覚特性にあわせ、低周波数帯域は少ない数の信号対背景音比をグループ化し、高周波数帯域は多くの数の信号対背景音比をグループ化してもよい。このグループ化は予め設定しておいてもよいし、抑圧係数あるいは信号対背景音比に応じて計算しても良い。
さらに、上記のように算出した係数補正下限値を時間方向に平滑化しても良い。また、時間方向に平滑化した抑圧係数を用いて上記平滑化方法を適用して、係数補正下限値を算出しても良い。
抑圧係数補正部2620は、抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を乗算器251に出力する。抑圧係数と係数補正下限値とから補正抑圧係数を算出する方法は、特許文献1に開示されている方法を用いてもよい。特許文献1に開示されている方法は、抑圧係数と係数補正下限値とを比較する方法である。抑圧係数が係数補正下限値より大きい場合は、抑圧係数補正部2620は補正抑圧係数として抑圧係数を出力する。また、抑圧係数が係数補正下限値より小さい場合は、抑圧係数補正部2620は補正抑圧係数として係数補正下限値を出力する。
乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
次に、図8を参照して、信号処理部172の第二の構成例を詳細に説明する。信号処理部172は、第二の変換信号と、分析情報として抑圧係数情報を受信し、修正復号信号を出力する。信号処理部172は、抑圧係数復号部260と係数補正下限値推定部2611と抑圧係数補正部2620と乗算器251とから構成される。信号処理部172の第一の構成例を示す図7と比較すると、係数補正下限値推定部2610が係数補正下限値推定部2611に置換されている。図7に示される信号処理部172の第一の構成例と重複する部分の説明は省略し、係数補正下限値推定部2611について説明する。
係数補正下限値推定部2611は、抑圧係数と第二の変換信号とから係数補正下限値を推定し、係数補正下限値を抑圧係数補正部2620に出力する。上述した係数補正下限値推定の第四の方法と同様にして、抑圧係数を信号対背景音比に変換し、信号対背景音比と第二の変換信号から[数7]を用いて背景音を算出する。
また、信号対背景音比を求める場合に、第二の変換信号が用いられてもよい。第二の変換信号における量子化誤差をゼロとすると、第二の変換信号はXである。従って、[数4]を用いれば、目的音Sが得られる。ここで、一般的に[数4]を用いて得られるものはSの推定値であるSハットとなる。これは、抑圧係数Gが完璧な値として求められることが、実際には少ないからである。一般的には、抑圧係数の誤差がSとSハットの差を生じさせる。従って、SハットはSと残留背景音の和として表される。残留背景音をNとすれば、Nハットと同様の手段でNを推定することができる。このようにして求めたSとNを[数5]に代入してRを求めることができる。このようにして求められたRは、目的音と背景音を分離した後の信号対背景音比を表し、利用者が聴取する信号の信号対背景音比となる。このため、上記Rを用いることで、より利用者の知覚に適応した係数補正下限値を求めることができる。
さらに、背景音を時間及び周波数方向、あるいは、どちらか一方向にグループ化し、各グループ内の背景音の平均値を当該グループの平均背景音として算出した後、平均背景音に応じて予め設定した係数補正下限値を算出してもよい。周波数方向のグループ化は人間の聴覚特性にあわせ、低周波数帯域は少ない数の背景音をグループ化し、高周波数帯域は多くの数の背景音をグループ化することができる。このグループ化は予め設定しておいてもよいし、抑圧係数、信号対背景音比、あるいは背景音に応じて計算しても良い。
また、上記で説明した分析情報は、複数の周波数帯域で共通の分析情報として算出されてもよい。たとえば、送信部10は、等間隔に周波数帯域を分割し、分割した周波数帯域毎に分析情報を算出してもよい。さらに、送信部10は、人間の聴覚特性にあわせて分析情報を算出してもよい。すなわち、送信部10は低周波数帯域を細かく分割し、高周波数帯域は荒く分割し、分割した単位で分析情報を算出してもよい。これにより、分析情報の情報量を削減することができる。
以上説明したように、本発明の第一の実施の形態によれば、送信部から出力される入力信号の分析情報に基づいて、受信部で複数の構成要素で構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。さらに、抑圧係数を、係数補正下限値を用いて補正することにより、信号歪の増加を避けることが出来る。
本発明の第二の実施の形態について、図9を参照して詳細に説明する。本発明の第二の実施の形態において、受信部35は信号制御情報を受信できる構成を有し、特定の構成要素を独立に制御することができる。図9に示される第二の実施の形態と図1に示される第一の実施の形態とを比較すると、受信部15に含まれる信号制御部151が、本実施の形態では受信部35に含まれる信号制御部350で構成されている。また、本実施の形態において、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。以降、図1と重複する部分の説明は省略する。
図10を参照して、信号制御部350の第一の構成例について詳細に説明する。信号制御部350は、変換部171、信号処理部360及び逆変換部173から構成される。第一の実施の形態と比較すると、信号制御部151に含まれる信号処理部172が、本実施の形態では信号処理部360で構成されている。信号制御部350は、復号信号、分析情報及び信号制御情報を受信し、出力信号を出力する。信号制御部350は、信号制御情報と分析情報とに基づいて、復号部150から受けた復号信号を、構成要素ごとに操作する。また、信号制御部350は、構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作してもよい。信号処理部360は、変換部171からの第二の変換信号、分離部152から信号制御情報を受信する。さらに、信号処理部360は、信号制御情報を受信する。そして、信号処理部360は、分析情報と信号制御情報とに基づいて、第二の変換信号の周波数成分の構成要素を制御し、修正復号信号を生成する。信号処理部360は、修正復号信号を逆変換部173に出力する。
さらに、具体的には、信号処理部360は、分析情報に基づいて、周波数毎の分析パラメータを導出する。そして、信号処理部360は、第二の変換信号を、分析パラメータに基づいて、構成要素に分解する。さらに、信号処理部360は、信号制御情報に基づく周波数毎のパラメータに応じて、複数の構成要素間の関係を変更した修正復号信号を作成する。信号処理部360は、修正復号信号を逆変換部173に出力する。また、信号処理部360は、分析パラメータに基づいて、複数の構成要素から構成される構成要素群に分解してもよい。
信号制御情報は、入力信号の各構成要素を周波数ごとに制御する情報である。つまり、信号制御情報は、構成要素間の関係、例えば、目的音と背景音とから構成される場合には目的音と背景音のエネルギレベルを変更するための情報である。信号制御情報は、利用者によって外部から入力されることとしてもよい。例えば、外部から入力される信号制御情報としては、受信部に予め登録されていた利用者の嗜好などの個人情報、受信部の動作状態(スピーカをオフにしてあるなどの外部環境情報を含む)、受信部の種類や形式、電源や電池の利用状態や残量、アンテナの種類や状態(折りたたまれているなどの形状、向きなど)がある。また、信号制御情報は、別の形式で自動的に獲得されることとしてもよい。信号制御情報は、受信部内部または近傍に設置されたセンサを経由して、自動的に獲得されることとしてもよい。例えば、自動的に獲得される信号制御情報としては、外部雑音量、明るさ、時間帯、地理的な位置、気温、映像との同期情報、カメラを通じたバーコード情報などがある。
以下、複数の構成要素から構成される入力信号の一例として、目的音と背景音とから構成される入力信号を用いてより詳細に説明する。信号制御部350は、信号制御情報と分析情報である抑圧係数情報と復号信号とを受信し、目的音と背景音を制御して出力信号を生成し、出力する。抑圧係数情報は、背景音を抑圧するために目的音と背景音とから構成される入力信号に作用される情報である。また、信号制御部350は抑圧係数情報を用いて復号信号を制御する。
続いて、図11を参照して、信号処理部360の構成例について詳細に説明する。信号処理部360は、第二の変換信号、抑圧係数情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、抑圧係数復号部260と係数補正下限値推定部2610と抑圧係数修正部460と乗算器251とから構成される。図7を用いて説明した信号処理部172と比較すると、抑圧係数補正部2620が、図11では抑圧係数修正部460で構成されている。以降、図7と重複する部分の説明は省略し、抑圧係数修正部460について説明する。
抑圧係数修正部460は、抑圧係数と係数補正下限値とから補正抑圧係数を算出し、外部から入力された信号制御情報を用いて補正抑圧係数を修正することにより修正抑圧係数を算出し、出力する。
図12を参照して、抑圧係数修正部460の第一の構成例を詳細に説明する。抑圧係数修正部460は、抑圧係数と係数補正下限値と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、抑圧係数補正部2620と乗算器470とから構成される。抑圧係数補正部2620は、第一の実施の形態で説明したように抑圧抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を乗算器470に出力する。乗算器470は、補正抑圧係数と信号制御情報との積を計算し、修正抑圧係数を出力する。本構成例では、信号制御情報は、補正抑圧係数に対する倍率として入力される。このような構成により、簡易な信号制御情報により補正抑圧係数を制御することができる。
図13を参照して、抑圧係数修正部460の第二の構成例を詳細に説明する。抑圧係数修正部460は、抑圧係数と係数補正下限値と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、抑圧係数補正部2620と比較部471とから構成される。抑圧係数補正部2620は、第一の実施の形態で説明したように抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を比較部471に出力する。比較部471は、補正抑圧係数と信号制御情報を比較して、その比較結果に応じた信号を出力する。例えば、比較部471は、最大比較を行う場合は、補正抑圧係数と信号制御情報との大きい方の値を出力する。また、比較部471は、最小比較を行い、補正抑圧係数と信号制御情報との小さい方の値を出力してもよい。これらの場合には、信号制御情報には、補正抑圧係数の最大値または最小値が入力される。このような構成により、出力信号の範囲を予め規定することができ、想定外の信号が出力されて音質を損ねることを回避できる。
図14を参照して、抑圧係数修正部460の第三の構成例を詳細に説明する。抑圧係数修正部460の第三の構成例は、上述の第一の構成例と第二の構成例とを組み合わせたものである。抑圧係数修正部460は、抑圧係数と係数補正下限値と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、抑圧係数補正部2620、乗算器470、比較部471、指定抑圧係数制御部472及びスイッチ473から構成される。抑圧係数補正部2620は、第一の実施の形態で説明したように抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を乗算器470と比較部471とに出力する。指定抑圧係数制御部472は、信号制御情報を乗算器470、比較部471、又はスイッチ473に出力する。ここで、信号制御情報には、乗算器470で使用する補正抑圧係数の倍率と、比較部471で使用する抑圧係数の最大値または最小値とを少なくとも含む。さらに、信号制御情報には、スイッチ473における選択のための制御情報が含まれても良い。指定抑圧係数制御部472は、信号制御情報として補正抑圧係数の倍率を受信した場合は、補正抑圧係数の倍率を乗算器470に出力する。乗算器470は、補正抑圧係数と補正抑圧係数の倍率との積を計算し、修正抑圧係数をスイッチ473に出力する。指定抑圧係数制御部472は、信号制御情報として抑圧係数の最大値または最小値を受信した場合は、抑圧係数の最大値または最小値を比較部471に出力する。比較部471は、補正抑圧係数と抑圧係数の最大値または最小値とを比較して、その比較結果に応じた信号を修正抑圧係数としてスイッチ473に出力する。指定抑圧係数制御部472は、選択のための制御情報を受信して、制御情報をスイッチ473に出力する。スイッチ473は、指定抑圧係数制御部472から入力された信号制御情報に応じて、乗算器470の出力または比較部471の出力のいずれかを選択して出力する。
抑圧係数修正部460の第三の構成例では、補正抑圧係数に倍率を作用させて修正抑圧係数を求める機能と、補正抑圧係数に抑圧係数の最大値と最小値を作用させて修正抑圧係数を求める機能とを、信号制御情報で適宜選択して実現してもよい。この構成により、前記第一の構成例と前記第二の構成例の効果を併せて実現することができる。
続いて、図15を参照して、信号処理部360の第二の構成例について詳細に説明する。信号処理部360は、第二の変換信号、抑圧係数情報及び信号制御情報を受信し、修正抑圧係数を出力する。信号処理部360は、抑圧係数復号部260と係数補正下限値推定部2610と係数補正下限値修正部4630と抑圧係数補正部2620と乗算器251とから構成される。上述の図11の構成では信号制御情報により抑圧係数を修正していたが、本構成は信号制御情報により係数補正下限値を修正する点が異なる。これに伴い、抑圧係数と修正した係数補正下限値とから修正抑圧係数を算出する。また、図7を用いて説明した信号処理部172と比較すると、図15では係数補正下限値修正部4630が追加されている。以降、図7と重複する部分の説明は省略し、係数補正下限値修正部4630について説明する。
係数補正下限値修正部4630は、外部から入力された信号制御情報を用いて係数補正下限値を修正する。以下、係数補正下限値の修正方法を説明する。小さな抑圧係数は背景音を強力に抑圧するが、同時に目的音の一部も抑圧する。つまり、一般に、残留背景音と出力信号歪との大きさはトレードオフの関係にあり、小さな残留背景音と小さな出力信号歪とを同時に満たすことはできない。このため、過小な抑圧係数を用いると出力される目的音に含まれる歪が増加する。そこで、係数補正下限値で抑圧係数の最小値を保証し、出力信号における歪の最大値を一定の範囲に収める必要がある。そこで、過剰な抑圧による出力信号歪の増加を避けるためにある程度の残留背景音を許容する、若しくは、十分小さな残留背景音のために過剰な抑圧による出力信号歪を許容するかのどちらかを受け入れる必要がある。係数補正下限値はこのトレードオフを制御するために用いられている。従って、係数補正下限値を信号制御情報により修正することにより、残留背景音と出力信号歪の大きさとのトレードオフを制御することができる。このような構成により、信号制御情報により抑圧係数を容易に制御することができる。
本構成例において、例えば、信号制御情報として許容される残留背景音の大きさが入力されてもよい。この場合、許容される残留背景音の大きさから係数補正下限値の倍率を生成し、係数補正下限値の倍率を係数補正下限値に乗算することにより係数補正下限値を修正しても良い。この場合の信号制御情報に対する係数補正下限値の倍率の関係の一例を図34に示す。図34は、信号制御情報が大きい場合に係数補正下限値の倍率が大きくなる、右肩上がりの特性を有している。係数補正下限値の倍率が大きい場合は、係数補正下限値は増幅されて利用される。このために、より大きな係数補正下限値を用いたことと等価になる。
すなわち、より大きな残留雑音を許容し、出力信号歪を小さくする。反対に、係数補正下限値の倍率が大きい場合には、係数補正下限値の効果は弱められる。これは、より強力な抑圧が実行されることを意味する。図34において、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪は最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音は最小になる。
続いて、図16を参照して、信号処理部360の第三の構成例について詳細に説明する。信号処理部360は、第二の変換信号、抑圧係数情報及び信号制御情報を受信し、修正抑圧係数を出力する。信号処理部360は、抑圧係数復号部260と係数補正下限値推定部2611と抑圧係数修正部460と乗算器251とから構成される。上述の図11の構成とは係数補正下限値推定部2610が係数補正下限値推定部2611に置換されている。図11と重複する部分の説明は省略する。また、係数補正下限値推定部2611は、第一の実施の形態で説明したように、抑圧係数と第二の変換信号とから係数補正下限値を推定し、係数補正下限値を抑圧係数修正部460に出力する。
続いて、図17を参照して、信号処理部360の第四の構成例について詳細に説明する。信号処理部360は、第二の変換信号、抑圧係数情報及び信号制御情報を受信し、修正抑圧係数を出力する。信号処理部360は、抑圧係数復号部260と係数補正下限値推定部2611と係数補正下限値修正部4630と抑圧係数補正部2620と乗算器251とから構成される。上述の図15の構成とは係数補正下限値推定部2610が係数補正下限値推定部2611に置換されている。図15と重複する部分の説明は省略する。また、係数補正下限値推定部2611は、第一の実施の形態で説明したように、抑圧係数と第二の変換信号とから係数補正下限値を推定し、係数補正下限値を抑圧係数修正部4630に出力する。
本発明の第二の実施の形態によれば、受信部で受けた信号制御情報に基づいて、特定の構成要素だけを独立に制御することができる。また、送信部で信号の分析を行い、受信部にて複数の構成要素から構成される入力信号を構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部の信号分析に係る演算量を削減することが出来る。
本発明の第三の実施の形態を、図18を参照して説明する。図18と第二の実施の形態を表す図9を比較すると、受信部35が、図18では受信部55で構成される点で異なる。受信部55は、伝送信号と信号制御情報と構成要素レンダリング情報を入力とし、複数の出力チャネルから構成される出力信号を出力する。第二の実施の形態と比較して、構成要素レンダリング情報も入力とする点、出力信号が複数の出力チャネルから構成される信号である点、が異なる。
構成要素レンダリング情報とは、入力信号の構成要素を複数の出力チャネルに出力するための情報である。つまり、構成要素レンダリング情報は、復号信号に含まれる構成要素と受信部55の出力信号との関係を周波数成分毎に表した情報である。たとえば、復号信号に混合されている各構成要素の定位情報を表す。音像をぼかしたりして定位感を操作するための情報を含んでいてもよい。
構成要素レンダリング情報を利用することにより、構成要素ごとに各出力チャネルへの出力信号を制御することができる。各構成要素は、特定の1つの出力チャネル(例えばスピーカ)から出力してもよいし、複数の出力チャネルに分配して出力してもよい。例えば、構成要素が目的音と背景音である場合には目的音を特定の出力チャネルのみから出力し、背景音をその他の出力チャネルから出力することにより、目的音は明確に定位させ、環境音により臨場感を向上させることができる。
受信部55は、第二の実施の形態で説明した図9の受信部35と比較すると、信号制御部350が出力信号生成部550で構成される点で異なる。出力信号生成部550は、復号信号、分析情報、信号制御情報に加えて、構成要素レンダリング情報も入力される。
本実施の形態の特徴である出力信号生成部550の構成例を、図19を参照して、目的音と背景音の混在した入力信号を例として説明する。出力信号生成部550は、構成要素情報変換部563とレンダリング部562とから構成される。
図20に構成要素情報変換部563の構成例を示す。構成要素情報変換部563は、構成要素パラメータ生成部651とレンダリング情報生成部652とから構成される。構成要素情報変換部563は、分析情報と信号制御情報と構成要素レンダリング情報とからレンダリング情報を計算し、レンダリング情報を出力する。以下、目的音と背景音とから構成される入力信号を対象とし、分析情報が抑圧係数情報の場合を例として、構成要素パラメータ生成部651とレンダリング情報生成部652の構成をより詳細に説明する。
まず、構成要素パラメータ生成部651は、抑圧係数情報から抑圧係数を復号する。次に、構成要素パラメータ生成部651は、抑圧係数から係数補正下限値を推定する。そして、構成要素パラメータ生成部651は、抑圧係数と係数補正下限値から、各周波数成分に対応した補正抑圧係数を生成する。その後、構成要素パラメータ生成部651は、信号制御情報と補正抑圧係数に基づき構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。なお、係数補正下限値の推定方法ならびに補正抑圧係数の算出方法は第一の実施の形態で説明した通りである。
構成要素パラメータ算出の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f) , i=1,2,…,P(Pは復号信号のチャネル数)とし、目的音を制御するための信号制御情報をAmain(f)、背景音を制御するための信号制御情報をAsub(f)とすると、構成要素パラメータH(f)は、
Figure 0005668923
と表せる。
レンダリング情報生成部652は、構成要素パラメータH(f)と構成要素レンダリング情報U(f)に基づき、復号信号と出力信号の関係を表すレンダリング情報を出力する。具体例として、W(f)=U(f)×H(f)とすることができる。
なお、レンダリング情報は修正復号信号と出力信号生成部550の出力信号との関係を周波数成分毎に表した情報であり、信号間のエネルギ差、時間差や相関などを用いて表すことができる。レンダリング情報の一例として非特許文献10(2007年、アイエスオー/アイイシー 23003-1:2007 パート1 エムペグ サラウンド、(ISO/IEC 23003-1:2007 Part 1 MPEG Surround))に開示された情報が知られている。
また、構成要素情報変換部563の他の構成例として、図20における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、統合されたユニットは、抑圧係数情報と信号制御情報と構成要素レンダリング情報とからレンダリング情報を生成し、出力する。まず、統合されたユニットは抑圧係数情報から抑圧係数を復号する。次に、抑圧係数から係数補正下限値を推定し、抑圧係数と係数補正下限値に基づいて各周波数成分に対応した補正抑圧係数を生成する。そして、統合されたユニットは補正抑圧係数と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報を出力する。具体例として、レンダリング情報W(f)は、
Figure 0005668923
と表せる。
さらに、構成要素情報変換部563で抑圧係数情報と、信号制御情報及び構成要素レンダリング情報とからレンダリング情報を算出する際に、第二の実施の形態に記載したように係数補正下限値を信号制御情報により修正した後、修正した係数補正下限値と抑圧係数から修正抑圧係数を算出し、修正抑圧係数と構成要素レンダリング情報を用いてレンダリング情報を算出することもできる。この場合、レンダリング情報W(f)は、修正抑圧係数をg’i(f) , i=1,2,…,P(Pは復号信号のチャネル数)とすると、
Figure 0005668923
となる。
このような構成にすることにより、復号信号に含まれる各構成要素を制御するための情報をレンダリング情報に含めることができる。
レンダリング部562は、構成要素情報変換部563から出力されたレンダリング情報を用いて、復号信号を変換して出力信号を生成し、出力信号生成部550の出力信号として出力する。
変換の方法として、非特許文献10に開示された方法が知られている。非特許文献10に開示されているMPEG Surroundデコーダを用いた場合、レンダリング情報としてMPEG Surroundデコーダに供給されるデータストリームを出力する。なお、MPEG Surroundデコーダ内で使用するパラメータをデータストリームに変換することなくレンダリング部に供給してもよい。
ある周波数帯域fにおける復号信号の周波数成分をXk(f), k=1,2,…,P(Pは復号信号のチャネル数)、出力信号の周波数成分をVk(f), k=1,2,…,Q(Qは出力信号のチャネル数)とし、
Figure 0005668923
Figure 0005668923
とすると、レンダリング部の動作は、V(f)=W(f)×X(f)となる。
以上説明したように、本発明の第三の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。また、信号制御情報に基づいて、特定の構成要素だけを独立に制御することもできる。入力信号が複数の音源から構成される場合は、特定の音源について独立に制御することができる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第四の実施の形態は、構成要素レンダリング情報に信号の分離を制御するための、すなわち構成要素を独立に制御するための信号制御情報を含むものである。図21を参照し、本発明の第四の実施の形態を説明する。図21と第三の実施の形態を表す図18とを比較すると、図18の受信部55が、図21では受信部75で構成されている点で異なる。受信部75は、伝送信号と構成要素レンダリング情報とを入力とし、複数の出力チャネルから構成される信号を出力信号として出力する。第三の実施の形態における受信部55とは、信号制御信号を入力としない点と、出力信号生成部550が出力信号生成部750で置換されている点で異なる。なお、本実施の形態における構成要素レンダリング情報は、復号信号に含まれる各構成要素を操作するための情報を含んでいてもよい。出力信号生成部750は、各構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作することも可能である。また、信号は一般的な複数音源から構成されるものであってもよい。以下、本実施の形態の特徴である出力信号生成部750の構成例について説明する。
図22に、図21の出力信号生成部750の構成例を示す。出力信号生成部750は、構成要素情報変換部760とレンダリング部562とから構成される。出力信号生成部750は、第三の実施の形態における図19に示す出力信号生成部550とは、構成要素情報変換部563が構成要素情報変換部760で構成されている点で異なる。以下、構成要素情報変換部760の構成例について説明する。
構成要素情報変換部760は、分析情報と構成要素レンダリング情報とからレンダリング情報を計算し、レンダリング情報を出力する。以下、複数の音源、目的音と背景音とから構成される入力信号を対象とし、分析情報が抑圧係数情報の場合を例として、図23を参照して構成要素情報変換部760の構成例を説明する。構成要素情報変換部760は、構成要素パラメータ生成部851とレンダリング情報生成部652とから構成される。なお、抑圧係数情報は送信部10における信号分析部101が算出する。抑圧係数情報を分析情報として用いた場合の信号分析部101については第一の実施の形態において詳細に説明しているため、説明を省略する。
構成要素パラメータ生成部851は、抑圧係数情報を受信し、抑圧係数情報を復号する。そして、構成要素パラメータ生成部851は、抑圧係数情報に基づいて各周波数成分に対応した抑圧係数を算出し、抑圧係数から係数補正下限値を推定する。さらに、構成要素パラメータ生成部851は、抑圧係数と係数補正下限値から補正抑圧係数を算出し、補正抑圧係数を構成要素パラメータとしてレンダリング情報生成部652へ出力する。なお、係数補正下限値の推定方法ならびに補正抑圧係数の算出方法は第一の実施の形態で説明した通りである。
この変換の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f)とすると、構成要素パラメータH(f)は、[数9]において、Amain(f)=1、Asub(f)=1の場合となる。すなわち、
Figure 0005668923
となる。レンダリング情報生成部652については、第三の実施の形態において、図20を用いて説明したとおりであるため、説明を省略する。
本構成例では、レンダリング情報に構成要素ごとの制御を行うための情報を含ませ、レンダリング部562で、構成要素ごとの操作を実現することを特徴とする。このため、制御を行うための情報の種類が削減され、制御が容易になる。
以上説明したように、本発明の第四の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第五の実施の形態は、符号化部において発生した量子化歪みの影響を考慮に入れた分析を行うことを特徴とする。図24を参照して本発明の第五の実施の形態を詳細に説明する。図1に示される本発明の第一の実施の形態と比較すると、第一の実施の形態における送信部10が送信部90で置換されている。さらに、送信部10に含まれる信号分析部101が、送信部90に含まれる信号分析部900で置換されている。また、信号分析部900には、入力信号と符号化部100からの符号化信号が入力されている。
また、第二の実施の形態から第四の実施の形態において、送信部10に含まれる信号分析部101を本実施の形態の信号分析部900で置換することとしてもよい。この場合、入力信号と符号化部100からの符号化信号が信号分析部900に入力されるようにすればよい。
第五の実施の形態によると、信号分析部900が符号化部において発生した量子化歪みの影響を考慮に入れた分析を行うことにより、受信部15において復号を行う際に発生する量子化歪みを低減することが可能になる。
図25を参照して、信号分析部900の第一の構成例について詳細に説明する。信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、入力信号と符号化部100からの符号化信号とから分析情報を生成する。符号化信号は量子化歪みの加わった信号であるので、量子化歪み量を考慮して分析情報を生成することが出来る。
信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、変換部120、復号部150、量子化歪み計算部910、分析情報計算部911及び変換部920から構成される。
入力信号は、変換部120に入力される。また、符号化部100からの符号化信号は、復号部150に入力される。
復号部150は、符号化部100から入力された符号化信号の復号を行う。復号部150は、復号信号を変換部920へ出力する。変換部920では、復号信号を周波数成分へと分解する。変換部920は、周波数成分分解された復号信号を量子化歪み計算部910へ出力する。
変換部120は、入力信号を周波数成分へと分解する。変換部120は、周波数成分分解された入力信号を量子化歪み部910および分析情報計算部911へ出力する。量子化歪み計算部910は、周波数成分分解された復号信号と周波数成分分解された入力信号とを比較し、量子化歪み量を周波数成分ごとに計算する。このために、通常は変換部920と変換部120とは、同一の変換を実行する。これらが同一の変換を実行しない場合には、少なくとも量子化歪計算部910において、同等の信号の間で量子化歪を計算することができるように、周波数帯域や変換成分などの整合をとる処理が必要となる。量子化歪の計算は、例えば、周波数成分分解された復号信号の各周波数成分の大きさと周波数成分分解された入力信号の各周波数成分の大きさとの差をとることでその周波数における量子化歪みとしてもよい。量子化歪み計算部910は、各周波数の量子化歪み量を分析情報計算部911に出力する。
分析情報計算部911は、変換部120から周波数成分分解された入力信号を受信し、量子化歪み計算部910から各周波数の量子化歪み量を受信する。分析情報計算部911は、周波数成分分解された入力信号について、各周波数成分に対応した入力信号を構成要素ごとに分解する。信号は一般的な複数音源から構成されるものであってもよい。そして、分析情報計算部911は、複数の構成要素間の関係を表す分析情報を生成する。分析情報計算部911は、分析情報を出力する。また、周波数成分分解された入力信号について、分析情報計算部911は、複数の構成要素から構成される構成要素群に分解することとしてもよい。
分析情報計算部911は、量子化歪み量を考慮し、受信部における復号の際に、量子化歪みが低減されるように分析情報の計算を行う。例えば、分析情報計算部911は、周波数成分分解された入力信号の各周波数成分の大きさとその周波数における量子化歪みの大きさとから、量子化歪みが聴覚マスキングされるように、分析情報を計算してもよい。ここで、分析情報計算部911は、聴覚マスキングにおいて、周波数成分の大きさが大きい周波数の周辺周波数では、小さい成分は聞こえにくくなることを利用してもよい。各周波数成分の大きさから周辺周波数において聞こえにくくなる成分の大きさをマスキング特性とする。分析情報計算部911は、マスキング特性を全周波数において計算してもよいし、特定の周波数帯域だけで計算してもよい。分析情報計算部911は、各周波数において、量子化歪みの影響を考慮して分析情報の補正を行う。マスキング特性より量子化歪みの大きさが小さい場合には、量子化歪みが聞こえにくい。この場合には、量子化歪みの影響が少ないので、分析情報計算部911は、分析情報の補正は行わない。マスキング特性より量子化歪みの大きさが大きい場合は、マスキングされない。この場合には、分析情報計算部911は、量子化歪みを低減させるように分析情報を補正する。
以上のように、分析情報計算部911が分析情報を補正することにより、受信部において復号を行った際に量子化歪みが聴覚マスキングされ、歪や雑音が低減される。
これまで聴覚マスキングを考慮して量子化歪みを低減するような分析情報の補正について説明してきた。しかし、聴覚マスキングを考慮せず、全ての周波数において量子化歪みを低減するように分析情報を補正する構成でもよい。
続いて、図26を参照して、複数の音源である目的音と背景音とから構成される入力信号を対象とし、分析情報が抑圧係数情報の場合を例として、分析情報計算部911の構成を詳細に説明する。分析情報計算部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、分析情報を出力する。分析情報計算部911は、背景音情報生成部202と抑圧係数計算部2011と抑圧係数符号化部2021とから構成される。
背景音推定部1020は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信する。背景音推定部1020は、量子化歪み量を考慮し、背景音の推定を行う。たとえば、背景音推定部1020は、推定した背景音に量子化歪みを加算したものを推定背景音として、分析情報計算部121に含まれる背景音推定部200と同様の処理を行ってもよい。背景音推定部1020は、量子化歪みが考慮された背景音推定結果を抑圧係数計算部2011に出力する。抑圧係数計算部2011と抑圧係数符号化部2021は第一の実施の形態で説明したとおりである。この構成により、分析情報は量子化歪みが考慮されたものとなる。さらに、分析情報として抑圧係数を用いる場合は、量子化歪みも背景音と同時に抑圧するように小さめの抑圧係数としてもよい。
以上説明したように、信号分析部900は、符号化部100において発生した符号化歪みの効果を低減するように分析情報の生成を行う。これに対応して、受信部15は量子化歪みが考慮された分析情報に基づいて、復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みを低減することができるという効果を有する。
以上、本発明の第五の実施の形態は、送信側で量子化歪みが考慮された抑圧係数情報が生成される。従って、受信側は、量子化歪みが考慮された抑圧係数情報に基づいて係数補正下限値を生成することができる。そして、受信側は、上記の係数補正下限値を用いて復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みや符号化歪みを低減することができるという効果を有する。
次に、本発明の第六の実施の形態について説明する。本発明の第六の実施の形態は、信号分析部900に含まれる複数の変換部を符号化部100に含まれる変換部と共用することによって、送信側部における演算量と、分析情報に基づいて受信側部で構成要素ごとの制御に係る演算量を低減する。
図27を参照して、本発明の第六の実施の形態を説明する。図1に示す本発明の第一の実施の形態と、図27に示す本発明の第六の実施の形態とは、送信部10が送信部13で構成されている点、受信部15が受信部18で構成されている点で異なる。この構成により、本発明の第六の実施の形態は、送信部の中にある変換部を共用し、受信部の中にある変換部を共用することができる。この結果、送信部13及び受信部18の演算量を低減することが出来る。
図1に示される送信部10と図27に示される送信部13は、符号化部100が符号化部1100で構成されている点、信号分析部101が、信号分析部1101で構成されている点で異なる。本実施の形態では、符号化部1100が周波数成分分解された入力信号を信号分析部1101に出力している。
図28を参照して、符号化部1100の構成例を詳細に説明する。図2に示される符号化部100と図28に示される符号化部1100とは、変換部110の出力である第一の変換信号が、信号分析部1101へ出力される点で異なる。変換部110及び量子化部111の動作については図2と重複するので、説明は省略する。ここで、符号化部1100の演算量は、図2に示される符号化部100と出力される信号が異なるのみであるので、符号化部100の演算量とほぼ同一である。
図29を参照して、信号分析部1101の構成例を詳細に説明する。図4に示す信号分析部101と図29に示される信号分析部1101とは、信号分析部101に含まれている変換部120が削除されている点が異なる。
信号分析部1101は、符号化部1100から第一の変換信号を受信する。受信した第一の変換信号は分析情報計算部121へ入力される。ここで、図28に示される符号化部1100内の変換部110と、図4に示される信号分析部101内の変換部120とを比較すると、変換部に供給される入力信号が同一であり、変換部の動作が同一ならば、各々の出力である第一の変換信号と第二の変換信号は同一となる。そのため、変換部110と変換部120の動作が同一である場合、信号分析部1101では変換部120を削除し、信号分析部1101が出力する第一の変換信号を第二の変換信号として使用することが出来る。この構成により、信号分析部1101の演算量は、変換部120の演算量に相当する分だけ、信号分析部101よりも削減される。分析情報計算部121の動作については、図4の説明と重複するので省略する。
図1に示される受信部15と図27に示される受信部18は、復号部150が復号部1150で置換されている点と、信号制御部151が信号制御部1151で置換されている点で異なる。
図30を参照して、復号部1150の構成例を説明する。図3に示される復号部150と復号部1150とは、復号部1150において逆変換部161が削除されている点で異なる。逆量子化部160の動作については、図3の説明と重複するので省略する。図3に示される復号部150は、逆量子化部160が出力する第一の変換信号を逆変換部161により時間領域信号に逆変換し、復号信号として図5に示される変換部171に出力している。図5では、変換部171が復号信号を受信し、第二の変換信号に変換する処理を行っている。ここで、上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、本実施の形態において、復号部1150は、逆量子化部160の出力する第一の変換信号を信号制御部1151に含まれる信号処理部172に出力する。従って、本実施の形態において、逆変換部161を削除することができる。
図31を参照して、信号制御部1151の構成例を詳細に説明する。図5に示される信号制御部151と図31に示される信号制御部1151とは、信号制御部1151において変換部171が削除されている点で異なる。信号処理部172及び逆変換部173の動作については、図5の説明と重複するので省略する。
図5の信号制御部151は、時間領域信号として入力された復号信号が変換部171により第二の変換信号に変換され、信号処理部172に出力している。上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、信号制御部1151に含まれる信号処理部172は、逆量子化部160の出力する第一の変換信号を受信することができる。従って、本実施の形態において、変換部171を取り除くことができる。
ここで、信号制御部1151に復号部1150から入力される信号に着目すると、図1に示される第一の実施の形態と図27に示される第六の実施の形態とは、逆量子化部160が出力する信号が、逆変換部161および変換部171を経由しているか否かの違いがある。第一の変換信号を第二の変換信号として使用できる場合において、第一の実施の形態及び第六の実施の形態のいずれも、逆量子化部160が出力する信号の周波数成分と信号制御処理部172に入力される信号の周波数成分は同じである。従って、信号制御部1151内の信号処理部172は、図5に示される信号処理部172と同一の結果を出力する。また、復号部1150の演算量は、図3に示される逆変換部161の演算量に相当する分だけ、復号部150よりも削減されている。さらに、信号制御部1151の演算量は、図5に示される変換部171の演算量に相当する分だけ、信号制御部151よりも削減されている。
以上、本発明の第六の実施の形態は、本発明の第一の実施の形態の効果に加えて、変換部120、逆変換部161及び変換部160のそれぞれの演算量に相当する分だけ、第一の実施の形態よりも演算量が削減されるという効果を有する。さらに、第六の実施の形態の演算量削減の構成は、本発明の第二の実施の形態から第五の実施の形態に適用することが可能である。これにより、各実施の形態は、本発明の第六の実施の形態と同様の演算量削減の効果を有する。
図32を参照して、本発明の第七の実施の形態を説明する。第一の実施の形態乃至第六の実施の形態まで、一方向通信のみを考慮してきた。すなわち、端末に内蔵された送信部から、別の端末に内蔵された受信部との間での通信について説明してきた。第七の実施の形態は、双方向の通信を考慮し、一台の送受信端末に本発明を適用した送信部と受信部の両方を内蔵しているものである。ここで送信部と受信部の両方を内蔵する本発明を適応した端末としては、第一の実施の形態乃至第六の実施の形態のいずれかの送信部および受信部を組み合わせて用いてもよい。本発明の第七の実施の形態では、送信部と受信部の両方を持つことにより、テレビ会議端末や携帯電話などの双方向通信に利用した際に、本発明の効果が得られる。
放送など、一方向の音声通信が行われる場合にも本発明の信号分析制御システムを適用することができる。放送局の送信端末は、例えば、少なくとも図1に示される送信部10を有すればよい。放送局とは、放送免許を持つ放送局のみならず、多地点テレビ会議のメイン会場など、音声を送信し、受信をほとんど行わない地点を含む。この場合の送信端末には、本発明の第一の実施の形態乃至第六の実施の形態における送信部のいずれを用いてもよい。
また、受信のみを行う地点においても、本発明の信号分析制御システムを適用することができる。受信のみを行う地点における受信端末では、例えば、少なくとも図1に示される受信部15を有すればよい。この受信端末には、本発明の第一の実施の形態乃至第六の実施の形態における受信部のいずれを用いてもよい。
さらに、図33を参照して、本発明の第八の実施の形態に基づく信号処理装置を詳細に説明する。本発明の第八の実施の形態は、プログラム制御により動作するコンピュータ1300、1301から構成される。コンピュータは、中央処理装置、プロセッサ、データ処理装置のいずれでもよい。
コンピュータ1300は、第一の実施の形態乃至第七の実施の形態のいずれかに係る処理を行い、入力信号を受け伝送信号を出力するためのプログラムに基づき動作する。一方、コンピュータ1301は、第一の実施の形態乃至第七の実施の形態のいずれかに係る処理を行い、伝送信号を受け、出力信号を出力するためのプログラムに基づき動作する。なお、第七の実施の形態で説明した送信部および受信部を両方もつ場合、送信処理と受信処理を同一のコンピュータを用いて処理を実行してもよい。
上記で説明してきた第一の実施の形態乃至第八の実施の形態では、送信部、伝送路、受信部の動作として説明してきたが、それぞれ、録音部、蓄積媒体、再生部と置き換えてもよい。たとえば、図1に示す送信部10は、伝送信号をビットストリームとして蓄積媒体に出力し、蓄積媒体にビットストリームを記録してもよい。また、受信部15は、蓄積媒体に記録されているビットストリームを取出し、ビットストリームを復号して処理を行うことにより出力信号を生成してもよい。
以上の如く、本発明の第1の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記分析情報を補正する補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報に基づいて、前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、本発明の第2の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号と信号制御情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記分析情報を補正する補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、本発明の第3の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号と前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記分析情報を補正する補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報と前記構成要素レンダリング情報とに基づいて、前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、本発明の第4の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号と信号制御情報と前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて前記分析情報を補正する補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報と前記信号制御情報と前記構成要素レンダリング情報とに基づいて、前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、本発明の第5の態様は、上述した態様において、前記構成要素レンダリング情報は、前記構成要素の定位情報を含むことを特徴とする。
また、本発明の第6の態様は、上述した態様において、前記分析情報は、抑圧係数を含むことを特徴とする。
また、本発明の第7の態様は、上述した態様において、前記補正値は、係数補正下限値を含むことを特徴とする。
また、本発明の第8の態様は、複数の構成要素を含む信号の前記構成要素に基づいて算出される分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に基づいて、前記分析情報を補正する補正値を生成し、前記補正値に基づいて前記分析情報を補正し、前記補正された分析情報に基づいて、前記信号の構成要素を制御することを特徴とする信号分析制御方法である。
また、本発明の第9の態様は、上述した態様において、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号をから前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報を補正する分析情報補正部と、前記補正された分析情報に基づいて、前記信号の構成要素を制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、本発明の第10の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報を補正する分析情報補正部と、信号制御情報を受け、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の構成要素を制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、本発明の第11の態様は、複数の構成要素を含む信号と前記構成要素を制御するための分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成部と、前記補正値に基づいて前記分析情報を補正する分析情報補正部と、前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報を受け、前記補正された分析情報と前記構成要素レンダリング情報とに基づいて、前記信号の構成要素を制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、本発明の第12の態様は、複数の構成要素を含む信号と前記構成要素を制御するための分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成部と、前記補正値に基づいて、前記分析情報を補正する分析情報補正部と、信号制御情報と前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報とを受け、前記補正された分析情報と前記信号制御情報と前記構成要素レンダリング情報とに基づいて前記信号の構成要素を制御する信号処理部とを含むことを特徴とする信号制御装置である。
また、本発明の第13の態様は、上述した態様において、前記構成要素レンダリング情報は、前記構成要素の定位情報を含むことを特徴とする。
また、本発明の第14の態様は、上述した態様において、前記分析情報は、抑圧係数を含むことを特徴とする。
また、本発明の第15の態様は、上述した態様において、前記補正値は、係数補正下限値を含むことを特徴とする。
また、本発明の第16の態様は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、複数の構成要素を含む信号の前記構成要素に基づいて算出される分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部とを含み、前記信号制御装置は、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に基づいて前記分析情報を補正する補正値を生成する分析情報補正値生成部と、前記補正値に基づいて前記分析情報を補正する分析情報補正部と、前記補正された分析情報に基づいて前記信号の構成要素を制御する信号処理部とを含むことを特徴とする信号分析制御システムである。
また、本発明の第17の態様は、コンピュータに、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号をから前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報を補正する分析情報補正処理と、前記補正された分析情報に基づいて、前記信号の構成要素を制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、本発明の第18の態様は、コンピュータに、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報を補正する分析情報補正処理と、信号制御情報を受け、前記補正された分析情報と前記信号制御情報とに基づいて、前記信号の構成要素を制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、本発明の第19の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報を補正する分析情報補正処理と、前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報を受け、前記補正された分析情報と前記構成要素レンダリング情報とに基づいて、前記信号の構成要素を制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、本発明の第20の態様は、複数の構成要素を含む信号と前記構成要素に基づいて算出される分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報を補正する分析情報補正処理と、信号制御情報と前記構成要素を複数の出力チャネルに出力するための構成要素レンダリング情報とを受け、前記補正された分析情報と前記信号制御情報と前記構成要素レンダリング情報とに基づいて、前記信号の構成要素を制御する信号制御処理とを実行させることを特徴とする信号制御プログラムである。
また、本発明の第21の態様は、上述した態様において、前記構成要素レンダリング情報は、前記構成要素の定位情報を含むことを特徴とする。
また、本発明の第22の態様は、上述した態様において、前記分析情報は、抑圧係数を含むことを特徴とする。
また、本発明の第23の態様は、上述した態様において、前記補正値は、係数補正下限値を含むことを特徴とする。
また、本発明の第24の態様は、上述した態様において、コンピュータに、複数の構成要素を含む信号の前記構成要素に基づいて算出される分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に基づいて、前記分析情報を補正する補正値を生成する分析情報補正値生成処理と、前記補正値に基づいて、前記分析情報を補正する分析情報補正処理と、前記補正された分析情報に基づいて、前記信号の構成要素を制御する信号分析処理とを実行させることを特徴とする信号分析制御プログラムである。
以上好ましい実施の形態及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び態様に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
本出願は、2008年3月14日に出願された日本出願特願2008−65086号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、信号分析又は制御を行う装置、信号分析又は制御をコンピュータに実現するためのプログラムといった用途に適用できる。

Claims (18)

  1. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、
    前記補正値に基づいて前記分析情報の抑圧係数を補正し、
    前記補正された分析情報の抑圧係数に基づいて、前記信号の背景雑音を制御する
    ことを特徴とする信号制御方法。
  2. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と、音声と背景雑音のエネルギレベルを変更する信号制御情報とを受信し、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、
    前記補正値に基づいて前記分析情報の抑圧係数を補正し、
    前記補正された分析情報の抑圧係数と前記信号制御情報とに基づいて、前記信号の背景雑音を制御する
    ことを特徴とする信号制御方法。
  3. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、
    前記補正値に基づいて前記分析情報を補正し、
    前記補正された分析情報の抑圧係数と前記レンダリング情報とに基づいて、前記信号の背景雑音を制御する
    ことを特徴とする信号制御方法。
  4. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号と信号制御情報と前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に基づいて前記抑圧係数の下限値である補正値を生成し、
    前記補正値に基づいて前記分析情報の抑圧係数を補正し、
    前記補正された分析情報の抑圧係数と前記信号制御情報と前記レンダリング情報とに基づいて、前記背景雑音を制御する
    ことを特徴とする信号制御方法。
  5. 前記レンダリング情報は、前記音声と背景雑音の定位感を操作する定位情報を含むこと
    を特徴とする請求項3または請求項4に記載の信号制御方法。
  6. 音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成し、
    前記信号と前記分析情報とを多重化して多重化信号を生成し、
    前記多重化信号を受信し、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成し、
    前記補正値に基づいて前記分析情報の抑圧係数を補正し、
    前記補正された分析情報の抑圧係数に基づいて、前記信号の背景雑音を制御する
    ことを特徴とする信号分析制御方法。
  7. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、
    前記補正された分析情報の抑圧係数に基づいて、前記信号の背景雑音を制御する信号処理部と
    を含むことを特徴とする信号制御装置。
  8. 音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、
    音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、前記補正された分析情報の抑圧係数と前記信号制御情報とに基づいて、前記信号の背景雑音を制御する信号処理部と
    を含むことを特徴とする信号制御装置。
  9. 音声と背景雑音を含む信号と前記音声と背景雑音を制御するための抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、
    前記補正値に基づいて前記分析情報の抑圧係数を補正する分析情報補正部と、
    前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報を受け、前記補正された分析情報の抑圧係数と前記レンダリング情報とに基づいて、前記信号の背景雑音を制御する信号処理部と
    を含むことを特徴とする信号制御装置。
  10. 音声と背景雑音を含む信号と前記音声と背景雑音を制御するための抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正部と、
    音声と背景雑音のエネルギレベルを変更する信号制御情報と、前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、前記補正された分析情報の抑圧係数と前記信号制御情報と前記レンダリング情報とに基づいて前記信号の背景雑音を制御する信号処理部と
    を含むことを特徴とする信号制御装置。
  11. 前記レンダリング情報は、前記音声と背景雑音の定位感を操作する定位情報を含むこと
    を特徴とする請求項または請求項10に記載の信号制御装置。
  12. 信号分析装置と信号制御装置とを含む信号分析制御システムであって、
    前記信号分析装置は、
    音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成する信号分析部と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と
    を含み、
    前記信号制御装置は、
    前記多重化信号を受信し、当該多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成部と、
    前記補正値に基づいて前記分析情報の抑圧係数を補正する分析情報補正部と、
    前記補正された分析情報の抑圧係数に基づいて前記信号の背景雑音を制御する信号処理部と
    を含むことを特徴とする信号分析制御システム。
  13. コンピュータに、
    音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、
    前記補正された分析情報の抑圧係数に基づいて、前記信号の背景雑音を制御する信号制御処理と
    を実行させることを特徴とする信号制御プログラム。
  14. コンピュータに、
    音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、
    音声と背景雑音のエネルギレベルを変更する信号制御情報を受け、前記補正された分析情報の抑圧係数と前記信号制御情報とに基づいて、前記信号の背景雑音を制御する信号制御処理と
    を実行させることを特徴とする信号制御プログラム。
  15. コンピュータに、
    音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、
    前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報を受け、前記補正された分析情報の抑圧係数と前記レンダリング情報とに基づいて、前記信号の背景雑音を制御する信号制御処理と
    を実行させることを特徴とする信号制御プログラム。
  16. コンピュータに、
    音声と背景雑音を含む信号と前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報とを含む多重化信号を受信し、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、
    音声と背景雑音のエネルギレベルを変更する信号制御情報と、前記音声と背景雑音を複数の出力チャネルに出力するためのレンダリング情報とを受け、前記補正された分析情報の抑圧係数と前記信号制御情報と前記レンダリング情報とに基づいて、前記信号の背景雑音を制御する信号制御処理と
    を実行させることを特徴とする信号制御プログラム。
  17. 前記レンダリング情報は、前記音声と背景雑音の定位感を操作する定位情報を含むことを特徴とする請求項15または請求項16に記載の信号制御プログラム。
  18. コンピュータに、
    音声と背景雑音を含む信号の前記音声と背景雑音に基づいて算出される抑圧係数を含む分析情報を生成する信号分析処理と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、
    前記多重化信号を受信し、当該多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に基づいて、前記抑圧係数の下限値である補正値を生成する分析情報補正値生成処理と、
    前記補正値に基づいて、前記分析情報の抑圧係数を補正する分析情報補正処理と、
    前記補正された分析情報の抑圧係数に基づいて、前記信号の背景雑音を制御する信号分析処理と
    を実行させることを特徴とする信号分析制御プログラム。
JP2010502815A 2008-03-14 2009-03-10 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム Expired - Fee Related JP5668923B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010502815A JP5668923B2 (ja) 2008-03-14 2009-03-10 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008065086 2008-03-14
JP2008065086 2008-03-14
JP2010502815A JP5668923B2 (ja) 2008-03-14 2009-03-10 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
PCT/JP2009/054500 WO2009113516A1 (ja) 2008-03-14 2009-03-10 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム

Publications (2)

Publication Number Publication Date
JPWO2009113516A1 JPWO2009113516A1 (ja) 2011-07-21
JP5668923B2 true JP5668923B2 (ja) 2015-02-12

Family

ID=41065183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010502815A Expired - Fee Related JP5668923B2 (ja) 2008-03-14 2009-03-10 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム

Country Status (5)

Country Link
US (1) US8665914B2 (ja)
EP (1) EP2261894A4 (ja)
JP (1) JP5668923B2 (ja)
CN (1) CN101960514A (ja)
WO (1) WO2009113516A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009131066A1 (ja) * 2008-04-21 2009-10-29 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
US9379559B2 (en) * 2012-02-03 2016-06-28 International Business Machines Corporation System and method of charging a vehicle using a dynamic power grid, and system and method of managing power consumption in the vehicle
EP2965315B1 (en) * 2013-03-04 2019-04-24 Voiceage Evs Llc Device and method for reducing quantization noise in a time-domain decoder
CN108449502B (zh) * 2018-03-12 2019-12-10 Oppo广东移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN108449506B (zh) * 2018-03-12 2020-04-17 Oppo广东移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端
CN108449497B (zh) * 2018-03-12 2020-08-14 Oppo广东移动通信有限公司 语音通话数据处理方法、装置、存储介质及移动终端

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3568255B2 (ja) 1994-10-28 2004-09-22 富士通株式会社 音声符号化装置及びその方法
JP3321335B2 (ja) * 1995-06-07 2002-09-03 シャープ株式会社 符号化雑音低減画像伝送装置
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
CN1647156B (zh) * 2002-04-22 2010-05-26 皇家飞利浦电子股份有限公司 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7630396B2 (en) * 2004-08-26 2009-12-08 Panasonic Corporation Multichannel signal coding equipment and multichannel signal decoding equipment
JP4443449B2 (ja) * 2005-03-24 2010-03-31 株式会社ザナヴィ・インフォマティクス ハンズフリー通話装置
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2006132857A2 (en) * 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
US8233636B2 (en) 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
WO2007032647A1 (en) 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100863479B1 (ko) 2006-02-07 2008-10-16 엘지전자 주식회사 부호화/복호화 장치 및 방법
JP5227946B2 (ja) * 2006-03-28 2013-07-03 テレフオンアクチーボラゲット エル エム エリクソン(パブル) フィルタ適応周波数分解能
JP5435204B2 (ja) * 2006-07-03 2014-03-05 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
US9118805B2 (en) * 2007-06-27 2015-08-25 Nec Corporation Multi-point connection device, signal analysis and device, method, and program

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Also Published As

Publication number Publication date
CN101960514A (zh) 2011-01-26
US20110002225A1 (en) 2011-01-06
JPWO2009113516A1 (ja) 2011-07-21
WO2009113516A1 (ja) 2009-09-17
EP2261894A4 (en) 2013-01-16
US8665914B2 (en) 2014-03-04
EP2261894A1 (en) 2010-12-15

Similar Documents

Publication Publication Date Title
JP5773124B2 (ja) 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
US9734835B2 (en) Voice decoding apparatus of adding component having complicated relationship with or component unrelated with encoding information to decoded voice signal
EP3118849B1 (en) Encoding device, decoding device, and method thereof
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
EP1906706B1 (en) Audio decoder
JP5668923B2 (ja) 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP2012177939A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
WO2010005050A1 (ja) 信号分析装置、信号制御装置及びその方法と、プログラム
JP5282906B2 (ja) 多地点接続装置、信号分析及び装置と、その方法及びプログラム
JP5425067B2 (ja) 音響信号復号装置および音響信号復号装置におけるバランス調整方法
JP5556175B2 (ja) 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
WO2009087923A1 (ja) 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
KR101607334B1 (ko) 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141202

R150 Certificate of patent or registration of utility model

Ref document number: 5668923

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees