JP6721977B2 - 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 - Google Patents

音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 Download PDF

Info

Publication number
JP6721977B2
JP6721977B2 JP2015244243A JP2015244243A JP6721977B2 JP 6721977 B2 JP6721977 B2 JP 6721977B2 JP 2015244243 A JP2015244243 A JP 2015244243A JP 2015244243 A JP2015244243 A JP 2015244243A JP 6721977 B2 JP6721977 B2 JP 6721977B2
Authority
JP
Japan
Prior art keywords
signal
audio
encoding
channel
addition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015244243A
Other languages
English (en)
Other versions
JP2017111230A (ja
JP2017111230A5 (ja
Inventor
江原 宏幸
宏幸 江原
貴紀 青山
貴紀 青山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Priority to JP2015244243A priority Critical patent/JP6721977B2/ja
Priority to CN201680059429.5A priority patent/CN108140394B/zh
Priority to PCT/JP2016/004891 priority patent/WO2017104105A1/ja
Priority to EP16875095.8A priority patent/EP3392881B1/en
Publication of JP2017111230A publication Critical patent/JP2017111230A/ja
Priority to US15/976,987 priority patent/US10424308B2/en
Publication of JP2017111230A5 publication Critical patent/JP2017111230A5/ja
Application granted granted Critical
Publication of JP6721977B2 publication Critical patent/JP6721977B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本開示は、音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法に関する。
非特許文献1には、EVS(Enhanced Voice Services)コーデックのアルゴリズムが開示されている。EVSコーデックでは、入力信号を分析し、入力信号の特徴に応じて最適な符号化モードを用いて入力信号の符号化を行うことにより、高品質な音声音響(サウンド)信号(以下、単に「音響信号」と呼ぶ)の符号化及び復号処理を効率的に行うことができる。
非特許文献2には、マイクロホンアレイを用いたビームフォーマ(例えば、Griffiths-Jim型ビームフォーマ)技術が開示されている。非特許文献2には、Griffiths-Jim型ビームフォーマの一例として、マイクロホンアレイの各チャネル信号の総和信号と、隣接するチャネル信号の差分信号とを用いて特定方向から到来する音響信号を抽出する構成が開示されている。
EVSコーデックを用いて、マイクロホンアレイで取得したマルチチャネル信号の各チャネル信号に対して独立して符号化すると、各チャネル信号に対して、独立した符号化誤差が加えられることになる。このため、各チャネル信号の相関関係が崩れてしまい、各チャネル信号の相互相関を利用しているビームフォーミング処理に影響を及ぼしてしまう。
本開示の一態様は、EVSコーデックにおいてマルチチャネル信号の符号化を行う場合にビームフォーミング性能の劣化を抑えることができる音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法を提供することである。
本開示の一態様に係る音声音響信号符号化装置は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成する変換部と、前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成する第1符号化部と、前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
本開示の一態様に係る音声音響信号符号化装置は、少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
本開示の一態様に係る音声音響信号復号装置は、次の構成を具備する。まず、逆多重化部で、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離する。ここで、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成されたデータであり、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードで、それぞれ符号化して生成されたデータである。さらに、第1復号部で、前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得る。第2復号部では、前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得る。逆変換部は、前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する。
本開示の一態様に係る音声音響信号符号化方法は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成し、前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成し、前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成し、前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する。
本開示の一態様に係る音声音響復号方法は、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得て、前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得て、前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する。
なお、これらの包括的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、または、記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本開示の一態様によれば、EVSコーデックにおいてマルチチャネル信号の符号化を行う場合にビームフォーミング性能の劣化を抑えることができる。
本開示の一態様における更なる利点および効果は、明細書および図面から明らかにされる。かかる利点および/または効果は、いくつかの実施形態並びに明細書および図面に記載された特徴によってそれぞれ提供されるが、1つまたはそれ以上の同一の特徴を得るために必ずしも全てが提供される必要はない。
マルチチャネル音響信号符号化復号システムの構成例を示す図 変換器の内部構成の一例を示す図 エンコーダの内部構成の一例を示す図 デコーダの内部構成の一例を示す図 逆変換器の内部構成の一例を示す図 収音処理システムの構成例を示す図
以下、本開示の各実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
[システム構成]
図1は、本実施の形態に係るシステムの構成例を示す。図1に示すシステム1は、少なくとも、音声音響信号の符号化を行う符号化装置10(マルチチャネルエンコーダ)及び音声音響信号の復号を行う復号装置20(マルチチャネルデコーダ)を備える。
符号化装置10には、マルチチャネルデジタル音響信号の各チャネル信号が入力される。例えば、マルチチャネルデジタル音響信号は、マイクロホンアレーユニット(図示せず)が取得したアナログ音響信号に対してデジタル変換を施すことにより得られる。なお、図1では、4個のチャネル信号(ch1〜ch4)が入力される場合について示すが、マルチチャネルデジタル音響信号のチャネル数は4個に限定されない。
[符号化装置の構成]
符号化装置10は、変換器11(変換部に相当する)及びエンコーダ12を含む構成を採る。
変換器11は、入力信号である各チャネル信号(ch1〜ch4)に対して重み付け加算処理を施し、各チャネル信号(ch1〜ch4)をマルチチャネルデジタル信号(S、X、Y、Z)に変換する。
図2は、変換器11の内部構成の一例を示す。図2において、加算器111−1、111−2、111−3は、複数のチャネル信号ch1〜ch4を全て加算して加算信号S(=ch1+ch2+ch3+ch4)を生成する。
また、図2に示す減算器112−1、112−2、112−3は、複数のチャネル信号ch1〜ch4のチャネル間の差分信号を生成する。例えば、図2では、減算器112−1は隣接するチャネル信号ch1とチャネル信号ch2との差分信号X(=ch1−ch2)を生成し、減算器112−2は隣接するチャネル信号ch2とチャネル信号ch3との差分信号Y(=ch2−ch3)を生成し、減算器112−3は隣接するチャネル信号ch3とチャネル信号ch4との差分信号Z(=ch3−ch4)を生成する。
変換器11は、加算信号S及び差分信号X、Y、Zを含むマルチチャネルデジタル信号をエンコーダ12に出力する。
エンコーダ12は、EVSコーデックを用いて、変換器11から出力されるマルチチャネルデジタル信号をそれぞれ符号化してモノラル符号化データを生成し、モノラル符号化データを多重化してマルチチャネル符号化データとして出力する。
図3は、エンコーダ12の内部構成の一例を示す。図3に示すエンコーダ12は、モノラルマルチモードエンコーダ121、122、123、124及び多重化部125を含む構成を採る。
モノラルマルチモードエンコーダ121(第1符号化部に相当する)は、変換器11から入力される加算信号Sを符号化してモノラル符号化データ(第1符号化データに相当する)を生成する。モノラルマルチモードエンコーダ121は、モノラル符号化データを多重化部125へ出力する。
なお、モノラルマルチモードエンコーダ121は、符号化の際、入力される加算信号Sの特徴(例えば、音声、非音声などの種類)に応じて符号化モードを判定し、判定した符号化モードを用いて加算信号Sの符号化を行う。モノラルマルチモードエンコーダ121は、加算信号Sの符号化に用いられた符号化モードを示すモード情報を、モノラルマルチモードエンコーダ122〜124へ出力する。また、モノラルマルチモードエンコーダ121は、モード情報を符号化し、モノラル符号化データに含めて、多重化部125へ出力する。
つまり、モノラルマルチモードエンコーダ121〜124は、加算信号Sの符号化に用いられた符号化モードを共有する。
モノラルマルチモードエンコーダ122〜124(第2符号化部に相当する)は、モノラルマルチモードエンコーダ121から入力されるモード情報に示される符号化モードを用いて、変換器11から入力される差分信号X、Y、Zをそれぞれ符号化してモノラル符号化データ(第2符号化データに相当する)を生成する。モノラルマルチモードエンコーダ122〜124は、モノラル符号化データを多重化部125へ出力する。
多重化部125は、マルチモードエンコーダ121〜124から入力される各符号化データを多重して、マルチチャネル符号化データとして伝送路へ出力する。
[復号装置の構成]
復号装置20は、デコーダ21及び逆変換器22(逆変換部に相当する)を含む構成を採る。
デコーダ21は、受信したマルチチャネル符号化データを、複数のモノラル符号化データに分離し、複数のモノラル符号化データを復号して、復号マルチチャネルデジタル信号(S’、X’、Y’、Z’)を得る。
図4は、デコーダ21の内部構成の一例を示す。図4に示すデコーダ21は、逆多重化部211及びモノラルマルチモードデコーダ212〜215を含む構成を採る。
逆多重化部211は、伝送路を介して符号化装置10から受け取ったマルチチャネル符号化データを、加算信号に対応するモノラル符号化データと各差分信号に対応するモノラル符号化データとに分離する。逆多重化部211は、加算信号に対応するモノラル符号化データをモノラルマルチモードデコーダ212(第1復号部に相当する)に出力し、各差分信号に対応するモノラル符号化データをモノラルマルチモードデコーダ213〜215(第2復号部に相当する)にそれぞれ出力する。なお、加算信号に対応するモノラル符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれている。
モノラルマルチモードデコーダ212は、逆多重化部211から入力されるモード情報を復号して、符号化装置10で用いられた符号化モードを特定する。モノラルマルチモードデコーダ212は、特定した符号化モードに基づいて、加算信号Sに対応するモノラル符号化データを復号し、得られる復号信号S’を逆変換器22へ出力する。また、モノラルマルチモードデコーダ212は、符号化モードを示すモード情報をモノラルマルチモードデコーダ213〜215へ出力する。
つまり、モノラルマルチモードデコーダ212〜215は、符号化装置10において加算信号Sの符号化に用いられた符号化モードを共有する。
モノラルマルチモードデコーダ213〜215は、モノラルマルチモードデコーダ212から入力されるモード情報に示される符号化モードに従って、逆多重化部211から入力される、差分信号X、Y、Zにそれぞれ対応するモノラル符号化データを復号し、得られる復号信号X’、Y’、Z’を逆変換器22へ出力する。
逆変換器22は、デコーダ21から入力される各復号信号S’,X’,Y’,Z’に対して重み付け加算を施し、復号信号S’,X’,Y’,Z’を復号マルチチャネルデジタル音響信号(ch1’〜ch4’)に変換する。
図5は、逆変換器22の内部構成の一例を示す。図5において、増幅器221−1〜221−7には、各復号信号S’,X’,Y’,Z’に対する重み付け係数が設定されている。加算器222−1〜222−4は、各増幅器221−1〜221−7から出力される信号を加算して、マルチチャネルデジタル音響信号の各復号チャネル信号を生成する。
例えば、増幅器221−1〜221−7及び加算器222−1〜222−4は、以下のようにして各復号チャネル信号ch1’〜ch4’を生成する。
ch1’=0.25×(S’+3X’+2Y’+ Z)
ch2’=0.25×(S’− X’+2Y’+ Z)
ch3’=0.25×(S’− X’−2Y’+ Z)
ch4’=0.25×(S’− X’−2Y’−3Z)
[効果]
以上のように、本実施の形態では、符号化装置10は、マルチチャネル信号を、全てのチャネルの加算信号と、チャネル間の差分信号とにミキシングして符号化する。この際、符号化装置10は、加算信号の符号化において判定された符号化モードを、差分信号の符号化にも用いる。また、復号装置20は、加算信号及び差分信号の各々に対応するモノラル符号化データを、符号化装置10で用いた符号化モードに従って復号する。
このように加算信号の符号化復号を行い、復号加算信号を用いて各チャネル信号を再合成することによって,各チャネル信号に加わる符号化誤差を共通化することができる。さらに、加算信号及び差分信号の符号化モードを共通とすることにより、各チャネル信号に加わる符号化誤差の特性を揃えることができる。これにより、チャネル信号間の相関関係の崩れを抑えることができる。よって、復号装置20では、復号チャネル信号間の位相歪みを低減できる。換言すると、符号化/復号に用いる符号化モードが全てのチャネルで同じになり、また、全てのチャネルの信号が全チャネルの平均信号の復号信号を用いて表現される。このため、復号装置20では、同一時間において異なる符号化モードが使用されたり、各チャネルで符号化誤差を共有しなかったりすることによって生じる、復号信号の歪特性がチャネル間で異なるというマルチチャネル信号の品質劣化を回避することができる。
これにより、例えば、復号装置20の後段において、各チャネル信号の位相関係を利用するビームフォーミング処理への符号化誤差の影響を低減させることができる。つまり、本実施の形態によれば、EVSコーデックによって符号化されたマルチチャネル信号を用いてビームフォーミング処理を行う場合に、ビームフォーミング性能の劣化を抑えることができる。
また、符号化装置10の各モノラルマルチモードエンコーダ及び復号装置20の各モノラルマルチモードデコーダでは符号化モードが共有されるので、符号化装置10は、全てのモノラルマルチモードエンコーダ121〜124に対するモード情報を符号化する必要はなく、1つのモード情報のみを復号装置20へ送信すればよい。
また、符号化装置10は、全チャネルの加算信号Sに基づいて符号化モードを判定するので、マルチチャネル全体として最適な符号化モードを選択することができる。これは、加算信号Sにはマルチチャネル音響信号における音の平均的な特徴が含まれているのに対して、差分信号X,Y,Zは加算信号Sに対して信号のレベルが小さく、音の特徴を捉えにくいためである。
また、本実施の形態によれば、隣接チャネルの信号位相を補正してから差分信号を算出する場合でも、差分信号の符号化歪を少なくする、という効果が得られる。
なお、本実施の形態では、複数の符号化モード(マルチモード)を有する符号化装置について説明したが、1つの符号化モードのみを有し、モード切替を行わない符号化装置についても適用可能である。例えば、変換器において、少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する。エンコーダにおいて、第1符号化部では、変換器から出力された1チャネルの加算信号を符号化して第1符号化データを生成し、第2符号化部では、少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する。そして、多重化部において、第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成し、出力する。
このような構成においても、本実施形態のマルチモードと同様に、エンコーダにおいて復号加算信号を用いて各チャネル信号を再合成することによって、各チャネル信号に加わる符号化誤差を共通化することができるため、各チャネル信号の位相関係を利用するビームフォーミング処理への符号化誤差の影響を低減させることができる。
また、デコーダについても、本実施の形態では、符号化装置から出力された、符号化モード情報に示される符号化モードに従って逆多重化をする復号装置について説明したが、符号化モード情報が入力されない場合についても適用可能である。
(実施の形態2)
本実施の形態では、マルチチャネル音響信号に対してビームフォーミング処理(収音処理)を行う収音システムについて説明する。
図6は、本実施の形態に係る収音システムの構成例を示す。図6に示す収音システム1aは、マイクロホンアレーユニット30と収音処理部40と、実施の形態1で説明した符号化装置10及び復号装置20と、を含む構成を採る。
マイクロホンアレーユニット30は、音響信号をアナログ電気信号に変換する複数のマイクロホン(図6では4個のマイクロホン)と、アナログ電気信号をデジタル音響信号に変換するA/D変換器とを含む。マイクロホンアレーユニット30は、各マイクロホンに対応するデジタル音響信号(チャネル信号ch1〜ch4)から構成されるマルチチャネルデジタル音響信号を符号化装置10に出力する。
実施の形態1で説明したように、符号化装置10はマルチチャネルデジタル音響信号を符号化し、復号装置20は符号化装置10から受け取るマルチチャネル符号化データを復号し、各復号チャネル信号(ch1’〜ch4’)から構成される復号マルチチャネル音響信号を収音処理部40へ出力する。
収音処理部40は、復号装置20から入力される復号マルチチャネル音響信号に対してビームフォーミング処理を行って、収音対象の信号(目標信号)のみを抽出して出力する。
具体的には、収音処理部40は、位相補正部41と、加算部42と、減算部43と、サイドローブキャンセラ44と、サイドローブサプレッサ45とを含む構成を採る。
位相補正部41は、目標信号の到来方向に応じて、復号マルチチャネル音響信号の各復号チャネル信号の位相を補正して、位相補正後の復号チャネル信号を加算部42及び減算部43に出力する。
加算部42は、位相補正後の全ての復号チャネル信号を加算する。加算信号では、目標信号の成分が強調される。加算部42は、加算信号をサイドローブキャンセラ44に出力する。
減算部43は、位相補正後の復号チャネル信号に対して、隣接チャネル間の差分信号を生成する。隣接チャネル間の差分信号では、目標信号の成分が相殺され、雑音成分が強調される。減算部43は、差分信号をサイドローブキャンセラ44及びサイドローブサプレッサ45に出力する。
サイドローブサプレッサ44及びサイドローブサプレッサ45は、加算部42から入力される加算信号と減算部43から入力される差分信号とを用いて、目標信号の成分を強調するとともに目標信号以外の成分を抑圧する抑圧部として機能する。
具体的には、サイドローブキャンセラ44は、加算部42から入力される加算信号から、減算部43から入力される差分信号に対応する成分を取り除くことにより、目標信号以外の信号成分(雑音成分など)を抑圧して、目標信号を強調させる。
サイドローブサプレッサ45は、サイドローブキャンセラ44から入力される信号、及び、減算部43から入力される差分信号を用いて、目標信号以外の信号成分を周波数領域(スペクトル領域)において更に抑圧して、目標信号を強調させる。
サイドローブサプレッサ45の出力信号は、ビームフォーム処理の最終出力信号として出力される。
例えば、収音システム1aにおいて、収音処理部40の処理は、クラウドサーバが行ってもよい。すなわち、復号装置20は、復号マルチチャネル音響信号を、インターネットなどのネットワークを介して接続されるクラウドサーバに送信し、クラウドサーバが収音処理を行ってもよい。
このようにして、本実施の形態によれば、収音処理(ビームフォーミング処理)の性能劣化を抑えたマルチチャネル音響信号の伝送が可能となる。
以上、本開示各実施の形態について説明した。
なお、図5では、復号装置20の逆変換器22において重み付け係数を設定する場合について説明したが、変換器11及び逆変換器22の重み付け係数は任意に変更可能である。例えば、符号化装置10の変換器11において重み付け係数を設定してもよい。この場合、変換器11は、以下のように加算信号S及び差分信号X,Y,Zを生成する。
S=0.25×(ch1+ch2+ch3+ch4)
X=0.25×(ch1−ch2)
Y=0.25×(ch2−ch3)
Z=0.25×(ch3−ch4)
また、この場合、逆変換器22は、以下のように各復号チャネル信号ch1’〜ch4’を生成する。
ch1’=S’+3X’+2Y’+ Z
ch2’=S’− X’+2Y’+ Z
ch3’=S’− X’−2Y’+ Z
ch4’=S’− X’−2Y’−3Z
また、例えば、収音システム1aにおいて、変換器11及び逆変換器22の重み付け加算の内容は、収音処理における加算部42の加算処理及び減算部43の減算処理の内容が本実施の形態と異なる場合には、それに合わせてもよい。
また、本開示の一態様は、上記各実施の形態に限定されず、種々変更して実施することが可能である。
例えば、X,Y,Zは以下のようなチャネル間差分信号とすることも可能である。
X=(ch1+ch2)−(ch3+ch4)
Y=(ch1+ch3)−(ch2+ch4)
Z=(ch1+ch4)−(ch2+ch3)
これに対応するための各復号チャネル信号ch1’〜ch4’も導出可能である。
また、上記各実施の形態では、本開示の一態様をハードウェアで構成する場合を例にとって説明したが、本開示はハードウェアとの連携においてソフトウェアでも実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。集積回路は、上記実施の形態の説明に用いた各機能ブロックを制御し、入力端子と出力端子を備えてもよい。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)または、LSI内部の回路セルの接続若しくは設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
本開示の音声音響信号符号化装置は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を生成する変換部と、加算信号の特徴に応じた符号化モードで加算信号を符号化して第1符号化データを生成する第1符号化部と、加算信号の符号化に用いられた符号化モードで差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、第1符号化データと第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
本開示の音声音響信号符号化装置は、少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、を具備する構成を採る。
本開示の音声音響信号符号化装置において、音声音響入力信号は、マイクロホンアレーユニットから出力される信号である。
本開示の音声音響信号符号化装置において、差分信号は、複数のチャネル信号の隣接チャネル間の差分信号である。
本開示の音声音響信号符号化装置において、第1符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる。
本開示の音声音響信号復号装置は、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、第1符号化データは、音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、加算信号の特徴に応じた符号化モードで符号化して生成され、第2符号化データは、音声音響信号符号化装置において、複数のチャネル信号のチャネル間の差分信号を加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成される、逆多重化部と、加算信号の符号化に用いられた符号化モードで第1符号化データを復号して復号加算信号を得る第1復号部と、加算信号の符号化に用いられた符号化モードで第2符号化データを復号して復号差分信号を得る第2復号部と、復号加算信号及び復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する逆変換部と、を具備する構成を採る。
本開示の音声音響信号復号装置において、差分信号は、複数のチャネル信号の隣接チャネル間の差分信号である。
本開示の音声音響信号復号装置において、第1符号化データには、加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる。
本開示の収音システムは、復号装置から出力される復号音声音響信号に対してビームフォーミング処理を行い、目標信号を抽出する収音処理部を具備し、収音処理部は、復号音声音響信号の各復号チャネル信号の位相を補正する位相補正部と、位相補正された復号チャネル信号の全てを加算して加算信号を生成する加算部と、位相補正された復号チャネル信号の隣接チャネル間の差分信号を生成する減算部と、加算信号と差分信号とを用いて、目標信号の成分を強調するとともに目標信号以外の成分を抑圧する抑圧部と、を具備する。
本開示の音声音響信号符号化方法は、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、複数のチャネル信号のチャネル間の差分信号を生成し、加算信号の特徴に応じた符号化モードで加算信号を符号化して第1符号化データを生成し、加算信号の符号化に用いられた符号化モードで差分信号をそれぞれ符号化して第2符号化データを生成し、第1符号化データと第2符号化データとを多重化して、マルチチャネル符号化データを生成する。
本開示の音声音響信号復号方法は、音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、第1符号化データは、音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、加算信号の特徴に応じた符号化モードで符号化して生成され、第2符号化データは、音声音響信号符号化装置において、複数のチャネル信号のチャネル間の差分信号を加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、加算信号の符号化に用いられた符号化モードで第1符号化データを復号して復号加算信号を得て、加算信号の符号化に用いられた符号化モードで第2符号化データを復号して復号差分信号を得て、復号加算信号及び復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する。
本開示の一態様は、マルチチャネルの音声音響(サウンド)信号の符号化及び復号を行う装置に有用である。
1 システム
1a 収音システム
10 符号化装置
11 変換器
12 エンコーダ
20 復号装置
21 デコーダ
22 逆変換器
30 マイクロホンアレーユニット
40 収音処理部
41 位相補正部
42 加算部
43 減算部
44 サイドローブキャンセラ
45 サイドローブサプレッサ
111,222 加算器
112 減算器
121,122,123,124 モノラルマルチモードエンコーダ
125 多重化部
211 逆多重化部
212,213,214,215 モノラルマルチモードデコーダ
221 増幅器

Claims (10)

  1. マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成する変換部と、
    前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成する第1符号化部と、
    前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
    前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
    を具備する音声音響信号符号化装置。
  2. 少なくとも3チャネルのマルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して1チャネルの加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を少なくとも2チャネル生成する、変換部と、
    前記1チャネルの加算信号を符号化して第1符号化データを生成する第1符号化部と、
    前記少なくとも2チャネルの差分信号をそれぞれ符号化して第2符号化データを生成する第2符号化部と、
    前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する多重化部と、
    を具備する音声音響信号符号化装置。
  3. 前記音声音響入力信号は、マイクロホンアレーユニットから出力される信号である、
    請求項1または2に記載の音声音響信号符号化装置。
  4. 前記差分信号は、4チャネルの前記音声音響入力信号の差分信号であり、以下の数式に基づいて計算される、
    請求項1または2に記載の音声音響信号符号化装置。
    X=(ch1+ch2)−(ch3+ch4)
    Y=(ch1+ch3)−(ch2+ch4)
    Z=(ch1+ch4)−(ch2+ch3)
    ch1〜ch4は前記複数のチャネル信号であり、X,Y,Zは前記チャネル間の差分信号である。
  5. 前記第1符号化データには、前記加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる、
    請求項1に記載の音声音響信号符号化装置。
  6. 音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成される、逆多重化部と、
    前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得る第1復号部と、
    前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得る第2復号部と、
    前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する逆変換部と、
    を具備する音声音響信号復号装置。
  7. 前記差分信号は、4チャネルの前記音声音響入力信号の差分信号であり、以下の数式に基づいて計算される、
    請求項6に記載の音声音響信号復号装置。
    X=(ch1+ch2)−(ch3+ch4)
    Y=(ch1+ch3)−(ch2+ch4)
    Z=(ch1+ch4)−(ch2+ch3)
    ch1〜ch4は前記複数のチャネル信号であり、X,Y,Zは前記チャネル間の差分信号である。
  8. 前記第1符号化データには、前記加算信号の符号化に用いられた符号化モードを示すモード情報が含まれる、
    請求項6に記載の音声音響信号復号装置。
  9. マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して加算信号を生成し、前記複数のチャネル信号のチャネル間の差分信号を生成し、
    前記加算信号の特徴に応じた符号化モードで前記加算信号を符号化して第1符号化データを生成し、
    前記加算信号の符号化に用いられた符号化モードで前記差分信号をそれぞれ符号化して第2符号化データを生成し、
    前記第1符号化データと前記第2符号化データとを多重化して、マルチチャネル符号化データを生成する、
    音声音響信号符号化方法。
  10. 音声音響信号符号化装置から出力されたマルチチャネル符号化データを第1符号化データと第2符号化データに分離し、前記第1符号化データは、前記音声音響信号符号化装置において、マルチチャネルの音声音響入力信号を構成する複数のチャネル信号を全て加算して生成される加算信号を、前記加算信号の特徴に応じた符号化モードで符号化して生成され、前記第2符号化データは、前記音声音響信号符号化装置において、前記複数のチャネル信号のチャネル間の差分信号を前記加算信号の符号化に用いられた符号化モードでそれぞれ符号化して生成され、
    前記加算信号の符号化に用いられた符号化モードで前記第1符号化データを復号して復号加算信号を得て、
    前記加算信号の符号化に用いられた符号化モードで前記第2符号化データを復号して復号差分信号を得て、
    前記復号加算信号及び前記復号差分信号に対して重み付け加算を施し、復号音声音響信号を生成する、
    音声音響信号復号方法。
JP2015244243A 2015-12-15 2015-12-15 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 Active JP6721977B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015244243A JP6721977B2 (ja) 2015-12-15 2015-12-15 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
CN201680059429.5A CN108140394B (zh) 2015-12-15 2016-11-16 语音音频信号编码装置及其方法、解码装置及其方法
PCT/JP2016/004891 WO2017104105A1 (ja) 2015-12-15 2016-11-16 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
EP16875095.8A EP3392881B1 (en) 2015-12-15 2016-11-16 Audio acoustics signal encoding apparatus, audio acoustics signal decoding apparatus, audio acoustics signal encoding method, and audio acoustics signal decoding method
US15/976,987 US10424308B2 (en) 2015-12-15 2018-05-11 Audio sound signal encoding device, audio sound signal decoding device, audio sound signal encoding method, and audio sound signal decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015244243A JP6721977B2 (ja) 2015-12-15 2015-12-15 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法

Publications (3)

Publication Number Publication Date
JP2017111230A JP2017111230A (ja) 2017-06-22
JP2017111230A5 JP2017111230A5 (ja) 2018-12-20
JP6721977B2 true JP6721977B2 (ja) 2020-07-15

Family

ID=59056323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015244243A Active JP6721977B2 (ja) 2015-12-15 2015-12-15 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法

Country Status (5)

Country Link
US (1) US10424308B2 (ja)
EP (1) EP3392881B1 (ja)
JP (1) JP6721977B2 (ja)
CN (1) CN108140394B (ja)
WO (1) WO2017104105A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
CN106710600B (zh) * 2016-12-16 2020-02-04 广州广晟数码技术有限公司 多声道音频信号的去相关编码方法和装置
SG11202012936VA (en) * 2018-07-04 2021-01-28 Fraunhofer Ges Forschung Multisignal audio coding using signal whitening as preprocessing
JP7176418B2 (ja) * 2019-01-17 2022-11-22 日本電信電話株式会社 多地点制御方法、装置及びプログラム
CN113259083B (zh) * 2021-07-13 2021-09-28 成都德芯数字科技股份有限公司 一种调频同步网相位同步方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3175446B2 (ja) * 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
US5619524A (en) * 1994-10-04 1997-04-08 Motorola, Inc. Method and apparatus for coherent communication reception in a spread-spectrum communication system
EP0938781A2 (en) * 1997-09-12 1999-09-01 Cellon France SAS Transmission system with improved reconstruction of missing parts
JP4163294B2 (ja) * 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
WO2010085083A2 (en) * 2009-01-20 2010-07-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
JP2015011076A (ja) * 2013-06-26 2015-01-19 日本放送協会 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置

Also Published As

Publication number Publication date
EP3392881B1 (en) 2020-05-06
CN108140394A (zh) 2018-06-08
EP3392881A1 (en) 2018-10-24
US20180261233A1 (en) 2018-09-13
WO2017104105A1 (ja) 2017-06-22
US10424308B2 (en) 2019-09-24
CN108140394B (zh) 2022-03-25
JP2017111230A (ja) 2017-06-22
EP3392881A4 (en) 2018-10-24

Similar Documents

Publication Publication Date Title
JP6721977B2 (ja) 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
US11011179B2 (en) Signal processing apparatus and method, and program
KR101117336B1 (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
RU2640647C2 (ru) Устройство и способ преобразования первого и второго входных каналов, по меньшей мере, в один выходной канал
JP5533502B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5163545B2 (ja) オーディオ復号装置及びオーディオ復号方法
EP2285139A3 (en) Device and method for converting spatial audio signal
WO2009084226A1 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
KR20070085532A (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법
US20110112843A1 (en) Signal analyzing device, signal control device, and method and program therefor
WO2015140293A1 (en) Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal
JP2015528925A (ja) オーディオ信号処理装置および方法
JP2017111230A5 (ja)
KR101926209B1 (ko) 입체음향 오디오 신호의 프로세싱
KR20230165855A (ko) 공간 오디오 객체 분리
CA3212985A1 (en) Combining spatial audio streams
JP2007187749A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための新装置
GB2574667A (en) Spatial audio capture, transmission and reproduction
JP5340378B2 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
US10553230B2 (en) Decoding apparatus, decoding method, and program
KR20230017367A (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
US20220124201A1 (en) Multipoint control method, apparatus and program
WO2009142017A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
JP2006270649A (ja) 音声・音響信号処理装置およびその方法
JP2010107821A (ja) マルチチャンネルオーディオ復号装置、マルチチャンネルオーディオ復号方法、プログラム及び集積回路

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181105

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190717

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20191114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200619

R150 Certificate of patent or registration of utility model

Ref document number: 6721977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150