WO2015145660A1

WO2015145660A1 - 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置

Info

Publication number: WO2015145660A1
Application number: PCT/JP2014/058859
Authority: WO
Inventors: 長谷川　真
Original assignee: パイオニア株式会社
Priority date: 2014-03-27
Filing date: 2014-03-27
Publication date: 2015-10-01
Also published as: JP6371376B2; US20170103772A1; US10839824B2; JPWO2015145660A1

Abstract

　高域補間に際して、まず、高調波生成部が、入力された圧縮音声信号（ＣＡＤ）の高調波信号を生成する。こうした高調波信号の生成と並行して、カットオフ周波数Ｆ_C1を有するＨＰＦ部（１２１₁）が、圧縮音声信号（ＣＡＤ）の高域成分を抽出する。また、カットオフ周波数Ｆ_C2（＞Ｆ_C1）を有するＨＰＦ部（１２１₂）が、圧縮音声信号（ＣＡＤ）の高域成分を抽出する。推定部（１２４）は、ＨＰＦ部（１２１₁）の出力信号（ＨＰＤ₁）からＨＰＦ部（１２１₂）の出力信号（ＨＰＤ₂）を差し引いた差信号（ＳＢＤ）の信号レベルと、信号（ＨＰＤ₂）との信号レベルとの比に基づいて、圧縮音声信号（ＣＡＤ）の欠落帯域を推定する。そして、推定部（１２４）が、推定された欠落帯域に基づいて、高域補間のための信号成分を高調波信号から抽出する可変ＨＰＦ部（１３０）のカットオフ周波数を制御する。

Description

音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置

　本発明は、音響装置、欠落帯域推定装置、信号処理方法及び信号処理プログラム、並びに、当該信号処理プログラムが記録された記録媒体、及び、周波数帯域推定装置に関する。

　近年、デジタル形式で記録された音響コンテンツを再生する音響装置が広く普及している。こうした音響コンテンツのデータは、多くの場合に、ファイルサイズを縮小するために、ＭＰ３（MPEG（Moving Picture Expert Group） Audio Layer-3）等の方式によってデジタル圧縮処理が施されている。かかるデジタル圧縮処理が行われて生成された圧縮音声データを解凍して得られる圧縮音声信号は、圧縮処理前の音声データを得る際に採用されたサンプリング周波数（Ｆ_S）によって制限される帯域よりも更に高音帯域が制限された音声信号となっている。そして、圧縮処理により制限される高音帯域は、同一方式による圧縮処理であれば、ビットレートが低くなるほど（すなわち、圧縮率が高くなるほど）広くなる。

　このため、ビットレートに応じた、すなわち、圧縮率の応じた圧縮処理に起因して信号成分が欠落することになった高音帯域を補間する技術が提案されている（特許文献１参照：以下、「従来例」という）。この従来例の技術では、判別手段が、圧縮音声データを解凍して得られる圧縮音声信号とは分離されているビットレート等の情報を読み取る。引き続き、当該判別手段が、読み取られたビットレート等に基づいて、高調波発生手段が発生した高調波信号を通過させるハイパスフィルタのカットオフ周波数を設定することにしている。こうしてカットオフ周波数が設定されたハイパスフィルタを通過した信号が圧縮音声信号と合成されることにより、高音帯域の信号成分が補間される。

特開２００４―３１７６２２号公報

　上述した従来例の技術では、判別手段が、高調波発生手段が発生した高調波信号に対してハイパスフィルタリング処理を施すハイパスフィルタのカットオフ周波数を適切に設定するために、圧縮音声データとは分離されているビットレート等の情報を読み取るようになっている。すなわち、従来例の技術では、判別手段が、圧縮音声データ及びビットレート等の情報が記憶された記憶装置にアクセスできるようになっている。

　ところで、近年においては、圧縮音声データ及びビットレート等の情報は、小型の携帯端末装置により、音響コンテンツとして、ネットワーク上のサーバからダウンロードされる場合が多い。このため、小型の携帯端末装置により生成される圧縮音声信号を、別の音響装置へ送り、当該音響装置により高音帯域の補間を行った高品質な音声信号とした上で、音声出力をすることがある。

　かかる場合に従来例の技術を適用する際には、圧縮音声信号の経路とは異なる経路を介して、携帯端末装置から別の音響装置へビットレート等の情報を送信することが必要となる。したがって、携帯端末装置における機能の追加が必要となり、簡易な構成で高音帯域の補間を行った高品質な音声を出力できるとはいい難かった。

　このため、簡易な構成で高音帯域の補間を行った高品質な音声を出力できる技術が待望されている。かかる要請に応えることが、本発明が解決すべき課題の一つとして挙げられる。

　本発明は、第１の観点からすると、入力された音声信号の高調波を生成する高調波生成部と；カットオフ周波数が可変であり、前記高調波生成部が生成した前記高調波の高域成分を抽出する可変ハイパスフィルタ部と；第１のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記可変ハイパスフィルタ部のカットオフ周波数を制御する制御部と；を備えることを特徴とする音響装置である。

　本発明は、第２の観点からすると、第１のカットオフ周波数を有し、入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記入力された音声信号において信号成分が欠落している高音帯域を推定する推定部と；を備えることを特徴とする欠落帯域推定装置である。

　本発明は、第３の観点からすると、入力された音声信号の高調波を生成する高調波生成部と；カットオフ周波数が可変であり、前記高調波生成部が生成した前記高調波の高域成分を抽出する可変ハイパスフィルタ部と；第１のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；を備える音響装置において使用される信号処理方法であって、前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとを取得する取得工程と；前記取得工程における取得結果に基づいて、前記可変ハイパスフィルタ部のカットオフ周波数を制御する制御工程と；
　を備えることを特徴とする信号処理方法である。

　本発明は、第４の観点からすると、音響装置が有するコンピュータに、本発明の信号処理方法を実行させる、ことを特徴とする信号処理プログラムである。

　本発明は、第５の観点からすると、音響装置が有するコンピュータにより読み取り可能に、本発明の信号処理プログラムが記録されている、ことを特徴とする記録媒体である。

　本発明は、第６の観点からすると、第１のカットオフ周波数を有し、入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記入力された音声信号の周波数帯域を推定する推定部と；を備えることを特徴とする周波数帯域推定装置である。

本発明の一実施形態に係る音響装置の構成を概略的に示すブロック図である。図１の音響装置に入力されるビットレートごとの圧縮音声信号の平均的なスペクトルを示す図である。図１の欠落帯域推定装置の構成を示すブロック図である。図３の２種のハイパスフィルタ（ＨＰＦ）部のフィルタリング特性を説明するための図である。３つのビットレートごとに、図３の２種のレベル検出部の検出対象に対応する信号成分を説明するための図である。図１の合成部の構成を説明するためのブロック図である。図１の装置による高域補間を説明するための図である。

　１００　　…　音響装置
　１１０　　…　高調波生成部
　１２０　　…　欠落帯域推定装置（周波数帯域推定装置）
　１２１₁ 　…　ハイパスフィルタ（第１のハイパスフィルタ）
　１２１₂ 　…　ハイパスフィルタ（第２のハイパスフィルタ）
　１２４　　…　推定部（制御部）
　１３０　　…　可変ハイパスフィルタ部
　１４０　　…　合成部

　以下、本発明の一実施形態を、図１～図７を参照して説明する。なお、図面においては、同一又は同等の要素には同一の符号を付し、重複する説明を省略する。

　［構成］
　図１には、一実施形態に係る音響装置１００の概略的な構成が、ブロック図にて示されている。この図１に示されるように、音響装置１００は、圧縮音声解凍装置（ＣＡＤＤ）２００及び音出力装置３００と接続されている。

　ここで、上記の圧縮音声解凍装置２００は、ＭＰ３規格等の所定の標準規格に準拠して生成された圧縮音声データを解凍して、圧縮音声信号（音声信号）ＣＡＤを生成する。こうして生成された圧縮音声信号ＣＡＤが、音響装置１００へ送られる。

　なお、本実施形態では、圧縮音声信号ＣＡＤは、「ＢＲ１」、「ＢＲ２（＞ＢＲ１）」及び「ＢＲ３（＞ＢＲ２）」の３種類のビットレートのいずれかに対応する圧縮音声信号となっている。

　また、上記の音出力装置３００は、スピーカＳＰを備えて構成されている。この音出力装置３００は、音響装置１００から送られた高域補間後の信号ＨＩＤを受ける。そして、音出力装置３００は、高域補間後の信号ＨＩＤに従った音をスピーカＳＰから出力する。

　＜音響装置１００の構成＞
　上記の音響装置１００は、高調波生成部（ＨＭＧ）１１０と、欠落帯域推定装置（ＭＢＥ）１２０を備えている。また、音響装置１００は、可変ハイパスフィルタ（ＨＰＦ）部１３０と、合成部１４０とを備えている。

　上記の高調波生成部１１０は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤを受ける。引き続き、高調波生成部１１０は、圧縮音声信号ＣＡＤの所定の周波数帯域（０～Ｆ_H）の成分の第１～第Ｎ次の高調波を生成する。そして、生成された高調波のうち、サンプル周波数Ｆ_Sで定まる圧縮前音声の帯域の最高周波数Ｆ_MAX（＝Ｆ_S／２）以下の成分が、信号ＨＭＤとして、可変ＨＰＦ部１３０へ送られる。

　上記の欠落帯域推定装置１２０は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤを受ける。引き続き、欠落帯域推定装置１２０は、圧縮音声信号ＣＡＤに基づいて、圧縮音声信号ＣＡＤにおいて信号成分が欠落している高音帯域（以下、「欠落帯域」とも呼ぶ）を推定する。そして、欠落帯域推定装置１２０は、当該推定された欠落帯域の最低周波数を指定したカットオフ周波数指定ＨＰＣを可変ＨＰＦ部１３０へ送る。

　ここで、圧縮音声信号ＣＡＤにおける欠落帯域を推定することは、圧縮音声信号ＣＡＤの周波数帯域を推定することに他ならない。このため、欠落帯域推定装置１２０は、圧縮音声信号ＣＡＤの周波数帯域を推定する周波数帯域推定装置としての機能も有しているといえる。

　なお、欠落帯域推定装置１２０の構成の詳細については、後述する。

　上記の可変ＨＰＦ部１３０は、高調波生成部１１０から送られた信号ＨＭＤを受ける。また、可変ＨＰＦ部１３０は、欠落帯域推定装置１２０から送られたカットオフ周波数指定ＨＰＣを受ける。そして、可変ＨＰＦ部１３０は、カットオフ周波数指定ＨＰＣで指定された周波数をカットオフ周波数とするハイパスフィルタリング処理を信号ＨＭＤに対して施す。このハイパスフィルタリング処理の結果が、信号ＨＢＤとして合成部１４０へ送られる。

　上記の合成部１４０は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤを受ける。また、合成部１４０は、可変ＨＰＦ部１３０から送られた信号ＨＢＤを受ける。そして、合成部１４０は、圧縮音声信号ＣＡＤと信号ＨＢＤとの合成を行い、高域補間後の信号ＨＩＤを生成する。こうして生成された高域補間後の信号ＨＩＤは、音出力装置３００へ送られる。

　なお、合成部１４０の構成の詳細については、後述する。

　ここで、ビットレートと圧縮音声の帯域との関係を説明する。図２（Ａ）には、サンプル周波数Ｆ_Sでサンプリングされて生成されたデジタル楽曲音に対応する圧縮前音声の平均的なスペクトルが模式的に示されている。この図２（Ａ）に示されるように、圧縮前音声の帯域の上限周波数は、最高周波数Ｆ_MAX（＝Ｆ_S／２）となっている。

　かかる圧縮前音声のデータを圧縮して得られる上述したビットレートＢＲ１～ＢＲ３の圧縮音声データを解凍して得られる圧縮音声の信号帯域が図２（Ｂ）～（Ｄ）に示されている。ここで、図２（Ｂ）には、ビットレートＢＲ１の圧縮音声の信号帯域が示されている。この図２（Ｂ）に示されるように、ビットレートＢＲ１の圧縮音声は、信号帯域の上限周波数が周波数Ｆ_BR1であり、周波数帯域（Ｆ_BR1～Ｆ_MAX）が、圧縮前音声と比べて、信号成分の欠落帯域となっている。

　また、図２（Ｃ）には、ビットレートＢＲ２（＞ＢＲ１）の圧縮音声の信号帯域が示されている。この図２（Ｃ）に示されるように、ビットレートＢＲ２の圧縮音声は、信号帯域の上限周波数が周波数Ｆ_BR2（＞Ｆ_BR1）であり、周波数帯域（Ｆ_BR2～Ｆ_MAX）が、圧縮前音声と比べて、信号成分の欠落帯域となっている。

　また、図２（Ｄ）には、ビットレートＢＲ３（＞ＢＲ２）の圧縮音声の信号帯域が示されている。この図２（Ｄ）に示されるように、ビットレートＢＲ３の圧縮音声は、信号帯域の上限周波数が周波数Ｆ_BR3（＞Ｆ_BR2）であり、周波数帯域（Ｆ_BR3～Ｆ_MAX）が、圧縮前音声と比べて、信号成分の欠落帯域となっている。

　（欠落帯域推定装置１２０の構成）
　次に、上記の欠落帯域推定装置１２０の構成について説明する。

　欠落帯域推定装置１２０は、図３に示されるように、パイパスフィルタ（ＨＰＦ）部１２１₁，１２１₂と、減算部１２２とを備えている。また、欠落帯域推定装置１２０は、レベル検出部１２３₁，１２３₂と、推定部１２４とを備えている。

　上記のＨＰＦ部１２１₁は、カットオフ周波数Ｆ_C1でハイパスフィルタリング処理を行う。このＨＰＦ部１２１₁は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤを受ける。そして、ＨＰＦ部１２１₁は、カットオフ周波数Ｆ_C1のハイパスフィルタリング処理を圧縮音声信号ＣＡＤに対して施す。このハイパスフィルタリング処理の結果が、信号ＨＰＤ₁として減算部１２２へ送られる。

　上記のＨＰＦ部１２１₂は、カットオフ周波数Ｆ_C2（＞Ｆ_C1）でハイパスフィルタリング処理を行う。このＨＰＦ部１２１₂は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤを受ける。そして、ＨＰＦ部１２１₂は、カットオフ周波数Ｆ_C2のハイパスフィルタリング処理を圧縮音声信号ＣＡＤに対して施す。このハイパスフィルタリング処理の結果が、信号ＨＰＤ₂として減算部１２２及びレベル検出部１２３₂へ送られる。

　上記の減算部１２２は、ＨＰＦ部１２１₁から送られた信号ＨＰＤ₁を受ける。また、減算部１２２は、ＨＰＦ部１２１₂から送られた信号ＨＰＤ₂を受ける。そして、減算部１２２は、信号ＨＰＤ₁から信号ＨＰＤ₂を差し引く。こうして算出された結果が、信号ＳＢＤとしてレベル検出部１２３₁へ送られる。

　上記のレベル検出部１２３₁は、減算部１２２から送られた信号ＳＢＤを受ける。そして、レベル検出部１２３₁は、信号ＳＢＤのパワーレベルを検出する。レベル検出部１２３₁による検出結果は、検出レベルＤＬ₁として推定部１２４へ送られる。

　上記のレベル検出部１２３₂は、ＨＰＦ部１２１₂から送られた信号ＨＰＤ₂を受ける。そして、レベル検出部１２３₂は、信号ＨＰＤ₂のパワーレベルを検出する。レベル検出部１２３₂による検出結果は、検出レベルＤＬ₂として推定部１２４へ送られる。

　上記の推定部１２４は、レベル検出部１２３₁から送られた検出レベルＤＬ₁を受ける。また、推定部１２４は、レベル検出部１２３₂から送られた検出レベルＤＬ₂を受ける。そして、推定部１２４は、検出レベルＤＬ₁と検出レベルＤＬ₂との比Ｒ（＝ＤＬ₁／ＤＬ₂）に基づいて、圧縮音声信号ＣＡＤにおける欠落帯域を推定する。

　引き続き、推定部１２４は、推定された欠落帯域の下限周波数を指定したカットオフ周波数指定ＨＰＣを生成する。こうして生成されたカットオフ周波数指定ＨＰＣは、可変ＨＰＦ部１３０へ送られる。

　なお、ＨＰＦ部１２１₁及びＨＰＦ部１２１₂のフィルタリング特性の例が図４に示されている。ここで、図４（Ａ）には、ＨＰＦ部１２１₁のフィルタリング特性の例が示されている。また、図４（Ｂ）には、ＨＰＦ部１２１₂のフィルタリング特性の例が示されている。

　ここで、ＨＰＦ部１２１₂のフィルタリング特性は、ビットレートが「ＢＲ１」，「ＢＲ２」，「ＢＲ３」のいずれであっても、比Ｒの算出に際して、推定部１２４における除算資源がオーバフローを起こさないように設定される。

　また、ＨＰＦ部１２１₁及びＨＰＦ部１２１₂の検出対象に対応する信号成分が図５に模式的に示されている。なお、図５では、ＨＰＦ部１２１₁の検出対象に対応する信号成分が横線ハッチで示されるとともに、ＨＰＦ部１２１₂の検出対象に対応する信号成分が縦線ハッチで示されている。

　ここで、図５（Ａ）には、ビットレートＢＲ１の場合に、ＨＰＦ部１２１₁及びＨＰＦ部１２１₂の検出対象に対応する信号成分が模式的に示されている。また、図５（Ｂ）には、ビットレートＢＲ２の場合に、ＨＰＦ部１２１₁及びＨＰＦ部１２１₂の検出対象に対応する信号成分が模式的に示されている。また、図５（Ｃ）には、ビットレートＢＲ３の場合に、ＨＰＦ部１２１₁及びＨＰＦ部１２１₂の検出対象に対応する信号成分が模式的に示されている。

　図５（Ａ）～（Ｃ）を相互に比較して分るように、ビットレートが異なると、算出される比Ｒが異なるようになっている。このため、算出された比Ｒの値に基づいて圧縮音声信号ＣＡＤにおける欠落領域が推定できるので、ビットレートに対する欠落帯域が一義的に決まっている場合は、推定部１２４は、圧縮音声信号ＣＡＤのビットレートを推定することができる。

　（合成部１４０の構成）
　次いで、上記の合成部１４０の構成について説明する。

　合成部１４０は、図６に示されるように、遅延部１４１と、乗算部１４２₁，１４２₂を備えている。また、合成部１４０は、加算部１４３を備えている。

　上記の遅延部１４１は、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤ（＝Ｄ₀（Ｔ）（Ｔ：時刻））を受ける。そして、遅延部１４１は、圧縮音声信号ＣＡＤを、高調波生成部１１０及び可変ＨＰＦ部１３０における位相遅延に対応する時間Ｔ_DLだけ遅延させた信号ＤＬＤ（＝Ｄ（Ｔ））を生成する。ここで、信号Ｄ（Ｔ）と圧縮音声信号Ｄ₀（Ｔ）との関係は、次の（１）式で表される。
　　Ｄ（Ｔ）＝Ｄ₀（Ｔ－Ｔ_DL）　　　　　　　…（１）

　この結果、信号ＤＬＤと、上述した可変ＨＰＦ部１３０から出力される信号ＨＢＤとの同期が図られるようになっている。こうして生成された信号ＤＬＤは、乗算部１４２₁へ送られる。

　上記の乗算部１４２₁は、遅延部１４１から送られた信号ＤＬＤを受ける。そして、乗算部１４２₁は、信号ＤＬＤをＫ₁倍して信号ＭＬＤを生成する。こうして生成された信号ＭＬＤは、加算部１４３へ送られる。

　上記の乗算部１４２₂は、可変ＨＰＦ部１３０から送られた信号ＨＢＤを受ける。そして、乗算部１４２₂は、信号ＨＢＤをＫ₂倍して信号ＭＨＤを生成する。こうして生成された信号ＭＨＤは、加算部１４３へ送られる。

　なお、値Ｋ₁と値Ｋ₂との比は、適切な高域補間の観点から、実験、シミュレーション、経験等に基づいて予め定められる。

　上記の加算部１４３は、乗算部１４２₁から送られた信号ＭＬＤを受ける。また、加算部１４３は、乗算部１４２₂から送られた信号ＭＨＤを受ける。そして、加算部１４３は、信号ＭＬＤと信号ＭＨＤとを加算して高域補間後の信号ＨＩＤを生成する。こうして生成された高域補間後の信号ＨＩＤは、音出力装置３００へ送られる。

　上述のようにして生成された信号ＭＨＤのスペクトルが図７に示されている。ここで、図７（Ａ）には、ビットレートＢＲ１の圧縮音声信号ＣＡＤに対応して生成された信号ＭＨＤのスペクトルが、破線にて示されている。また、図７（Ｂ）には、ビットレートＢＲ２の圧縮音声信号ＣＡＤに対応して生成された信号ＭＨＤのスペクトルが、破線にて示されている。さらに、図７（Ｃ）には、ビットレートＢＲ３の圧縮音声信号ＣＡＤに対応して生成された信号ＭＨＤのスペクトルが、破線にて示されている。なお、図７（Ａ）～（Ｃ）では、信号ＤＬＤをＫ₁倍した信号ＭＬＤ（ひいては、圧縮音声信号ＣＡＤをＫ₁倍した信号）のスペクトルが、実線にて示されている。

　図７（Ａ）～（Ｃ）に示されるように、信号ＨＭＤは、圧縮音声信号ＣＡＤにおける信号成分の欠落帯域を、適切に補間する信号となっている。

　［動作］
　次に、上記のように構成された音響装置１００の動作について、圧縮音声信号ＣＡＤに基づく信号ＨＢＤ（図１参照）の生成処理に主に着目して説明する。

　圧縮音声解凍装置２００が圧縮音声信号ＣＡＤの供給を開始すると、音響装置１００では、高調波生成部１１０及び欠落帯域推定装置１２０が圧縮音声信号ＣＡＤを受ける。また、音響装置１００では、合成部１４０が圧縮音声信号ＣＡＤを受ける（図１参照）。

　圧縮音声信号ＣＡＤを受けると、高調波生成部１１０は、圧縮音声信号ＣＡＤの所定の周波数帯域の成分の高調波を生成する。そして、高調波生成部１１０は、生成された高調波のうち、サンプル周波数Ｆ_Sで定まる圧縮前音声の帯域の最高周波数Ｆ_MAX以下の成分を、信号ＨＭＤとして、可変ＨＰＦ部１３０へ送る（図１参照）。

　一方、圧縮音声信号ＣＡＤを受けると、欠落帯域推定装置１２０は、上述の高調波生成部１１０による高周波発生と並行して、圧縮音声信号ＣＡＤに基づいて、圧縮音声信号ＣＡＤにおける欠落帯域を推定する。かかる欠落帯域の推定に際して、欠落帯域推定装置１２０では、圧縮音声信号ＣＡＤを受けたＨＰＦ部１２１₁が、カットオフ周波数Ｆ_C1のハイパスフィルタリング処理を圧縮音声信号ＣＡＤに対して施す。そして、ＨＰＦ部１２１₁は、ハイパスフィルタリング処理の結果を、信号ＨＰＤ₁として減算部１２２へ送る（図３参照）。

　また、圧縮音声信号ＣＡＤを受けると、ＨＰＦ部１２１₂が、上述のＨＰＦ部１２１₁によるハイパスフィルタリング処理と並行して、カットオフ周波数Ｆ_C2のハイパスフィルタリング処理を圧縮音声信号ＣＡＤに対して施す。そして、ＨＰＦ部１２１₂は、ハイパスフィルタリング処理の結果を、信号ＨＰＤ₂として減算部１２２及びレベル検出部１２３₂へ送る（図３参照）。

　ＨＰＦ部１２１₁から送られた信号ＨＰＤ₁、及び、ＨＰＦ部１２１₂から送られた信号ＨＰＤ₂を受けると、減算部１２２は、信号ＨＰＤ₁と信号ＨＰＤ₂との差分を算出する。そして、減算部１２２は、算出された差分を、信号ＳＢＤとしてレベル検出部１２３₁へ送る（図３参照）。

　減算部１２２から送られた信号ＳＢＤを受けると、レベル検出部１２３₁は、信号ＳＢＤのパワーレベルを検出する。そして、レベル検出部１２３₁は、検出結果を、検出レベルＤＬ₁として推定部１２４へ送る（図３参照）。

　ＨＰＦ部１２１₂から送られた信号ＨＰＤ₂を受けると、レベル検出部１２３₂は、信号ＨＰＤ₂のパワーレベルを検出する。そして、レベル検出部１２３₂は、検出結果を、検出レベルＤＬ₂として推定部１２４へ送る（図３参照）。

　レベル検出部１２３₁から送られた検出レベルＤＬ₁、及び、レベル検出部１２３₂から送られた検出レベルＤＬ₂を受けると、推定部１２４は、検出レベルＤＬ₁及び検出レベルＤＬ₂に基づいて、カットオフ周波数指定ＨＰＣを生成する。かかるカットオフ周波数指定ＨＰＣの生成に際して、推定部１２４は、まず、検出レベルＤＬ₁と検出レベルＤＬ₂との比Ｒ（＝ＤＬ₁／ＤＬ₂）を算出する。

　引き続き、推定部１２４は、算出された比Ｒに基づいて、圧縮音声信号の欠落帯域を推定する。

　次に、推定部１２４は、推定された欠落帯域の下限周波数を指定したカットオフ周波数指定ＨＰＣを生成する。そして、推定部１２４は、生成されたカットオフ周波数指定ＨＰＣは、可変ＨＰＦ部１３０へ送る（図３参照）。

　欠落帯域推定装置１２０（より詳しくは、推定部１２４）から送られたカットオフ周波数指定ＨＰＣを受けると、可変ＨＰＦ部１３０は、カットオフ周波数指定ＨＰＣで指定された周波数をカットオフ周波数とするハイパスフィルタリング処理を、高調波生成部１１０から送られた信号ＨＭＤに対して施して、信号ＨＢＤを生成する。そして、可変ＨＰＦ部１３０は、生成された信号ＨＢＤを合成部１４０へ送る（図１参照）。

　可変ＨＰＦ部１３０から送られた信号ＨＢＤを受けると、合成部１４０は、信号ＨＢＤと、圧縮音声解凍装置２００から送られた圧縮音声信号ＣＡＤとの合成を行う。かかる合成に際して、合成部１４０では、遅延部１４１が、圧縮音声信号ＣＡＤを、高調波生成部１１０及び可変ＨＰＦ部１３０における位相遅延に対応する時間Ｔ_DLだけ遅延させて、信号ＨＢＤとの同期が図られ信号ＤＬＤを生成する。そして、遅延部１４１は、生成された信号ＤＬＤを乗算部１４２₁へ送る（図６参照）。

　遅延部１４１から送られた信号ＤＬＤを受けると、乗算部１４２₁は、信号ＤＬＤをＫ₁倍して信号ＭＬＤを生成する。そして、乗算部１４２₁は、生成された信号ＭＬＤを加算部１４３へ送る（図６参照）。

　一方、乗算部１４２₂は、信号ＨＢＤをＫ₂倍して信号ＭＨＤを生成する。そして、乗算部１４２₂は、生成された信号ＭＨＤを加算部１４３へ送る（図６参照）。

　乗算部１４２₁から送られた信号ＭＬＤ、及び、乗算部１４２₂から送られた信号ＭＨＤを受けると、加算部１４３は、信号ＭＬＤと信号ＭＨＤとを加算して、高域補間がなされた信号ＨＩＤを生成する。そして、加算部１４３は、生成された高域補間後の信号ＨＩＤを音出力装置３００へ送る（図６参照）。

　すなわち、合成部１４０は、信号ＨＢＤと圧縮音声信号ＣＡＤとの同期を図ったうえで、適切な高域補間ができる混合比で重み付け加算して、信号ＨＢＤと圧縮音声信号ＣＡＤとの合成を行う。かかる合成の結果として生成された高域補間後の信号ＨＩＤが、音出力装置３００へ送られるようになっている。

　音響装置１００（より詳しくは、合成部１４０）から送られた高域補間後の信号ＨＩＤを受けると、音出力装置３００は、高域補間後の信号ＨＩＤに従った音をスピーカＳＰから出力する。この結果、圧縮音声信号ＣＡＤのビットレートに対応して適切に高域補間が行われた高品質の音声が、音出力装置３００から出力される。

　以上説明したように、本実施形態では、高域補間に際して、まず、高調波生成部１１０が、入力された圧縮音声信号ＣＡＤの高調波を生成する。こうした高調波の生成と並行して、欠落帯域推定装置１２０が圧縮音声信号ＣＡＤにおける欠落帯域を推定する。

　かかる欠落帯域の推定に際して、欠落帯域推定装置１２０では、カットオフ周波数Ｆ_C1を有するハイパスフィルタ部１２１₁が、圧縮音声信号ＣＡＤの高域成分を抽出するとともに、カットオフ周波数Ｆ_C2（＞Ｆ_C1）を有するハイパスフィルタ部１２１₂が、圧縮音声信号ＣＡＤの高域成分を抽出する。引き続き、欠落帯域推定装置１２０では、推定部１２４が、ハイパスフィルタ部１２１₁（第１のハイパスフィルタ部）から出力された信号ＨＰＤ₁からハイパスフィルタ部１２１₂（第２のハイパスフィルタ部）から出力された信号ＨＰＤ₂を差し引いた差信号ＳＢＤのレベルと、信号ＨＰＤ₂とのレベルとの比Ｒを算出する。なお、圧縮音声信号ＣＡＤのビットレートが異なると、比Ｒが異なるように、ハイパスフィルタ部１２１₁，１２１₂のフィルタリング特性が設定される。

　次に、推定部１２４が、算出された比Ｒに基づいて、圧縮音声信号ＣＡＤの欠落帯域を推定する。そして、推定部１２４が、推定された欠落帯域の下限周波数を指定したカットオフ周波数指定ＨＰＣを可変ＨＰＦ部１３０へ送ることにより、可変ＨＰＦ部１３０によるハイパスフィルタリング処理を制御する。

　かかる制御もとで、可変ＨＰＦ部１３０は、カットオフ周波数指定ＨＰＣで指定された周波数をカットオフ周波数とするハイパスフィルタリング処理を、高調波生成部１１０から送られた信号ＨＭＤに対して施して、信号ＨＢＤを生成する。そして、合成部１４０により、圧縮音声信号ＣＡＤと信号ＨＢＤとが合成される。

　したがって、本実施形態によれば、簡易な構成で高音帯域の補間を適切に行った高品質な音声を出力できる。

　［実施形態の変形］
　本発明は、上記の実施形態に限定されるものではなく、様々な変形が可能である。

　例えば、上記の実施形態では、第１のハイパスフィルタ部から出力された信号から第２のハイパスフィルタ部から出力された信号を差し引いた差信号のレベルと、第２のハイパスフィルタ部から出力された信号のレベルとの比に基づいて、入力された圧縮音声信号の欠落帯域を推定するようにした。これに対し、第１のハイパスフィルタ部から出力された信号のレベルと、第２のハイパスフィルタ部から出力された信号のレベルとの比に基づいて、入力された圧縮音声信号の周波数帯域を推定するようにしてもよい。そして、推定された周波数帯域の上限周波数を指定したカットオフ周波数指定を、可変ＨＰＦ部に対して行うようにしてもよい。

　また、圧縮音声信号のビットレートが異なると、第１のハイパスフィルタ部から出力された信号のレベルと、第２のハイパスフィルタ部から出力された信号のレベルとの比が異なるのであれば、上記の実施形態で例示したハイパスフィルタ部の特性以外のフィルタリング特性を有するハイパスフィルタ部を採用してもよい。

　また、上記の実施形態では、圧縮音声信号の高域補間に本発明を適用するようにしたが、圧縮音声信号以外の音声信号の高域補間に本発明を適用してもよい。

　また、上記の実施形態では、音響装置とは別の装置として圧縮音声解凍装置及び音出力装置が配置される構成とした。これに対し、音響装置が圧縮音声解凍装置の機能を備えるようにしてもよいし、また、音響装置が音出力装置の機能を備えるようにしてもよい。

　なお、上記の実施形態の音響装置を、ＤＳＰ（Digital Signal Processor）等を備えた演算手段としてのコンピュータとして構成し、予め用意されたプログラムを当該コンピュータで実行することにより、上記の実施形態における処理の一部又は全部を実行するようにしてもよい。このプログラムは、ＣＤ－ＲＯＭ、ＤＶＤ等の可搬型記録媒体に記録された形態で取得されるようにしてもよいし、インターネットなどのネットワークを介した配送の形態で取得されるようにしてもよい。

Claims

　入力された音声信号の高調波を生成する高調波生成部と；
　カットオフ周波数が可変であり、前記高調波生成部が生成した前記高調波の高域成分を抽出する可変ハイパスフィルタ部と；
　第１のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；
　前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；
　前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記可変ハイパスフィルタ部のカットオフ周波数を制御する制御部と；
　を備えることを特徴とする音響装置。
　前記第１のカットオフ周波数及び前記第２のカットオフ周波数は、前記入力された音声信号に対応するビットレートが異なると、前記第１のハイパスフィルタ部の出力信号のレベルと前記第２のハイパスフィルタ部の出力信号のレベルとの比が異なるように設定される、
　ことを特徴とする請求項１に記載の音響装置。
　前記制御部は、前記第１のハイパスフィルタ部の出力信号から前記第２のハイパスフィルタ部の出力信号を差し引いた差信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとの比に基づいて、前記可変ハイパスフィルタ部のカットオフ周波数を制御する、ことを特徴とする請求項２に記載の音響装置。
　前記入力された音声信号と、前記可変ハイパスフィルタ部の出力信号とを合成する合成部を更に備える、ことを特徴とする請求項１～３のいずれか一項に記載の音響装置。
　第１のカットオフ周波数を有し、入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；
　前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；
　前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記入力された音声信号において信号成分が欠落している高音帯域を推定する推定部と；
　を備えることを特徴とする欠落帯域推定装置。
　入力された音声信号の高調波を生成する高調波生成部と；カットオフ周波数が可変であり、前記高調波生成部が生成した前記高調波の高域成分を抽出する可変ハイパスフィルタ部と；第１のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；を備える音響装置において使用される信号処理方法であって、
　前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとを取得する取得工程と；
　前記取得工程における取得結果に基づいて、前記可変ハイパスフィルタ部のカットオフ周波数を制御する制御工程と；
　を備えることを特徴とする信号処理方法。
　音響装置が有するコンピュータに、請求項６に記載の信号処理方法を実行させる、ことを特徴とする信号処理プログラム。
　音響装置が有するコンピュータにより読み取り可能に、請求項７に記載の信号処理プログラムが記録されている、ことを特徴とする記録媒体。
　第１のカットオフ周波数を有し、入力された音声信号の高域成分を抽出する第１のハイパスフィルタ部と；
　前記第１のカットオフ周波数よりも高い第２のカットオフ周波数を有し、前記入力された音声信号の高域成分を抽出する第２のハイパスフィルタ部と；
　前記第１のハイパスフィルタ部の出力信号のレベルと、前記第２のハイパスフィルタ部の出力信号のレベルとに基づいて、前記入力された音声信号の周波数帯域を推定する推定部と；
　を備えることを特徴とする周波数帯域推定装置。