JP2012244336A - 音声信号処理装置、音声信号処理方法および音響再生装置 - Google Patents
音声信号処理装置、音声信号処理方法および音響再生装置 Download PDFInfo
- Publication number
- JP2012244336A JP2012244336A JP2011111338A JP2011111338A JP2012244336A JP 2012244336 A JP2012244336 A JP 2012244336A JP 2011111338 A JP2011111338 A JP 2011111338A JP 2011111338 A JP2011111338 A JP 2011111338A JP 2012244336 A JP2012244336 A JP 2012244336A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- sound
- speaker
- unit
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Details Of Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】スピーカから出力される音が周囲の物体に反射した後に到達する反射音を良好に受聴可能とする。
【解決手段】入力音声信号Diに基づいて、キャンセル用音声信号を生成する。そして、このキャンセル用音声信号を、入力音声信号に加算して、出力音声信号Di″を得る。キャンセル用音声信号は、スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音(主とする音)が到達した後に到達する所定の第2の反射音(副とする音)をキャンセルするための信号である。この出力音声信号をスピーカに供給することで、スピーカから出力されて受聴点に到達する反射音に、上述の第2の反射音をキャンセルする反射音が含まれるようになり、結果的に受聴点において第2の反射音がキャンセルされる。スピーカは、例えばテレビ受信機等の表示機器の筐体の背面側に下向きに取り付けられている。
【選択図】図10
【解決手段】入力音声信号Diに基づいて、キャンセル用音声信号を生成する。そして、このキャンセル用音声信号を、入力音声信号に加算して、出力音声信号Di″を得る。キャンセル用音声信号は、スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音(主とする音)が到達した後に到達する所定の第2の反射音(副とする音)をキャンセルするための信号である。この出力音声信号をスピーカに供給することで、スピーカから出力されて受聴点に到達する反射音に、上述の第2の反射音をキャンセルする反射音が含まれるようになり、結果的に受聴点において第2の反射音がキャンセルされる。スピーカは、例えばテレビ受信機等の表示機器の筐体の背面側に下向きに取り付けられている。
【選択図】図10
Description
本技術は、音声信号処理装置、音声信号処理方法および音響再生装置に関する。特に、本技術は、スピーカから出力される音が周囲の物体に反射した後に到達する音、つまり反射音を受聴する音響再生装置に適用し得る音声信号処理装置等に関する。
近年、プラズマ、液晶などの表示デバイスが広く一般化し、テレビ受信機は薄型化、大型化の一途を辿っている。このようなテレビ受信機においては、薄型化によってスピーカサイズは大きな制約を受け、また、画面の大型化、狭縁化によって、画面両端へのスピーカ設置が困難になってきている。その結果、テレビ受信機に設置されるスピーカに関しては、サイズが小さく、かつ設置位置が背面に移設され、さらには下向きに設置されることが多くなっている(例えば、特許文献1参照)。
そのため、使用者に届く音はとても「良い音」と呼べるものではなくなってきている。なお、ここで言う「良い音」とは、個々人の主観的なものではなく、物理的に理想的な特性、つまりフラットな周波数特性を持つスピーカがあったとして、これを受聴点に向けて正面に配置して視聴者が受聴する場合を想定する。つまり、再生されるべき記録された音の周波数特性が、できる限りそのままに受聴できる場合を「良い音」が実現できている、とする。
さて、使用者からみてスピーカが下向きになっただけで、大抵の人は音が良くきこえないことは容易に想像がつく。その原因の客観的な一例を挙げる。すなわち、音の低域成分は指向性が鋭くないため、スピーカが下向きでも使用者に届きやすいので、比較的聞こえやすい。しかし、高域成分になればなるほど指向性が強くなるため、使用者には聞こえづらくなる。このため、音としては高域がないようないわゆる「こもった音」になる。この対策として、高域を持ち上げる信号処理を施すことで周波数特性をフラットに近づけて十分な高域再生を実現し、「こもった音」を解消することで「良い音」を実現するための努力がなされている。
しかし、信号処理で周波数特性を調整するといっても、設計段階では、テレビが使用者環境でどのように設置されるのかは不明である。例えば、テレビ受信機の筐体にスピーカを下向きに取り付けた場合、使用者の受聴点においてどのような周波数特性を持つか、設計者には把握できない。この場合、テレビ受信機が低いテレビ台に置かれるのか、あるいは高さが1m位もあるテレビスタンドに設置されるのかによって、周波数特性が大きく異なってくるからである。
結局、設計段階では、信号処理でどの程度高域を上げるべきかなど、周波数特性をフラット化するための逆フィルタの特性をはっきりと決めることができない。そのため、設計者は使用者の環境を「推測」し、あるいは特定の環境を想定した「仮定」で、信号処理の内容を決めなくてはならない。したがって、その信号処理機能をテレビ受信機に実装しても、使用者がその恩恵を受けることができるかは曖昧といわざるを得ない。
また、大局的に低域、高域といった2点の周波数特性を調整しただけではフラット化は困難であり、「良い音」が実現できるわけではない。低域、高域で大雑把にでも周波数特性を調整すれば、多少なりとも音質は改善する。しかし、それでも「音声が聞き取りにくい」、「楽器ごとのバランスがおかしい」といった、細かい音質問題は容易に改善しないことが多い。
本技術の目的は、スピーカから出力される音が周囲の物体に反射した後に使用者に到達する反射音を良好に受聴可能とすることにある。
本技術の概念は、
スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して出力音声信号を得る音声信号加算部と
を備える音声信号処理装置にある。
スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して出力音声信号を得る音声信号加算部と
を備える音声信号処理装置にある。
本技術において、キャンセル用音声信号生成部により、キャンセル用音声信号が生成される。そして、音声信号加算部により、このキャンセル用音声信号が入力音声信号に加算されて出力音声信号が得られる。キャンセル用音声信号は、スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのものである。スピーカは、例えばテレビ受信機等の表示機器の筐体の背面側に下向きに取り付けられている。この場合、使用者は、スピーカから出力されて受聴点に到達する反射音を受聴する。この反射音は、スピーカから出力される音が周囲の物体に反射した後に到達する音である。
このように本技術においては、出力音声信号は、入力音声信号に、キャンセル用音声信号が加算されたものとなる。そのため、この出力音声信号をスピーカに供給することで、スピーカから出力して受聴点に到達する反射音に、上述の第2の反射音をキャンセルする反射音が含まれるようになり、結果的に受聴点において第2の反射音がキャンセルされる。したがって、使用者は、受聴点において、第1の反射音を、上述の第2の反射音に影響されることなく、良好に受聴可能となる。
なお、本技術において、例えば、キャンセル用音声信号生成部は、入力音声信号を、受聴点に到達する第1の反射音と第2の反射音との時間差に対応する時間だけ遅延させる遅延部と、この遅延部の出力信号のゲインを反射量に応じて調整してキャンセル用音声信号を得るゲイン調整部とを有する、ようにされてもよい。
そして、本技術において、例えば、遅延部における遅延量を調整するための情報としてスピーカの設置位置から壁までの距離の情報をユーザが入力するためのユーザインタフェースと、このユーザインタフェースで入力される距離の情報に基づいて、遅延部における遅延量を制御する制御部とをさらに備える、ようにされてもよい。この場合、ユーザインタフェースは、距離の情報をユーザが入力するためのGUI表示を行う表示部と、表示部に表示されたGUI表示を用いて距離の情報をユーザが入力するためのユーザ入力部とを有する、ようにされてもよい。このようにユーザインタフェースが備えられることで、実際のスピーカの設置位置から壁までの距離に応じて、遅延部における遅延量を最適に調整することが可能となる。
また、本技術において、例えば、スピーカの設定位置から壁までの距離の情報を得る距離センサと、この距離センサで得られる距離の情報に基づいて、遅延部における遅延量を制御する制御部とをさらに備える、ようにされてもよい。この場合、実際のスピーカの設置位置から壁までの距離の情報が距離センサにより得られるので、使用者の手間を必要とすることなく、遅延部における遅延量を最適に調整することが可能となる。
また、本技術において、例えば、ゲイン調整部におけるゲインを調整するための情報として反射量の情報をユーザが入力するためのユーザインタフェースと、このユーザインタフェースで入力される反射量の情報に基づいて、ゲイン調整部におけるゲインを制御する制御部とをさらに備える、ようにされてもよい。この場合、ユーザインタフェースは、反射量の情報をユーザが入力するためのGUI表示を行う表示部と、表示部に表示されたGUI表示を用いて反射量の情報をユーザが入力するためのユーザ入力部とを有する、ようにされてもよい。このようにユーザインタフェースが備えられることで、ゲイン調整部におけるゲインを最適に調整することが可能となる。
本技術によれば、スピーカから出力される音が周囲の物体に反射した後に到達する反射音を良好に受聴できるようになる。
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態
2.第2の実施の形態
3.第3の実施の形態
4.変形例
1.第1の実施の形態
2.第2の実施の形態
3.第3の実施の形態
4.変形例
<1.第1の実施の形態>
最初に、本技術の原理について説明する。
[スピーカが前面側にある場合]
図1は、スピーカSPがテレビ受信機(TV)の筐体の前面側に配置されている例を示している。この場合、使用者は、主に、テレビ受信機の正面側に位置して視聴する。そのため、スピーカSPから出力された音Doが直接に受聴点Pに音Dpとして届く。
最初に、本技術の原理について説明する。
[スピーカが前面側にある場合]
図1は、スピーカSPがテレビ受信機(TV)の筐体の前面側に配置されている例を示している。この場合、使用者は、主に、テレビ受信機の正面側に位置して視聴する。そのため、スピーカSPから出力された音Doが直接に受聴点Pに音Dpとして届く。
この音Dpは、本来であれば空間伝播時になんらかの減衰や周波数特性の変化を受ける可能性がある。しかし、ここでは、説明の簡単化のため、空間伝播時の減衰や周波数特性の変化は非常に小さく、無視できるものとして説明する。ただし、伝播経路長が異なる場合には、時間遅れは発生するものと仮定する。
[スピーカが背面側にある場合]
図2は、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されている例を示している。この場合、使用者は、主に、テレビ受信機の正面側に位置して視聴する。この場合、スピーカSPから出力された音Doは、テレビ受信機を載せた台のS点でまず反射し、その後、受聴点Pに音Dp′として届く。本技術では、この反射に着目しており、反射による減衰はあるものとする。
図2は、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されている例を示している。この場合、使用者は、主に、テレビ受信機の正面側に位置して視聴する。この場合、スピーカSPから出力された音Doは、テレビ受信機を載せた台のS点でまず反射し、その後、受聴点Pに音Dp′として届く。本技術では、この反射に着目しており、反射による減衰はあるものとする。
一般的には、物体による音の反射率は、全ての周波数成分で均一ではない。そのため、反射音はS点において周波数特性の変化を受けたのち、P点に音Dp′として届く。この際、たとえば高域が大きく減衰することなどにより、P点に届くのは「こもった音」になる場合がある。その結果、音楽においてきらびやかさがなくなってつまらなくなってしまう、あるいは音声では明瞭度が下がって聞き取りにくくなってしまう、といった問題がある。
[理想周波数特性Dと、実際の周波数特性D′の違い]
図3(a)は、一例として、図1のP点に届く音Dpの周波数特性f(Dp)と、図2のP点に届く音Dp′の周波数特性f(Dp′)の比較を示している。ここでは、説明の簡単化のため、f(Dp)を基準として、これを平坦化して評価するものとする。f(Dp′)はS点における反射により周波数特性の変化を受け、例えば、図示のように、全体的に大きさGが小さくなったり、山谷ができたりする。
図3(a)は、一例として、図1のP点に届く音Dpの周波数特性f(Dp)と、図2のP点に届く音Dp′の周波数特性f(Dp′)の比較を示している。ここでは、説明の簡単化のため、f(Dp)を基準として、これを平坦化して評価するものとする。f(Dp′)はS点における反射により周波数特性の変化を受け、例えば、図示のように、全体的に大きさGが小さくなったり、山谷ができたりする。
全体的に大きさが小さくなるのは直感的に理解できるが、これは物体における反射率が100%でないために生じる現象である。また、周波数によって減衰率が異なるのは、反射を起こす物体表面の材質や内部損失率が周波数によって均一でないために生じる現象である。その結果、f(Dp′)は、f(Dp)に比べ、高域が減衰していわゆる「こもった音」になる。このような現象は当該業者間ではよく知られている。そのため、これ以上の説明は省略する。
[f(Dp′)を理想特性f(Dp)に近づける信号処理を実施してf(Dp″)に調整]
このように、同じスピーカSPから同じ音を出したとしても、スピーカSPの配置によってP点では大きな音の違いが出ることは従来からよく知られている。そこで、f(Dp′)の音のきらびやかさや明瞭度を回復させるために、図3(b)に示すように、Dp′の周波数特性f(Dp′)を、f(Dp″)のように調整する技術が一般的に用いられてきた。具体的には、アナログ信号処理、あるいはデジタル信号処理によってフィルタ処理を行い、f(Dp′)をf(Dp″)のように調整する。
このように、同じスピーカSPから同じ音を出したとしても、スピーカSPの配置によってP点では大きな音の違いが出ることは従来からよく知られている。そこで、f(Dp′)の音のきらびやかさや明瞭度を回復させるために、図3(b)に示すように、Dp′の周波数特性f(Dp′)を、f(Dp″)のように調整する技術が一般的に用いられてきた。具体的には、アナログ信号処理、あるいはデジタル信号処理によってフィルタ処理を行い、f(Dp′)をf(Dp″)のように調整する。
アナログ、デジタルに関わらず、用いられる信号処理は、ある周波数領域ごとに大きさを調整するものである。現在はデジタル信号処理が広く用いられており、例えばFIR(Finite Impulse Response)フィルタやIIR(InfiniteImpulse Response)フィルタを使うことで、このような調整は容易に実現可能となっている。
ただし、f(Dp′)を完全にf(Dp)の周波数特性に戻すことは困難である。その理由は、FIR/IIRでも、製品においてはそのリソース(演算量、ROM/RAM容量)に制限があるためであり、例えば、いくら調整したとしても、f(Dp″)のように若干のズレは残ったままとなる。f(Dp)に近づけようとすればするほど、リソースは巨大化し、コストや使用電力量の増加を招き、製品の価格を上昇させてしまう要因となる。よって、使用者におけるメリット、デメリットと、設計者側のメリット、デメリットの適切なバランスを取ることが常に求められることとなる。
図4(a)には、図3(a)のf(Dp)を実現する音響再生装置の一例を示している。入力音声信号Diはアンプにて電力増幅されたのちスピーカSPに送られ、このスピーカSPから音Doとして再生され、P点に音Dpとして到達する。ここでは、説明の都合上、このときのP点での再生音Dpの周波数特性と、入力音声信号Diの周波数特性は等しいと定義する。
図4(b)には、図3(a)のf(Dp′)を実現する音響再生装置の一例を示している。入力音声信号Diの特性は、図4(a)と同じであり、これがアンプにて電力増幅されたのちスピーカSPに送られ、このスピーカSPから音Doとして再生される。しかし、この音Doは、P点に届くまでに、図2および図3(a)で説明したように、S点での反射により周波数特性に変化が生じ、DpではなくDp′となる。
図4(c)には、図3(b)のf(Dp″)を実現する音響再生装置の一例を示している。入力音声信号Diの特性は、図4(a)、図4(b)と同じである。しかし、アンプで電力増幅される前に、フィルタにて周波数調整が実施されてDi′に変化させられた後、アンプに伝送される。このように周波数調整された音声信号は、アンプで電力増幅された後、スピーカから音Do′として再生され、P点に音Dp″として到達する。
周波数調整の内容は、図3(b)の説明で詳細を示したのでここでは省略する。その結果、P点におけるDp″の周波数特性f(Dp″)を、Dpの周波数特性f(Dp)に近い形に調整することが可能となり、本来再生されるべきである周波数特性に近い音質を実現できることとなる。この調整方法を実施するためには、周波数特性が変化した原因は必要とされず、f(Dp)とf(Dp″)ができるだけ一致するように、結果だけをみてフィルタの周波数調整を設定すればよい。
[スピーカが前面側にある場合+反射を考慮]
上述の図1にはスピーカSPがテレビ受信機(TV)の筐体の前面側に配置されている例を示したが、音の反射という現象が考慮されていない。図5は、スピーカSPがテレビ受信機(TV)の筐体の前面側に配置され、さらに、音の反射を考慮した一例を示している。
上述の図1にはスピーカSPがテレビ受信機(TV)の筐体の前面側に配置されている例を示したが、音の反射という現象が考慮されていない。図5は、スピーカSPがテレビ受信機(TV)の筐体の前面側に配置され、さらに、音の反射を考慮した一例を示している。
この図5では、図1と同様に、P点に届く受聴のための主とする音は、スピーカSPから届く直接音Dpであるが、それ以外に、例えば、天井のS1点からの反射音Rp1や、床のS2点からの反射音Rp2が存在するものとする。現実的には反射は至るところからあるが、説明の簡単化のため、反射率の大きそうな、上述の2点に絞って説明を続ける。ここで、Dpを「主とする音」と呼ぶことに対し、Rp1とRp2は本来不要なものであるため「副とする音」と呼ぶこととする。この場合、P点に、Dp以外にもRp1やRp2が届くことになるため、スピーカSPからどんなに理想的な周波数特性で音を出したとしても、P点に届く際にはなんらかの周波数特性の変化を受けることとなる。
[スピーカが背面側にある場合+反射を考慮]
上述の図2にはスピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されている例を示した。この例では、受聴するための主とする音に関する反射は考慮されているが、図1と同様に、主とする音以外の反射音は考慮されていない。図6は、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置され、受聴するための主とする音に関する反射が考慮され、さらに主とする音以外の反射をも考慮した一例を示している。
上述の図2にはスピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されている例を示した。この例では、受聴するための主とする音に関する反射は考慮されているが、図1と同様に、主とする音以外の反射音は考慮されていない。図6は、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置され、受聴するための主とする音に関する反射が考慮され、さらに主とする音以外の反射をも考慮した一例を示している。
この図6では、図2と同様に、受聴のための主とする音は、スピーカSPから出た音DoがS1点で反射してP点に届くDpである。それに加え、例えば同じスピーカSPから出た音DoはS2点で反射し、さらに壁のS3点で反射したのち、RpとしてP点に到達する。ここでも、実際には反射は至るところからあるが、説明の簡単化のため、スピーカSPに対しS1点とは対称位置にあるS2点からの反射のみがある、として説明を続ける。上述の図5と同様に、Dpを「主とする音」と呼ぶことに対し、Rpを「副とする音」と呼ぶこととする。この場合、P点ではDp以外にもRpが届くことになるため、やはりスピーカSPからどんなに理想的な周波数特性で音を出したとしても、P点に届く際にはなんらかの周波数特性の変化を受けることとなる。
[スピーカが前面側にあり、反射を考慮した場合の周波数特性]
図7は、図5における、主とする音と副とする音が混じり合った際の、周波数特性のシミュレーション結果のグラフを示す。このシミュレーションでは、音源としては特性を評価しやすい白色雑音を10秒間再生するものとし、この10秒間の全体的な周波数特性を調べるものとした。なお、図4(a)に示したように、ここでも再生装置の周波数特性は平坦であることとする。
図7は、図5における、主とする音と副とする音が混じり合った際の、周波数特性のシミュレーション結果のグラフを示す。このシミュレーションでは、音源としては特性を評価しやすい白色雑音を10秒間再生するものとし、この10秒間の全体的な周波数特性を調べるものとした。なお、図4(a)に示したように、ここでも再生装置の周波数特性は平坦であることとする。
まず、スピーカSPからP点までの直接の伝達特性をtf0とおく。説明の簡単化のため、この伝達特性は大きさ及び周波数特性の変化をもたらさないものと仮定する。tf0が持つ時間遅れ量xを括弧内に反映させるとすると、Dpは、以下の(1)式で表すことができる。なお、演算子「*」は、伝達特性を反映させるものとして、以下使用する。
Dp = Do(0) * tf0 =Do(x) ・・・(1)
Dp = Do(0) * tf0 =Do(x) ・・・(1)
Do(0)はスピーカSPから出たばかりの音である。この括弧内の「0」を基準の時間とすると、伝達特性tf0によって周波数特性の変化は生じないものの、スピーカSPからP点までの距離に応じた時間遅れ量xが生じるので、DpはDo(x)となる。なお、この括弧内の数字は、Do(0)の「0」を基準とした時間遅れ量を示しており、デジタルデータなどのサンプルを特定するためのインデックスではない。図7(a)は、Do(x)の周波数特性を示しており、白色雑音の平坦な特性が見て取れる。
次に、スピーカSPからS1点を経由しP点までの伝達特性をtf1とおく。説明の簡単化のため、この伝達特性は周波数特性の変化をもたらさないものの、S1点での反射の影響で大きさは1/10になるものと仮定する。tf1が持つ時間遅れ量をx+yとおくと、P点に到達するRp1は、以下の(2)式で表すことができる。なお、tf1の時間遅れ量がx+yとなるのは、tf0に比べtf1の経路が長い分、tf0よりもy分だけ増加するためである。
Rp1 = Do(0) * tf1
= Do(x+y) * 1/10 ・・・(2)
Rp1 = Do(0) * tf1
= Do(x+y) * 1/10 ・・・(2)
同様に、スピーカSPからS2点を経由しP点までの伝達特性をtf2とおき、反射による大きさが1/10になるものとし、時間遅れ量をx+zとすると、P点に到達するRp1は、以下の(3)式で表すことができる。
Rp2 = Do(0) * tf2
= Do(x+z) * 1/10 ・・・(3)
Rp2 = Do(0) * tf2
= Do(x+z) * 1/10 ・・・(3)
また、説明の簡単化のため、z=yと仮定すると、P点に到達する全ての音Pallは、以下の(4)式で表すことができる。
Pall = Dp + Rp1 + Rp2
= Do(x) + Do(x+y) * 1/5 ・・・(4)
Pall = Dp + Rp1 + Rp2
= Do(x) + Do(x+y) * 1/5 ・・・(4)
つまり、本来のDoに加え、不要な成分がDoの1/5の大きさで混じり合っていることになる。さらに、この不要な成分は、Do(x)に比べy分だけ遅れている。この時間遅れ量は経路の長さによってまちまちである。例えば、部屋のサイズ感から考えて、説明の簡単化のために、余分な経路の長さLを3.4mとすると、音速を340m/sとすれば、その時間遅れ量は10msecとなる。図7(b)は、このようにRp1とRp2を定義した場合の、DpとRp1およびRp2が混じり合った際の周波数特性を示している。
この図7(b)に示す周波数特性においては、Doのみの場合の図7(a)に示す周波数特性と比べると、一定の細かい間隔で±2dB程度の山谷が発生していることがわかる。この現象はDpとRp1およびRp2の干渉により現実的によく起きていることである。しかし、実際には、Rp1とRp2の大きさがもっと小さいことが多いため、図7(a)の周波数特性と、図7(b)の周波数特性の違いは、それほど大きなものとはならない場合が殆どである。そのため、音質に与える影響は少なく、問題になることはまれである。
[スピーカが背面にあり反射を考慮した場合の周波数特性]
図8は、図6における、主とする音と副とする音が混じり合った際の、周波数特性のシミュレーション結果のグラフを示す。このシミュレーションも、図7と同様に、音源としては特性を評価しやすい白色雑音を約10秒間再生するものとし、この10秒間の全体的な周波数特性を調べるものとする。
図8は、図6における、主とする音と副とする音が混じり合った際の、周波数特性のシミュレーション結果のグラフを示す。このシミュレーションも、図7と同様に、音源としては特性を評価しやすい白色雑音を約10秒間再生するものとし、この10秒間の全体的な周波数特性を調べるものとする。
まず、スピーカSPからS1点を経由してP点までの伝達特性をtf1とおく。説明の簡単化のため、この伝達特性は周波数特性の変化をもたらさないものの反射の影響で大きさが1/2になると仮定する。tf1が持つ時間遅れ量xを括弧内に反映させるとすると、Dpは、以下の(5)式で表すことができる。
Dp = Do(0) * tf1 =Do(x) * 1/2 ・・・(5)
Dp = Do(0) * tf1 =Do(x) * 1/2 ・・・(5)
Do(0)はスピーカSPから出たばかりの音である。この括弧内の「0」を基準の時間とすると、伝達特性tf1によって周波数特性の変化は生じないものの、大きさの変化とスピーカからP点までの距離に応じた時間遅れ量xが生じるので、DpはDo(x)*1/2と表現される。
図8(a)は、Do(x)の周波数特性を示しており、白色雑音の平坦な特性が見て取れる。ただし、現実的には周波数ごとに反射率が異なることがあり、図3(a),(b)で示したように、その周波数特性は平坦にならないことがある。つまり、図7(a)と図8(a)は一致しないことがある。しかし、本技術では、次に述べる反射時における干渉問題の改善が主眼であるので、上述したように伝達特性tf1による周波数特性変化がないもの同士で効果を比較しても良い。
次に、スピーカSPからS2点までの伝達特性をtf2、さらにS2点からS3点を経由してP点までの伝達特性をtf3とおく。説明の簡単化のため、この伝達特性は周波数特性の変化をもたらさないものの、S2点、S3点では反射の影響で大きさはそれぞれ1/2になるものと仮定する。説明の簡単化のため、tf2およびtf3が持つ時間遅れ量を合わせてx+yとおくと、P点に到達するRpは、以下の(6)式で表すことができる。なお、時間遅れ量がx+yとなるのは、tf1に比べtf2とtf3の経路が長い分、tf1よりもy分だけ増加するためである。
Rp = Do(0) * tf2 *tf3
= Do(x+y) * 1/2* 1/2
= Do(x+y) * 1/4 ・・・(6)
Rp = Do(0) * tf2 *tf3
= Do(x+y) * 1/2* 1/2
= Do(x+y) * 1/4 ・・・(6)
よって、P点に到達する全ての音Pallは、以下の(7)式で表すことができる。
Pall = Dp + Rp
= Do(x) * 1/2 + Do(x+y)* 1/4 ・・・(7)
Pall = Dp + Rp
= Do(x) * 1/2 + Do(x+y)* 1/4 ・・・(7)
つまり、本来のDoに加え、本来不要な成分がDoの1/2の大きさで混じり合っていることになる。さらに、この本来不要な成分は、Do(x)に比べy分だけ遅れている。この時間遅れ量は経路の長さによってまちまちである。テレビ受信機(TV)と壁の距離感から考えて、説明の簡単化のために、余分な経路の長さLを34cmとすると、音速を340m/sとすれば、その時間遅れ量は1msecとなる。図8(b)は、このようにRpを定義した場合の、DpとRpが混じり合った際の周波数特性を示している。
この図8(b)に示す周波数特性においては、Doのみの場合の図8(a)に示す周波数特性と比べると、一定の間隔で±6dB程度の山谷が発生していることがわかる。これは、そもそもDp,Rpともに反射成分であるため、主とする音であるDp自体が小さくなり、さらに反射成分であるRpの大きさに近く、しかもRpの時間遅れ量も比較的に短いために生じる現象である。よって、図7(b)に比べると、特定の周波数においてはDpとRpが強めあい、また別の周波数においてはDpとRpが弱めあうという干渉作用が顕著にでて、違和感を生じることがある。
この干渉作用による山谷の間隔は、DpとRpの時間遅れ量yが大きいほど間隔が短くなるものであり、図7(b)と比べ、図8(b)では山谷の間隔が長く、かつ山谷が大きいことがわかる。この現象は、単に2つの音を加算することを考えるとよくわかる。例えば、時間遅れのない同一の2つの信号を加算すれば、信号の大きさは2倍になる。次に、この信号がデジタル信号であるとし、片方の信号のみ1サンプルだけ遅らせて加算すると、低域では位相差が小さいため大きさはほぼ2倍近くになるが、高域になるにつれ大きさは小さくなっていく。
これは、ナイキスト周波数ギリギリの信号を1サンプルずらして加算すれば、完全に符号の異なる信号同士を加算するわけであるから、大きさは0になる、というローパス特性を有することから直感的に理解できる。時間遅れを2サンプル、3サンプルと遅らせていくと、単なるローパス特性ではなく、櫛歯状のフィルタ特性を有するようになり、時間遅れ量が大きいほど、櫛歯は細かくなってゆく。
さて、上述の違和感の原因としては、例えば音声の特徴である山の部分(フォルマント)と、干渉によって発生した谷が一致して、山を潰してしまうことが挙げられる。図7(b)のように、干渉による山谷が細かく、音声の特徴の山や谷の1つ1つに干渉の山谷が複数個分入ったりしても、干渉の影響が山や谷ごとに平均化されるため音声の特徴は大きく崩れない。しかし、図8(b)のように、干渉による山谷の間隔が大きいと、音声の特徴である特定の山が大きく潰れ、逆に谷の部分が不用に増強され、音声の特徴が大きく崩されてしまう。
このように音声の特徴が崩されてしまうと、「もぞもぞしゃべっているような感じ」や「しゃべっている内容が聞き取りにくい」といった音質劣化が生じる。これは、いわゆるフォルマントの構造が崩されるためである。フォルマントを取り除いて再生すると母音が認識でなくなることは良く知られた事実である。また、音楽においては、山に当たった特定の楽器のみが大きく聞こえ、谷に当たった別の楽器については小さく聞こえるようになり、楽曲全体のバランスがおかしくなる、といった音質劣化を生じる。
上述の問題は、周波数特性が単に低域が強いとか高域が弱いといった大局的な従来の視点からみたものではなく、周波数特性の微細構造に着目した、新しい問題の捉え方といえる。このような微細構造を放置したまま、低域や高域を大局的に調整しても、音質劣化は改善しないことがある。
[本技術による問題解決方法]
図9は、上述の問題に対する本技術による解決方法の一例を示している。まず、図6に示したように、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されているものとする。そして、P点にはスピーカSPから出た音がS1点で反射した主とする音Dpと、スピーカSPから出た音がS2点およびS3点にて反射した副とする音Rpの2つが届くこととする。ここで、図8で説明したように、DpとRpの干渉によって、聴感上の違和感が発生しているとする。
図9は、上述の問題に対する本技術による解決方法の一例を示している。まず、図6に示したように、スピーカSPがテレビ受信機(TV)の筐体の背面側に下向きで配置されているものとする。そして、P点にはスピーカSPから出た音がS1点で反射した主とする音Dpと、スピーカSPから出た音がS2点およびS3点にて反射した副とする音Rpの2つが届くこととする。ここで、図8で説明したように、DpとRpの干渉によって、聴感上の違和感が発生しているとする。
違和感の主な原因は本来不要なRpがDpに対して悪影響を及ぼすためである。そのため、本技術では、図に示すようにRpをキャンセルするための音Cpを生成するキャンセル信号Ciを予め生成して入力音声信号Diに重畳する。そして、スピーカSPから合成音Do″(=Do+Co)として再生することで、P点におけるRpをキャンセルする。この処理を数式で表現すると、以下のようになる。
まず、スピーカSPから発生させる音Do″を、以下の(8)式のように定義する。この(8)式において、Coは、新たに加えられてスピーカSPから発生するキャンセル音である。また、yは、図6、図8で示した、スピーカSPからS1点を経由してP点に到達するまでの時間遅れと、スピーカSPからS2点およびS3点を経由してP点に到達するまでの時間遅れの差分である。
Do″(0) = Do(0) + Co(y) ・・・(8)
Do″(0) = Do(0) + Co(y) ・・・(8)
次に、Dpを、以下の(9)式のように表現する。
Dp = Do″(0) * tf1
= Do(x) * 1/2 + Co(x+y)* 1/2 ・・・(9)
Dp = Do″(0) * tf1
= Do(x) * 1/2 + Co(x+y)* 1/2 ・・・(9)
さらに、Rpを、以下の(10)式のように表現する。
Rp = Do″(0) * tf2 * tf3
= Do(x+y) * 1/4 +Co(x+2y) * 1/4 ・・・(10)
Rp = Do″(0) * tf2 * tf3
= Do(x+y) * 1/4 +Co(x+2y) * 1/4 ・・・(10)
よって、P点に到達する全ての音Pallは、以下の(11)式のように表すことができる。
Pall = Dp + Rp
= Do(x) * 1/2+ Co(x+y) * 1/2
+ Do(x+y) * 1/4 +Co(x+2y) * 1/4
・・・(11)
Pall = Dp + Rp
= Do(x) * 1/2+ Co(x+y) * 1/2
+ Do(x+y) * 1/4 +Co(x+2y) * 1/4
・・・(11)
ここで、Co(x+y) = −Do(x+y)* 1/2、Co(x+2y) = −Do(x+2y) * 1/2とおくと、中間の2項がキャンセルされ、(11)式は、以下の(12)式のようになる。
Pall = Do(x) * 1/2− Do(x+y) * 1/4
+ Do(x+y) * 1/4− Do(x+2y) * 1/8
= Do(x) * 1/2 −Do(x+2y) * 1/8
・・・(12)
Pall = Do(x) * 1/2− Do(x+y) * 1/4
+ Do(x+y) * 1/4− Do(x+2y) * 1/8
= Do(x) * 1/2 −Do(x+2y) * 1/8
・・・(12)
つまり、スピーカSPから、Doに加え、Doを1/2の大きさにして時間遅れ量yを与えたのち位相を反転した音を出せば、中間の2項がキャンセルされることとなる。この結果、従来は主とする音に対して1/2の大きさを持つ副とする音がy時間だけ遅れて加算されていたものが、本技術を用いることで主とする音の1/4の大きさを持つ副とする音が2y時間だけ遅れて減算されるようになる。
この場合、スピーカSPからの出力音Do″は、以下の(13)式で表される。このようにDo″を設定すれば、P点にてRpを1/2の大きさに低減することが可能となる。
Do″(0) = Do(0) + Co(y)
= Do(0) − Do(y)* 1/2 ・・・(13)
Do″(0) = Do(0) + Co(y)
= Do(0) − Do(y)* 1/2 ・・・(13)
[反射率を一般化してαとした場合の式]
なお、上述は、(5)式に示したように、反射率(反射量)を1/2とした場合である。反射率を一般化して、1/αとおくと、(5)式は、以下の(14)式のように変形される。
Dp = Do(0) * tf1 =Do(x) * 1/α ・・・(14)
なお、上述は、(5)式に示したように、反射率(反射量)を1/2とした場合である。反射率を一般化して、1/αとおくと、(5)式は、以下の(14)式のように変形される。
Dp = Do(0) * tf1 =Do(x) * 1/α ・・・(14)
さらに、(6)式は、以下の(15)式のように変形される。
Rp = Do(0) * tf2 *tf3
=Do(x+y) * 1/α *1/α
=Do(x+y) * (1/α)2 ・・・(15)
Rp = Do(0) * tf2 *tf3
=Do(x+y) * 1/α *1/α
=Do(x+y) * (1/α)2 ・・・(15)
よって、P点に到達する全ての音Pallは、以下の(16)式で表すことができる。つまり、本来のDoに加え、本来不要な成分がDoの1/α倍の大きさで混じり合っていることになる。
Pall = Dp + Rp
=Do(x) * 1/α + Do(x+y)* (1/α)2
・・・(16)
Pall = Dp + Rp
=Do(x) * 1/α + Do(x+y)* (1/α)2
・・・(16)
ここで、図9で示したように、RpをキャンセルさせるためにスピーカSPから発生させる音Do″を、以下の(17)式のように定義する。この(17)式において、Coは、新たに加えられてスピーカSPから発生するキャンセル音である。また、yは、図6、図8で示した、スピーカSPからS1点を経由してP点に到達するまでの時間遅れと、スピーカSPからS2点およびS3点を経由してP点に到達するまでの時間遅れの差分である。
Do″(0) = Do(0) + Co(y) ・・・(17)
Do″(0) = Do(0) + Co(y) ・・・(17)
次に、Dpを、以下の(18)式のように表現する。
Dp = Do″(0) * tf1
= Do(x) * 1/α +Co(x+y) * 1/α
・・・(18)
Dp = Do″(0) * tf1
= Do(x) * 1/α +Co(x+y) * 1/α
・・・(18)
さらに、Rpを、以下の(19)式のように表現する。
Rp = Do″(0) * tf2 *tf3
= Do(x+y) * (1/α)2
+ Co(x+2y) * (1/α)2 ・・・(19)
Rp = Do″(0) * tf2 *tf3
= Do(x+y) * (1/α)2
+ Co(x+2y) * (1/α)2 ・・・(19)
よって、P点に到達する全ての音Pallは、以下の(20)式のように表すことができる。
Pall = Dp + Rp
= Do(x) * 1/α +Co(x+y) * 1/α
+ Do(x+y) * (1/α)2
+ Co(x+2y) *(1/α)2 ・・・(20)
Pall = Dp + Rp
= Do(x) * 1/α +Co(x+y) * 1/α
+ Do(x+y) * (1/α)2
+ Co(x+2y) *(1/α)2 ・・・(20)
ここで、Co(x+y) = −Do(x+y)* 1/α、Co(x+2y) = −Do(x+2y) * 1/αとおくと、中間の2項がキャンセルされ、(20)式は、以下の(21)式のようになる。
Pall = Do(x) * 1/α− Do(x+y) * (1/α)2
+ Do(x+y) * (1/α)2− Do(x+2y) * (1/α)3
= Do(x) * 1/α − Do(x+2y)* (1/α)3
・・・(21)
Pall = Do(x) * 1/α− Do(x+y) * (1/α)2
+ Do(x+y) * (1/α)2− Do(x+2y) * (1/α)3
= Do(x) * 1/α − Do(x+2y)* (1/α)3
・・・(21)
つまり、スピーカSPから、Doに加え、Doを1/α倍の大きさにして時間遅れ量yを与えたのち位相を反転した音を出せば、中間の2項がキャンセルされることとなる。この結果、従来は主たる音に対して1/α倍の大きさを持つ副たる音がy時間だけ遅れて加算されていたものが、本技術を用いることで主たる音の(1/α)2倍の大きさを持つ副たる音が2y時間だけ遅れて減算されるようになる。
この場合、スピーカSPからの出力音Do″は、以下の(22)式で表される。このようにDo″を設定すれば、P点にてRpを1/α倍の大きさに低減することが可能となる。つまり、α>1という条件を満たせば、反射音の影響を低減できる、ということになる。
Do″(0) = Do(0) + Co(y)
= Do(0) − Do(y)* 1/α ・・・(22)
Do″(0) = Do(0) + Co(y)
= Do(0) − Do(y)* 1/α ・・・(22)
[音響再生装置の構成例]
図10は、第1の実施の形態としての音響再生装置100の構成例を示している。この音響再生装置100は、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)101と、アンプ102と、スピーカ103を有している。デジタルシグナルプロセッサ101は、音声信号処理部を構成している。また、アンプ102は、音声信号増幅部を構成している。
図10は、第1の実施の形態としての音響再生装置100の構成例を示している。この音響再生装置100は、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)101と、アンプ102と、スピーカ103を有している。デジタルシグナルプロセッサ101は、音声信号処理部を構成している。また、アンプ102は、音声信号増幅部を構成している。
デジタルシグナルプロセッサ101は、入力音声信号Diを処理して、出力音声信号Di″を得る。このデジタルシグナルプロセッサ101は、遅延部111、ゲイン調整部112および加算部113により構成されている。遅延部111およびゲイン調整部112は、キャンセル用音声信号を生成するキャンセル用音声信号生成部を構成している。加算部113は、入力音声信号Diにキャンセル用音声信号を加算して、出力音声信号Di″を得る。
キャンセル用音声信号は、スピーカ103から出力されて受聴点Pに到達する反射音のうち、第1の反射音(主とする音)が到達した後に到達する所定の第2の反射音(副とする音)をキャンセルするための音声信号である。すなわち、遅延部111は、入力音声信号Diを、受聴点Pに到達する第1の反射音と第2の反射音との時間差に対応する時間だけ遅延させる。また、ゲイン調整部112は、遅延部111の出力信号のゲインを反射量に応じて調整してキャンセル用音声信号を得る。ここで、第1の反射音は図9のDpに同等し、第2の反射音は図9のRpに相当する。
アンプ102は、デジタルシグナルプロセッサ101で得られた出力音声信号Di″を増幅してスピーカ103に供給する。スピーカ103は、電子機器、例えばテレビ受信機(TV)の筐体の背面側に下向きで配置されている(図9のスピーカSP参照)。そのため、使用者は、このスピーカ103から出力されて受聴点Pに到達する反射音を受聴する。なお、アンプ102はアナログである場合が多い。アンプ102がアナログである場合、Di″はデジタル信号からアナログ信号に変換されてからアンプ102に供給される必要がある。しかし、昨今はデジタルアンプも一般化しているし、説明の簡単化のために、アンプ102にはデジタル信号をそのまま伝送可能ということにする。スピーカ103は、アンプ102から供給される音声信号による音声を出力する
図10に示す音響再生装置100の動作を説明する。入力音声信号Diは、デジタルシグナルプロセッサ101に供給される。すなわち、この音声信号Diは、加算部113に供給されると共に、遅延部111に供給される。遅延部111では、入力音声信号Diが遅延される。ここで、入力音声信号をDi(t)とするとき、遅延部111では入力音声信号Diがnサンプル分保持され、遅延音声信号Di(t+n)が出力される。
次に、この遅延音声信号Di(t+n)は、ゲイン調整部112に供給される。このゲイン調整部112では、ゲインGiが調整され、ゲイン調整された音声信号Di(t+n)* Giが得られる。この音声信号Di(t+n) * Giは、加算部113に供給される。そして、加算部113では、出力音声信号Di″として、Di(t) + Di(t+n)* Giが得られる。この出力音声信号Di″は、アンプ102で電力増幅されたのちスピーカ103に送られ、このスピーカ103からは、音Do″が出力される。
ここで、以下の(23)式が成り立っている。
Di″ = Di(t) + Di(t+n)* Gi ・・・(23)
Di″ = Di(t) + Di(t+n)* Gi ・・・(23)
t=0、n=y、さらに、Gi = − 1/2とすれば、(23)式は、以下の(24)式となる。この(24)式のDi″を、図9で得られたDo″((13)式参照)と比較すれば、これが正にDo″を出力するための入力信号Ciであることがわかる。
Di″ = Di(0) −Di(y)* 1/2 ・・・(24)
Di″ = Di(0) −Di(y)* 1/2 ・・・(24)
上述したように、図10に示す音響再生装置100においては、スピーカ103(スピーカSP)から出力される音が周囲の物体に反射した後に受聴点Pに到達する反射音Dpを良好に受聴可能となる。また、図10に示す音響再生装置100においては、従来の信号処理技術と比べて平易、かつ低コストにも関わらず、効果的な音質調整を実現し、音質的に不利なスピーカ設置位置であっても、「良い音」を楽しめるようになる。
図11は、図10に示す音響再生装置100の効果を示している。図11(a)は、本技術の適用前のPallの周波数特性を示している。図11(b)は、本技術の適用後のPallの周波数特性を示している。干渉によって生じる山谷の大きさが適用の前後で±6dBから±3dB程に減少していることがわかる。これにより、干渉によって生じる山谷が音声の特徴を崩すことを効果的に低減させることが可能であり、またその山谷の間隔も密にすることで影響が平均化されやすくなる。そのため、音質劣化を効果的に抑制することが可能となる。
<2.第2の実施の形態>
[遅延量の調整]
図8、図11において、本技術の有効性を説明した。しかし、例えば、テレビ受信機(TV)を、台の上のどこにおくかで主とする音Dpと副とする音Rpの関係は変化する。例えば、図12は、テレビ受信機(TV)を台のP点よりに設置した場合を示している。この場合、Rpは、図9のRpに比べて、Dpを基準とすると、相対的により遅く届く。図13は、テレビ受信機(TV)を台の壁よりに設置した場合を示している。この場合、Rpは、図9のRpに比べて、Dpを基準とすると、相対的により速く届く。
[遅延量の調整]
図8、図11において、本技術の有効性を説明した。しかし、例えば、テレビ受信機(TV)を、台の上のどこにおくかで主とする音Dpと副とする音Rpの関係は変化する。例えば、図12は、テレビ受信機(TV)を台のP点よりに設置した場合を示している。この場合、Rpは、図9のRpに比べて、Dpを基準とすると、相対的により遅く届く。図13は、テレビ受信機(TV)を台の壁よりに設置した場合を示している。この場合、Rpは、図9のRpに比べて、Dpを基準とすると、相対的により速く届く。
つまり、図9の状態で効果が得られていても、テレビ受信機(TV)の設置位置を変更すると効果が得られなくなってしまう場合がある。これは、以下のことからも言える。上述したように、スピーカSPから発生させる音Do″を、以下の(25)式のように定義した。なお、この(25)式は、上述の(8)式と同じものである。
Do″(0) = Do(0) + Co(y) ・・・(25)
Do″(0) = Do(0) + Co(y) ・・・(25)
この(25)式において、y、つまり、Dpを基準とするRpの時間遅れ量yが適切でないと、以下の(26)式の中間の2項のyが一致しなくなることから、DpとRpの干渉を抑制できなくなるためである。なお、この(26)式は、上述の(12)式に含まれている。
Pall = Do(x) * 1/2− Do(x+y) * 1/4
+ Do(x+y) * 1/4 −Do(x+2y) * 1/8
・・・(26)
Pall = Do(x) * 1/2− Do(x+y) * 1/4
+ Do(x+y) * 1/4 −Do(x+2y) * 1/8
・・・(26)
[音響再生装置の構成例]
図14は、第2の実施の形態としての音響再生装置100Aの構成例を示している。この図14において、図10と対応する部分には、同一符号を付し、その詳細説明は省略する。この音響再生装置100Aは、デジタルシグナルプロセッサ101と、アンプ102と、スピーカ103と、制御部104と、ユーザ入力部105と、表示部106を有している。ユーザ入力部105および表示部106は、ユーザインタフェースを構成している。
図14は、第2の実施の形態としての音響再生装置100Aの構成例を示している。この図14において、図10と対応する部分には、同一符号を付し、その詳細説明は省略する。この音響再生装置100Aは、デジタルシグナルプロセッサ101と、アンプ102と、スピーカ103と、制御部104と、ユーザ入力部105と、表示部106を有している。ユーザ入力部105および表示部106は、ユーザインタフェースを構成している。
制御部104は、ユーザ入力部105から使用者(ユーザ)が入力するスピーカ103から壁までの距離の情報に基づいて、遅延部111における遅延量を制御する。この制御部104には、ユーザ入力部105の他に、表示部106が接続されている。ユーザ入力部105は、例えば、テレビ受信機(TV)の筐体に配置された操作ボタン、操作摘み、さらには、リモートコントロール装置等である。表示部106は、液晶表示素子などで構成されるが、テレビ受信機(TV)の画像表示部を兼用することもできる。
使用者(ユーザ)がユーザ入力部105から上述の距離情報を入力する際には、表示部106に、図15に示すように、距離の情報をユーザが入力するためのGUI(Graphical User Interface)表示が行われる。使用者(ユーザ)は、このGUI表示を用いて、スピーカ103から壁までの距離の情報を入力する。このようにユーザ入力部105から距離の情報が入力されることで、制御部104により、遅延部111における遅延量は、スピーカ103から壁までの実際の距離に応じた値に調整される。
上述したように、(26)式の中間2項がキャンセルしなくなる理由は、それぞれのyが一致しないためである。これは、上述の(25)式におけるyを調整することで解決可能な問題である。図14に示す音響再生装置100Aにおいては、使用者(ユーザ)がユーザ入力部105により、スピーカ103から壁までの距離の情報を入力して、yを適切に調整でき、上述の問題を解決できる。
例えば、テレビ受信機(TV)が相対的にP点に近い場合には、壁までの距離が長くなるため、使用者(ユーザ)は、背面距離を長く設定する。逆に、テレビ受信機(TV)が相対的にP点から遠い場合には、壁までの距離が短くなるため、使用者(ユーザ)は、背面距離を短く設定する。
背面距離を長くするということは、Dpに比べRpの遅れが大きくなることである。そのため、この場合、制御部104は、yを増やす方向に調整を行う。逆に、背面距離を短くするということは、DpとRpの遅れが少なくなることである。そのため、この場合、制御部104は、yを減らす方向に調整を行う。このように、使用者(ユーザ)がユーザ入力部105、例えばリモートコントロール装置等を操作して背面距離を変えることで、テレビ受信機(TV)の様々な設置位置に応じて適切な調整が可能となる。
<3.第3の実施の形態>
[距離センサ]
図14に示す音響再生装置100Aにおいては、使用者(ユーザ)がユーザ入力部105により、スピーカ103から壁までの距離の情報を入力可能としている。しかし、この距離の情報を、例えば、図16に示すように、テレビ受信機(TV)の筐体の背面側に距離センサ107を設置し、この距離センサ107から得ることも考えられる。このように距離センサ107を設けることで、使用者(ユーザ)がユーザ入力部105から距離情報を入力する手間を回避できる。
[距離センサ]
図14に示す音響再生装置100Aにおいては、使用者(ユーザ)がユーザ入力部105により、スピーカ103から壁までの距離の情報を入力可能としている。しかし、この距離の情報を、例えば、図16に示すように、テレビ受信機(TV)の筐体の背面側に距離センサ107を設置し、この距離センサ107から得ることも考えられる。このように距離センサ107を設けることで、使用者(ユーザ)がユーザ入力部105から距離情報を入力する手間を回避できる。
[音響再生装置の構成例]
図17は、第3の実施の形態としての音響再生装置100Bの構成例を示している。この図17において、図14と対応する部分には、同一符号を付し、その詳細説明は省略する。この音響再生装置100Bは、デジタルシグナルプロセッサ101と、アンプ102と、スピーカ103と、制御部104Bと、ユーザ入力部105と、表示部106と、距離センサ107を有している。この距離センサ107は、例えば、赤外線距離センサ等である。
図17は、第3の実施の形態としての音響再生装置100Bの構成例を示している。この図17において、図14と対応する部分には、同一符号を付し、その詳細説明は省略する。この音響再生装置100Bは、デジタルシグナルプロセッサ101と、アンプ102と、スピーカ103と、制御部104Bと、ユーザ入力部105と、表示部106と、距離センサ107を有している。この距離センサ107は、例えば、赤外線距離センサ等である。
制御部104Bは、距離センサ107で得られるスピーカ103から壁までの距離の情報に基づいて、遅延部111における遅延量を制御する。これにより、遅延部111における遅延量は、スピーカ103から壁までの実際の距離に応じた値とされる。
また、制御部104Bは、ユーザ入力部105から使用者(ユーザ)が入力する反射量の情報に基づいて、ゲイン調整部112におけるゲインを制御する。この制御部104Bには、ユーザ入力部105の他に、表示部106が接続されている。ユーザ入力部105は、例えば、テレビ受信機(TV)の筐体に配置された操作ボタン、操作摘み、さらには、リモートコントロール装置等である。表示部106は、液晶表示素子などで構成されるが、テレビ受信機(TV)の画像表示部を兼用することもできる。
使用者(ユーザ)がユーザ入力部105から上述の反射量情報を入力する際には、表示部106に、図18に示すように、反射量の情報をユーザが入力するためのGUI(Graphical User Interface)表示が行われる。使用者(ユーザ)は、このGUI表示を用いて、反射量の情報を入力する。このようにユーザ入力部105から反射量の情報が入力されることで、制御部104Bにより、ゲイン調整部112におけるゲインは、入力された反射量の情報に応じた値に調整される。
<4.変形例>
なお、上述実施の形態においては、スピーカ103(スピーカSP)が、テレビ受信機(TV)の筐体の背面側に下向きで設置される場合を例にとって説明した。しかし、本技術は、スピーカが同様の状態に設置されるその他の電子機器、例えばフォトフレーム等にも同様に適用できる。
なお、上述実施の形態においては、スピーカ103(スピーカSP)が、テレビ受信機(TV)の筐体の背面側に下向きで設置される場合を例にとって説明した。しかし、本技術は、スピーカが同様の状態に設置されるその他の電子機器、例えばフォトフレーム等にも同様に適用できる。
また、上述実施の形態においては、キャンセル用音声信号を生成する系を1系統だけ備えている(図10、図14、図17参照)。遅延量およびゲインを異にする複数の反射音をキャンセルするために、キャンセル用音声信号を生成する系を複数系統備える構成も考えられる。
また、本技術は、以下のような構成を取ることもできる。
(1)スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して出力音声信号を得る音声信号加算部と
を備える音声信号処理装置。
(2)上記キャンセル用音声信号生成部は、上記入力音声信号を、上記受聴点に到達する上記第1の反射音と上記第2の反射音との時間差に対応する時間だけ遅延させる遅延部と、
上記遅延部の出力信号のゲインを反射量に応じて調整して上記キャンセル用音声信号を得るゲイン調整部とを有する
前記(1)に記載の音声信号処理装置。
(3)上記遅延部における遅延量を調整するための情報として上記スピーカの設置位置から壁までの距離の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
前記(2)に記載の音声信号処理装置。
(4)上記ユーザインタフェースは、
上記距離の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記距離の情報をユーザが入力するためのユーザ入力部とを有する
前記(3)に記載の音声信号処理装置。
(5)上記スピーカの設定位置から壁までの距離の情報を得る距離センサと、
上記距離センサで得られる上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
前記(2)に記載の音声信号処理装置。
(6)上記ゲイン調整部におけるゲインを調整するための情報として反射量の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記反射量の情報に基づいて、上記ゲイン調整部におけるゲインを制御する制御部とをさらに備える
前記(1)から(5)のいずれかに記載の音声信号処理装置。
(7)上記ユーザインタフェースは、
上記反射量の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記反射量の情報をユーザが入力するためのユーザ入力部とを有する
前記(6)に記載の音声信号処理装置。
(8)上記スピーカは、表示機器の筐体の背面側に下向きに取り付けられている
前記(1)から(7)のいずれかに記載の音声信号処理装置。
(9)スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するステップと、
上記生成されたキャンセル用音声信号を上記入力音声信号に加算して出力音声信号を得るステップと
を備える音声信号処理方法。
(10)表示機器の筐体の背面側に下向きに取り付けられたスピーカと、
入力音声信号を処理して出力音声信号を得る音声信号処理部と、
上記音声信号処理部で得られた出力音声信号を増幅して上記スピーカに供給する音声信号増幅部とを備え、
上記音声信号処理部は、
上記スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、上記入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して上記出力音声信号を得る音声信号加算部とを有する
音響再生装置。
(11)上記表示機器は、テレビ受信機である
前記(10)に記載の音響再生装置。
(1)スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して出力音声信号を得る音声信号加算部と
を備える音声信号処理装置。
(2)上記キャンセル用音声信号生成部は、上記入力音声信号を、上記受聴点に到達する上記第1の反射音と上記第2の反射音との時間差に対応する時間だけ遅延させる遅延部と、
上記遅延部の出力信号のゲインを反射量に応じて調整して上記キャンセル用音声信号を得るゲイン調整部とを有する
前記(1)に記載の音声信号処理装置。
(3)上記遅延部における遅延量を調整するための情報として上記スピーカの設置位置から壁までの距離の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
前記(2)に記載の音声信号処理装置。
(4)上記ユーザインタフェースは、
上記距離の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記距離の情報をユーザが入力するためのユーザ入力部とを有する
前記(3)に記載の音声信号処理装置。
(5)上記スピーカの設定位置から壁までの距離の情報を得る距離センサと、
上記距離センサで得られる上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
前記(2)に記載の音声信号処理装置。
(6)上記ゲイン調整部におけるゲインを調整するための情報として反射量の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記反射量の情報に基づいて、上記ゲイン調整部におけるゲインを制御する制御部とをさらに備える
前記(1)から(5)のいずれかに記載の音声信号処理装置。
(7)上記ユーザインタフェースは、
上記反射量の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記反射量の情報をユーザが入力するためのユーザ入力部とを有する
前記(6)に記載の音声信号処理装置。
(8)上記スピーカは、表示機器の筐体の背面側に下向きに取り付けられている
前記(1)から(7)のいずれかに記載の音声信号処理装置。
(9)スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するステップと、
上記生成されたキャンセル用音声信号を上記入力音声信号に加算して出力音声信号を得るステップと
を備える音声信号処理方法。
(10)表示機器の筐体の背面側に下向きに取り付けられたスピーカと、
入力音声信号を処理して出力音声信号を得る音声信号処理部と、
上記音声信号処理部で得られた出力音声信号を増幅して上記スピーカに供給する音声信号増幅部とを備え、
上記音声信号処理部は、
上記スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、上記入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して上記出力音声信号を得る音声信号加算部とを有する
音響再生装置。
(11)上記表示機器は、テレビ受信機である
前記(10)に記載の音響再生装置。
100,100A,100B・・・音響再生装置
101・・・デジタルシグナルプロセッサ
102・・・アンプ
103・・・スピーカ
104,104B・・・制御部
105・・・ユーザ入力部
106・・・表示部
107・・・距離センサ
111・・・遅延部
112・・・ゲイン調整部
113・・・加算部
101・・・デジタルシグナルプロセッサ
102・・・アンプ
103・・・スピーカ
104,104B・・・制御部
105・・・ユーザ入力部
106・・・表示部
107・・・距離センサ
111・・・遅延部
112・・・ゲイン調整部
113・・・加算部
Claims (11)
- スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して出力音声信号を得る音声信号加算部と
を備える音声信号処理装置。 - 上記キャンセル用音声信号生成部は、上記入力音声信号を、上記受聴点に到達する上記第1の反射音と上記第2の反射音との時間差に対応する時間だけ遅延させる遅延部と、
上記遅延部の出力信号のゲインを反射量に応じて調整して上記キャンセル用音声信号を得るゲイン調整部とを有する
請求項1に記載の音声信号処理装置。 - 上記遅延部における遅延量を調整するための情報として上記スピーカの設置位置から壁までの距離の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
請求項2に記載の音声信号処理装置。 - 上記ユーザインタフェースは、
上記距離の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記距離の情報をユーザが入力するためのユーザ入力部とを有する
請求項3に記載の音声信号処理装置。 - 上記スピーカの設定位置から壁までの距離の情報を得る距離センサと、
上記距離センサで得られる上記距離の情報に基づいて、上記遅延部における遅延量を制御する制御部とをさらに備える
請求項2に記載の音声信号処理装置。 - 上記ゲイン調整部におけるゲインを調整するための情報として反射量の情報をユーザが入力するためのユーザインタフェースと、
上記ユーザインタフェースで入力される上記反射量の情報に基づいて、上記ゲイン調整部におけるゲインを制御する制御部とをさらに備える
請求項2に記載の音声信号処理装置。 - 上記ユーザインタフェースは、
上記反射量の情報をユーザが入力するためのGUI表示を行う表示部と、
上記表示部に表示されたGUI表示を用いて上記反射量の情報をユーザが入力するためのユーザ入力部とを有する
請求項6に記載の音声信号処理装置。 - 上記スピーカは、表示機器の筐体の背面側に下向きに取り付けられている
請求項1に記載の音声信号処理装置。 - スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、入力音声信号に基づいて生成するステップと、
上記生成されたキャンセル用音声信号を上記入力音声信号に加算して出力音声信号を得るステップと
を備える音声信号処理方法。 - 表示機器の筐体の背面側に下向きに取り付けられたスピーカと、
入力音声信号を処理して出力音声信号を得る音声信号処理部と、
上記音声信号処理部で得られた出力音声信号を増幅して上記スピーカに供給する音声信号増幅部とを備え、
上記音声信号処理部は、
上記スピーカから出力されて受聴点に到達する反射音のうち、第1の反射音が到達した後に到達する所定の第2の反射音をキャンセルするためのキャンセル用音声信号を、上記入力音声信号に基づいて生成するキャンセル用音声信号生成部と、
上記入力音声信号に、上記キャンセル用音声信号生成部で生成されたキャンセル用音声信号を加算して上記出力音声信号を得る音声信号加算部とを有する
音響再生装置。 - 上記表示機器は、テレビ受信機である
請求項10に記載の音響再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011111338A JP2012244336A (ja) | 2011-05-18 | 2011-05-18 | 音声信号処理装置、音声信号処理方法および音響再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011111338A JP2012244336A (ja) | 2011-05-18 | 2011-05-18 | 音声信号処理装置、音声信号処理方法および音響再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012244336A true JP2012244336A (ja) | 2012-12-10 |
Family
ID=47465592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011111338A Withdrawn JP2012244336A (ja) | 2011-05-18 | 2011-05-18 | 音声信号処理装置、音声信号処理方法および音響再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012244336A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106030505A (zh) * | 2014-02-11 | 2016-10-12 | Lg电子株式会社 | 显示装置及其控制方法 |
-
2011
- 2011-05-18 JP JP2011111338A patent/JP2012244336A/ja not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106030505A (zh) * | 2014-02-11 | 2016-10-12 | Lg电子株式会社 | 显示装置及其控制方法 |
EP3105673A4 (en) * | 2014-02-11 | 2017-10-18 | LG Electronics Inc. | Display device and control method thereof |
US10089062B2 (en) | 2014-02-11 | 2018-10-02 | Lg Electronics Inc. | Display device and control method thereof |
CN106030505B (zh) * | 2014-02-11 | 2019-06-04 | Lg电子株式会社 | 显示装置及其控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5665134B2 (ja) | ヒアリングアシスタンス装置 | |
US9210504B2 (en) | Processing audio signals | |
CN106664473B (zh) | 信息处理装置、信息处理方法和程序 | |
US9111543B2 (en) | Processing signals | |
JP5063528B2 (ja) | ノイズキャンセルシステム | |
CN100525101C (zh) | 使用波束形成算法来记录信号的方法和设备 | |
CN108141502A (zh) | 音频信号处理 | |
JP4886881B2 (ja) | 音響補正装置、音響出力装置、及び音響補正方法 | |
JP3505085B2 (ja) | オーディオ装置 | |
US10560782B2 (en) | Signal processor | |
WO2016042410A1 (en) | Techniques for acoustic reverberance control and related systems and methods | |
WO2009093416A1 (ja) | 音声信号処理装置および方法 | |
US11195539B2 (en) | Forced gap insertion for pervasive listening | |
Zhuang et al. | A constrained optimal hear-through filter design approach for earphones | |
JP2012244336A (ja) | 音声信号処理装置、音声信号処理方法および音響再生装置 | |
JP2012100117A (ja) | 音響処理装置及び方法 | |
JP4872794B2 (ja) | 音響エコーキャンセラ | |
WO2023013019A1 (ja) | 発話フィードバック装置、発話フィードバック方法、プログラム | |
JP5644278B2 (ja) | マスカ音生成装置及びプログラム | |
JP2006074409A (ja) | 音声出力装置 | |
JP2008092274A (ja) | オーディオ再生装置 | |
JP2023119438A (ja) | 音声信号処理装置 | |
JP2023036332A (ja) | 音響システム | |
JP6690285B2 (ja) | 音信号調整装置、音信号調整プログラム及び音響装置 | |
KR20230057333A (ko) | 휴대용 노래방을 위한 저복잡도 하울링 억제 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140805 |