JP2012104992A - 再生装置、再生方法、提供装置および再生システム - Google Patents

再生装置、再生方法、提供装置および再生システム Download PDF

Info

Publication number
JP2012104992A
JP2012104992A JP2010250714A JP2010250714A JP2012104992A JP 2012104992 A JP2012104992 A JP 2012104992A JP 2010250714 A JP2010250714 A JP 2010250714A JP 2010250714 A JP2010250714 A JP 2010250714A JP 2012104992 A JP2012104992 A JP 2012104992A
Authority
JP
Japan
Prior art keywords
volume
acoustic data
unit
value
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010250714A
Other languages
English (en)
Other versions
JP5585401B2 (ja
Inventor
Katsuaki Yamashita
功誠 山下
Tetsunori Itabashi
徹徳 板橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010250714A priority Critical patent/JP5585401B2/ja
Priority to US13/287,000 priority patent/US9148104B2/en
Publication of JP2012104992A publication Critical patent/JP2012104992A/ja
Application granted granted Critical
Publication of JP5585401B2 publication Critical patent/JP5585401B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】元の音響データの音量変化に比較的近い音量変化を維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能な、新規かつ改良された技術を提供する。
【解決手段】音響データを再生する映像音響データデコード回路130と、映像音響データデコード回路130により再生された音響データの音量を、複数の音響データの各々の音量特性値と音響データの音量特性値との関係に基づいて補正するコンプレッサー回路160と、を備える、再生装置100が提供される。
【選択図】図8

Description

本発明は、再生装置、再生方法、提供装置および再生システムに関する。
近年、HDD(Hard Disk Drive)などの記憶装置の大容量化に伴い、ユーザが携帯機器などを使用して楽曲を聴くなどといった一般的な環境などにおいても携帯機器などにおいて容易に大量の楽曲を保持することができる環境が整ってきている。しかし、そのような大量の楽曲を順に再生する場合、楽曲ごとの録音状態が異なっているなどといった理由から、楽曲ごとの音量が所望の範囲内に収まらず、ある楽曲の音量は大き過ぎる一方、別の楽曲の音量は小さ過ぎるなどといった状況が起こり得る。
さらに、最近では、ADSL(Asymmetric Digital Subscriber Line)や光ファイバーなどの高速ネットワークも普及してきており、一般家庭に存在するPC(Personal Computer)などにおいても、ネットワーク上の楽曲サーバに常時接続して、連続的に楽曲をストリーミング再生できる環境が整ってきている。このような環境においても同様に、ある楽曲の音量は大き過ぎる一方、別の楽曲の音量は小さ過ぎるなどといった状況が起こり得る。
かかる状況においては、ユーザは楽曲を心地よく聴くのが困難であり、楽曲の音量を調整する操作はユーザにとって煩わしいものである。このような状況を改善するために、ノーマライザーという自動音量補正装置が提案されている。自動音量補正装置は、各楽曲の再生時の音量を自動的に補正するものである(例えば、特許文献1参照。)。
特開2001−320793号公報
しかしながら、上記したノーマライザーは、一般的には楽曲の音量が所定の目標レベルに収まるように動的に楽曲の音量を制御するため、再生中の楽曲に関して原曲の音量カーブを忠実に再現できないという問題があった。例えば、楽曲の先頭付近は音量が小さいが、再生の途中から急激に音量が上がる楽曲であっても、常に所定の音量レベルで再生されてしまう。このような楽曲の再生では、楽曲の作曲者や録音者が意図した音量カーブを得ることはできないのは明らかである。楽曲以外の音響データに関しても同様の問題があった。
また、このような楽曲の再生では、再生中の楽曲の音量が必要以上に増幅されることがあり、増幅による音声の歪みが発生し易く、楽曲の音質を損ねてしまうという問題が起こっている。楽曲以外の音響データに関しても同様の問題が起こっている。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、元の音響データの音量変化に比較的近い音量変化を維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能な、新規かつ改良された技術を提供することにある。
上記課題を解決するために、本発明のある観点によれば、音響データを再生する再生部と、上記再生部により再生された上記音響データの音量を、複数の音響データの各々の音量特性値と上記音響データの音量特性値との関係に基づいて補正する音量補正部と、を備える、再生装置が提供される。
上記再生装置は、上記複数の音響データの各々の音量特性値と上記音響データの音量特性値との関係に基づいて音量補正のためのパラメータを算出するパラメータ算出部をさらに備え、上記音量補正部は、上記パラメータ算出部により算出されたパラメータに従って上記音響データの音量を補正することとしてもよい。
上記音量特性値は、上記音響データの音量平均値を示し、上記パラメータ算出部は、上記複数の音響データの上記音量平均値の分布に基づいて決定される基準平均値より上記音響データの上記音量平均値が小さい場合に上記音響データの音量を増幅するためのパラメータを算出し、上記基準平均値よりも上記音響データの上記音量平均値が大きい場合に上記音響データの音量を減衰するためのパラメータを算出することとしてもよい。
上記音量補正部は、非線形補正部および第1の線形補正部を有し、上記パラメータ算出部は、上記第1の線形補正部に設定される線形補正用パラメータ、および上記非線形補正部に設定される非線形補正用パラメータを算出することとしてもよい。
上記パラメータ算出部は、上記基準平均値より上記音響データの上記音量平均値が小さい場合、上記音響データの音量ピーク値に対する音量上限値の比率を上記線形補正用パラメータとして算出し、上記音響データの上記音量平均値に対する上記基準平均値の比率に基づいて上記非線形補正用パラメータを算出することとしてもよい。
上記パラメータ算出部は、上記基準平均値より上記音響データの上記音量平均値が大きい場合、上記音響データの上記音量平均値に対する上記基準平均値の比率を上記線形補正用パラメータとして算出することとしてもよい。
上記パラメータ算出部は、上記基準平均値よりも小さい下側基準値より上記音響データの上記音量平均値が小さい場合に上記音響データの音量を増幅するためのパラメータを算出し、上記基準平均値よりも大きい上側基準値より上記音響データの上記音量平均値が大きい場合に上記音響データの音量を減衰するためのパラメータを算出し、上記下側基準値と上記上側基準値との間に上記音響データの上記音量平均値が含まれる場合、上記音響データをスルー出力させるためのパラメータを上記音量補正部に設定することとしてもよい。
上記音量補正部は、上記第1の線形補正部の後段に上記非線形補正部と並列に接続される第2の線形補正部を有し、上記パラメータ算出部は、上記音響データをスルー出力させるためのパラメータとして、上記第1の線形補正部および上記第2の線形補正部に増幅率1を設定し、上記非線形補正用パラメータとして増幅率0を設定することとしてもよい。
以上説明したように、本発明によれば、元の音響データの音量変化に比較的近い音量変化を維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能である。
音響データを再生して得られる音声の波形の一例を示す図である。 一般的な音量補正技術による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例を示す図である。 本発明の実施形態に係る再生装置による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例を示す図である。 本発明の実施形態に係る音量特性値の一例としてのPeak値およびRMS値について説明するための図である。 本発明の実施形態に係る音量特性値の一例としてのPeak値の計算例を示す図である。 本発明の実施形態に係る音量特性値の一例としてのRMS値の計算例を示す図である。 本発明の実施形態に係る再生装置のハードウェア構成を示す図である。 本発明の実施形態に係る再生システムの機能構成を示す図である。 本発明の実施形態に係る属性情報の管理手法の一例について説明するための図である。 本発明の実施形態に係る属性情報の管理手法の他の一例について説明するための図である。 本発明の実施形態に係る再生システムにより実行される処理の流れを示すフローチャートである。 本発明の実施形態に係る再生装置による音響データの音量補正に適用し得るコンプレッサー回路を示す図である。 本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路が有する静特性(音響データの音量を増幅する場合)の一例を示す図である。 本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路が有する静特性(音響データの音量を減衰する場合)の一例を示す図である。 本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路が有する静特性(音響データの音量を増幅する場合)の他の一例を示す図である。 本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路が有する動特性の一例を示す図である。 本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路における制御信号(エンベロープ信号)の生成手法の一例を示す図である。 本発明の実施形態に係る再生装置による音響データの音量補正の処理の流れの詳細を示すフローチャートである。 本発明の実施形態に係る再生装置に適用し得るパラメータ算出部によるパラメータの算出例(音響データの音量を増幅する場合)を示す図である。 本発明の実施形態に係る再生装置に適用し得るパラメータ算出部によるパラメータの算出例(音響データの音量を減衰する場合)を示す図である。 本発明の実施形態に係る再生装置に適用し得るパラメータ算出部によるパラメータの算出例(音響データをスルー出力する場合)を示す図である。 本発明の実施形態に係る音量特性値の一例としてのPeak値の統計分布について説明するための図である。 本発明の実施形態に係る音量特性値の一例としてのRMS値の統計分布について説明するための図である。 本発明の実施形態に係る再生装置による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の一例について説明するための図である。 本発明の実施形態に係る再生装置による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の他の一例について説明するための図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付すことにより重複説明を省略する。
また、以下の順序にしたがって当該「発明を実施するための形態」を説明する。
1.実施形態
1−1. 音響データを再生して得られる音声の波形
1−2. 一般的な音量補正技術による音量補正
1−3. 本発明の実施形態に係る再生装置による音量補正
1−4. 音量特性値の一例としてのPeak値およびRMS値
1−5. 音量特性値の一例としてのPeak値の計算例
1−6. 音量特性値の一例としてのRMS値の計算例
1−7. 再生装置のハードウェア構成
1−8. 再生システムの機能構成
1−9. 属性情報の管理手法の一例
1−10.属性情報の管理手法の他の一例
1−11.再生システムにより実行される処理
1−12.音響データの音量補正に適用し得るコンプレッサー回路
1−13.コンプレッサー回路が有する静特性(音量増幅時)の一例
1−14.コンプレッサー回路が有する静特性(音量減衰時)の一例
1−15.コンプレッサー回路が有する静特性(音量増幅時)の他の一例
1−16.コンプレッサー回路が有する動特性の一例
1−17.コンプレッサー回路における制御信号の生成手法の一例
1−18.音響データの音量補正の処理の流れの詳細
1−19.パラメータ算出部によるパラメータ(音量増幅時)の算出例
1−20.パラメータ算出部によるパラメータ(音量減衰時)の算出例
1−21.パラメータ算出部によるパラメータ(スルー出力時)の算出例
1−22.音量特性値の一例としてのPeak値の統計分布
1−23.音量特性値の一例としてのRMS値の統計分布
1−24.RMS基準値の決定手法の一例
1−25.RMS基準値の決定手法の他の一例
2.使用例
3.変形例
4.まとめ
<1.実施形態>
[1−1.音響データを再生して得られる音声の波形]
図1は、音響データを再生して得られる音声の波形の一例を示す図である。図1を参照しながら、音響データを再生して得られる音声の波形の一例について説明する。なお、図1には、音声波形のPeak値およびRMS(Root Mean Square)値のラインが示されているが、Peak値およびRMS値は、本発明の実施形態において、音量特性の一例として用いられ得るものである。また、RMS値は、音量平均値の一例として使用されるものである。
ある音響データを再生して得られる音声の波形は、図1に示すように示される。ここで、図1に示された波形のうちの上側に示した波形は、音響データを再生して得られる音声を左(Lch)および右(Rch)のスピーカの双方から出力する方式(以下、「ステレオ音声方式」とも言う。)によりLchから出力された音声の波形を示したものである。また、図1に示された波形のうちの下側に示した波形は、ステレオ音声方式によりRchから出力された音声の波形を示したものである。音響データに対する補正は行われていない。
図1に示された音声波形は、CD−DA形式(Compact Disc Digital Audio)により記録された音響データと同様の記録方式により記録された音響データを再生して得られたものである。CD−DA形式は、サンプリング周波数44.1kHz、量子化ビット数16bit、ステレオPCM(Pulse Code Modulation)形式により音響データを記録するものである。
音響データが量子化ビット数16bit、PCM形式により記録されたものである場合、その音響データは、符号1bitおよびデータ15bitにより構成された2の補数コードにより表現される。この音響データにより表現できる音声の音量(振幅値)の最大値(あるいは最小値)は、正側で+32767、負側で−32768である。最小値から最大値までの範囲を超える音量の音声については最大値(あるいは最小値)に丸められることとなるが、その結果としてクリップノイズと呼ばれる不快な歪みが発生する可能性がある。
他方、音量が小さ過ぎる音声が音響データとして記録されている場合には、16bitの情報量を使い切れずに、音響データが再生された結果として良好なS/Nの音声が得られないこととなる。それゆえ、音響データの一例として楽曲を使用する場合には、楽曲の制作者は1曲を通して音量が16bitにより表現される範囲内に収まるようにミキサーなどの機器を用いて音量を調整しながら楽曲を録音する。
しかしながら、図1に示した音声波形を有する楽曲のように、市販されているCDもしくは楽曲ファイルの中には、全体を通して16bitにより表現できる値の最大値に音量が達しない楽曲が録音されていることもある。そのような楽曲が録音されている理由としては様々なものが想定されるが、録音技術が発達していなかった古い年代に録音された楽曲には、一般的にそのような傾向がある。
図1に示した例は、他の楽曲と比べて比較的音量が小さいクラシック曲の音声波形である。このようなクラシック曲を単独で再生する場合には音量はさほど気にならないが、音量が比較的大きい楽曲の前後にこのようなクラシック曲を再生する場合は、このようなクラシック曲の音量が相対的に小さくなるため、音量の小ささが気になる可能性が高い。それゆえ、このクラシック曲の音量のみを上げたくなるという状況となり得る。
図1に示した音声波形を音声波形部分M11〜M14に分けた場合、音声波形部分M11は静かな部分であり、音声波形部分M12は徐々に盛り上がる部分であり、音声波形部分M13は静かな部分であり、音声波形部M14は盛り上がる部分である。上記したように、図1に示した音声波形はクラシック曲を再生して得られるものであり、聴く人に対して全体的に音量が小さいという印象を与え易いと想定される。そこで、このクラシック曲を再生する場合には、音声の音量を全体的に上げる必要があると考えられる。
[1−2.一般的な音量補正技術による音量補正]
図2は、一般的な音量補正技術による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例を示す図である。図2を参照しながら、一般的な音量補正技術による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例について説明する。
図2に示した音声波形を音声波形部分M21、M22に分けた場合、音声波形部分M21は一気に盛り上がる部分であり、音声波形部分M22は盛り上がりっぱなしによりメリハリがない部分である。図2に示すように、一般的な音量補正技術による音量補正により、上記したクラシック曲の音量は大きくなっているが、原曲が有する音量変化(以下、「音量カーブとも言う。」を維持することができておらず、聴く人に不自然な感じを与える結果となっている。
また、一般的な音量補正技術による音量補正により、図2に示された音声波形からは把握できないような音声の歪みも発生している。聴く人に不自然な感じを与えることとなってしまった理由の1つは、音量増幅が音声波形全体を考慮してなされたものではなく、音声波形の一部を考慮して部分的に適切な音量増幅を行っていることが挙げられる。
[1−3.本発明の実施形態に係る再生装置による音量補正]
図3は、本発明の実施形態に係る再生装置による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例を示す図である。図3を参照しながら、本発明の実施形態に係る再生装置による音量補正を音響データに適用した場合において音響データを再生して得られる音声の波形の一例について説明する。
図3に示した音声波形を音声波形部分M31、M32、M33、M34に分けた場合、音声波形部分M31は静かな部分であり、音声波形部分M32は徐々に盛り上がる部分であり、音声波形部分M33は静かな部分であり、音声波形部分M34は徐々に盛り上がる部分である。図3に示すように、本発明の実施形態に係る再生装置による音量補正により、上記したクラシック曲の音量は大きくなっており、原曲が有する音量カーブを維持することができている。
また、本発明の実施形態に係る再生装置による音量補正により、音声の歪みも軽減することができる。聴く人に自然な感じを与えるような音量補正を行うことが可能となった理由の1つは、音量増幅が音声波形全体を考慮してなされたものであることが挙げられる。音声波形全体を考慮して音量増幅を行うために、例えば、上記したPeak値およびRMS値などといったメタデータを使用することができる。Peak値およびRMS値などのメタデータは、例えば、サーバに保持させておき、再生装置にダウンロードして使用することができる。
[1−4.音量特性値の一例としてのPeak値およびRMS値]
図4は、本発明の実施形態に係る音量特性値の一例としてのPeak値およびRMS値について説明するための図である。図4を参照しながら、本発明の実施形態に係る音量特性値の一例としてのPeak値およびRMS値について説明する。
図4に示すように、1箇所だけ突発的な衝撃音のような大きな音があり、それ以外は歌声のみが含まれている楽曲が録音されていたとする。このような楽曲は、一般的にはダイナミックレンジの広い音と呼ばれる。衝撃音の音量が最大音量に相当し、16bitにより表現できる値の最大値に相当するため、衝撃音以外の音声については相対的に音量を下げて録音せざるを得ない。
例えば、衝撃音のPeak値が+32767であった場合は、衝撃音以外の音声に相当する歌声などの音量はPeak値を+1000くらいまで下げて録音しないと、楽曲全体が16bitに収まらない。このようなケースでは、衝撃音以外の音声に相当する歌声の音量が、相対的にかなり小さく感じられてしまう。
このような背景から、本発明の実施形態に係る再生システムは、例えば、楽曲の音量を表す特徴量としてPeak値およびRMS値の2つを保持することとしている。Peak値は、楽曲1曲の中に出現する突発的な音量変化が生じたときの音量レベルを表す特徴量として用いるのに適していると言える。図4に示した例では、Peak値は、衝撃音の音量レベルを表現するのに適していると言える。また、RMS値は、楽曲の音声が有するパワーに対する積分値の時間平均を表すものであり、楽曲全体の平均的な音量レベルを表す特徴量として用いるのに適していると言える。図4に示した例においては、RMS値は、主に衝撃音以外の音声に相当する歌声の音量レベルを表す特徴量となっている。
[1−5.音量特性値の一例としてのPeak値の計算例]
図5は、本発明の実施形態に係る音量特性値の一例としてのPeak値の計算例を示す図である。図5を参照しながら、本発明の実施形態に係る音量特性値の一例としてのPeak値の計算例について説明する。
音響データの一例としての楽曲1曲をモノラル音声により再生した場合、例えば、図5に示した式1のような関数により計算を行うことにより、変数PeakにPeak値が格納される。また、音響データの一例としての楽曲1曲をステレオ音声により再生した場合、例えば、図5に示した式2のような関数により計算を行うことにより、変数PeakにPeak値が格納される。本発明の実施形態に係る再生システムは、例えば、このような計算により変数PeakにPeak値を格納し、変数Peakに格納したPeak値を音量特性値の一例として使用することができる。
[1−6.音量特性値の一例としてのRMS値の計算例]
図6は、本発明の実施形態に係る音量特性値の一例としてのRMS値の計算例を示す図である。図6を参照しながら、本発明の実施形態に係る音量特性値の一例としてのRMS値の計算例について説明する。
音響データの一例としての楽曲1曲をモノラル音声により再生した場合、例えば、図6に示した式3のような関数により計算を行うことにより、変数RMSにRMS値が格納される。また、音響データの一例としての楽曲1曲をステレオ音声により再生した場合、例えば、図6に示した式2のような関数により計算を行うことにより、変数RMSにRMS値が格納される。本発明の実施形態に係る再生システムは、例えば、このような計算により変数RMSにRMS値を格納し、変数RMSに格納したRMS値を音量特性値の一例として使用することができる。
[1−7.再生装置のハードウェア構成]
図7は、本発明の実施形態に係る再生装置のハードウェア構成例を示す図である。図7を参照しながら、本発明の実施形態に係る再生装置のハードウェア構成例について説明する。
図7に示すように、本発明の実施形態に係る再生装置100は、例えば、CPU(Central Processing Unit)910と、ROM(Read Only Memory)920と、RAM(Random Access Memory)930と、バス940と、ユーザインタフェース950と、記憶装置960と、通信装置970と、デコード回路980と、を備えるものである。
CPU910は、演算処理装置および制御装置として機能し、例えば、ROM920に記録された各種プログラムを読み出して記憶装置960に記憶させておき、各種プログラムを実行するに際して、記憶装置960により記憶された各種プログラムをRAM930に展開し、RAM930に展開した各種プログラムを実行することができる。かかる各種プログラムの実行により、再生装置100内の動作全般またはその一部を制御することが可能である。
ROM920は、読み出し専用のメモリであり、例えば、CPU910により読み出される各種プログラムやその実行に使用されるパラメータなどを記憶することができる。
RAM930は、記憶装置960からCPU910により読み出された各種プログラムやその実行に使用されるパラメータなどを一時的に記憶することが可能である。また、CPU910による各種プログラムの実行に際して一時的に記憶しておく必要が生じた各種データなどを記憶することも可能である。
バス940は、再生装置100の内部に設けられている各ハードウェアを接続し、各ハードウェア間における信号の送受信を実現するために機能する。
ユーザインタフェース950は、入力装置により構成されるものである。例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなどにより構成され、ユーザからの操作を受け付ける機能を有する。入力装置は、例えば、受け付けた操作に基づいて入力信号を生成し、CPU910に出力する。音響データを再生して得られる音声を聴いている人は、例えば、入力装置を操作することにより、再生装置100に対して各種のデータを入力したり処理動作を指示したりすることができる。
記憶装置960は、記憶装置960は、データ格納用の装置であり、例えば、HDDなどの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイス等により構成される。記憶装置960は、外部から取得した音響データや画像データなどを格納することができる。記憶装置960は、例えば、CPU910によりROM920から読み出された各種プログラムを記憶しておく機能などを有するものである。
通信装置970は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。通信装置970は、例えば、有線または無線LAN(Local Area Network)用の通信カード、ADSL(Asymmetric Digital Subscriber Line)用のルータ、各種通信用のモデムなどにより構成される。この通信装置970は、例えば、他の通信機器との間で音響データなどのデータを送受信することができる。また、通信装置970に接続されるネットワークは、有線または無線によって接続されたネットワークなどにより構成され、例えば、インターネット、家庭内LANなどであってもよい。
デコード回路980は、符号化された音響データを復号し、再生する機能を有するものである。また、デコード回路980は、符号化された映像データを復号し、再生する機能を有していてもよい。
以上、本発明の実施形態に係る再生装置100の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、本発明の実施形態に係る再生装置100を実施する時の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。
[1−8.再生システムの機能構成]
図8は、本発明の実施形態に係る再生システムの機能構成を示す図である。図8を参照しながら、本発明の実施形態に係る再生システムの機能構成について説明する。
図8に示すように、本発明の実施形態に係る再生システム10は、再生装置100と、提供装置200と、出力装置300とを備えるものである。再生装置100と提供装置200とは、例えば、ネットワークを介して接続されており、互いに通信可能とされている。再生装置100と出力装置300とは、例えば、専用線により接続されており、出力装置300は、再生装置100から出力された音声信号を音声として出力することが可能である。また、出力装置300は、再生装置100から出力された画像信号を画像として出力することが可能である。
再生装置100は、少なくとも、再生部の一例としての映像音響データデコード回路130(以下、単に「映像音響データデコード回路130」とも言う。)と、音量補正部の一例としてのコンプレッサー回路160(以下、単に「コンプレッサー回路160」とも言う。)を備えるものである。ここでは、再生装置100は、映像音響データデコード回路130を備えることとしており、映像音響データデコード回路130は、符号化された映像データと符号化された音響データとの双方を復号して再生することとする。しかしながら、再生装置100は、再生部は、符号化された映像データを復号して再生する機能は有していなくてもよい。映像音響データデコード回路130は、例えば、上記したデコード回路980により構成される。
コンプレッサー回路160は、映像音響データデコード回路130により再生された音響データ(以下、「再生対象音響データ」とも言う。)の音量を、複数の音響データの各々の音量特性値と再生対象音響データの音量特性値との関係に基づいて補正する機能を有するものである。複数の音響データは、特に限定されるものではなく、再生対象音響データを含むものであってもよいし、含まないものであってもよい。音量特性値としては、Peak値やRMS値などを例として挙げることができる。
再生装置100は、映像音響データデコード回路130と、コンプレッサー回路160とを備えることにより、元の音響データの音量変化に比較的近い音量変化を維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能となる。
再生装置100は、パラメータ算出部150を備えることとしてもよい。パラメータ算出部150は、複数の音響データの各々の音量特性値と音響データの音量特性値との関係に基づいて音量補正のためのパラメータを算出する機能を有するものである。音量補正のためのパラメータは、コンプレッサー回路160において音響データの音量補正に使用される。すなわち、コンプレッサー回路160は、パラメータ算出部150により算出されたパラメータに従って再生対象音響データの音量を補正する。
再生装置100は、受信部110、映像音響データ取得部120、映像音響データデコード回路130、属性情報取得部140、ミキサー装置170、記憶部180などを備えることとしてもよい。受信部110は、提供装置200から、上記した複数の音響データの各々の音量特性値、再生対象音響データの音量特性値、再生対象音響データ自体などを受信することが可能である。しかしながら、上記した複数の音響データの各々の音量特性値、再生対象音響データの音量特性値、再生対象音響データ自体などは、提供装置200から受信せずに、再生装置100が備える記憶部180により記憶されているものを再生装置100において使用することもできる。受信部110は、提供装置200から映像データを受信することとしてもよい。受信部110は、例えば、通信装置970により構成されるものである。
映像音響データ取得部120は、受信部110により受信された再生対象音響データを受信部110から取得する機能を有するものである。映像音響データ取得部120は、取得した再生対象音響データを映像音響データデコード回路130に出力する機能をさらに有している。映像音響データ取得部120は、受信部110により映像データが受信された場合には、その映像データを受信部110から取得する機能を有していてもよい。その場合には、映像音響データ取得部120は、受信部110から取得した映像データを映像音響データデコード回路130に出力する機能をさらに有する。映像音響データデコード回路130に出力された再生対象音響データや映像データは、映像音響データデコード回路130において使用される。
属性情報取得部140は、受信部110により受信された再生対象音響データの音量特性値を受信部110から取得する機能を有するものである。属性情報取得部140は、受信部110により受信された再生対象音響データの音量特性値をパラメータ算出部150に出力する機能をさらに有している。パラメータ算出部150に出力された再生対象音響データの音量特性値は、パラメータ算出部150において使用される。属性情報取得部140は、再生対象音響データの音量特性値を再生対象音響データの属性情報(「メタデータ」とも言う。以下同じ。)として属性情報取得部140から受信することができる。
ミキサー装置170は、コンプレッサー回路160から出力された再生対象音響データおよび映像データを合成する機能を有するものである。コンプレッサー回路160から出力された再生対象音響データは、必要に応じて音量が補正されている。ミキサー装置170は、再生対象音響データおよび映像データが合成されてなる合成信号を出力装置300に出力する。
再生装置100は、記憶部180をさらに備えることとしてもよい。記憶部180は、例えば、記憶装置960によって構成されるものである。記憶部180は、再生装置100を構成する各機能ブロックの動作を制御するための各種プログラムを記憶する機能や、そのプログラムが実行される際に使用される各種データなどを記憶する機能を有するものである。
映像音響データ取得部120や、属性情報取得部140、パラメータ算出部150などは、例えば、CPU910、RAM930などにより構成され、CPU910が記憶部180によって記憶されているプログラムをRAM930に展開して実行することによりその機能が実現されるものである。しかし、このような構成に限らず、映像音響データ取得部120や、属性情報取得部140、パラメータ算出部150の中には、専用のハードウェアにより構成されるものが存在してもよい。
提供装置200は、少なくとも、記憶部210と、取得部220と、解析部230と、送信部240とを備えるものである。記憶部210は、例えば、記憶装置によって構成されるものである。記憶部180は、提供装置200を構成する各機能ブロックの動作を制御するための各種プログラムを記憶する機能や、そのプログラムが実行される際に使用される各種データなどを記憶する機能を有するものである。記憶部180は、例えば、上記した複数の音響データの各々の音量特性値を記憶する機能を有していてもよい。また、記憶部180は、再生対象音響データを記憶する機能を有していてもよい。
取得部220は、複数の音響データの各々の音量特性値を取得する機能を有するものである。取得部220は、例えば、記憶部180により記憶されている複数の音響データの各々の音量特性値を取得する。複数の音響データの各々の音量特性値としては、例えば、複数の音響データの各々のRMS値を使用することができる。また、取得部220は、再生対象音響データを取得する機能を有するものである。取得部220は、例えば、記憶部180により記憶されている再生対象音響データを取得する。
解析部230は、取得部220により取得された複数の音響データの各々の音量特性値の分布を解析する機能を有するものである。複数の音響データの各々の音量特性値の分布としては、例えば、複数の音響データの各々のRMS値の分布を使用することができる。解析部230は、複数の音響データの各々の音量特性値の分布を解析することにより、RMS基準値を解析結果として算出してもよい。RMS基準値の算出手法については、後に詳細に説明する。解析部230により複数の音響データの各々の音量特性値の分布が解析されて得られた結果は、解析結果の一例として送信部240に出力される。RMS基準値は、基準平均値の一例である。
また、解析部230は、取得部220により取得された再生対象音響データを解析する機能をさらに有するものである。解析部230は、再生対象音響データを解析することにより、再生対象音響データの音量特性値を算出してもよい。また、解析部230は、再生対象音響データの音量特性値の一例として、再生対象音響データのRMS値を算出してもよい。解析部230は、このように解析して得られた再生対象音響データの音量特性値を、例えば、再生対象音響データの属性情報として記憶部210に記憶させておき、必要に応じて記憶部210から取得できるようにしておくこともできる。解析部230により再生対象音響データが解析されて得られた結果は、解析結果の一例として送信部240に出力される。
ここでは、解析部230は、複数の音響データの各々の音量特性値の分布を解析して得た結果と、再生対象音響データを解析して得た結果とを、解析結果として送信部240に出力することとしている。しかしながら、解析部230は、これらの解析結果を用いてさらに解析を進め、その結果として得られた解析結果を送信部240に出力するようにしてもよい。例えば、解析部230は、解析をさらに進めた結果として、音量補正のためのパラメータを算出することとしてもよい。かかる場合には、当該パラメータを解析結果の一例として送信部240に出力することとしてもよい。音量補正のためのパラメータについては、後に詳細に説明する。
送信部240は、再生対象音響データを再生する再生装置100に対して、再生対象音響データ、および解析部230による解析結果を送信する機能を有するものである。送信部240は、例えば、取得部220により記憶部210から取得された再生対象音響データを再生装置100に送信することができる。送信部240は、例えば、通信装置により構成されるものである。送信部240は、記憶部210により映像データが記憶されている場合には、記憶部210により記憶されている映像データを再生装置100に送信し、再生させることとしてもよい。
取得部220や、解析部230などは、例えば、CPU、RAMなどにより構成され、CPUが記憶部210によって記憶されているプログラムをRAMに展開して実行することによりその機能が実現されるものである。しかし、このような構成に限らず、取得部220や、解析部230の中には、専用のハードウェアにより構成されるものが存在してもよい。
出力装置300は、少なくとも、音声出力部310を備えるものである。音声出力部310は、例えば、スピーカまたはヘッドホンによって構成されるものである。音声出力部310は、映像音響データデコード回路130により再生された音響データをアナログ信号に変換して出力する機能を有している。出力装置300は、画像出力部320を有していてもよい。画像出力部320は、例えば、表示装置によって構成されるものである。画像出力部320は、映像音響データデコード回路130により再生された映像データをアナログ信号に変換して出力する機能を有している。
[1−9.属性情報の管理手法の一例]
図9は、本発明の実施形態に係る属性情報の管理手法の一例について説明するための図である。図9を参照しながら、本発明の実施形態に係る属性情報の管理手法の一例について説明する。
図9に示すように、再生対象音響データの属性情報は、提供装置200が備える記憶部210に記憶されている再生対象音響データと同一の楽曲ファイルにヘッダデータとして埋め込まれていることとしてもよい。解析部230は、例えば、上記した解析結果を属性情報として楽曲ファイルにヘッダデータとして埋め込んでおけばよい。そのようにすれば、提供装置200は、再生装置100からの再生対象音響データの送信要求に応じて、取得部220により属性情報が埋め込まれた楽曲ファイルを取得し、送信部240により再生装置100に送信すればよい。
[1−10.属性情報の管理手法の他の一例]
図10は、本発明の実施形態に係る属性情報の管理手法の他の一例について説明するための図である。図10を参照しながら、本発明の実施形態に係る属性情報の管理手法の他の例について説明する。
図10に示すように、再生対象音響データの属性情報は、提供装置200が備える記憶部210に記憶されている再生対象音響データと同一の楽曲ファイルに埋め込まれていなくてもよい。解析部230は、例えば、上記した解析結果を属性情報として再生対象音響データに紐付けをして記憶部210に記憶させておけばよい。提供装置200は、例えば、再生対象音響データを識別するための情報と属性情報とを対応付けて記憶部210に記憶しておく。
一方、再生装置100は、必要に応じて、再生対象音響データを識別するための情報を含む要求を提供装置200に送信し、その要求に対する応答として再生対象音響データを識別するための情報に対応する属性情報を取得することができる。再生対象音響データを識別するための情報としては、例えば、再生対象音響データの一部を解析して得られる情報(Fingerprint)を使用することができる。
[1−11.再生システムにより実行される処理]
図11は、本発明の実施形態に係る再生システムにより実行される処理の流れを示すフローチャートである。図11を参照しながら、本発明の実施形態に係る再生システム10により実行される処理の流れについて説明する。
図11に示すように、提供装置200の解析部230は、再生対象音響データのPeak値およびRMS値を予め計算しておくことができる(ステップS101)。再生対象音響データのPeak値およびRMS値は、再生対象音響データの音量特性値の例に相当する。続いて、記憶部210は、解析部230により計算された再生対象音響データのPeak値およびRMS値を再生対象音響データと対応付けて属性情報として保持しておくことができる(ステップS102)。計算結果と再生対象音響データとの対応付けについては、上記したように様々な手法が想定される。ステップS101およびステップS102は、再生システム10において1パス目の処理として実行され得るものである。記憶部210がこのように属性情報を保持しておき、必要に応じて取得されるようにしておけば、同一の再生対象音響データを次回以降に再生する際に再度1パス目の処理を実行する必要はなくなるという利点がある。
続いて、再生装置100の受信部110は、映像音響データデコード回路130による再生対象音響データの再生前に再生対象音響データの属性情報をダウンロードする(ステップS201)。再生装置100のパラメータ算出部150は、この属性情報に基づいて音量補正パラメータを算出し(ステップS202)、算出した音量補正パラメータをコンプレッサー回路160に設定する(ステップS203)。映像音響データデコード回路130は、再生対象音響データをデコードしながらコンプレッサー回路160に通す(ステップS204)。ステップS201〜ステップS204は、再生システム10において2パス目の処理として実行され得るものである。2パス目の処理を実行すると、音量が補正された後の再生対象音響データが出力される。
[1−12.音響データの音量補正に適用し得るコンプレッサー回路]
図12は、本発明の実施形態に係る再生装置100による音響データの音量補正に適用し得るコンプレッサー回路を示す図である。図12を参照しながら、本発明の実施形態に係る再生装置100による音響データの音量補正に適用し得るコンプレッサー回路160について説明する。
図12に示すように、コンプレッサー回路160は、映像音響データデコード回路130から入力された信号の大きさが出力目標レベルになるように信号を調整し、調整後の信号を出力信号として出力する。本発明の実施形態に係るコンプレッサー回路160は、既存のコンプレッサー回路とは異なり、例えば、線形増幅部161および非線形増幅部163を有している。また、コンプレッサー回路160は、例えば、線形増幅部161の後段に非線形増幅部163と並列に接続される線形増幅部162を有しており、かかるコンプレッサー回路160を有することは、本発明の実施形態に係る再生装置100の特徴の1つである。これらの増幅部をメタデータにより適切に制御することで、制作者の意図する元の音響データの音量変化カーブを維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能となる。以下、映像音響データデコード回路130から入力される信号が音声信号(例えば、再生対象音響データの音声信号)であるとして説明する。
線形増幅部161は、第1の線形補正部の一例として機能し、図12においては「Sgain」と表されている。また、線形増幅部162は、第2の線形補正部の一例として機能し、図12においては「Tgain」と表されている。また、非線形増幅部163は、非線形補正部の一例として機能し、図12においては「Dgain」と表されている。「Sgain」「Tgain」「Dgain」は、各増幅部における増幅率を示している。
線形増幅部161は、音声信号に対して線形の増幅処理を施すものである。線形増幅部162は、線形増幅部161から出力された音声信号に対して線形の増幅処理を施すものである。非線形増幅部163は、線形増幅部161から出力された音声信号に対して非線形の増幅処理を施すものであり、主に音声レベルの高い音声波形への振幅圧縮処理を行う。その振幅圧縮処理は、非線形処理により行われるため、音声に歪みが生じ、振幅圧縮率が高まるにつれ、その歪み率が大きくなってしまう。
[1−13.コンプレッサー回路が有する静特性(音量増幅時)の一例]
図13は、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を増幅する場合)の一例を示す図である。図13を参照しながら、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を増幅する場合)の一例について説明する。
図13に示したグラフは、特に、再生対象音響データの音量を増幅する場合において、非線形増幅部163(増幅率Dgainを有する増幅部)が有する静特性を示したものである。図13には、非線形増幅部163に対して入力される信号の大きさと非線形増幅部163から出力される信号の大きさとの関係が示されている。非線形増幅部163が有する動特性を考慮する場合には、図13に示された非線形増幅部163から出力される信号の大きさは、当該大きさを有する信号になるように非線形増幅部163により制御される出力目標レベルとしての意味を持つ。
図13に示した例では、非線形増幅部163への入力信号の大きさがTに達するまでは、入力信号の大きさの増分に比例して非線形増幅部163からの出力信号の大きさの増分が変化する。また、非線形増幅部163への入力信号の大きさがTを超えると、非線形増幅部163からの出力信号の大きさの増分が0dBに飽和する。非線形増幅部163への入力信号の大きさがTに達するまでは、非線形増幅部163からの出力信号の大きさは、非線形増幅部163への入力信号の大きさに増幅率Dgainを乗じた分だけ大きい値となっている。非線形増幅部163への入力信号の大きさがTに達するまでは、音声信号に対して非線形な増幅が行われていることになる。
[1−14.コンプレッサー回路が有する静特性(音量減衰時)の一例]
図14は、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を減衰する場合)の一例を示す図である。図14を参照しながら、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を減衰する場合)の一例について説明する。
図14に示したグラフは、特に、再生対象音響データの音量を減衰する場合において、非線形増幅部163(増幅率Dgainを有する増幅部)が有する静特性を示したものである。図14には、非線形増幅部163に対して入力される信号の大きさと非線形増幅部163から出力される信号の大きさとの関係が示されている。非線形増幅部163が有する動特性を考慮する場合には、図14に示された非線形増幅部163から出力される信号の大きさは、当該大きさを有する信号になるように非線形増幅部163により制御される出力目標レベルとしての意味を持つ。
図14に示した例では、非線形増幅部163からの出力信号の大きさは、非線形増幅部163への入力信号の大きさに増幅率Dgainを乗じた分だけ小さい値となっている。非線形増幅部163への入力信号の大きさがTに達するまでは、音声信号に対して非線形な増幅が行われていることになる。図14に示した場合のように、音声信号の音量を減衰する場合には、音声信号に対して線形減衰を施すこととなるため、音声に歪みが発生することは考慮しなくてよい。
[1−15.コンプレッサー回路が有する静特性(音量増幅時)の他の一例]
図15は、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を増幅する場合)の他の一例を示す図である。図15を参照しながら、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する静特性(音響データの音量を増幅する場合)の他の一例について説明する。
図15に示したグラフは、特に、再生対象音響データの音量を増幅する場合において、非線形増幅部163(増幅率Dgainを有する増幅部)が有する静特性を示したものであり、図13を参照しながら説明した静特性に代わって使用される例であり、図13に示した静特性と図14に示した静特性との複合型に相当するものである。図15には、非線形増幅部163に対して入力される信号の大きさと非線形増幅部163から出力される信号の大きさとの関係が示されている。非線形増幅部163が有する動特性を考慮する場合には、図15に示された非線形増幅部163から出力される信号の大きさは、当該大きさを有する信号になるように非線形増幅部163により制御される出力目標レベルとしての意味を持つ。
図15に示した例では、非線形増幅部163への入力信号の大きさがT1に達するまでは、比較的大きな増幅率により入力信号の大きさの増分に比例して非線形増幅部163からの出力信号の大きさの増分が変化する。また、非線形増幅部163への入力信号の大きさがT1を超えると、非線形増幅部163からの出力信号の大きさの増分が低下していく。非線形増幅部163への入力信号の大きさがT2を超えてからは、非線形増幅部163からの出力信号の大きさは、非線形増幅部163への入力信号の大きさよりも低くなり、音声信号に対して非線形な増幅が行われていることになる。かかる増幅処理も振幅圧縮処理に相当し、音声に歪みが生じ得る。
[1−16.コンプレッサー回路が有する動特性の一例]
図16は、本発明の実施形態に係る再生装置に適用し得るコンプレッサー回路が有する動特性の一例を示す図である。図16を参照しながら、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163が有する動特性の一例について説明する。
一般的に、コンプレッサーは聴感上自然な音声振幅圧縮を実現するため、時間的に増幅率の変動する動特性を有している。図16(A)に示した入力信号は、トーンバースト信号に相当する。また、図16(B)に示した信号は、コンプレッサーが生成したエンベロープ信号に相当する。コンプレッサー回路160内の非線形増幅部163は、図16(A)に示した入力信号に基づいて図16(B)に示したエンベロープ信号を生成することができる。エンベロープ信号の生成については、図17を参照しながら後に詳細に説明する。
非線形増幅部163は、図16(B)に示したエンベロープ信号の大きさと出力目標レベルとの比率から、増幅ゲイン率を求める。具体的には、非線形増幅部163は、出力目標レベルをエンベロープ信号の大きさで除算して増幅ゲイン率とする。非線形増幅部163は、この増幅ゲイン率を、時々刻々、図16(A)に示した入力信号に乗算することで、図16(C)に示した出力信号を得ることができる。図16(C)に示した出力信号は、トーンバースト信号のエンベロープを表している。
[1−17.コンプレッサー回路における制御信号の生成手法の一例]
図17は、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160内の非線形増幅部163における制御信号(エンベロープ信号)の生成手法の一例を示す図である。図17を参照しながら、本発明の実施形態に係る再生装置100に適用し得るコンプレッサー回路160における制御信号(エンベロープ信号)の生成手法の一例について説明する。
非線形増幅部163は、図16(A)に示した入力信号に対して絶対値をとり、時定数を持たせる。時定数には3種類あり、立ち上がり率を表すアタックタイム、ピークを保持するホールドタイム、立ち下がり率を表すリリースタイムである。非線形増幅部163は、これらのパラメータを変えることで、コンプレッサー回路160内の非線形増幅部163の挙動を変えることができる。具体的には、非線形増幅部163は、これらのパラメータを変えることでコンプレッサー回路160に音響データを通して得られる音声の音色が変化する。一般的には、聴感上において適切な値をパラメータの固定値として設定しておく。
[1−18.音響データの音量補正の処理の流れの詳細]
図18は、本発明の実施形態に係る再生装置による音響データの音量補正の処理の流れの詳細を示すフローチャートである。図18を参照しながら、本発明の実施形態に係る再生装置100による音響データの音量補正の処理の流れの詳細について説明する。なお、図18に示した処理は、上記した2パス目の処理に相当する。
図18に示すように、再生装置100の属性情報取得部140は、受信部110を介して再生対象音響データのRMS値を取得する(ステップS303)。パラメータ算出部150は、属性情報取得部140により取得されたRMS値とあらかじめ定められたRMS基準値との大小を比較する(ステップS302)。RMS基準値は、複数の音響データのRMS値の分布に基づいて決定されるものであり、その決定手法については後に詳細に説明する。
パラメータ算出部150は、RMS値が基準値より小さい場合は、音量増幅(ゲイン増幅)を行うためのパラメータを算出し、RMS値より大きい場合は、音量減衰(ゲイン減衰)を行うためのパラメータを算出する。RMS値が基準値と同じ場合は、音量補正を行わない(スルー出力する)ようにするためのパラメータを算出する。パラメータ算出部150は、例えば、コンプレッサー回路160内の線形増幅部161に設定される線形補正用パラメータ(例えば、増幅率Sgain)、およびコンプレッサー回路160内の非線形増幅部163に設定される非線形補正用パラメータ(例えば、増幅率Dgain)を算出することができる。コンプレッサー回路160は、パラメータ算出部150により算出されたパラメータに基づいて、音量補正を行う。
[1−19.パラメータ算出部によるパラメータ(音量増幅時)の算出例]
図19は、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データの音量を増幅する場合)を示す図である。図19を参照しながら、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データの音量を増幅する場合)について説明する。
図19に示すように、音響データの音量を増幅する場合、パラメータ算出部150は、再生対称音響データの音量が全体で(RMS基準値/RMS値)倍に増幅するよう、線形増幅部161に設定される増幅率Sgain(線形補正用パラメータの一例)および非線形増幅部163に設定される増幅率Dgain(非線形補正用パラメータの一例)を算出する。
まず、線形増幅部161に設定される増幅率Sgainの算出方法について述べる。ここでは、再生対象音響データのメタデータの1つであるPeak値を利用する。パラメータ算出部150は、例えば、メタデータの1つであるPeak値と音量上限値(例えば、「32768」)との比率を線形増幅部161に設定される増幅率Sgainとして算出する。パラメータ算出部150により算出された増幅率Sgainは、パラメータ算出部150により線形増幅部161に設定される。線形増幅部161では線形増幅を行い、メタデータの1つであるPeak値を考慮した増幅のため、飽和しないことが保証されている。このため、線形増幅部161における音量増幅に際して音声の歪みは発生しない。但し、線形増幅部161では音量増幅が足りない可能性があり、音量増幅の不足分については非線形増幅部163にて補うことができる。
次に、非線形増幅部163に設定される増幅率Dgainの算出方法について述べる。ここでは、再生対象音響データのメタデータの1つであるRMS値を利用する。パラメータ算出部150は、再生対象音響データのRMS値に対するRMS基準値の比率に基づいて増幅率Dgainを算出する。パラメータ算出部150により算出された増幅率Dgainは、パラメータ算出部150により非線形増幅部163に設定される。パラメータ算出部150は、例えば、(RMS基準値/RMS値)/Sgainを増幅率Dgainとして算出する。かかる値が増幅率Dgainとしてパラメータ算出部150により設定されれば、非線形増幅部163における増幅を、増幅率Sgainを考慮して低く抑えられる。すなわち、音声の歪みを低く抑えることができる。増幅率Dgainは、図13に示した静特性における増幅率に相当する。
[1−20.パラメータ算出部によるパラメータ(音量減衰時)の算出例]
図20は、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データの音量を減衰する場合)を示す図である。図20を参照しながら、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データの音量を減衰する場合)について説明する。
図20に示すように、音響データの音量を減衰する場合、パラメータ算出部150は、再生対象音響データのRMS値に対するRMS基準値の比率を線形増幅部161に設定される増幅率Sgain(線形補正用パラメータの一例)として算出する。パラメータ算出部150により算出された増幅率Sgainは、パラメータ算出部150により線形増幅部161に設定される。
パラメータ算出部150は、「0.0」を増幅率Dgain(非線形補正用パラメータの一例)として算出する。「1.0」を増幅率Tgainとして算出する。パラメータ算出部150により算出された増幅率Dgainおよび増幅率Tgainは、パラメータ算出部150により非線形増幅部163および線形増幅部162に設定される。かかる値がパラメータ算出部150により設定されれば、線形増幅部162により線形減衰を行うため、音声の歪み無く減衰することができる。線形増幅部162はスルー出力を行い、非線形増幅部163は無音を出力し、線形増幅部162および非線形増幅部163から出力された両出力が加算され、最終段の出力信号となる。
[1−21.パラメータ算出部によるパラメータ(スルー出力時)の算出例]
図21は、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データをスルー出力する場合)を示す図である。図21を参照しながら、本発明の実施形態に係る再生装置100に適用し得るパラメータ算出部150によるパラメータの算出例(音響データをスルー出力する場合)について説明する。
図21に示すように、音響データをスルー出力する場合、パラメータ算出部150は、「1.0」を線形増幅部161に設定される増幅率Sgain(線形補正用パラメータの一例)として算出する。また、パラメータ算出部150は、「0.0」を増幅率Dgain(非線形補正用パラメータの一例)として算出する。また、パラメータ算出部150は、「1.0」を増幅率Tgainとして算出する。
パラメータ算出部150により算出された増幅率Sgain、増幅率Dgainおよび増幅率Tgainは、パラメータ算出部150により線形増幅部161、非線形増幅部163および線形増幅部162に設定される。かかる値がパラメータ算出部150により設定されれば、非線形増幅部163による処理が行われないため、歪みのない音声を出力することができる。
次に、パラメータ算出部150において算出に用いられているRMS基準値の求め方について述べる。RMS基準値は、例えば、再生対象音響データのPeak値及びRMS値の統計分布から算出する。
[1−22.音量特性値の一例としてのPeak値の統計分布]
図22は、本発明の実施形態に係る音量特性値の一例としてのPeak値の統計分布について説明するための図である。図22を参照しながら、本発明の実施形態に係る音量特性値の一例としてのPeak値の統計分布について説明する。
図22は、一般的な楽曲(音響データの例)群のPeak値の統計分布(ヒストグラム)を示している。多くの楽曲のPeak値は音量の上限値である32768の付近となっているが、図22に示されたヒストグラムを参照する限りは、Peak値が音量の上限値付近にない曲も多く存在しているので、そのような楽曲に対しては、図19に示したような、線形増幅のための各増幅率の組み合わせを適用することで、非線形増幅による音声の歪みを適切に抑えることができる。本例では、RMS基準値の算出にPeak値の統計分布を直接利用していないが、例えば、Peak値の統計分布の平均値と後述するRMS値の統計分布の平均値との差分とから、最適な増幅率となるよう非線形増幅部163が有する静特性と動特性を変更してもよい。
[1−23.音量特性値の一例としてのRMS値の統計分布]
図23は、本発明の実施形態に係る音量特性値の一例としてのRMS値の統計分布について説明するための図である。図23を参照しながら、本発明の実施形態に係る音量特性値の一例としてのRMS値の統計分布について説明する。
図23は、一般的な楽曲(音響データの例)群のRMS値の統計分布(ヒストグラム)を示している。図23を参照すると、RMS値の平均値を中心にほぼ正規分布で広範囲に広がっているのがわかる。数十dBの音量差で、さまざまな楽曲が分布していることがわかる。リスナーが再生しようとしている楽曲群に相当する音楽ライブラリは既知であるため、それらの楽曲群の統計分布を予め求めておくことは可能である。ネットワークを介したストリーミング再生のユースケースに関しても同様である。本発明の実施形態においては、再生する楽曲群の統計分布を、図22、図23などに示したようにあらかじめ計算して求めておくことができる。
[1−24.RMS基準値の決定手法の一例]
図24は、本発明の実施形態に係る再生装置100による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の一例について説明するための図である。図24を参照しながら、本発明の実施形態に係る再生装置100による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の一例について説明する。
図24に示すように、解析部230は、統計分布からRMS値の平均値を求めることができる。解析部230は、RMS値の平均値をRMS基準値としてもよいが、図24に示した例では、RMS値の平均値+1.5シグマ(シグマは標準偏差)をRMS基準値としている。また、解析部230は、RMS値の平均値+3シグマ−数dB(例えば、6dB)をRMS基準値としてもよい。解析部230は、RMS値の平均値をRMS基準値としない理由は、より多くの楽曲に対して、音量補正をゲイン増幅モードで動作させるためであり、量子化ビット数16ビットを有効に利用したS/Nの良い音にすることができる。
ノーマライザーを3つの動作モード(ゲイン増幅、ゲイン減衰、スルー出力)のいずれにより動作させるのが好ましいかはユーザに嗜好によるので、このRMS基準値の決め方は一通りではなく、ユーザが統計分布のRMS平均値を基準に好きな音量レベルに決めてよい。
[1−25.RMS基準値の決定手法の他の一例]
図25は、本発明の実施形態に係る再生装置100による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の他の一例について説明するための図である。図25を参照しながら、本発明の実施形態に係る再生装置100による音響データの音量補正の処理に使用され得るRMS基準値の決定手法の他の一例について説明するための図である。
パラ
図24に示した例では、RMS基準値を一つとしたが、図25に示した例では、RMS基準値の上限値と下限値の2つを設けている。このとき、パラメータ算出部150は、RMS基準値よりも小さい下側基準値(下限のRMS基準値)より再生対象音響データのRMS値が小さい場合に再生対象音響データの音量を増幅するためのパラメータを算出する。また、パラメータ算出部150は、RMS基準値よりも大きい上側基準値(上限のRMS基準値)より再生対象音響データのRMS値が大きい場合に再生対象音響データの音量を減衰するためのパラメータを算出する。パラメータ算出部150は、下限のRMS基準値と上限のRMS基準値との間に再生対象音響データのRMS値が含まれる場合、再生対象音響データをスルー出力させるためのパラメータを算出する。
RMS基準値と下側基準値との差分およびRMS基準値と上側基準値との差分についは、特に限定されるものではなく、例えば、3dBとすることができる。すなわち、RMS基準値+3dBを上限のRMS基準値とし、RMS基準値−3dBレベルを下限のRMS基準値とすることができる。コンプレッサー回路160は、上限のRMS基準値より大きいRMS値を持つ楽曲に対してはゲイン減衰の音量補正動作を行い、下限のRMS基準値より小さいRMS値を持つ楽曲に対してはゲイン増幅の音量補正動作を行うことができる。上限のRMS基準値と下側のRMS基準値との間のRMS値を持つ楽曲に対しては何もせずに、楽曲をスルー出力する。スルー出力することで、再生対象音響データに必要以上の音量制御処理をする必要がなくなり、音質の劣化を最小限にすることができる。これらの動作モードの設定に関しても、ユーザ側で統計分布のRMS平均値を基準に自由に決めることができる。
<2.使用例>
以上に説明した本発明の実施形態に係る再生システム10の使用例と一般的な再生システムの使用例とについて説明する。以下に示すように、一般的な再生システムの使用例についてシナリオ1、2に記載し、本発明の実施形態に係る再生システム10の使用例についてシナリオ例3に記載する。
シナリオ例1)
Aさんはこれまでに購入したCDが100枚くらいあり、これらの楽曲は全てPCなどにリッピングして保存している。楽曲数として1000曲くらいがPCに保存されている。その中にはクラシックの曲やロックの曲が混じっている。AさんはPC上の音楽ファイルを専用のソフトウェアを使ってランダム再生してみた。
1曲目はロックが再生された。音量が大きめだったので音量ボリュームを10段階中3にした。次に2曲目にクラシックが再生された。音量がとても小さく感じたので、Aさんは音量ボリュームを3から7に上げた。ところがこのクラシックの曲は後半にとても盛り上がり、うるさく感じられてきた。そこでAさんはボリュームを5に下げた。3曲目は再び、別のロックの曲が再生された、音量がすごく大きく感じられたので、ボリュームを5から3に下げた。Aさんは音量調整をとても煩わしく感じた。
シナリオ例2)
Aさんは、既存の「ダイナミック型」のノーマライザー処理をONにした。AさんはPC上の音楽ファイルを専用のソフトウェアを使ってランダム再生してみた。1曲目はロックが再生された。音量が大きめだったので音量ボリュームを10段階中3にした。次に2曲目にクラシックが再生された。音量はロックの曲とそんなに差を感じなかったので3のまま再生した。ところがクラシックの曲のフルートやピアノの音が原曲と比べて、なぜか歪みっぽく感じられた。
そして、このクラシック曲は前半が静かで後半がすごく盛り上がるはずなのに、前半からフルートとピアノの音量がすごく上がり過ぎているのが気になった。前半の音量感の勢いのまま後半の盛り上がり部分に突入したので、後半のドラマチックな盛り上がり方を感じ取ることができなかった。3曲目は再び、別のロックの曲が再生された。音量調整は全体を通して3のままで変える必要がなかったが、クラシックの曲の音量の不自然さや歪みによる音質の劣化が気になった。
シナリオ例3)
Aさんは本発明の実施形態に係る再生システム10の音量補正機能をONにした。AさんはPC上の音楽ファイルを専用のソフトウェアを使ってランダム再生してみた。1曲目はロックが再生された。音量が大きめだったので音量ボリュームを10段階中3にした。次に2曲目にクラシックが再生された。静かな感じのフルートとピアノの演奏から始まったが、音量を上げようと思う程ではなかった。むしろ、静寂の中のフルートとピアノの演奏が心地良かった。音も透き通ったようなきれいな音色が響いていた。後半は打楽器を含む大人数でのオーケストラの演奏が始まり、すごく盛り上がり感を感じとることができた。この場合でも音量は3のままで最適な音量感を感じとることができた。
クラシック曲の再生が終わり、3曲目は再び、別のロックの曲が再生された。クラシックの後にロック調の気持の良いドラムやギター音が再生されたが、音量感はちょうど良かった。音量調整は全体を通して3のままで変える必要がなかった。全体を通して、クラシックのやさしい音色とロックの激しい音色の対比が気持ちよかった。音量感は全体を通して3でちょうど良かった。
<3.変形例>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、提供装置200により保持されている楽曲に対してRMS基準値を算出するための統計処理を行うこととしたが、本発明はかかる例に限定されない。例えば、RMS基準値を楽曲のジャンルごとに行うようにしてもよい。例えば、クラシック曲の楽曲群のRMS基準値とロック曲の楽曲群のRMS基準値とを別個に算出し、再生装置100による音量補正に使用することも可能である。また、各ユーザのプレイリストごとに算出してもよい。また、上記実施形態では、RMS基準値を算出するための統計処理を提供装置200が行うこととしたが、再生装置100が行うこととすることもできる。
<4.まとめ>
本実施形態によれば、元の音響データの音量変化に比較的近い音量変化を維持しつつ各音響データ間の音量の違いを低減させ、音量増幅による音声の歪みを低減させながら音響データを再生することが可能である。
10 再生システム
100 再生装置
110 受信部
120 映像音響データ取得部
130 映像音響データデコード回路(再生部)
140 属性情報取得部
150 パラメータ算出部
160 コンプレッサー回路(音量補正部)
161 線形増幅部
162 線形増幅部
163 非線形増幅部
170 ミキサー装置
180 記憶部
200 提供装置
210 記憶部
220 取得部
230 解析部
240 送信部
300 出力装置
310 音声出力部
320 画像出力部

Claims (11)

  1. 音響データを再生する再生部と、
    前記再生部により再生された前記音響データの音量を、複数の音響データの各々の音量特性値と前記音響データの音量特性値との関係に基づいて補正する音量補正部と、
    を備える、再生装置。
  2. 前記再生装置は、
    前記複数の音響データの各々の音量特性値と前記音響データの音量特性値との関係に基づいて音量補正のためのパラメータを算出するパラメータ算出部をさらに備え、
    前記音量補正部は、
    前記パラメータ算出部により算出されたパラメータに従って前記音響データの音量を補正する、
    請求項1に記載の再生装置。
  3. 前記音量特性値は、
    前記音響データの音量平均値を示し、
    前記パラメータ算出部は、
    前記複数の音響データの前記音量平均値の分布に基づいて決定される基準平均値より前記音響データの前記音量平均値が小さい場合に前記音響データの音量を増幅するためのパラメータを算出し、
    前記基準平均値よりも前記音響データの前記音量平均値が大きい場合に前記音響データの音量を減衰するためのパラメータを算出する、
    請求項2に記載の再生装置。
  4. 前記音量補正部は、
    非線形補正部および第1の線形補正部を有し、
    前記パラメータ算出部は、
    前記第1の線形補正部に設定される線形補正用パラメータ、および前記非線形補正部に設定される非線形補正用パラメータを算出する、
    請求項3に記載の再生装置。
  5. 前記パラメータ算出部は、
    前記基準平均値より前記音響データの前記音量平均値が小さい場合、前記音響データの音量ピーク値に対する音量上限値の比率を前記線形補正用パラメータとして算出し、前記音響データの前記音量平均値に対する前記基準平均値の比率に基づいて前記非線形補正用パラメータを算出する、
    請求項4に記載の再生装置。
  6. 前記パラメータ算出部は、
    前記基準平均値より前記音響データの前記音量平均値が大きい場合、前記音響データの前記音量平均値に対する前記基準平均値の比率を前記線形補正用パラメータとして算出する、
    請求項5に記載の再生装置。
  7. 前記パラメータ算出部は、
    前記基準平均値よりも小さい下側基準値より前記音響データの前記音量平均値が小さい場合に前記音響データの音量を増幅するためのパラメータを算出し、
    前記基準平均値よりも大きい上側基準値より前記音響データの前記音量平均値が大きい場合に前記音響データの音量を減衰するためのパラメータを算出し、
    前記下側基準値と前記上側基準値との間に前記音響データの前記音量平均値が含まれる場合、前記音響データをスルー出力させるためのパラメータを前記音量補正部に設定する、
    請求項6に記載の再生装置。
  8. 前記音量補正部は、
    前記第1の線形補正部の後段に前記非線形補正部と並列に接続される第2の線形補正部を有し、
    前記パラメータ算出部は、
    前記音響データをスルー出力させるためのパラメータとして、前記第1の線形補正部および前記第2の線形補正部に増幅率1を設定し、前記非線形補正用パラメータとして増幅率0を設定する、
    請求項7に記載の再生装置。
  9. 音響データを再生するステップと;
    再生された前記音響データの音量を、複数の音響データの各々の音量特性値と前記音響データの音量特性値の関係とに基づいて補正するステップと;
    を含む、再生方法。
  10. 音響データおよび複数の音響データの各々の音量特性値を記憶する記憶部と、
    前記音響データおよび前記複数の音響データの各々の音量特性値を取得する取得部と、
    前記音響データを解析するとともに前記複数の音響データの各々の音量特性値の分布を解析する解析部と、
    音響データを再生する再生装置に、前記音響データ、および前記解析部による解析結果を送信する送信部と、
    を備える、提供装置。
  11. 音響データおよび複数の音響データの各々の音量特性値を記憶する記憶部、
    前記音響データおよび前記複数の音響データの各々の音量特性値を取得する取得部、
    前記音響データを解析するとともに前記複数の音響データの各々の音量特性値の分布を解析する解析部、および
    前記解析部による解析結果を送信する送信部、
    を有する提供装置と;
    前記提供装置から、前記音響データ、および前記解析結果を受信する受信部、
    前記音響データを再生する再生部、および、
    前記再生部により再生された前記音響データの音量を前記解析結果に基づいて補正する音量補正部、
    を有する再生装置と、
    を備える、再生システム。
JP2010250714A 2010-11-09 2010-11-09 再生装置、再生方法、提供装置および再生システム Expired - Fee Related JP5585401B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010250714A JP5585401B2 (ja) 2010-11-09 2010-11-09 再生装置、再生方法、提供装置および再生システム
US13/287,000 US9148104B2 (en) 2010-11-09 2011-11-01 Reproduction apparatus, reproduction method, provision apparatus, and reproduction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010250714A JP5585401B2 (ja) 2010-11-09 2010-11-09 再生装置、再生方法、提供装置および再生システム

Publications (2)

Publication Number Publication Date
JP2012104992A true JP2012104992A (ja) 2012-05-31
JP5585401B2 JP5585401B2 (ja) 2014-09-10

Family

ID=46019643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010250714A Expired - Fee Related JP5585401B2 (ja) 2010-11-09 2010-11-09 再生装置、再生方法、提供装置および再生システム

Country Status (2)

Country Link
US (1) US9148104B2 (ja)
JP (1) JP5585401B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014078297A (ja) * 2012-10-10 2014-05-01 Teac Corp 録音装置
JP2014078298A (ja) * 2012-10-10 2014-05-01 Teac Corp 録音装置
WO2019181778A1 (ja) * 2018-03-22 2019-09-26 ヤマハ株式会社 ダイナミクスプロセッサの動的な特性の表示方法及び表示装置
WO2019181781A1 (ja) * 2018-03-23 2019-09-26 ヤマハ株式会社 ダイナミクス処理方法及びダイナミクス処理装置
JP2020067531A (ja) * 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置
JP2021510038A (ja) * 2018-01-07 2021-04-08 グレースノート インコーポレイテッド 音量調整のための方法及び装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9729118B2 (en) * 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US10057681B2 (en) * 2016-08-01 2018-08-21 Bose Corporation Entertainment audio processing
US10331400B1 (en) * 2018-02-22 2019-06-25 Cirrus Logic, Inc. Methods and apparatus for soft clipping
JPWO2021085242A1 (ja) * 2019-10-30 2021-05-06

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11352967A (ja) * 1998-06-11 1999-12-24 Casio Comput Co Ltd 効果付加装置
JP2007003845A (ja) * 2005-06-24 2007-01-11 Seiko Epson Corp 再生情報生成装置及び音声再生装置
JP2008065904A (ja) * 2006-09-07 2008-03-21 Sony Corp 再生装置、再生方法及び再生プログラム
JP2008521028A (ja) * 2004-11-16 2008-06-19 ソニー エリクソン モバイル コミュニケーションズ, エービー 録音音量の正規化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100724836B1 (ko) * 2003-08-25 2007-06-04 엘지전자 주식회사 디지털 오디오 기기에서의 오디오 출력 레벨 조절장치 및방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11352967A (ja) * 1998-06-11 1999-12-24 Casio Comput Co Ltd 効果付加装置
JP2008521028A (ja) * 2004-11-16 2008-06-19 ソニー エリクソン モバイル コミュニケーションズ, エービー 録音音量の正規化方法
JP2007003845A (ja) * 2005-06-24 2007-01-11 Seiko Epson Corp 再生情報生成装置及び音声再生装置
JP2008065904A (ja) * 2006-09-07 2008-03-21 Sony Corp 再生装置、再生方法及び再生プログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014078298A (ja) * 2012-10-10 2014-05-01 Teac Corp 録音装置
US9666196B2 (en) 2012-10-10 2017-05-30 Teac Corporation Recording apparatus with mastering function
JP2014078297A (ja) * 2012-10-10 2014-05-01 Teac Corp 録音装置
JP2021510038A (ja) * 2018-01-07 2021-04-08 グレースノート インコーポレイテッド 音量調整のための方法及び装置
US11824507B2 (en) 2018-01-07 2023-11-21 Gracenote, Inc. Methods and apparatus for volume adjustment
US11545949B2 (en) 2018-01-07 2023-01-03 Gracenote, Inc. Methods and apparatus for volume adjustment
JP7071508B2 (ja) 2018-01-07 2022-05-19 グレースノート インコーポレイテッド 音量調整のための方法、コンピュータ可読記憶媒体及び装置
WO2019181778A1 (ja) * 2018-03-22 2019-09-26 ヤマハ株式会社 ダイナミクスプロセッサの動的な特性の表示方法及び表示装置
US11252507B2 (en) 2018-03-23 2022-02-15 Yamaha Corporation Dynamics processing method and dynamics processing device
JP7193772B2 (ja) 2018-03-23 2022-12-21 ヤマハ株式会社 ダイナミクス処理方法
JP2019169887A (ja) * 2018-03-23 2019-10-03 ヤマハ株式会社 ダイナミクス処理方法
WO2019181781A1 (ja) * 2018-03-23 2019-09-26 ヤマハ株式会社 ダイナミクス処理方法及びダイナミクス処理装置
JP2020067531A (ja) * 2018-10-23 2020-04-30 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置
JP7194559B2 (ja) 2018-10-23 2022-12-22 株式会社コーエーテクモゲームス プログラム、情報処理方法、及び情報処理装置

Also Published As

Publication number Publication date
US20120114127A1 (en) 2012-05-10
US9148104B2 (en) 2015-09-29
JP5585401B2 (ja) 2014-09-10

Similar Documents

Publication Publication Date Title
JP5585401B2 (ja) 再生装置、再生方法、提供装置および再生システム
KR101310231B1 (ko) 저음 증강 장치 및 방법
JP4668415B2 (ja) 低周波数オーディオエンハンスメントシステム
JP5149991B2 (ja) 音声再生装置、音声再生方法及びプログラム
US20110170710A1 (en) Method and apparatus for adjusting volume
JP2012235310A (ja) 信号処理装置および方法、プログラム、並びにデータ記録媒体
JP2009300707A (ja) 情報処理装置および方法、並びにプログラム
WO2012111043A1 (ja) 信号処理方法、信号処理装置、再生装置およびプログラム
JP4706666B2 (ja) 音量制御装置及びコンピュータプログラム
TW201118719A (en) System and method for modifying an audio signal
JP5062055B2 (ja) 音声信号処理装置及び方法
WO2019050646A1 (en) TRANSIENT DETECTION FOR LOUDSPEAKER DISTORTION REDUCTION
JP2003243952A (ja) デジタルオーディオシステム、自動音量調整要素生成方法、自動音量調整方法、自動音量調整要素生成プログラム、自動音量調整プログラム、自動音量調整要素生成プログラムが記録された記録媒体及び自動音量調整プログラムが記録された記録媒体
US7518056B2 (en) Optimisation of MIDI file reproduction
JP2009031357A (ja) 楽曲配信システム、楽曲編集装置、楽曲再生装置、楽曲記憶装置およびプログラム
JP4392040B2 (ja) 音響信号処理装置、音響信号処理方法、音響信号処理プログラムおよびコンピュータに読み取り可能な記録媒体
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JP5598722B2 (ja) 音声再生装置、音声再生装置における再生音調整方法
JP2002109824A (ja) ディジタル音声信号の記録方法、およびその装置
Ciesla Bits, Sample Rates, and Other Fundamentals of Digital Audio
Thiele Some Thoughts on the Dynamiics of Reproduced Sound
KR100703923B1 (ko) 멀티미디어기기를 위한 입체음향 최적화 장치 및 방법
KR100698847B1 (ko) 휴대폰용 오디오 서비스 방법
JP6807769B2 (ja) 音響装置及び音質調整方法
JP5440677B2 (ja) 楽曲配信システム、楽曲編集装置およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140707

R151 Written notification of patent or utility model registration

Ref document number: 5585401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees