JP2007003845A - 再生情報生成装置及び音声再生装置 - Google Patents

再生情報生成装置及び音声再生装置 Download PDF

Info

Publication number
JP2007003845A
JP2007003845A JP2005184217A JP2005184217A JP2007003845A JP 2007003845 A JP2007003845 A JP 2007003845A JP 2005184217 A JP2005184217 A JP 2005184217A JP 2005184217 A JP2005184217 A JP 2005184217A JP 2007003845 A JP2007003845 A JP 2007003845A
Authority
JP
Japan
Prior art keywords
audio data
sound
audio
correction amount
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005184217A
Other languages
English (en)
Inventor
Kenichiro Tomita
憲一郎 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2005184217A priority Critical patent/JP2007003845A/ja
Publication of JP2007003845A publication Critical patent/JP2007003845A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 平均音量が互いに異なる音声が連続して再生される場合に、ユーザは、再生音量を調整しなくてはならず大変面倒であった。
【解決手段】 予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するための再生情報生成装置であって、複数の音声データから各音声の平均音量が略一定となるような補正量を各音声データ毎に算出する補正量算出部と、算出された各補正量とそれら補正量と各音声データとの対応関係を示す対応関係情報とを少なくとも含むように再生情報を生成する生成部と、を備える再生情報生成装置。
【選択図】 図1

Description

本発明は、複数の音声データの表す各音声を再生する場合に、各音声の平均音量を略一定に保つことが可能な技術に関する。
従来から、複数の音声データファイル(音声のみを表すデータファイル、及び音声と動画像とを表すデータファイル)を、予め指定した順序で記録媒体から読み出し、これらファイルを連続して再生する再生装置が提案されている(下記特許文献1参照)。
特開2004−120551号公報
前述の再生装置において、複数の音声データファイルが連続して再生されると、各ファイルに含まれる音声が連続して再生されることとなる。このとき、各音声の平均音量が互いに異なる場合がある。これは、例えば、工場の騒音やささやき声のように、音声の内容がそれぞれ異なる場合や、音声の録音レベルがそれぞれ異なる場合に起こり得る。
このように、平均音量が互いに異なる音声が連続して再生されると、1つの音声の再生が終わり、次の音声が再生された途端に音量が大きく(若しくは小さく)なり、音声が聞きづらくなる場合がある。かかる場合に、ユーザは、再生装置のリモコンや再生装置の本体に備えられたボリューム調整ボタン等により、再生音量を調整しなくてはならず大変面倒であった。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、複数の音声データの表す各音声を再生する場合に、各音声の平均音量を略一定に保つことが可能な技術を提供することを目的とする。
前述の課題の少なくとも一部を解決するために、本発明の再生情報生成装置は、予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するための再生情報生成装置であって、前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する補正量算出部と、前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する生成部と、を備えることを要旨とする。
このような構成とすることで、生成部が生成する再生情報には、補正量算出部により算出された、各音声の平均音量が略一定となるような補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、が少なくとも含まれる。従って、各音声を再生するにあたり、この再生情報に基づき、再生情報に含まれる対応関係情報を参照して、各音声データに対応する補正量を導き出すことができる。また、このようにして導き出した補正量を用いて各音声データを補正することにより、再生される各音声の平均音量を略一定にすることができる。その結果、ユーザは再生される音声が変わる度に、再生音量を調整しなくてよい。また、生成部は、音声データとは別に、補正量を含む再生情報を生成するので、オリジナルの音声データを加工することなく再生される各音声を略一定にすることができる。
上記再生情報生成装置において、前記補正量算出部は、前記補正量を算出する場合に、各音声の音声波形の振幅と、前記音声波形を構成する互いに周波数が異なる正弦波の、前記音声波形に含まれる割合と、前記正弦波の周波数に応じた重み付け値と、に基づき、各音声の平均音量を算出すると共に、前記算出した平均音量に基づき、前記補正量を算出することが好ましい。
このような構成とすることで、補正量算出部は、各音声の音声波形の振幅と、音声波形を構成する互いに周波数が異なる正弦波の、音声波形に含まれる割合と、の他に、正弦波の周波数に応じた重み付け値に基づき、各音声の平均音量を算出する。ここで、体感音量(人間の聴覚で感じる音量)は、同じ音圧でも正弦波の周波数によって異なるので、重み付け値が、この体感音量に基づく周波数に応じた重み付け値であれば、この重み付け値に基づき各音声の平均音量を算出することで、各音声の体感音量としての平均音量を算出することが可能となる。
本発明の第1の音声再生装置は、予め選択された複数の音声データについて、それら音声データの表す各音声を再生することが可能な音声再生装置であって、各音声データ毎の補正量及びそれら補正量と各音声データとの対応関係を示す対応関係情報を少なくとも含む再生情報と、前記複数の音声データと、を入力する入力部と、前記入力された各音声データ毎に、前記入力された再生情報に含まれる前記対応関係情報を参照して、該音声データに対応する前記補正量を導き出すと共に、前記導き出した補正量を用いて該音声データを補正する補正部と、前記補正された複数の音声データの表す各音声を再生する再生部と、を備えることを要旨とする。
このような構成とすることで、補正部が各音声データを補正する際に用いる補正量は、各音声データに対応する補正量である。従って、補正量が、各音声の平均音量が略一定となるように各音声データに対応して定められていれば、補正部は、この補正量を用いて音声データを補正することにより、補正後の各音声データの表す各音声の平均音量を略一定にすることができる。その結果、再生部が再生する各音声の平均音量は略一定となるので、ユーザは再生される音声が変わる度に再生音量を調整しなくてよい。
本発明の第2の音声再生装置は、予め選択された複数の音声データについて、それら音声データの表す各音声を再生することが可能な音声再生装置であって、前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する補正量算出部と、前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する生成部と、各音声データ毎に、前記生成された再生情報に含まれる前記対応関係情報を参照して、該音声データに対応する前記補正量を導き出すと共に、前記導き出した補正量を用いて該音声データを補正する補正部と、前記補正された複数の音声データの表す各音声を再生する再生部と、を備えることを要旨とする。
このような構成とすることで、生成部が生成する再生情報には、補正量算出部により算出された、各音声の平均音量が略一定となるような補正量と、各音声データとの対応関係を示す対応関係情報と、が少なくとも含まれる。従って、音声データの表す音声を再生するにあたり、補正部は、この再生情報に含まれる対応関係情報を参照して、この音声データに対応する補正量を導き出すと共に、導き出した補正量を用いてこの音声データを補正することができる。また、このようにして補正された各音声データの表す音声の平均音量は略一定となるので、再生部が再生する各音声の平均音量は略一定となり、ユーザは再生される音声が変わる度に、再生音量を調整しなくてよい。また、生成部は、音声データとは別に、補正量を含む再生情報を生成するので、オリジナルの音声データを加工することなく再生される各音声を略一定にすることができる。
なお、本発明は、上記した再生情報生成装置や音声再生装置としての構成の他、その音声再生装置を備えるプロジェクタとしても構成することができる。また、そのような装置発明の態様に限ることなく、再生情報生成方法や音声再生方法などの方法発明としての態様で実現することも可能である。さらには、それら方法や装置を構成するためのコンピュータプログラムとしての態様や、そのようなコンピュータプログラムを記録した記録媒体としての態様や、上記コンピュータプログラムを含み搬送波内に具現化されたデータ信号など、種々の態様で実現することも可能である。
本発明をコンピュータプログラムまたはそのプログラムを記録した記録媒体等として構成する場合には、再生情報生成装置や音声再生装置を制御するプログラム全体として構成するものとしてもよいし、本発明の機能を果たす部分のみを構成するものとしてもよい。また、記録媒体としては、ROMカートリッジ、パンチカード、バーコードなどの符合が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置などコンピュータが読み取り可能な種々の媒体を利用できる。
以下、本発明を実施するための最良の形態を実施例に基づいて以下の順序で説明する。
A.実施例:
A1.プロジェクタ及びプレゼンテーションシステムの概要構成:
A2.コンテンツ再生処理:
A3.実施例の効果:
B.変形例:
A.実施例:
A1.プロジェクタ及びプレゼンテーションシステムの概要構成:
図1は、本発明の一実施例としてのプロジェクタの概要構成を示す機能ブロック図である。図1に示すプロジェクタPJ1は、主として、デジタルデータ再生IC(Integrated Circuit)100と、DRAM140と、フラッシュメモリ141と、メモリカードスロット120と、メモリカードスロット120に挿入されたメモリカードからのデータの読み出し/書き込みを行うメモリカード制御部121と、リモコン131と、リモコン131から送信されるユーザの指示をデジタルデータ再生IC100に出力するリモコン制御部130と、を備える。
さらに、プロジェクタPJ1は、音声を再生するための機能部として、デジタル音声データをアナログ音声信号に変換するDAC(Digital-Analog Converter)110と、オーディオアンプ及び音量調整ICを有する音量調整部111と、スピーカ112と、を備える。
また、プロジェクタPJ1は、画像を再生するための機能部として、液晶パネル駆動部150と、照明光学系151と、液晶パネル152と、投写光学系153と、を備える。
前述のデジタルデータ再生IC100は、CPU101,メモリ制御部102,音声処理部103,画像処理部104を備えており、それぞれ内部バスによって接続されている。
また、前述のフラッシュメモリ141には、予め、補正係数テーブルTbが記憶されている。さらに、フラッシュメモリ141には、予め、音声や画像を再生するためのアプリケーションプログラムと、音声データの音量補正値を算出するためのアプリケーションプログラムと、が記憶されている。そして、CPU101は、これらのアプリケーションプログラムを実行することにより、それぞれ、再生処理部101a及び補正値算出部101bとして機能することになる。
なお、前述の補正値算出部101bが請求項における補正量算出部及び生成部に、前述の再生処理部101a及び音声処理部103が請求項における補正部に、前述のDAC110,音量調整部111,スピーカ112が請求項における再生部に、前述のメモリカードスロット120及びメモリカード制御部121が請求項における入力部に、それぞれ相当する。
図2は、図1に示すプロジェクタPJ1を備えたプレゼンテーションシステムの概要構成を示す説明図である。図2に示すプレゼンテーションシステム2000は、前述のプロジェクタPJ1と、パーソナルコンピュータPC1と、を備える。
このプレゼンテーションシステム2000は、パーソナルコンピュータPC1に記憶されている音声データファイルや画像データファイル(静止画像のみを表すデータファイル)の表す音声や画像(動画像)のコンテンツを、プロジェクタPJ1において、ユーザの所望する再生方法(再生順序や再生時間等)で再生するシステムである。
ここで、パーソナルコンピュータPC1からプロジェクタPJ1へのデータの移動は、メモリカードMCを介して行われる。すなわち、ユーザは、パーソナルコンピュータPC1において音声データファイルや画像データファイルをメモリカードMCに記憶させ、このメモリカードMCをプロジェクタPJ1のメモリカードスロット120に挿入する。
また、ユーザは、再生させたいコンテンツのデータファイルの他に、コンテンツの再生方法を記述したファイル(以下、「コンテンツ再生情報ファイル」と呼ぶ。)も併せてメモリカードMCに記憶させる。
そして、プロジェクタPJ1は、このコンテンツ再生情報ファイルに記載された再生方法に従ってコンテンツを再生し、画像をスクリーン等に投写表示させると共にスピーカ112から音声を出力する。このとき、プロジェクタPJ1は、順次再生する音声について、それぞれの平均音量がほぼ一定となるようにする。
A2.コンテンツ再生処理:
コンテンツ再生処理の前提として、ユーザが、図2に示すプレゼンテーションシステム2000を用いてプレゼンテーションを行うために、パーソナルコンピュータPC1において、再生させたいコンテンツのデータファイルをメモリカードMCに記憶させ、このメモリカードMCをプロジェクタPJ1のメモリカードスロット120に挿入する。
ここで、ユーザがメモリカードMCに記憶させたデータファイルは、図2に示すようなディレクトリ構成で記憶されている。すなわち、Musicディレクトリには、ファイル「Jazz001.wav」,「Classic003.mp3」が、Moviesディレクトリにはファイル「Demo004.mpg」が、Picturesディレクトリには、ファイル「A001.jpg」〜「A003.jpg」,「B001.jpg」〜「B003.jpg」が、それぞれ格納されている。
これらファイルのうち、拡張子「.wav」のファイルはWindows(登録商標)標準の音声ファイルを、拡張子「.mp3」のファイルは「MPEG1 Audio Layer-3」形式で圧縮された音声ファイルを、拡張子「.mpg」のファイルはMPEG1形式で圧縮された動画像ファイルを、拡張子「.jpg」のファイルはISO(International Organization for Standardization)で標準化された圧縮された静止画像ファイルを、それぞれ示す。なお、音声ファイル及び動画像ファイルが前述の音声データファイルに相当し、静止画像ファイルが前述の画像データファイルに相当する。
また、ユーザは、これらデータファイルの他に、設定ファイル「AUTORUN.CFG」及び前述のコンテンツ再生情報ファイルである「SINR003.CFG」をメモリカードMCに記憶させる。
ここで、設定ファイル「AUTORUN.CFG」は、後述するコンテンツ再生処理において最初に読み出されるファイルであり、コンテンツ再生情報ファイルが複数あった場合に、いずれのファイルをコンテンツ再生処理において参照すべきかを指定するためのファイルである。なお、ユーザは、予め、この参照すべきコンテンツ再生情報ファイルとして「SINR003.CFG」を指定して「AUTORUN.CFG」を作成しているものとする。
そして、ユーザは、図1に示すリモコン131を操作して、プロジェクタPJ1の操作メニューからプレゼンテーション自動再生メニューを選択して実行を指示する。このようにして、ユーザによりプレゼンテーション自動再生が指示されると、プロジェクタPJ1においてコンテンツ再生処理が開始される。
コンテンツ再生処理が開始されると、図1に示す再生処理部101aは、メモリカード制御部121を介して、メモリカードスロット120に挿入されたメモリカードMCから、設定ファイル「AUTORUN.CFG」を読み出す。そして、読み出したファイル「AUTORUN.CFG」において指定されたコンテンツ再生情報ファイルをメモリカードMCから読み出す。
前述のように、設定ファイル「AUTORUN.CFG」には、コンテンツ再生情報ファイル「SINR003.CFG」が指定されているので、再生処理部101aは、メモリカードMCから、このコンテンツ再生情報ファイル「SINR003.CFG」を読み出す。
図3は、コンテンツ再生情報ファイル「SINR003.CFG」の記載内容及びコンテンツの再生順序を模式的に示す説明図である。図3において、(A)はコンテンツ再生情報ファイル「SINR003.CFG」の記載内容を示し、(B)は(A)の記載内容の表すコンテンツの再生順序を示す。
図3(A)に示すように、コンテンツ情報ファイル「SINR003.CFG」は、大きく分けて、設定部分と、主要部分である「コンテンツ1」,「コンテンツ2」,「コンテンツ3」と、から成る。これらのうち、設定部分には、このコンテンツ再生情報ファイルのファイル名やこのファイルのバージョンが記載されている。
「コンテンツ1」では、音声ファイル「Jazz001.wav」を再生しながら、静止画像ファイル「A001.jpg」,「A002.jpg」,「A003.jpg」を、この順序で再生する旨が指定されている。「コンテンツ2」では、動画像ファイル「Demo004.mpg」を再生する旨が指定されている。
「コンテンツ3」では、コンテンツ1と同様に、音声ファイル「Classic003.mp3」を再生しながら、静止画像ファイル「B001.jpg」,「B002.jpg」,「B003.jpg」を、この順序で再生する旨が指定されている。
そして、コンテンツ再生情報ファイル「SINR003.CFG」では、図3(B)に示すように、「コンテンツ1」,「コンテンツ2」,「コンテンツ3」を、この順序で記載することにより、コンテンツ1〜3を、この順序で再生するように指定している。
なお、ユーザは、このコンテンツ再生情報ファイル「SINR003.CFG」を、パーソナルコンピュータPC1において、プレゼンテーション用のコンテンツを整理するためのアプリケーションを実行させて作成する。
図1に示す再生処理部101aが、読み出したコンテンツ再生情報ファイルにおいて、音声データファイルが指定されていることを確認すると、本発明の特徴部分である音声再生処理が開始される。
図4は、本実施例における音声再生処理の手順を示すフローチャートである。図4に示す音声再生処理が開始されると、図1に示す補正値算出部101bにより、音量補正値算出処理が実行される(ステップS202)。
図5は、補正値算出部101bにより実行される音量補正値算出処理の手順を示すフローチャートである。図5に示す音量補正値算出処理が開始されると、図1に示す補正値算出部101bは、コンテンツ再生情報ファイルで指定された、最初の音声データファイルをメモリカードMCから読み出してDRAM140に記憶させる(ステップS302)。
図3に示すように、コンテンツ再生情報ファイル「SINR003.CFG」では、最初の音声データファイルとして、「Jazz001.wav」が指定されているので、補正値算出部101bは、メモリカードMCから「Jazz001.wav」を読み出してDRAM140に記憶させる。
次に、補正値算出部101bは、DRAM140に記憶させた音声データファイルを読み出し、音声データファイルの示す各チャネルの波形データを合成し、合成波形データをDRAM140に記憶させる(ステップS304)。「Jazz001.wav」については、音声(波)を所定の周波数(例えば、44.1kHz)でサンプリングして、所定のビット精度(例えば、16ビット)で表現した波形データを含んでいる。そして、ステレオ音声の場合には、かかる波形データが2チャネル分(右チャネル及び左チャネル)含まれているので、これらチャネルの波形データを足し合わせて、波形データを合成する。
なお、「Demo004.mpg」及び「Classic003.mp3」に含まれる音声データは圧縮されたデータであり、波形データそのままではないので、音声データを波形データに変換した後に波形データを合成する。
なお、前述の音声ファイル「Jazz001.wav」に基づく合成波形データのビット精度は、説明の便宜上、16ビットであるものとする。
次に、補正値算出部101bは、DRAM140に記憶させた合成波形データを読み出し、ビット精度の中央値を0とした場合の合成波形データの表す波形(合成波形)の最大振幅値を求め、DRAM140に記憶させる(ステップS306)。
前述のように、合成波形データのビット精度が16ビットである場合、ビット精度の中央値は、32768(10進表示)である。そして、合成波形の振幅の範囲が、例えば、6268〜60568である場合、ビット精度の中央値を0とすると、合成波形の振幅の範囲は、26500〜27800となる。従って、この場合、最大振幅は「27800」となり、この最大振幅値「27800」がDRAM140に記憶される。
次に、補正値算出部101bは、合成波形のうち、無音部分を除く有音部分について、単位期間毎に、各周波数成分(合成波形を構成する互いに異なる周波数の正弦波)の合成波形に含まれる割合を算出し、この割合の高い上位3成分の周波数及び割合をDRAM140に記憶させる(ステップS308)。
具体的には、まず、前述の合成波形データを、ビット精度の中央値(32768)を0とするように正規化する。次に、無音とみなすしきい値を定め、このしきい値を下回る値が一定期間(例えば4秒)以上連続する期間を無音部分として定める。次に、この無音部分を除く有効部分について、0.1秒を単位期間として、この単位期間毎に合成波形をフーリエ変換し、各周波数成分の割合を求める。なお、前述の無音を示すしきい値は、正規化後の合成波形データを大きい順に並べたときに、上位20%に最も近い値の1/16の値として算出して定める。
そして、例えば、最初の0.1秒が有効部分であり、フーリエ変換した結果、上位3成分の周波数(割合)が、1000Hz波(0.623),250Hz波(0.214),125Hz(0.119)であった場合には、これら周波数成分の周波数及び割合がDRAM140に記憶される。
次に、補正値算出部101bは、DRAM140から最大振幅値の他、各単位期間毎の上位3成分の周波数及び割合を読み出すと共に、フラッシュメモリ141から補正係数テーブルTbを読み出す。そして、補正値算出部101bは、読み出した上記3成分の周波数及び割合と、補正係数テーブルTbと、に基づき、単位期間毎の体感音量の指標値となる音量表現値を、下記式(1)に従って算出する(ステップS310)。
R=最大振幅値×Σ(各周波数成分の割合×各周波数成分の補正係数)・・・(1)
ここで、式(1)に示す「各周波数成分の補正係数」については、補正値算出部101bが、補正係数テーブルTbに基づき各周波数毎に導き出す。
図6は、図1に示す補正係数テーブルTbの内容を示す説明図である。図6に示すように、補正係数テーブルTbでは、所定の周波数幅ごとに補正係数が定められている。この補正係数は、ISO226:2003において規定された等ラウドネス曲線(1000Hzで音圧40dBの正弦波の体感音量を基準として、この基準となる体感音量を得るための、各周波数毎の音圧を示す曲線)に基づいて定められている。
等ラウドネス曲線によると、例えば、125Hzの正弦波の場合、前述の基準となる体感音量を得るために、およそ60dBの音圧が必要となる。従って、同じ音圧であれば、125Hzの正弦波は、1000Hzの正弦波に比べて1/100の体感音量となる。このように、周波数によって体感音量が異なるので、本実施例では、体感音量に基づく各周波数に応じた重み付けを補正係数として、各周波数成分の割合に掛け合わせるようにして音量表現値を算出するようにしている。
具体的には、1000Hzの正弦波の体感音量を「1」とした場合の、各周波数毎の体感音量(前述の125Hzの正弦波であれば、体感音量「0.01」)を、各周波数における補正係数として、音量表現値を算出している。
なお、等ラウドネス曲線にあてはめれば、各周波数毎に補正係数を求めることは可能であるが、説明の便宜上、図6に示すように、所定の周波数幅ごとに補正係数の代表値を定めている。
そして、例えば、最初の0.1秒についての上位3成分(1000Hz波,250Hz波,125Hz波)についての補正係数は、図6に示す補正係数テーブルに基づき、それぞれ「1」,「0.1」,「0.01」と定められる。従って、最初の0.1秒についての音量表現値R1は、上記式(1)に従って、以下のように算出される。
R1=27800×(0.623×1+0.214×0.1+0.119×0.01)
=17947
図5に戻って、補正値算出部101bは、単位期間毎に算出した音量表現値を所定の基準値に補正する場合の割合dを、下記式(2)に従って算出し、DRAM140に記憶させる(ステップS312)。ここで、下記式(2)において、「16384」は基準値を示し、この基準値は、1000Hzの正弦波を100%含み、最大振幅がビット精度の最大振幅の50%である音声について、上記式(1)により算出した音量表現値である。
d=(16384/R−1)×100・・・(2)
具体的には、例えば、前述の最初の0.1秒についての音量表現値R1については、上記式(2)に音量表現値R1「17947」を代入して、−8.71(%)と算出される。そして、この算出された割合dは、最初の0.1秒についての音量表現値R1を8.71(%)小さくすることで、基準値に補正できることを示す。
次に、補正値算出部101bは、DRAM140から、単位期間毎に算出した前述の割合dを読み出し、読み出した各割合dのうち、上位20%及び下位20%を除いた割合dについて最小2乗法で平均値を算出する(ステップS314)。なお、上位20%及び下位20%を除く理由は、特異点を排除して適切な平均値を得るためである。
そして、補正値算出部101bは、算出した平均値を、当該音声データファイルの音量補正値として、DRAM140に読み出したコンテンツ再生情報ファイルの当該音声データファイルの指定箇所に追記する(ステップS316)。
具体的には、例えば、前述の音声ファイル「Jazz001.wav」について、音量補正値として「+12%」が算出された場合に、補正値算出部101bは、図3(A)において破線で示すように、ファイル名「Jazz001.wav」の後に続けて「/VOL+12」を追記する。このように追記することで、音声ファイル「Jazz001.wav」に音量補正値「+12%」を対応付けることができる。
次に、補正値算出部101bは、コンテンツ再生情報ファイルで指定された全ての音声データファイルについて、音量補正値をコンテンツ再生情報ファイルに追記したか否かを判定する(ステップS318)。全ての音声データファイルについて音量補正値を追記していないと判定した場合に、補正値算出部101bは、次の音声データファイルをメモリカードMCから読み出し(ステップS320)、上述したステップS304〜ステップS318の処理を実行する。
以上の音声補正値算出処理の結果、上述した「Jazz001.wav」と同様にして、「Demo004.mpg」,「Classic003.mp3」について、それぞれ音量補正値として、例えば、「+22%」,「−8%」が算出された場合、図3(A)において破線で示すように、それぞれ「/VOL+22」,「/VOL−8」が、各音声データファイル名の後に追記される。
図4に戻って、音量補正値算出処理が終了すると、図1に示す再生処理部101aは、DRAM140から、音量補正値が追記されたコンテンツ再生情報ファイルを読み出し、このコンテンツ再生情報ファイルに従って、指定された音声データファイルをメモリカードMCから順次読み出し、音声データファイルに含まれる波形データを音声処理部103に出力する。このとき、再生処理部101aは、コンテンツ再生情報ファイルを参照して、当該音声データファイルに対応する音量補正値を導き出し、波形データと共に音声処理部103に出力する(ステップS204)。
具体的には、例えば、コンテンツ再生情報ファイル「SINR003.CFG」に従って、再生処理部101aは、まず、音声ファイル「Jazz001.wav」の波形データ及び音量補正値「+12%」を音声処理部103に出力する。そして、静止画像ファイル「A001.jpg」〜「A003.jpg」(コンテンツ1)の再生が終わると、次に、動画像ファイル「Demo004.mpg」の波形データ及び音量補正値「+22%」を音声処理部103に出力する。そして、この動画像ファイル「Demo004.mpg」(コンテンツ2)の再生が終わると、音声ファイル「Classic003.mp3」の波形データ及び音量補正値「−8%」を音声処理部103に出力する。
なお、「Demo004.mpg」及び「Classic003.mp3」については、再生処理部101aは、圧縮されたデータを波形データに変換した後に音声処理部103に出力する。
次に、音声処理部103は、再生処理部101aから入力された波形データを、入力された音量補正値を用いて順次補正してDAC110に出力する(ステップS206)。従って、例えば、「Jazz001.wav」であれば「+12%」だけ、「Demo004.mpg」であれば「+22%」だけ、「Classic003.mp3」であれば「−8%」だけ、それぞれの波形データが補正されてDAC110に出力される。
ここで、波形データを補正した場合に、補正前後で合成波形の周波数成分は変わらないので、音量表現値Rを求める上記式(1)の右辺については、最大振幅値のみが音量補正値だけ補正されることとなる。従って、補正後の単位期間毎の音量表現値Rは、補正前に比べて音量補正値だけ補正されることとなる。それ故、補正後の合成波形(音声)の平均音量表現値は、ほぼ前述の基準値となる。
従って、各ファイル「Jazz001.wav」,「Demo004.mpg」,「Classic003.mp3」の波形データを、それぞれ補正した後の各音声の平均音量表現値は、ほぼ一定となる。
次に、DAC110は、補正された波形データを、アナログ音声信号に順次変換して音量調整部111に出力する(ステップS208)。そして、音量調整部111は、ユーザが、リモコン131やプロジェクタPJ1本体が備えるボリューム調整ボタン(図示省略)で設定した音量となるように、入力されたアナログ音声信号をアンプで増幅し、スピーカ112に出力する(ステップS210)。
以上の音声再生処理の結果、コンテンツ再生情報ファイル「SINR003.CFG」に従って、音量補正値で補正された波形データの示す音声が、スピーカ112から順次出力されることとなる。前述のように、音量補正値で補正された各波形データの表す音声の平均音量表現値はほぼ一定なので、スピーカ112から出力される音声の平均音量はほぼ一定となる。
次に、画像の再生処理について簡単に説明する。まず、再生処理部101aは、メモリカードMCから読み出したコンテンツ再生情報ファイルに従い、指定された画像データファイルを順次読み出す。
そして、再生処理部101aは、この画像データファイルに含まれる画像データ、または、前述の音声再生処理で読み出した音声データファイルのうち、動画像ファイルに含まれる画像データを、画像処理部104に出力する。画像処理部104は、入力された画像データに基づき、画像の表示状態、例えば、コントラストやシャープネスなどが、所望の状態となるように調整し、画像信号として液晶パネル駆動部150に出力する。
液晶パネル駆動部150は、入力された画像信号に基づいて、液晶パネル152を駆動する。これにより、液晶パネル152では、照明光学系151から射出された照明光を、画像情報に応じて変調する。投写光学系153は、プロジェクタPJ1の筐体の前面に取付けられており、液晶パネル152によって変調された投写光を、図示せざるスクリーンに投写する。これにより、スクリーンに画像が投写表示される。
A3.実施例の効果:
以上説明したように、コンテンツ再生情報ファイルに従って複数の音声を再生する場合に、補正値算出部101bは、予め、各音声の平均音量表現値がほぼ一定となるように、各音声の波形データ毎に音量補正値を算出すると共に、この音量補正値を、該当する音声データファイルに対応付けるようにして、コンテンツ再生情報ファイルに追記する。
従って、再生処理部101aは、このコンテンツ再生情報ファイルに従って、音声データファイルに含まれる波形データを音声処理部103に出力する際に、併せて、この音声データファイルに対応する音量補正値を音声処理部103に出力することができる。その結果、音声処理部103は、入力された波形データを適切な音量補正値で補正することができる。そして、この補正後の波形データの表す音声の平均音量表現値はほぼ一定となるので、スピーカ112から出力される音声の平均音量はほぼ一定となる。
従って、ユーザが、最初に再生される音声について、再生音量を所望の音量に調整すれば、プロジェクタPJ1は、その音量を保ったまま、順次指定された音声データファイルの表す音声を再生することとなる。その結果、ユーザは、再生される音声が変わるたびに音量を調整しなくてよい。
また、音量補正値と、音声データファイルと、を別々に記録しておくので、オリジナルの音声データファイルを加工することなく、再生される各音声の音量を調整することができる。
また、各波形データの音量補正値の元となる音量表現値は、各音声波形の最大振幅値の他に、この音声波形を構成する各周波数成分の割合に対して、体感音量に基づく各周波数に応じた補正係数(重み付け)を掛け合わせた値に基づいて算出される。そして、かかる音量補正値を用いて各波形データが補正されて音声として再生されるので、聞き取りにくい周波数帯の音量を大きめに、聞き取りやすい周波数帯の音量を小さめに調整するといった、体感音量に基づいた音量調整を行うことができる。
また、補正値算出部101bは、算出した音量補正値を、音声データファイルに対応付けてコンテンツ再生情報ファイルに追記するようにしている。従って、このコンテンツ再生情報ファイルを参照することで、プレゼンテーションを再度行う場合に音量補正値算出処理を省略することができる。また、音量補正値算出処理を実行できない他のプロジェクタで同じプレゼンテーションを行う場合でも、このようなコンテンツ再生情報ファイルを参照することで、適切な音量補正値で波形データを補正して音声を再生することができる。
B.変形例:
なお、本発明は、前述の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において、種々の態様において実施することが可能であり、例えば以下のような変形も可能である。
B1.変形例1:
上述した実施例では、音量補正値算出処理は、プロジェクタPJ1において実行されていたが、プロジェクタPJ1に代えてパーソナルコンピュータPC1において実行されるようにしてもよい。
具体的には、例えば、コンテンツ再生情報ファイルを生成する際に用いるアプリケーションプログラムに、この音量補正値算出処理部分を実装し、ユーザが、コンテンツ再生情報ファイルを生成した際に、この音量補正値算出処理を実行させるようにしてもよい。
このようにしても、パーソナルコンピュータPC1において、音量補正値が追記されたコンテンツ再生情報ファイルを作成することができる。そして、この場合、プロジェクタは、パーソナルコンピュータPC1で作成されたコンテンツ再生情報ファイルと、音声データファイルと、をメモリカードから読み出し、上述した実施例と同様にして、波形データを音量補正値で補正することにより、各音声の平均音量をほぼ一定にすることができる。
B2.変形例2:
上述した実施例では、コンテンツ再生情報ファイルの作成は、パーソナルコンピュータPC1において行われるものとしたが、パーソナルコンピュータPC1に代えて、プロジェクタPJ1において行われるようにしてもよい。
具体的には、例えば、上述した実施例におけるコンテンツ再生情報を作成する際に用いるアプリケーションプログラムをプロジェクタPJ1のフラッシュメモリ141に予め記憶させておき、ユーザが、このアプリケーションを起動させて、コンテンツ再生情報を生成するようにすればよい。なお、この場合、音声データファイルは、予めメモリカードに記憶させておき、プロジェクタPJ1から読み出すようにすればよい。このようにすることで、パーソナルコンピュータを用いることなく、コンテンツ再生情報ファイルの作成からプレゼンテーションまでを実行することが可能となる。
B3.変形例3:
上述した実施例では、プロジェクタPJ1における音量調整は、音声処理部103での音量補正値を用いた波形データの補正による音量調整と、音量調整部111でのアンプを用いたアナログ音声信号の増幅による音量調整と、により実現されていたが、本発明は、これら音量調整に限定されるものではない。
例えば、DAC110において、音量調整部111に出力するアナログ音声信号の振幅を、音量調整部111の許容振幅内に収めるために、固定倍率で増幅するようにしてもよい。なお、この固定倍率は、システム設計時に定めておくようにすればよい。
B4.変形例4:
上述した実施例では、コンテンツ再生情報ファイルにおいて、音声データファイルが指定されていると、必ず音声再生処理が実行されて音量調整がなされていたが、音量再生処理を行うか否かをユーザが指定するようにして、音量再生処理を行うと指定された場合にのみ、音声再生処理が実行されるようにしてもよい。
具体的には、例えば、ユーザがコンテンツ再生情報ファイルを作成する際に、音声再生処理を行うか否かを指定するようにして、「音声再生処理を行わない」ように指定した場合には、図3(A)において破線で示すように、コンテンツ再生情報ファイルに「VOLUME_SMOOTHING=Disable」を追記するようにする。一方、「音声再生処理を行う」ように指定した場合には、「VOLUME_SMOOTHING=Request」を追記するようにする。そして、再生処理部101aは、コンテンツ再生情報ファイルにおいて、音声データファイルが指定されていることを確認する際に、併せて「VOLUME_SMOOTHING」の値を確認するようにする。そして、「Request」の場合にのみ、音声再生処理が開始されるようにすればよい。
また、この「VOLUME_SMOOTHING」を「音声再生処理を行うか否か」を示すだけでなく、「音量補正値算出処理を実行済みであるか否か」を示すのに用いるようにしてもよい。例えば、音声補正値算出処理が実行された後に、「VOLUME_SMOOTHING」の値を、「Request」から「Enable」に書き換えるようにする。
このようにすることで、次回以降にコンテンツ再生処理を行う際に、この「VOLUME_SMOOTHING」の値を確認して、「Enable」であれば、音量補正値算出処理を行うことなく、音量調整が実行可能であることを簡単に判定することができる。なお、音量補正値算出処理を実行した後に、次回以降において、音声再生処理を行わないように指定する場合、「VOLUME_SMOOTHING」の値を、「Enable」から「Disable/Ready」に書き換えるようにしてもよい。
B5.変形例5:
上述した実施例では、音量表現値の基準値として、所定の音声(1000Hzの正弦波を100%含み、最大振幅がビット精度の最大振幅の50%である音声)の音量表現値を用いていたが、本発明は、これに限定されるものではない。
例えば、まず、コンテンツ再生情報ファイルにおいて最初に指定された音声データファイルについての平均音量表現値を、上述した実施例と同様にして求めておき、この求めた平均音量表現値を基準値として用いるようにしてもよい。
この場合、かかる基準値に基づき算出された音量補正値を用いて、2番目以降に指定された各ファイルの波形データを補正すると、それぞれの平均音量表現値は、最初に指定された音声データファイルについての平均音量表現値とほぼ一致することとなる。従って、出力される音声の平均音量をほぼ一定とすることができる。
B6.変形例6:
上述した実施例において、音量表現値を算出する際に、合成波形の各周波数成分のうち、合成波形に含まれる割合の高い上位3成分について、周波数及び含まれる割合を用いるようにしていたが、上位3成分に限らず、上位4成分や、上位5成分以上について、その周波数及び含まれる割合を用いるようにしても構わない。
B7.変形例7:
上述した実施例では、パーソナルコンピュータPC1で作成されたコンテンツ再生情報ファイルや音声データファイルの記録媒体として、メモリカードMCを用いるようにしていたが、メモリカードに限らず、例えば、磁気ディスクタイプの記録媒体(HDDやMO等)や、光学ディスクタイプの記録媒体(CD−R/RWやDVD等)を用いるようにしてもよい。なお、この場合、それぞれの記録媒体に対応するドライブをプロジェクタに用意するようにすればよい。
B8.変形例8:
上述した実施例では、コンテンツ再生情報ファイルと、コンテンツのデータファイルと、は同じメモリカードMCに記憶され、プロジェクタPJ1は、これらのファイルをメモリカードMCから読み出すものとしたが、それぞれのファイルを異なる記録媒体から読み出すようにしてもよい。
具体的には、例えば、プロジェクタがローカルエリアネットワークを介してインターネットに接続されている場合に、コンテンツ再生情報ファイルはメモリカードMCから読み出し、コンテンツのデータファイルは、インターネット上に接続されたサーバから読み出すようにしてもよい。このようにすることで、ユーザは、パーソナルコンピュータに記憶されていないコンテンツを用いてプレゼンテーションを行うことが可能となる。
B9.変形例9:
上述した実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよい。例えば、音声処理部103が行っていた波形データの補正を、ソフトウェアによりCPU101で実行するようにしてもよい。
B10.変形例10:
上述した実施例では、補正係数は、等ラウドネス曲線に基づいて定められていたが、等ラウドネス曲線のほかに、音量調整部111が有するオーディオアンプの、周波数に対する増倍率の変化や、スピーカ112の振動応答性を加味して、補正係数を定めるようにしてもよい。このようにすることで、ユーザの聴覚により即した音量調整を行うことが可能となる。
本発明の一実施例としてのプロジェクタの概要構成を示す機能ブロック図である。 図1に示すプロジェクタPJ1を備えたプレゼンテーションシステムの概要構成を示す説明図である。 コンテンツ再生情報ファイル「SINR003.CFG」の記載内容及びコンテンツの再生順序を模式的に示す説明図である。 本実施例における音声再生処理の手順を示すフローチャートである。 補正値算出部101bにより実行される音量補正値算出処理の手順を示すフローチャートである。 図1に示す補正係数テーブルTbの内容を示す説明図である。
符号の説明
100...デジタル再生IC
101...CPU
101a...再生処理部
101b...補正値算出部
102...メモリ制御部
103...音声処理部
104...画像処理部
110...DAC
111...音量調整部
112...スピーカ
120...メモリカードスロット
121...メモリカード制御部
130...リモコン制御部
131...リモコン
140...DRAM
141...フラッシュメモリ
150...液晶パネル駆動部
151...照明光学系
152...液晶パネル
153...投写光学系
2000...プレゼンテーションシステム
MC...メモリカード
PC1...パーソナルコンピュータ
PJ1...プロジェクタ
Tb...補正係数テーブル

Claims (9)

  1. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するための再生情報生成装置であって、
    前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する補正量算出部と、
    前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する生成部と、
    を備える再生情報生成装置。
  2. 請求項1に記載の再生情報生成装置において、
    前記補正量算出部は、前記補正量を算出する場合に、各音声の音声波形の振幅と、前記音声波形を構成する互いに周波数が異なる正弦波の、前記音声波形に含まれる割合と、前記正弦波の周波数に応じた重み付け値と、に基づき、各音声の平均音量を算出すると共に、前記算出した平均音量に基づき、前記補正量を算出することを特徴とする再生情報生成装置。
  3. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生することが可能な音声再生装置であって、
    各音声データ毎の補正量及びそれら補正量と各音声データとの対応関係を示す対応関係情報を少なくとも含む再生情報と、前記複数の音声データと、を入力する入力部と、
    前記入力された各音声データ毎に、前記入力された再生情報に含まれる前記対応関係情報を参照して、該音声データに対応する前記補正量を導き出すと共に、前記導き出した補正量を用いて該音声データを補正する補正部と、
    前記補正された複数の音声データの表す各音声を再生する再生部と、
    を備える音声再生装置。
  4. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生することが可能な音声再生装置であって、
    前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する補正量算出部と、
    前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する生成部と、
    各音声データ毎に、前記生成された再生情報に含まれる前記対応関係情報を参照して、該音声データに対応する前記補正量を導き出すと共に、前記導き出した補正量を用いて該音声データを補正する補正部と、
    前記補正された複数の音声データの表す各音声を再生する再生部と、
    を備える音声再生装置。
  5. 請求項3または請求項4に記載の音声再生装置を備えるプロジェクタ。
  6. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するための再生情報生成方法であって、
    前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する第1の工程と、
    前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する第2の工程と、
    を備える再生情報生成方法。
  7. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生するための音声再生方法であって、
    各音声データ毎の補正量及びそれら補正量と各音声データとの対応関係を示す対応関係情報を少なくとも含む再生情報と、前記複数の音声データと、を用意する第1の工程と、
    各音声データ毎に、前記再生情報に含まれる前記対応関係情報を参照して、該音声データに対応する前記補正量を導き出す第2の工程と、
    各音声データ毎に、前記導き出された補正量を用いて該音声データを補正する第3の工程と、
    前記補正された複数の音声データの表す各音声を再生する第4の工程と、
    を備える音声再生方法。
  8. 予め選択された複数の音声データについて、それら音声データの表す各音声を再生する際に用いられる再生情報を生成するためのコンピュータプログラムであって、
    前記複数の音声データから、各音声の平均音量が略一定となるような補正量を、各音声データ毎に算出する機能と、
    前記算出された各補正量と、それら補正量と各音声データとの対応関係を示す対応関係情報と、を少なくとも含むように、前記再生情報を生成する機能と、
    をコンピュータに実現させるためのプログラム。
  9. 請求項8に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005184217A 2005-06-24 2005-06-24 再生情報生成装置及び音声再生装置 Pending JP2007003845A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005184217A JP2007003845A (ja) 2005-06-24 2005-06-24 再生情報生成装置及び音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005184217A JP2007003845A (ja) 2005-06-24 2005-06-24 再生情報生成装置及び音声再生装置

Publications (1)

Publication Number Publication Date
JP2007003845A true JP2007003845A (ja) 2007-01-11

Family

ID=37689537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005184217A Pending JP2007003845A (ja) 2005-06-24 2005-06-24 再生情報生成装置及び音声再生装置

Country Status (1)

Country Link
JP (1) JP2007003845A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250241A (ja) * 2007-03-30 2008-10-16 Toshiba Corp 映像表示装置
JP2009538554A (ja) * 2006-05-26 2009-11-05 クウォン,ダエ−ホーン 標準聴力特性を用いたイコライゼーション方法及びそれを用いた音響出力装置
JP2012104992A (ja) * 2010-11-09 2012-05-31 Sony Corp 再生装置、再生方法、提供装置および再生システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009538554A (ja) * 2006-05-26 2009-11-05 クウォン,ダエ−ホーン 標準聴力特性を用いたイコライゼーション方法及びそれを用いた音響出力装置
JP2008250241A (ja) * 2007-03-30 2008-10-16 Toshiba Corp 映像表示装置
JP2012104992A (ja) * 2010-11-09 2012-05-31 Sony Corp 再生装置、再生方法、提供装置および再生システム

Similar Documents

Publication Publication Date Title
US10623879B2 (en) Method of editing audio signals using separated objects and associated apparatus
JP6231102B2 (ja) 主観的忠実度のための音声コンテンツの変換
KR20150122760A (ko) 음량 및 동적 범위 제어에 대한 메타데이터
US8253006B2 (en) Method and apparatus to automatically match keys between music being reproduced and music being performed and audio reproduction system employing the same
JP6201460B2 (ja) ミキシング管理装置
US8913760B2 (en) Sound reproducing device, reproduced sound adjustment method, acoustic characteristic adjustment device, acoustic characteristic adjustment method, and computer program
JP2009060209A (ja) 再生装置、プログラム、及び再生装置における周波数特性調整方法
JP2007003845A (ja) 再生情報生成装置及び音声再生装置
JP2007178584A (ja) 楽曲データ配信方法及び装置
JP2007219241A (ja) 音声処理装置、音声処理プログラム
KR101507468B1 (ko) 사용자 음성 중심의 음원 데이터의 생성 시스템 및 방법
JP2010068292A (ja) 音声出力装置、プロジェクタ、プログラムおよび情報記憶媒体
KR100383061B1 (ko) 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법
US20090192636A1 (en) Media Modeling
JP5838563B2 (ja) 電子楽器及びプログラム
KR20160010843A (ko) 진동 기능을 제공하는 오디오북 재생 방법, 장치 및 컴퓨터 판독 가능 매체
JP6690165B2 (ja) 出力制御装置、電子楽器、出力制御方法及びプログラム
EP2511908A2 (en) Audio authoring apparatus and audio playback apparatus for an object-based audio service, and audio authoring method and audio playback method using same
JP2009251044A (ja) 電子楽器および音量制御方法
JP2008226351A (ja) 音声再生装置、音声再生方法、及びプログラム
KR102001314B1 (ko) 노래방 녹음 음질 개선 장치 및 방법
KR100655802B1 (ko) 오디오 녹음파일을 생성하는 방법
JP5288219B2 (ja) 重ね録音装置、重ね録音方法およびプログラム
JP3363667B2 (ja) カラオケ装置
JP6654404B2 (ja) 音声補正方法、音声補正プログラム、音声補正装置および音声補正システム