JP4543261B2 - 再生装置 - Google Patents

再生装置 Download PDF

Info

Publication number
JP4543261B2
JP4543261B2 JP2005282220A JP2005282220A JP4543261B2 JP 4543261 B2 JP4543261 B2 JP 4543261B2 JP 2005282220 A JP2005282220 A JP 2005282220A JP 2005282220 A JP2005282220 A JP 2005282220A JP 4543261 B2 JP4543261 B2 JP 4543261B2
Authority
JP
Japan
Prior art keywords
sound
time
data
image
sound image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005282220A
Other languages
English (en)
Other versions
JP2007093925A (ja
Inventor
弘太 高橋
康生 政木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Original Assignee
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by THE UNIVERSITY OF ELECTRO-COMUNICATINS, Funai Electric Co Ltd filed Critical THE UNIVERSITY OF ELECTRO-COMUNICATINS
Priority to JP2005282220A priority Critical patent/JP4543261B2/ja
Priority to US11/527,554 priority patent/US8744244B2/en
Publication of JP2007093925A publication Critical patent/JP2007093925A/ja
Application granted granted Critical
Publication of JP4543261B2 publication Critical patent/JP4543261B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Television Signal Processing For Recording (AREA)

Description

本発明は、再生装置に関する。
従来、VCR再生装置やDVD再生装置等では、表示部に表示される映像を見ながら、又は、再生時間のカウンタを見ながら早送り操作又は巻戻し操作等が行われている。このような早送り・巻戻し操作においては、ユーザは、当該操作の間ずっと、表示部に表示される映像またはカウンタを注視しなくてはならず、眼に負担をかけることになるという問題があった。そのため、DVD等に記憶された映像データの中から各シーンの代表的な映像をサムネイル表示するものが知られている(例えば、特許文献1)。
しかし、上記映像データのサムネイル表示では早送り・巻戻し操作をシーン毎に行うことしかできず、ユーザが所望する音データ等を再生したい場合には対応できない。そこで、様々な音データを可視化して表示する装置が知られている。例えば、音声波形を表示するとともにサムネイル表示を行ったり(例えば、特許文献2)、会議等の音声データの時間変化を話者毎に区切った棒グラフを表示したり(例えば、特許文献3)、音データを解析して、音データの時間変化を周波数帯域毎に色分けした棒グラフで表示したり(例えば、特許文献4)、音データを解析し、時間軸,周波数軸,パワー軸からなる三次元グラフで表示したり(例えば、特許文献5)するものが知られている。
また、上述のグラフ表示以外の表示により音データを可視化表示する方法も知られている(例えば、特許文献6〜8)。例えば、音データを解析し、当該音データが人の声であるのか音楽であるのかを判定してアイコン表示するもの(例えば、特許文献6)、音声データを音声認識技術により文字表示を行うもの(例えば、特許文献7)等が知られている。また、音データを解析した解析値を一辺とする立体図形を時間軸上に表し、当該立体図形を変形させることにより、音データの編集を行えるようにしたものも知られている(例えば、特許文献8)。
その他、音の種類によらない普遍的な方法をあきらめ、例えば、音声などの特定の音源に絞った研究がある(非特許文献1)。また、音声を映像表示することで聴覚障害者に音声を認識させる試みも発表されている(非特許文献2)。
特開2005−033714号公報 特開平10−191248号公報 特開平08−317365号公報 特開平09−090937号公報 特開平08−292791号公報 特開平08−179791号公報 特開平11−109988号公報 特開2000−330600号公報 「Visible Speech」(Van Nostrand, New York, 1947年) 「聴覚障害者のための音声映像化」(日本音響学会誌52巻12号, P979,1996年)
ところで、ユーザが早送り操作又は巻戻し操作を行って所望する音データを再生する場合、ユーザは、音データを可視化した可視化表示中における、現在再生されている音デー
タの可視化表示の位置(現時点)を認識することにより、より容易に所望の音データの可視化表示の位置を認識することができる。
しかしながら、上記特許文献6〜8の発明では、音データの再生の進行に合わせて音データを可視化した可視化表示が随時変更されていくものではないので、可視化表示において、音データの再生の進行により現時点の位置が移っていくこととなって、現時点で再生されている音データが可視化された表示が可視化表示中のどの部分に当たるのかを、そのたび毎にユーザが読取らなければならず、結果として、現時点を起点とした過去や未来の音データの内容をユーザに一望させるには不十分なものであった。すなわち、従来の音データの可視化表示は絶対的な時間軸における表示であるため、現在再生されている音データと可視化された音データの関係が必ずしも明確になっていないので、音再生時においてユーザが所望する音データの内容を認識しにくく、音データの再生操作の支援が十分ではないという問題があった。
ここで、音データの再生操作の支援とは、例えば、早送り操作又は巻戻し操作においては、ユーザが当該操作中に音データの内容を刻一刻と監視することなしに、ワンタッチで操作できるように支援すること、早送り終了時点や巻戻し終了時点を予め予測できるようにして、早送りや巻戻しが行き過ぎることを防ぐように支援すること、また、新たな時点から音データを再生する操作においては、ドラマの結末など先に知っては困るような内容がユーザに晒されることなく、かつ、新たな再生時点を決定できる程度には内容を認識できるような情報をユーザに与えること等である。
また、非特許文献1及び非特許文献2の方法は、音データを音声データに限っており、音声,音楽,自然音等を含む音データを可視化することはできない。
本発明の課題は、連続性のある音データを画像データに可視化し、かつ当該画像データを現時点を起点とした時間軸に対して表示することにより、ユーザが音データの内容をより容易に認識できる再生装置を提供することにより、ユーザによる音データの再生操作を支援することである。
請求項1に記載の発明は、蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
音データを記憶する音データ記憶手段と、
前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
前記生成手段は、
前記音データの再生速度に応じて、前記音画像配置図の前記時間軸の縮尺を変更することを特徴としている。
請求項2に記載の発明は、蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
音データを記憶する音データ記憶手段と、
前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
前記生成手段は、前記時間軸の縮尺が異なる2以上の前記音画像配置図を生成し、
前記表示制御手段は、前記生成手段により生成された前記時間軸の縮尺が異なる2以上の前記音画像配置図を同時に表示部に表示させることを特徴としている。
請求項3に記載の発明は、蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
音データを記憶する音データ記憶手段と、
前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
前記生成手段は、横軸が前記時間軸であって、縦軸方向に前記時間軸の縮尺が変化する前記音画像配置図を生成し、
前記表示制御手段は、前記生成手段により生成された前記縦軸方向に前記時間軸の縮尺が変化する前記音画像配置図を表示部に表示させることを特徴としている。
請求項4に記載の発明は、蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
音データを記憶する音データ記憶手段と、
前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
前記生成手段は、前記時間軸の縮尺が、第1の時間帯から、この第1の時間帯よりも現時点から遠い第2の時間帯に向かうにつれて小さくなる音画像配置図を生成することを特徴としている。
請求項5に記載の発明は、請求項1〜4の何れか一項に記載の再生装置において、
前記音データと関連付けて映像データを記憶する映像データ記憶手段と、
前記生成手段により生成された音画像配置図と前記映像データ記憶手段に記憶された映像データに基づく映像とを合成した合成画像を生成する合成手段と、を備え、
前記表示制御手段は、
音データに基づく音が前記音出力部から出力される際に、前記合成手段により生成された合成画像を表示部に表示させることを特徴としている。
請求項6に記載の発明は、請求項に記載の再生装置において、
前記映像データ記憶手段から、所定の時点における代表映像データを抽出する代表映像データ抽出手段を備え、
前記合成手段は、
前記生成手段により生成された音画像配置図と前記映像データ記憶手段に記憶された映像データに基づく映像と前記代表映像データ抽出手段により抽出された代表映像データに基づく画像とを、現時点を起点とした相対的な時間軸に対応付けて合成することを特徴とする。
請求項7に記載の発明は、請求項1〜6の何れか一項に記載の再生装置において、
前記生成手段は、前記音画像配置図に、現時点を示す指標を合成することを特徴とする。
請求項8に記載の発明は、請求項1〜7の何れか一項に記載の再生装置において、
ユーザに操作されることにより、操作信号を出力する操作部を備え、
前記生成手段は、
前記音画像配置図に、再生開始時点を示す目印を合成し、
前記操作部から出力される前記目印を選択する操作信号に基づいて、前記目印に示される再生開始時点から音データの再生を開始する再生制御手段を備えることを特徴としている。
請求項1に記載の発明によれば、分析手段により、音データ記憶手段に記憶された音データが所定の分析条件に従って分析され、画像化手段により、当該分析結果が、分析結果に対応して予め設定された画像データに変換され、生成手段により、画像化された画像データに基づく音画像が現時点を起点とした相対的な時間軸に対応付けられて配置された音画像配置図が生成され、音データに基づく音が音出力部から出力される際に、表示制御手段により、生成された音画像配置図が表示部に表示され、音画像配置図は、現時点において音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含むので、現時点において音出力部から出力される音と可視化された音画像との対応付けが明確になることとなって、ユーザは、当該音画像配置図により連続性のある音データの内容をより容易に認識できる。
また、音画像配置図は、例えば、画像のサムネイル表示に比べて時間的な連続性があるため、瞬間的に全体の様子を把握することができるので、これにより、ユーザに直感的に情報を与えることができる。
また、生成手段により、音データの再生速度に応じて、音画像配置図の時間軸の縮尺が変更されるので、音画像配置図において音画像が時間軸に沿って移動する速度が音データの再生速度によらず一定となり、音データの再生速度に応じた適切な音画像配置図を表示部に表示させることができ、当該音画像配置図からユーザは更に容易に音データの内容を認識できる。
請求項2に記載の発明によれば、分析手段により、音データ記憶手段に記憶された音データが所定の分析条件に従って分析され、画像化手段により、当該分析結果が、分析結果に対応して予め設定された画像データに変換され、生成手段により、画像化された画像データに基づく音画像が現時点を起点とした相対的な時間軸に対応付けられて配置された音画像配置図が生成され、音データに基づく音が音出力部から出力される際に、表示制御手段により、生成された音画像配置図が表示部に表示され、音画像配置図は、現時点において音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含むので、現時点において音出力部から出力される音と可視化された音画像との対応付けが明確になることとなって、ユーザは、当該音画像配置図により連続性のある音データの内容をより容易に認識できる。
また、音画像配置図は、例えば、画像のサムネイル表示に比べて時間的な連続性があるため、瞬間的に全体の様子を把握することができるので、これにより、ユーザに直感的に情報を与えることができる。
また、生成手段は、時間軸の縮尺が異なる2以上の音画像配置図を生成し、表示制御手段は、生成手段により生成された時間軸の縮尺が異なる2以上の音画像配置図を同時に表示部に表示させるので、ユーザは、目的に応じて、時間軸の縮尺が異なる2以上の音画像配置図から所望の音画像配置図を選択し、選択した音画像配置図から容易に音データの内容を認識することができる。
請求項3に記載の発明によれば、分析手段により、音データ記憶手段に記憶された音データが所定の分析条件に従って分析され、画像化手段により、当該分析結果が、分析結果に対応して予め設定された画像データに変換され、生成手段により、画像化された画像データに基づく音画像が現時点を起点とした相対的な時間軸に対応付けられて配置された音画像配置図が生成され、音データに基づく音が音出力部から出力される際に、表示制御手段により、生成された音画像配置図が表示部に表示され、音画像配置図は、現時点において音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含むので、現時点において音出力部から出力される音と可視化された音画像との対応付けが明確になることとなって、ユーザは、当該音画像配置図により連続性のある音データの内容をより容易に認識できる。
また、音画像配置図は、例えば、画像のサムネイル表示に比べて時間的な連続性があるため、瞬間的に全体の様子を把握することができるので、これにより、ユーザに直感的に情報を与えることができる。
また、生成手段は、横軸が時間軸であって、縦軸方向に時間軸の縮尺が変化する音画像配置図を生成し、表示制御手段は、生成手段により生成された縦軸方向に時間軸の縮尺が変化する音画像配置図を表示部に表示させるので、ユーザは、一つの音画像配置図から複数の時間軸の縮尺が異なる音画像配置図A1を認識することができるとともに、ユーザが、独立して区切られた複数の時間軸の縮尺が異なる音画像配置図を見る場合における眼の負担を少なくすることができる。
請求項4に記載の発明によれば、分析手段により、音データ記憶手段に記憶された音データが所定の分析条件に従って分析され、画像化手段により、当該分析結果が、分析結果に対応して予め設定された画像データに変換され、生成手段により、画像化された画像データに基づく音画像が現時点を起点とした相対的な時間軸に対応付けられて配置された音画像配置図が生成され、音データに基づく音が音出力部から出力される際に、表示制御手段により、生成された音画像配置図が表示部に表示され、音画像配置図は、現時点において音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含むので、現時点において音出力部から出力される音と可視化された音画像との対応付けが明確になることとなって、ユーザは、当該音画像配置図により連続性のある音データの内容をより容易に認識できる。
また、音画像配置図は、例えば、画像のサムネイル表示に比べて時間的な連続性があるため、瞬間的に全体の様子を把握することができるので、これにより、ユーザに直感的に情報を与えることができる。
また、生成手段は、時間軸の縮尺が、第1の時間帯から、この第1の時間帯よりも現時点から遠い第2の時間帯に向かうにつれて小さくなる音画像配置図を生成するので、当該音画像配置図から、現時点付近の時間帯(第1の時間帯)の音データの内容を詳細に認識することができるとともに、現時点からより遠い第2の時間帯の音データの内容をおおまかに認識することができる。
請求項5に記載の発明によれば、請求項1〜4の何れか一項に記載の発明と同様の効果が得られるのは勿論のこと、特に、映像データ記憶手段により、音データと関連付けて映像データが記憶され、合成手段により、生成手段によって生成された音画像配置図と映像データ記憶手段に記憶された映像データに基づく映像とが合成された合成画像が生成され、音データに基づく音が音出力部から出力される際に、表示制御手段により、合成手段によって生成された合成画像が表示部に出力させるので、映像とともに音画像配置図を視認でき、当該音画像配置図により連続性のある音データの内容をより容易に認識できる。
請求項6記載の発明によれば、請求項5に記載の発明と同様の効果が得られるのは勿論のこと、特に、代表映像データ抽出手段により、映像データ記憶手段から、所定の時点における代表映像データが抽出され、合成手段により、生成手段によって生成された音画像配置図と映像データ記憶手段に記憶された映像データに基づく映像と代表映像データ抽出手段によって抽出された代表映像データに基づく画像とが現時点を起点とした相対的な時間軸に対応付けられて合成されるので、音画像配置図に代表映像データに基づく画像が表示されることとなって、ユーザは、音画像配置図に表示された代表映像データに基づく画像により所望の音データの音画像配置図における場所をより容易に認識することができ、所望の時間の音データをさらに容易に再生させることができる。
請求項に記載の発明によれば、請求項1〜6の何れか一項に記載の発明と同様の効果が得られるのは勿論のこと、特に、生成手段により、音画像配置図に、現時点を示す指標が合成されるので、ユーザは音画像配置図に表示される指標により、現時点を容易に確認でき、音画像配置図から更に容易に音データの内容を認識できる。
請求項8記載の発明によれば、請求項1〜7の何れか一項に記載の発明と同様の効果が得られるのは勿論のこと、特に、ユーザに操作されることにより、操作信号を出力する操作部を備え、生成手段により、音画像配置図に、再生開始時点を示す目印が合成され、再生制御手段により、操作部から出力される目印を選択する操作信号に基づいて、目印に示される再生開始時点から音データの再生が開始されるので、ユーザは音画像配置図における目印を選択するだけで、所望の時間の音データを容易に再生させることができる。
以下、図を参照して、本発明に係る再生装置,再生方法,記憶媒体を実施するための最良の形態を詳細に説明する。
(第1の実施形態)
第1の実施形態では、本発明に係る再生装置として音データ再生装置100を例示して説明する。
まず、第1の実施形態に係る音データ再生装置100の請求項2に対応する構成について、図1を参照して説明する。音データ再生装置100は、例えば、音データを記憶する音データ記憶手段を備えている。また、音データ再生装置100は、例えば、音データ記憶手段に記憶された音データを分析する分析手段,分析手段による分析結果を画像データに変換する画像化手段,画像化手段により画像化された画像データに基づく音画像Bを音データに基づく音が音出力部としての音出力装置200から出力される時点(現時点)を起点とした相対的な時間軸に対応付けて配置して音画像配置図A1を生成する生成手段,
生成手段により生成された音画像配置図A1を表示部としての表示装置300に表示させる表示制御手段等を備える制御部4と、操作部3等を備えて構成されている。
次に、第1の実施形態に係る音データ再生装置100の具体的な構成について図2を参照しながら説明する。音データ再生装置100は、例えば、図2に示すように、音データ入力部1,音データ記憶手段としての音データ記憶部2,操作部3,制御部4等を備えて構成され、CD,DVD等に蓄積された音データ又はラジオ放送等の外部から逐次入力される音データをデコード等の再生処理を施してスピーカ等を備えた音出力装置200に出力する。
音データ入力部1は、例えば、チューナ等を備えて構成され、ラジオ放送等の放送波を受信し、放送波に含まれる音データを音データ記憶部2に出力する。
音データ記憶部2は、例えば、CD,DVD,HDD,半導体メモリ,メモリカード等であり、時間的に連続する音データを記憶する。より具体的には、音データ記憶部2は、例えば、CD,DVD等に蓄積された時間的に連続する音データ又は音データ入力部1から逐次入力される音データを記憶する。
操作部3は、例えば、ユーザにより押下されることによって各種の操作信号を出力するための操作ボタン(図示省略)等を備えて構成されており、音データ再生装置100に設けられてもよいし、リモートコントローラとして備えられてもよい。
制御部4は、例えば、図2に示すように、CPU(Central Processing Unit)5,
RAM(Random Access Memory)6,記憶部7等を備えて構成されている。
CPU5は、記憶部7に格納された処理プログラム等を読み出して、RAM6に展開して実行することにより、音データ再生装置100全体の制御を行う。
RAM6は、CPU5により実行された処理プログラム等を、RAM6内のプログラム格納領域に展開するとともに、入力データや上記処理プログラムが実行される際に生じる処理結果等をデータ格納領域に格納する。
記憶部7は、例えば、プログラムやデータ等が予め記憶されている記録媒体(図示せず)を有しており、この記録媒体は、例えば、半導体メモリ等で構成されている。また、記憶部7は、CPU5が音データ再生装置100全体を制御する機能を実現させるための各種データ,各種処理プログラム,これらプログラムの実行により処理されたデータ等を記憶する。より具体的には、記憶部7は、例えば、図2に示すように、再生用音データ抽出プログラム7A,可視化用音データ抽出プログラム7B,分析プログラム7C,画像化プログラム7D,生成プログラム7E,表示制御プログラム7F,可視化パラメータ決定プログラム7G等を格納している。
再生用音データ抽出プログラム7Aは、例えば、CPU5に、操作部3から入力された操作信号に基づいて音データ記憶部2を検索し、再生する音データを抽出する機能を実現させるプログラムである。
可視化用音データ抽出プログラム7Bは、例えば、CPU5に、操作部3から入力された操作信号に基づいて音データ記憶部2を検索し、CPU5が後述する音画像Bを生成するのに必要な所定時間分の音データを抽出する機能を実現させるプログラムである。ここで所定時間とは、例えば、CPU5が再生用音データ抽出プログラム7Aを実行することにより抽出されて再生される音データの時点(現時点)を含む現時点よりも遅い時点(未
来の時点)までの時間などである。また、当該所定時間は、操作部3から入力される操作信号に基づいて定められてもよいし、音データに基づく音の再生速度に応じて定められてもよい。また、当該所定時間は、CPU5が後述する可視化パラメータ決定プログラム7Gを実行することにより変更可能となっている。
分析プログラム7Cは、例えば、CPU5に、可視化用音データ抽出プログラム7Bを実行することにより抽出した音データを所定の分析条件に従って分析する機能を実現させるプログラムである。具体的な分析条件としては、例えば、短時間フーリエ変換(FFT),ケプストラム分析,ウイグナー分布による時間周波数平面表現,ARモデル当てはめによる極位置の推定等が挙げられる。また、分析条件として、理論的な最適性等の裏付けがなくても、人間の直感に一致している経験的な条件が使用されてもよい。CPU5は、かかる分析プログラム7Cを実行することにより、分析手段として機能する。
画像化プログラム7Dは、例えば、CPU5に、分析プログラム7Cを実行することにより、音データを分析した分析結果を分析結果に対応して予め設定された画像データに変換する機能を実現させるプログラムである。より具体的には、画像化プログラム7Dは、CPU5に、分析結果を、例えば、分析によって得られたパラメータの値に対応するRGB値及び画素数(画像の大きさ)に変換することにより、RGB値で表現された色を有する画素集団として画像小片化し、音画像Bの画像データに変換する機能を実現するプログラムである。CPU5は、画像化プログラム7Dを実行することにより、画像化手段として機能する。
生成プログラム7Eは、例えば、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成する機能を実現させるプログラムである。また、生成プログラム7Eは、CPU5に、例えば、時間的に連続した音データのうち、現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。CPU5は、かかる生成プログラム7Eを実行することにより、生成手段として機能する。
表示制御プログラム7Fは、例えば、CPU5に、生成プログラム7Eを実行することにより生成した音画像配置図A1を液晶パネル等を備える表示装置300に表示させる機能を実現させるプログラムである。CPU5は、かかる表示制御プログラム7Fを実行することにより、表示制御手段として機能する。
可視化パラメータ決定プログラム7Gは、例えば、CPU5に、分析プログラム7Cや画像化プログラム7Dの実行における処理で使用される各種パラメータ値を調整する機能を実現させるプログラムである。
そして、CPU5は、可視化パラメータ決定プログラム7Gを実行することにより、例えば、音データに基づく音の再生速度に応じて短時間フーリエ変換(FFT)の時間分解能と周波数分解能とのトレードオフの関係における最適点が変化する場合に、当該変化に追従して、FFT点数を最適化させる等の調整を行う。
また、CPU5は、可視化パラメータ決定プログラム7Gを実行することにより、ユーザが、例えば、音データの種類(例えば、音声,音楽,男声,女声等)によって、音データの分析結果から生成される音画像Bの違いを際立たせるための操作信号が操作部3から入力された場合には、当該操作信号に基づいて、分析プログラム7Cや画像化プログラム7Dの実行における処理で使用される各種パラメータ値の調整を行う。
次に、上述のような構成の音データ再生装置100における音データの可視化動作(再
生動作)を図3に示すフローチャートを参照しながら説明する。
まず、CPU5は、再生用音データ抽出プログラム7Aを実行することにより、操作部3から入力される操作信号に基づいて音データ記憶部2を検索し、再生する音データを抽出する(ステップS1)。
次に、CPU5は、可視化用音データ抽出プログラム7Bを実行することにより、操作部3から入力された操作信号に基づいて音データ記憶部2を検索し、音画像Bを生成するのに必要な所定時間分の音データ、例えば、再生される音データの時点(現時点)を含む現時点よりも遅い時点(未来の時点)までの所定時間分の音データを抽出する(ステップS2)。
次に、CPU5は、分析プログラム7Cを実行することにより、ステップS2において抽出した音データを分析する(ステップS3:分析工程)。ステップS3において音データを分析して得られる分析結果の一例を図4(a)に示す。
図4(a)に示す分析結果は、音データをケプストラム分析したものであり、縦軸がケプストラム分析により得られる基本周波数を示し、横軸が時間を示す。
次に、CPU5は、画像化プログラム7Dを実行することにより、ステップS3において音データを分析した結果を分析結果に対応して予め設定された画像データに変換する(ステップS4:画像化工程)。
次に、CPU5は、生成プログラム7Eを実行することにより、ステップS4において分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、音画像配置図A1に現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標Sを合成する(ステップS5:生成工程)。
次に、CPU5は、ステップS1において抽出した再生用音データに基づく音を音出力装置200に出力させるとともに、表示制御プログラム7Fを実行して、ステップS5において生成した音画像配置図A1を表示装置300に表示させる(ステップS6:表示工程)。
ステップS6において、表示装置300に表示される音画像配置図A1の一例を図4(b),図4(c)に示す。
図4(b)に示す音画像配置図A1において、縦軸は音の強度を示し、横軸は時間経過を示す現時点を起点とした相対的な時間軸となっている。各音画像Bの色は、例えば、図4(a)に示す分析結果における基本周波数の数値によって規定されている。なお、音画像Bの色は、音色(FFT解析によって得られる倍音成分の構成比)によって規定されてもよい。また、図4(c)に示す音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により図4(a)に示す分析結果における基本周波数が表現されている。さらに、図4(d)に示す音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの横幅が一定となっている。各音画像Bの横幅を一定とすることにより、ステップS5の処理を単純で手間のかからないものとすることができる。また、横幅を一定とされた各音画像Bの色(RGB値)は、音の基本周波数及び音色により規定されている。より具体的には、例えば、図4(a)の分析において、同じ時間帯に複数の異なる周波数の基本周波数(以下、ピッチと称する)や音色が検出された場合、それぞれのピッチや音色が一つの音画像Bの中で色分けして表現されるとともに、それぞれのピッチや音色の強度が音画像Bの中で占める縦方向の長さによ
り表現されている。なお、図4(d)において、音の強度を表現しない場合には、音画像Bの縦方向の長さが一定とされてもよい。
そして、ユーザは、例えば、図4(b),図4(c),図4(d)等に示す音画像配置図A1から、音データの強度,音色及び基本周波数等を音画像Bの大きさ,形及び色等により認識することができるようになっており、音画像Bから音データの内容を認識できるようになっている。
また、図4(b),図4(c),図4(d)には、現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標Sが表示されている。
以上に説明した、第1の実施形態に係る音データ再生装置100及び再生方法によれば、CPU5が分析プログラム7Cを実行することにより、音データ記憶部2に記憶された音データが所定の分析条件に従って分析され、CPU5が画像化プログラム7Dを実行することにより、当該分析結果が、分析結果に対応して予め設定された画像データに変換され、CPU5が生成プログラム7Eを実行することにより、画像化された画像データに基づく音画像Bが現時点を起点とした相対的な時間軸に対応付けられて配置された音画像配置図A1が生成され、音データに基づく音が音出力装置200から出力される際に、CPU5が表示制御プログラム7Fを実行することにより、生成された音画像配置図A1が表示装置300に表示され、音画像配置図A1は、現時点において音出力装置200から出力される音に対応する音画像Bが認識可能であり、且つ、現時点を含む過去から未来の時間帯における音画像Bを含むので、現時点において音出力装置200から出力される音と可視化された音画像との対応付けが明確になることとなって、ユーザは、当該音画像配置図A1により連続性のある音データの内容をより容易に認識できる。
また、音画像配置図A1は、例えば、画像のサムネイル表示に比べて時間的な連続性があるため、瞬間的に全体の様子を把握することができるので、これにより、ユーザに直感的に情報を与えることができる。
また、第1の実施形態に係る音データ再生装置100によれば、CPU5が生成プログラム7Eを実行することにより、音画像配置図A1に、現時点を示す指標Sが合成されるので、ユーザは音画像配置図A1に表示される指標Sにより、現時点を容易に確認でき、音画像配置図A1から更に容易に音データの内容を認識できる。
なお、可視化用音データとして、CPU5が再生用音データ抽出プログラム7Aを実行することにより抽出されて再生される音データの時点(現時点)を含む現時点よりも遅い時点(未来の時点)までの所定時間分の音データが抽出されることとしたが、これに限られるものではなく、現時点よりも早い時点(過去の時点)から現時点(現時点を含む)までの所定時間分の音データが抽出されてもよいし、現時点よりも早い時点(過去の時点)から現時点よりも遅い時点(未来の時点)までの所定時間分の音データが抽出されてもよい。
また、可視化用音データとして、現時点から現時点よりも遅い時点(未来の時点)までの所定時間分の音データが抽出される場合には、抽出した再生用音データを一時的に音データ記憶部2等に記憶させ、可視化用音データの可視化処理に要する時間分だけ遅延させて、当該再生用音データに基づく音を音出力装置200に出力すればよい。
(第2の実施形態)
第2の実施形態では、本発明に係る再生装置として音・映像データ再生装置400を例示して説明する。
まず、第2の実施形態に係る音・映像データ再生装置400の請求項3に対応する構成について、図5を参照して説明する。音・映像データ再生装置400は、例えば、映像データを記憶する映像データ記憶手段,音データを記憶する音データ記憶手段を備えている。また、音・映像データ再生装置400は、例えば、音データ記憶手段に記憶された音デ
ータを分析する分析手段,分析手段による分析結果を画像データに変換する画像化手段,画像化手段により画像化された画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置して音画像配置図A1を生成する生成手段,生成手段により生成された音画像配置図A1と映像データ記憶手段に記憶された映像データに基づく映像A2とを合成した合成画像A3を生成する合成手段,合成手段により生成された合成画像A3を表示装置300に表示させる表示制御手段等を備える制御部4と、操作部3等を備えて構成されている。
次に、第2の実施形態に係る音・映像データ再生装置400の具体的な構成について図6を参照しながら説明する。音・映像データ再生装置400は、例えば、図6に示すように、音・映像データ入力部8,映像データ記憶部9,記憶部70の構成のみが第1の実施形態に係る音データ再生装置100と異なるので、同一の構成については同一の符号を付するとともに説明を省略する。
音・映像データ入力部8は、例えば、チューナ等を備えて構成され、デジタル放送等の放送波を受信し、放送波に含まれる音データを音データ記憶部2に出力するとともに、放送波に含まれる映像データを映像データ記憶部9に出力する。
映像データ記憶部9は、例えば、CD,DVD,HDD,半導体メモリ,メモリカード等であり、時間的に連続する映像データを音データ記憶部2に記憶される音データと対応づけて記憶し、映像データ記憶手段として機能する。より具体的には、映像データ記憶部9は、例えば、CD,DVD等に蓄積された時間的に連続する映像データ又は音・映像データ入力部8から逐次入力される映像データを記憶する。
記憶部70は、例えば、プログラムやデータ等が予め記憶されている記録媒体(図示せず)を有しており、この記録媒体は、例えば、半導体メモリ等で構成されている。また、記憶部70は、CPU5が音・映像データ再生装置400全体を制御する機能を実現させるための各種データ,各種処理プログラム,これらプログラムの実行により処理されたデータ等を記憶する。より具体的には、記憶部70は、例えば、図6に示すように、再生用音データ抽出プログラム7A,再生用映像データ抽出プログラム70H,可視化用音データ抽出プログラム7B,分析プログラム7C,画像化プログラム7D,生成プログラム7E,合成プログラム70I,表示制御プログラム70F,可視化パラメータ決定プログラム7G等を格納している。
再生用映像データ抽出プログラム70Hは、例えば、CPU5に、操作部3から入力された操作信号に基づいて映像データ記憶部9を検索し、再生する映像データを抽出する機能を実現させるプログラムである。
合成プログラム70Iは、例えば、CPU5に、生成プログラム7Eを実行することにより生成された音画像配置図A1と映像データ記憶部9に記憶された映像データに基づく映像A2とを合成した合成画像A3を生成する機能を実現させるプログラムである。CPU5は、かかる合成プログラム70Iを実行することにより、合成手段として機能する。
表示制御プログラム70Fは、例えば、CPU5に、合成プログラム70Iを実行することにより生成した合成画像A3を、液晶パネル等を備える表示装置300に表示させる機能を実現させるプログラムである。CPU5は、かかる表示制御プログラム70Fを実行することにより、表示制御手段として機能する。
次に、上述のような構成の音・映像データ再生装置400における音データの可視化動作(再生動作)を図7に示すフローチャートを参照しながら説明する。
まず、CPU5は、再生用音データ抽出プログラム7A及び再生用映像データ抽出プログラム70Hを実行することにより、操作部3から入力される操作信号に基づいて、音データ記憶部2を検索して再生する音データを抽出するとともに、映像データ記憶部9を検索して再生する映像データを抽出する(ステップS101)。
次に、CPU5は、可視化用音データ抽出プログラム7Bを実行することにより、操作部3から入力された操作信号に基づいて音データ記憶部2を検索し、音画像Bを生成するのに必要な所定時間分の音データ、例えば、現時点を含む現時点よりも遅い時点までの所定時間分の音データを抽出する(ステップS102)。
次に、CPU5は、分析プログラム7Cを実行することにより、ステップS102において抽出した音データを分析する(ステップS103)。
次に、CPU5は、画像化プログラム7Dを実行することにより、ステップS103において音データを分析した結果を分析結果に対応して予め設定された画像データに変換する(ステップS104)。
次に、CPU5は、生成プログラム7Eを実行することにより、ステップS104において分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、音画像配置図A1に現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標Sを合成する(ステップS105)。
次に、CPU5は、合成プログラム70Iを実行することにより、ステップS105において生成した音画像配置図A1とステップS101において抽出した映像データに基づく映像A2とを合成した合成画像A3を生成する(ステップS106)。
次に、CPU5は、ステップS101において抽出した再生用音データに基づく音を音出力装置200に出力させるとともに、表示制御プログラム70Fを実行して、ステップS106において生成した合成画像A3を表示装置300に表示させる(ステップS107)。
ステップS107において、表示装置300に表示される合成画像A3の一例を図8に示す。図8において、表示装置300の表示画面全体に映像データに基づく映像A2が表示され、表示装置300の画面の所定の部分(例えば、図8では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。そして、図8に示す音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により分析結果における基本周波数が表現されている。そして、ユーザは、図8に示す音画像配置図A1から、音データの強度,音色及び基本周波数等を音画像Bの大きさ,形及び色等により認識することができるようになっている。
また、図8の音画像配置図A1には、現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標Sが表示されている。
以上に説明した、第2の実施形態に係る音・映像データ再生装置400によれば、第1の実施形態に係る音データ再生装置100と同様の効果が得られるのは勿論のこと、特に、映像データ記憶部9に音データと関連付けて映像データが記憶され、CPU5が合成プログラム70Iを実行することにより、生成された音画像配置図A1と映像データ記憶部9に記憶された映像データに基づく映像A2とが合成された合成画像A3が生成され、音
データに基づく音が音出力装置200から出力される際に、CPU5が表示制御プログラム70Fを実行することにより、生成された合成画像A3が表示装置300に出力されるので、映像A2とともに音画像配置図A1を視認でき、当該音画像配置図A1により連続性のある音データの内容をより容易に認識できる。
なお、第2の実施形態に係る音・映像データ再生装置400は、次のように変形して実施されてもよい。
(変形例1)
第2の実施形態の変形例1に係る音・映像データ再生装置400aでは、生成プログラム7Eaのみが変形されている。
変形例1に係る生成プログラム7Eaは、例えば、第2の実施形態と同様に、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、現時点を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。
さらに、変形例1に係る生成プログラム7Eaは、例えば、CPU5に、音データの再生速度に応じて音画像配置図A1の時間軸の縮尺を変更する機能を実現させるプログラムである。より具体的には、生成プログラム7Eaは、例えば、CPU5に、音データの再生速度に比例させて、音画像配置図A1の時間軸の縮尺が小さくなるように変更する機能を実現させるプログラムである。CPU5は、かかる生成プログラム7Eaを実行することにより、生成手段として機能する。
次に、変形例1に係る音・映像データ再生装置400aが表示装置300に表示させる合成画像A3について説明する。音データの再生速度が通常速度である場合の変形例1に係る合成画像A3の一例を図9(a)に示し、音データの再生速度が早送り再生である場合の変形例1に係る合成画像A3の一例を図9(b)に示す。
変形例1に係る合成画像A3では、第2の実施形態と同様に、表示装置300の表示画面全体に映像データに基づく映像A2が表示され、表示装置300の表示画面の所定の部分(例えば、図9では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。また、変形例1に係る音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により分析結果における基本周波数が表現されており、現時点を示す指標Sが表示されている。
また、変形例1に係る音画像配置図A1の時間軸の縮尺は、音データの再生速度に比例して小さくなるように変更される。例えば、音データの再生速度が通常再生である場合には、音画像配置図A1の時間軸の縮尺は、例えば、現時点から過去に向かって30秒から、現時点から未来に向かって30秒までとなっており(図9(a))、音データの再生速度が早送り再生(例えば、4倍速再生)である場合には、音画像配置図A1の時間軸の縮尺は、例えば、現時点から過去に向かって2分から、現時点から未来に向かって2分までとなっている(図9(b))。
そして、音データの再生速度に比例して音画像配置図A1の時間軸の縮尺が小さくなるように変更されるため、どのような再生速度であっても、音画像配置図A1の右端(一番未来側)にあった音画像Bが、時間軸に沿って、音画像配置図A1の左端(一番過去側)に移動する速度は一定となるようになっている。
以上に説明した、第2の実施形態の変形例1に係る音・映像データ再生装置400aによれば、第2の実施形態に係る音・映像データ再生装置400と同様の効果が得られるの
は勿論のこと、特に、CPU5が生成プログラム7Eaを実行することにより、音データの再生速度に応じて、音画像配置図A1の時間軸の縮尺が変更されるので、音画像配置図A1において音画像Bが時間軸に沿って移動する速度が音データの再生速度によらず一定となり、音データの再生速度に応じた適切な音画像配置図A1を表示装置300に表示させることができ、当該音画像配置図A1からユーザは更に容易に音データの内容を認識できる。より具体的には、音画像配置図A1において音画像Bが時間軸に沿って移動する速度が音データの再生速度によらず一定となり、現在行っている再生速度における実際の経過時間を横軸にとった音画像配置図A1が表示されることとなる。すなわち、「このままの操作を続ければ何秒後に音にどのような変化が起こるか」をユーザに知らしめることができる。これによって、ユーザは、次の操作の計画を容易にたてることができる。
(変形例2)
第2の実施形態の変形例2に係る音・映像データ再生装置400bでは、生成プログラム7Ebのみが変形されている。
変形例2に係る生成プログラム7Ebは、例えば、第2の実施形態と同様に、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、現時点を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。
さらに、変形例2に係る生成プログラム7Ebは、例えば、CPU5に、時間軸の縮尺が異なる2以上の音画像配置図A1を生成する機能を実現させるプログラムである。CPU5は、かかる生成プログラム7Ebを実行することにより、生成手段として機能する。
次に、変形例2に係る音・映像データ再生装置400bが表示装置300に表示させる合成画像A3について説明する。
変形例2に係る合成画像A3では、第2の実施形態と同様に、表示装置300の画面全体に映像データに基づく映像A2が表示され、表示装置300の画面の所定の部分(例えば、図10では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。また、変形例2に係る音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により分析結果における基本周波数が表現されており、現時点を示す指標Sが表示されている。
また、変形例2に係る合成画像A3においては、時間軸が異なる2以上の音画像配置図A1が表示されるようになっている。例えば、図10に示すように、時間軸の縮尺がより大きい音画像配置図A1(例えば、図10では、−30秒〜30秒)と時間軸の縮尺がより小さい音画像配置図A1(例えば、図10では、−2分〜2分)とが上下に並べられて表示装置300の画面の下部部分に表示される。また、各音画像配置図A1,A1の時間軸の縮尺の対比がしやすいように、上下の音画像配置図A1,A1の間には、所定の時点をつなぐ線分Lが表示されている。
そして、変形例2に係る音・映像データ再生装置400bにおいては、時間軸が異なる2以上の音画像配置図A1が表示装置300に表示されるので、例えば、音データの再生速度が変更された場合に、1つの音画像配置図A1の時間軸の縮尺を再生速度に応じて変更することにより、通常再生速度における時間軸の縮尺の音画像配置図A1と変更後の再生速度における時間軸の縮尺の音画像配置図A1とが同時に表示されることになる。より具体的には、音データの再生速度が変更された場合に、1つの音画像配置図A1の時間軸の縮尺のみを再生速度に応じて変更して、他方の音画像配置図A1の時間軸の縮尺を通常再生速度に応じたものとすることにより、再生速度が変更されても、他方の音画像配置図A1においては常に通常再生速度に対応した時間軸の縮尺で音画像Bが表示されることと
なり、再生速度が変更されるたびに音画像配置図A1の時間軸の縮尺が目まぐるしく切り替わることによる眼の疲労を防ぐことができる。
以上に説明した、第2の実施形態の変形例2に係る音・映像データ再生装置400bによれば、第2の実施形態に係る音・映像データ再生装置400と同様の効果が得られるのは勿論のこと、特に、CPU5が生成プログラム7Ebを実行することにより、時間軸の縮尺が異なる2以上の音画像配置図A1が生成され、CPU5が表示制御プログラム70Fを実行することにより、生成された時間軸の縮尺が異なる2以上の音画像配置図A1が同時に表示装置300に表示されるので、ユーザは、目的に応じて、時間軸の縮尺が異なる2以上の音画像配置図A1から所望の音画像配置図A1を選択し、選択した音画像配置図A1から容易に音データの内容を認識することができる。
(変形例3)
第2の実施形態の変形例3に係る音・映像データ再生装置400cでは、生成プログラム7Ecのみが変形されている。
変形例3に係る生成プログラム7Ecは、例えば、第2の実施形態と同様に、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、現時点を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。
さらに、変形例3に係る生成プログラム7Ecは、例えば、CPU5に、横軸が現時点を起点とした相対的な時間軸であって、縦軸方向に時間軸の縮尺が徐々に変化する音画像配置図A1を生成する機能を実現させるプログラムである。CPU5は、かかる生成プログラム7Ecを実行することにより、生成手段として機能する。
次に、変形例3に係る音・映像データ再生装置400cが表示装置300に表示させる合成画像A3について説明する。
変形例3に係る合成画像A3では、第2の実施形態と同様に、表示装置300の画面全体に映像データに基づく映像A2が表示され、表示装置300の画面の所定の部分(例えば、図11では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。また、変形例3に係る音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、現時点を示す指標Sが表示されている。
また、変形例3に係る音画像配置図A1においては、縦軸方向に時間軸の縮尺が徐々に変化し、各音画像Bの横幅がそれに伴って変化するようになっている。例えば、図11に示すように、音画像配置図A1の縦軸方向の上側に向かうにつれて時間軸の縮尺が小さくなるようになっており、各音画像Bの横幅は縦軸方向上側に向かうにつれて小さくなるようになっている。この場合には、音画像Bの形状は縦方向に連続したものとなるため当該形状から音データの強度を認識することはできないが、音画像Bの色及び輝度等から音データの基本周波数,音色(例えば、音声、楽音により異なる)を認識できるようになっている。
以上に説明した、第2の実施形態の変形例3に係る音・映像データ再生装置400cによれば、第2の実施形態に係る音・映像データ再生装置400と同様の効果が得られるのは勿論のこと、特に、CPU5が生成プログラム7Ecを実行することにより、音画像配置図A1の縦軸方向に時間軸の縮尺が変化する音画像配置図A1が生成され、CPU5が表示制御プログラム70Fを実行することにより、生成された縦軸方向に時間軸の縮尺が変化する音画像配置図A1が表示装置300に表示されるので、ユーザは、一つの音画像配置図A1から複数の時間軸の縮尺が異なる音画像配置図A1を認識することができると
ともに、ユーザが、独立して区切られた複数の時間軸の縮尺が異なる音画像配置図A1を見る場合における眼の負担を少なくすることができる。
(変形例4)
第2の実施形態の変形例4に係る音・映像データ再生装置400dでは、生成プログラム7Edのみが変形されている。
変形例4に係る生成プログラム7Edは、例えば、第2の実施形態と同様に、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、現時点を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。
さらに、変形例4に係る生成プログラム7Edは、例えば、CPU5に、時間軸の縮尺が、現時点に近い時間帯(以下、第1の時間帯と称する)から、第1の時間帯よりも現時点から遠い時間帯(以下、第2の時間帯と称する)に向かうにつれて小さくなる音画像配置図A1を生成する機能を実現させるプログラムである。CPU5は、かかる生成プログラム7Edを実行することにより、生成手段として機能する。
次に、変形例4に係る音・映像データ再生装置400dが表示装置300に表示させる合成画像A3について説明する。
変形例4に係る合成画像A3では、第2の実施形態と同様に、表示装置300の画面全体に映像データに基づく映像A2が表示され、表示装置300の画面の所定の部分(例えば、図12では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。また、変形例4に係る音画像配置図A1では、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により分析結果における基本周波数が表現されており、現時点を示す指標Sが表示されている。
また、変形例4に係る音画像配置図A1においては、第1の時間帯における音画像配置図A1の時間軸の縮尺は、第2の時間帯における音画像配置図A1の時間軸の縮尺よりも大きくなるようになっている。
以上に説明した、第2の実施形態の変形例4に係る音・映像データ再生装置400dによれば、第2の実施形態に係る音・映像データ再生装置400と同様の効果が得られるのは勿論のこと、特に、CPU5が生成プログラム7Edを実行することにより、時間軸の縮尺が、第1の時間帯から、この第1の時間帯よりも現時点から遠い第2の時間帯に向かうにつれて小さくなる音画像配置図A1が生成されるので、当該音画像配置図A1から、現時点付近の時間帯(第1の時間帯)の音データの内容を詳細に認識することができるとともに、現時点からより遠い第2の時間帯の音データの内容をおおまかに認識することができる。
(第3の実施形態)
まず、第3の実施形態に係る音・映像データ再生装置500の具体的な構成について図13を参照しながら説明する。音・映像データ再生装置500は、例えば、図13に示すように、記憶部71の構成のみが第2の実施形態に係る音・映像データ再生装置400と異なるので、同一の構成については同一の符号を付するとともに説明を省略する。
記憶部71は、例えば、プログラムやデータ等が予め記憶されている記録媒体(図示せず)を有しており、この記録媒体は、例えば、半導体メモリ等で構成されている。また、記憶部71は、CPU5が音・映像データ再生装置500全体を制御する機能を実現させ
るための各種データ,各種処理プログラム,これらプログラムの実行により処理されたデータ等を記憶する。より具体的には、記憶部71は、例えば、図13に示すように、再生用音データ抽出プログラム7A,再生用映像データ抽出プログラム70H,可視化用音データ抽出プログラム7B,目印時点決定プログラム71J,サムネイル画像抽出プログラム71K,分析プログラム7C,画像化プログラム7D,生成プログラム71E,合成プログラム71I,表示制御プログラム70F,可視化パラメータ決定プログラム7G,再生制御プログラム71L等を格納している。
目印時点決定プログラム71Jは、例えば、CPU5に、音画像配置図A1に合成される目印Mの時間軸に対する位置(目印時点)を決定する機能を実現させるプログラムである。より具体的には、目印時点決定プログラム71Jは、CPU5に、例えば、音の強度について音データを分析して音の強度が急激に変化する時点などを目印時点として決定する機能を実現させるプログラムである。
サムネイル画像抽出プログラム71Kは、例えば、CPU5に、映像データ記憶部9を検索して、所定の時点における代表映像データを抽出する機能を実現させるプログラムである。ここで、所定の時点とは、例えば、場面が変化する時点や、CPU5が目印時点決定プログラム71Jを実行することにより決定される目印時点等である。CPU5は、かかるサムネイル画像抽出プログラム71Kを実行することにより、代表映像データ抽出手段として機能する。
生成プログラム71Eは、例えば、CPU5に、画像化プログラム7Dを実行することにより、分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、現時点を示す指標Sを音画像配置図A1に合成する機能を実現させるプログラムである。
また、生成プログラム71Eは、例えば、CPU5に、目印時点を表す目印Mを音画像配置図A1に合成する機能を実現させるプログラムである。ここで、音画像配置図A1に合成された目印Mは、ユーザが当該目印Mに対応する操作部3の操作ボタンを押下することにより選択され、ユーザが選択した目印Mの目印時点を新たな再生開始時点とする操作信号を入力するためのものである。CPU5は、かかる生成プログラム71Eを実行することにより生成手段として機能する。
合成プログラム71Iは、例えば、CPU5に、生成した音画像配置図A1と映像データ記憶部9に記憶された映像データに基づく映像A2とサムネイル画像抽出プログラム71Kを実行することにより抽出した代表映像データに基づく画像A4とを、現時点を起点とした相対的な時間軸に対応付けて合成する機能を実現させるプログラムである。CPU5は、かかる合成プログラム71Iを実行することにより、合成手段として機能する。
再生制御プログラム71Lは、例えば、CPU5に、音画像配置図A1に表示された目印Mに対応する操作部3の操作ボタンがユーザにより選択されて、選択された目印Mの目印時点を新たな再生開始時点とする操作信号が入力された際に、当該再生開始時点から音データの再生を開始する機能を実現させるプログラムである。CPU5は、かかる再生制御プログラム71Lを実行することにより、再生制御手段として機能する。
次に、上述のような構成の音・映像データ再生装置500における音データの可視化動作(再生動作)を図14に示すフローチャートを参照しながら説明する。
まず、CPU5は、再生用音データ抽出プログラム7A及び再生用映像データ抽出プログラム70Hを実行することにより、操作部3から入力される操作信号に基づいて、音データ記憶部2を検索して再生する音データを抽出するとともに、映像データ記憶部9を検索して再生する映像データを抽出する(ステップS201)。
次に、CPU5は、可視化用音データ抽出プログラム7Bを実行することにより、操作部3から入力された操作信号に基づいて音データ記憶部2を検索し、音画像Bを生成するのに必要な所定時間分の音データ、例えば、現時点を含む現時点よりも遅い時点までの所定時間分の音データを抽出する(ステップS202)。
次に、CPU5は、分析プログラム7Cを実行することにより、ステップS202において抽出した音データを分析する(ステップS203)。
次に、CPU5は、目印時点決定プログラム71Jを実行することにより、再生開始時点となる目印時点を決定する(ステップS204)。
次に、CPU5は、サムネイル画像抽出プログラム71Kを実行することにより、代表映像データを抽出する(ステップS205)。
次に、CPU5は、画像化プログラム7Dを実行することにより、ステップS203において音データを分析した結果を分析結果に対応して予め設定された画像データに変換する(ステップS206)。
次に、CPU5は、生成プログラム71Eを実行することにより、ステップS206において分析結果を画像化して得られた画像データに基づく音画像Bを現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図A1を生成するとともに、音画像配置図A1に現在再生されている音データの音画像Bの音画像配置図A1における位置(現時点)を示す指標S及び、目印時点を示す目印Mを合成する(ステップS207)。
次に、CPU5は、合成プログラム71Iを実行することにより、ステップS207において生成した音画像配置図A1と、ステップS201において抽出した映像データに基づく映像A2と、ステップS205において抽出した代表映像データに基づく画像A4とを、現時点を起点とした相対的な時間軸に対応付けて合成した合成画像A3を生成する(ステップS208)。
次に、CPU5は、ステップS201において抽出した再生用音データに基づく音を音出力装置200に出力させるとともに、表示制御プログラム70Fを実行して、ステップS208において生成した合成画像A3を表示装置300に表示させる(ステップS209)。
ステップS209において、表示装置300に表示される合成画像A3の一例を図15に示す。図15において、表示装置300の画面全体に映像データに基づく映像A2が表示され、表示装置300の画面の所定の部分(例えば、図15では、下部部分)に、映像データに基づく映像A2の上に重ねるようにして音画像配置図A1が表示されている。また、音画像配置図A1において、例えば、横軸が時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音画像Bの大きさ及び形により音の強度及び音色が表現され、各音画像Bの色により分析結果における基本周波数が表現されており、現時点を示す指標Sが表示されている。
また、音画像配置図A1には、目印時点を示す目印Mが時間軸に沿って表示されている。目印Mは、例えば、A,B,C・・・などのアルファベット表示や数字表示で示され、ユーザが目印Mに対応する操作部3の操作ボタンを選択することにより目印Mが選択されるようになっている。
また、合成画像A3において、例えば、音画像配置図A1の時間軸方向に沿って、代表
映像データに基づく画像A4が表示されている。図15においては、代表映像データとして目印時点に対応する映像データが抽出されており、目印Mの上側に対応する代表映像データに基づく画像A4が表示されている。
次に、第3の実施形態に係る音・映像データ再生装置500における音データ及び映像データの再生制御動作について図16に示すフローチャートを参照しながら説明する。
ユーザにより操作部3が操作されて目印Mが選択され、当該目印Mの目印時点を新たな再生開始時点とする操作信号が入力されると(ステップS301)、CPU5は、再生制御プログラム71Lを実行することにより、当該再生開始時点から音データ及び映像データの再生を開始する(ステップS302)。
以上に説明した、第3の実施形態に係る音・映像データ再生装置500によれば、第2の実施形態に係る音・映像データ再生装置400と同様の効果が得られるのは勿論のこと、特に、ユーザに操作されることにより、操作信号を出力する操作部3を備え、CPU5が生成プログラム71Eを実行することにより、音画像配置図A1に、再生開始時点を示す目印Mが合成され、CPU5が再生制御プログラム71Lを実行することにより、操作部3から出力される目印Mを選択する操作信号に基づいて、目印Mに示される再生開始時点から出力が開始されるので、ユーザは音画像配置図A1における目印Mを選択するだけで、所望の時間の音データを容易に再生させることができる。
また、CPU5がサムネイル画像抽出プログラム71Kを実行することにより、映像データ記憶部9から、所定の時点における代表映像データが抽出され、CPU5が合成プログラム71Iを実行することにより、生成した音画像配置図A1と映像データ記憶部9に記憶された映像データに基づく映像A2と抽出した代表映像データに基づく画像A4とが現時点を起点とした相対的な時間軸に対応付けられて合成されるので、音画像配置図A1に代表映像データに基づく画像A4が表示されることとなって、ユーザは、音画像配置図A1に表示された代表映像データに基づく画像A4により所望の音データの音画像配置図A1における場所をより容易に認識することができ、所望の時間の音データをさらに容易に再生させることができる。
なお、本実施形態において、CPU5が目印時点決定プログラム71Jを実行することにより決定する目印時点として、音の強度について音データを分析して音の強度が急激に変化する時点を例示したが、これに限られるものではなく、例えば、目印時点は、所定時間間隔ごとに決定されてもよい。
(第4の実施形態)
第4の実施形態では、本発明に係る記録媒体としてDVD600を例示して説明する。
図17に第4の実施形態に係るDVD600のデータ構造を示す。第4の実施形態に係るDVD600のデータ構造は、図4に示すように階層構造をとっており、例えば、標準規格の一つであるISO9660及びユニバーサルディスクフォーマット(UDF)ブリッジに準拠して定められている。そして、DVD600に記録されるデータは、リードインエリア601,ボリューム/ファイル構造エリア602,DVDビデオエリア603,他記録エリア604,リードアウトエリア605等の複数のエリアから構成される。
そして、DVD600は、DVDビデオエリア603に映像データ及び音データを記憶している。また、DVD600は、音データを所定の分析条件で分析した分析結果を画像データに変換して、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図データ606をメタデータとして他記録エリア604に記憶している。より具体的には、DVD600は、例えば、図4(b),(c)に示すような音画像配置図A1の音画像配置図データ606をメタデータとして他記録エリア604に記憶している。
以上に説明した、第4の実施形態に係るDVD600によれば、当該DVD600に、音画像配置図データ606がメタデータとして記憶されるので、再生装置(例えば、音データ再生装置100等)に分析手段,画像化手段,生成手段を備えずとも、当該DVD600に記憶されている音画像配置図データ606を再生することにより、音画像配置図A1を表示装置300に表示させることができる。
なお、本実施形態において、音画像配置図A1は、映像データに基づく映像A2の上に重ねられて表示されることとしたが、表示装置300の画面が音画像配置図A1が表示される部分と映像A2が表示される部分とに分けられてもよい。
また、本実施形態では、音画像配置図A1は、現時点を含む過去から未来の時間帯の音画像Bを含むこととしたが、現時点を含む現時点から過去の時間帯の音画像Bを含むものであってもよいし、現時点を含む現時点から未来の時間帯の音画像Bを含むものであってもよい。
また、変形例1〜4は、音データのみを再生する音データ再生装置100に適用されてもよい。
また、音データ再生装置100及び音・映像データ再生装置400,500に音出力装置200及び表示装置300が音出力部及び表示部として一体型で備えられてもよい。
また、音画像配置図A1における現時点を表すものとして指標Sを例示したが、現時点が認識できる表示であればなんであってもよく、例えば、音画像配置図A1に再生時間が表示されてもよい。
本発明の第1の実施形態に係る音データ再生装置の請求項2に対応する構成を説明する図である。 本発明の第1の実施形態に係る音データ再生装置の要部構成を説明するブロック図である。 本発明の第1の実施形態に係る音データ再生装置の動作を説明するフローチャートである。 本発明の第1の実施形態に係る音データ再生装置により音データを分析した分析結果の一例を説明する図(図4(a))及び本発明の第1の実施形態に係る音画像配置図の一例を示す図(図4(b),図4(c),図4(d))である。 本発明の第2の実施形態に係る音・映像データ再生装置の請求項3に対応する構成を説明する図である。 本発明の第2の実施形態に係る音・映像データ再生装置の要部構成を説明するブロック図である。 本発明の第2の実施形態に係る音・映像データ再生装置の動作を説明するフローチャートである。 本発明の第2の実施形態に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第2の実施形態の変形例1に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第2の実施形態の変形例2に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第2の実施形態の変形例3に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第2の実施形態の変形例4に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第3の実施形態に係る音・映像データ再生装置の要部構成を説明するブロック図である。 本発明の第3の実施形態に係る音・映像データ再生装置の動作を説明するフローチャートである。 本発明の第3の実施形態に係る音・映像データ再生装置が表示装置に表示させる合成画像の一例を示す図である。 本発明の第3の実施形態に係る音・映像データ再生装置の動作を説明するフローチャートである。 本発明の第4の実施形態に係る記録媒体のデータ構造の一例を示す図である。
符号の説明
2 音データ記憶部(音データ記憶手段)
3 操作部
5 CPU(分析手段,画像化手段,生成手段,表示制御手段,合成手段,代表映像データ
抽出手段,再生制御手段)
7C 分析プログラム(分析手段)
7D 画像化プログラム(画像化手段)
7E,7Ea,7Eb,7Ec, 7Ed,71E 生成プログラム(生成手段)
7F,70F 表示制御プログラム(表示制御手段)
70I,71I 合成プログラム(合成手段)
71K サムネイル画像抽出プログラム(代表映像データ抽出手段)
71L 再生制御プログラム(再生制御手段)
9 映像データ記憶部(映像データ記憶手段)
100 音データ再生装置(再生装置)
200 音出力装置(音出力部)
300 表示装置(表示部)
400,400a,400b,400c,400d,500 音・映像データ再生装置(再
生装置)
600 DVD(記録媒体)
606 音画像配置図データ
A1 音画像配置図
A2 映像
A3 合成画像
A4 画像
B 音画像
M 目印
S 指標

Claims (8)

  1. 蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
    音データを記憶する音データ記憶手段と、
    前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
    前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
    前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
    音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
    前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
    前記生成手段は、
    前記音データの再生速度に応じて、前記音画像配置図の前記時間軸の縮尺を変更することを特徴とする再生装置。
  2. 蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
    音データを記憶する音データ記憶手段と、
    前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
    前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
    前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
    音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
    前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
    前記生成手段は、前記時間軸の縮尺が異なる2以上の前記音画像配置図を生成し、
    前記表示制御手段は、前記生成手段により生成された前記時間軸の縮尺が異なる2以上の前記音画像配置図を同時に表示部に表示させることを特徴とする再生装置。
  3. 蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
    音データを記憶する音データ記憶手段と、
    前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
    前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
    前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
    音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
    前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
    前記生成手段は、横軸が前記時間軸であって、縦軸方向に前記時間軸の縮尺が変化する前記音画像配置図を生成し、
    前記表示制御手段は、前記生成手段により生成された前記縦軸方向に前記時間軸の縮尺が変化する前記音画像配置図を表示部に表示させることを特徴とする再生装置。
  4. 蓄積された音データ又は外部から逐次入力される音データに基づく音を再生して音出力部から出力する再生装置において、
    音データを記憶する音データ記憶手段と、
    前記音データ記憶手段に記憶された音データを、所定の分析条件に従って分析する分析手段と、
    前記分析手段による分析結果を、分析結果に対応して予め設定された画像データに変換する画像化手段と、
    前記画像化手段により画像化された画像データに基づく音画像を、現時点を起点とした相対的な時間軸に対応付けて配置した音画像配置図を生成する生成手段と、
    音データに基づく音が前記音出力部から出力される際に、前記生成手段により生成された音画像配置図を表示部に表示させる表示制御手段と、を備え、
    前記音画像配置図は、現時点において前記音出力部から出力される音に対応する音画像が認識可能であり、且つ、現時点を含む現時点から過去の時間帯、現時点を含む現時点から未来の時間帯、現時点を含む過去から未来の時間帯の3つの時間帯のうち、何れかの時間帯における音画像を含み、
    前記生成手段は、前記時間軸の縮尺が、第1の時間帯から、この第1の時間帯よりも現時点から遠い第2の時間帯に向かうにつれて小さくなる音画像配置図を生成することを特徴する再生装置。
  5. 前記音データと関連付けて映像データを記憶する映像データ記憶手段と、
    前記生成手段により生成された音画像配置図と前記映像データ記憶手段に記憶された映像データに基づく映像とを合成した合成画像を生成する合成手段と、を備え、
    前記表示制御手段は、
    音データに基づく音が前記音出力部から出力される際に、前記合成手段により生成された合成画像を表示部に表示させることを特徴とする請求項1〜4の何れか一項に記載の再生装置。
  6. 前記映像データ記憶手段から、所定の時点における代表映像データを抽出する代表映像データ抽出手段を備え、
    前記合成手段は、
    前記生成手段により生成された音画像配置図と前記映像データ記憶手段に記憶された映像データに基づく映像と前記代表映像データ抽出手段により抽出された代表映像データに基づく画像とを、現時点を起点とした相対的な時間軸に対応付けて合成することを特徴とする請求項に記載の再生装置。
  7. 前記生成手段は、前記音画像配置図に、現時点を示す指標を合成することを特徴とする請求項1〜6の何れか一項に記載の再生装置。
  8. ユーザに操作されることにより、操作信号を出力する操作部を備え、
    前記生成手段は、
    前記音画像配置図に、再生開始時点を示す目印を合成し、
    前記操作部から出力される前記目印を選択する操作信号に基づいて、前記目印に示される再生開始時点から音データの再生を開始する再生制御手段を備えることを特徴とする請求項1〜7の何れか一項に記載の再生装置。
JP2005282220A 2005-09-28 2005-09-28 再生装置 Active JP4543261B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005282220A JP4543261B2 (ja) 2005-09-28 2005-09-28 再生装置
US11/527,554 US8744244B2 (en) 2005-09-28 2006-09-27 Reproducing apparatus, reproducing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005282220A JP4543261B2 (ja) 2005-09-28 2005-09-28 再生装置

Publications (2)

Publication Number Publication Date
JP2007093925A JP2007093925A (ja) 2007-04-12
JP4543261B2 true JP4543261B2 (ja) 2010-09-15

Family

ID=37894084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005282220A Active JP4543261B2 (ja) 2005-09-28 2005-09-28 再生装置

Country Status (2)

Country Link
US (1) US8744244B2 (ja)
JP (1) JP4543261B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100782825B1 (ko) * 2005-12-01 2007-12-06 삼성전자주식회사 오디오 컨텐츠 선택 정보 제공 방법 및 장치와 그 방법을수행하는 프로그램이 기록된 기록매체
JP4945236B2 (ja) * 2006-12-27 2012-06-06 株式会社東芝 映像コンテンツ表示装置、映像コンテンツ表示方法及びそのプログラム
KR101437653B1 (ko) * 2007-01-26 2014-09-12 삼성전자주식회사 재생시점 변경용 gui 제공방법 및 이를 적용한 영상기기
IL182391A0 (en) * 2007-04-10 2007-07-24 Nario C System, method and device for presenting video signals
US9377990B2 (en) * 2007-09-06 2016-06-28 Adobe Systems Incorporated Image edited audio data
JP4856105B2 (ja) * 2008-01-31 2012-01-18 株式会社東芝 電子機器および表示処理方法
JP4618384B2 (ja) * 2008-06-09 2011-01-26 ソニー株式会社 情報提示装置および情報提示方法
US8560969B2 (en) * 2008-06-26 2013-10-15 Landmark Graphics Corporation Systems and methods for imaging operations data in a three-dimensional image
JP5643821B2 (ja) * 2010-06-18 2014-12-17 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声制御装置及び音声制御方法
JP5754119B2 (ja) * 2010-12-07 2015-07-29 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
KR102084630B1 (ko) * 2012-07-26 2020-03-05 삼성전자주식회사 질문 메시지 전송 방법 및 이를 위한 디스플레이 장치, 정보 공유 방법 및 모바일 기기
US9195569B2 (en) * 2013-01-28 2015-11-24 Nintendo Co., Ltd. System and method to identify code execution rhythms
US10809966B2 (en) * 2013-03-14 2020-10-20 Honeywell International Inc. System and method of audio information display on video playback timeline
CN104683933A (zh) 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
JP6062474B2 (ja) * 2015-03-20 2017-01-18 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
WO2017136854A1 (en) * 2016-02-05 2017-08-10 New Resonance, Llc Mapping characteristics of music into a visual display
JP6334584B2 (ja) * 2016-02-24 2018-05-30 株式会社東芝 表示制御装置、表示制御方法およびプログラム
US10423320B2 (en) * 2017-11-13 2019-09-24 Philo, Inc. Graphical user interface for navigating a video
US10165388B1 (en) * 2017-11-15 2018-12-25 Adobe Systems Incorporated Particle-based spatial audio visualization
BR102017026251A2 (pt) * 2017-12-05 2019-06-25 Samsung Eletrônica da Amazônia Ltda. Método e sistema de reconhecimento de dados de sensor utilizando o enriquecimento de dados para o processo de aprendizagem
JP7069904B2 (ja) * 2018-03-19 2022-05-18 京セラドキュメントソリューションズ株式会社 情報処理装置
JP7196675B2 (ja) * 2019-02-19 2022-12-27 京セラドキュメントソリューションズ株式会社 表示装置
CN113113043B (zh) * 2021-04-09 2023-01-13 中国工商银行股份有限公司 语音转图像方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231498A (ja) * 1987-03-20 1988-09-27 松下技研株式会社 音声編集装置
JPH07243871A (ja) * 1994-03-03 1995-09-19 Hioki Ee Corp 波形記録装置
JPH10133679A (ja) * 1996-10-31 1998-05-22 Sharp Corp 音声情報処理装置
JPH1115488A (ja) * 1997-06-24 1999-01-22 Hitachi Ltd 合成音声評価・合成装置
JP2001282299A (ja) * 2000-04-03 2001-10-12 Nippon Columbia Co Ltd オーディオデータ編集装置
JP2003216200A (ja) * 2002-01-28 2003-07-30 Telecommunication Advancement Organization Of Japan 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548346A (en) * 1993-11-05 1996-08-20 Hitachi, Ltd. Apparatus for integrally controlling audio and video signals in real time and multi-site communication control method
US5835667A (en) * 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
JP3565228B2 (ja) 1994-12-21 2004-09-15 日本電信電話株式会社 音可視化方法および装置
JP3623820B2 (ja) 1995-04-24 2005-02-23 株式会社ジャストシステム 音声処理装置
JPH08317365A (ja) 1995-05-22 1996-11-29 Matsushita Electric Ind Co Ltd 電子会議装置
JPH0990937A (ja) 1995-09-28 1997-04-04 Kawai Musical Instr Mfg Co Ltd ピアノ用の金属部品
JPH10191248A (ja) 1996-10-22 1998-07-21 Hitachi Denshi Ltd 映像編集方法およびその方法の手順を記録した記録媒体
JPH11109988A (ja) 1997-10-03 1999-04-23 Nippon Telegr & Teleph Corp <Ntt> 音情報可視化方法及び装置及び音情報可視化プログラムを格納した記憶媒体
US20020036694A1 (en) * 1998-05-07 2002-03-28 Merril Jonathan R. Method and system for the storage and retrieval of web-based educational materials
JP2000330600A (ja) 1999-05-20 2000-11-30 Nippon Telegr & Teleph Corp <Ntt> 音声可視化方法、可視化された音声情報の操作方法、これらの装置、及び、これらの方法を記録した記憶媒体
US6539354B1 (en) * 2000-03-24 2003-03-25 Fluent Speech Technologies, Inc. Methods and devices for producing and using synthetic visual speech based on natural coarticulation
US20040125124A1 (en) * 2000-07-24 2004-07-01 Hyeokman Kim Techniques for constructing and browsing a hierarchical video structure
JP4239074B2 (ja) 2003-07-11 2009-03-18 ソニー株式会社 情報信号再生装置および情報信号再生方法
JP4727342B2 (ja) * 2004-09-15 2011-07-20 ソニー株式会社 画像処理装置、画像処理方法、画像処理プログラム及びプログラム格納媒体
US7945142B2 (en) * 2006-06-15 2011-05-17 Microsoft Corporation Audio/visual editing tool

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63231498A (ja) * 1987-03-20 1988-09-27 松下技研株式会社 音声編集装置
JPH07243871A (ja) * 1994-03-03 1995-09-19 Hioki Ee Corp 波形記録装置
JPH10133679A (ja) * 1996-10-31 1998-05-22 Sharp Corp 音声情報処理装置
JPH1115488A (ja) * 1997-06-24 1999-01-22 Hitachi Ltd 合成音声評価・合成装置
JP2001282299A (ja) * 2000-04-03 2001-10-12 Nippon Columbia Co Ltd オーディオデータ編集装置
JP2003216200A (ja) * 2002-01-28 2003-07-30 Telecommunication Advancement Organization Of Japan 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム

Also Published As

Publication number Publication date
US20070071413A1 (en) 2007-03-29
US8744244B2 (en) 2014-06-03
JP2007093925A (ja) 2007-04-12

Similar Documents

Publication Publication Date Title
JP4543261B2 (ja) 再生装置
JP4834640B2 (ja) 電子機器および画像表示制御方法
JP5057918B2 (ja) 電子機器およびシーン種類表示方法
JP4496264B2 (ja) 電子機器及び映像表示方法
JP4491700B2 (ja) 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
JP4305269B2 (ja) 信号処理装置及び方法
JP4856105B2 (ja) 電子機器および表示処理方法
JP2009088978A (ja) 電子機器および画像表示制御方法
KR101374353B1 (ko) 음향 재생 장치
JP2007067595A (ja) 番組情報の通知方法
JP5422056B2 (ja) 楽曲情報処理装置及び方法、コンピュータプログラム並びに記録媒体
JP2014035436A (ja) 音声処理装置
JP5949720B2 (ja) 歌唱結果表示装置、プログラム
JP2010154342A (ja) 電子機器および映像コンテンツ情報表示方法
JP5012644B2 (ja) プレゼンテーション記録装置、プレゼンテーション再生装置及びプログラム
JP4230402B2 (ja) サムネイル画像抽出方法、装置、プログラム
KR101648711B1 (ko) 스크립트를 기반으로 하는 동영상 부가정보 처리 장치 및방법
JP2010152287A (ja) 自動演奏同期装置、自動演奏鍵盤楽器およびプログラム
KR20110132066A (ko) 영상표시기기의 영상 검색 장치 및 방법
JP2005250242A (ja) 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体
JP2017092832A (ja) 再生方法および再生装置
JP2009135754A (ja) ダイジェスト作成装置及び方法
JP2005249872A (ja) 音楽再生パラメータ設定装置および音楽再生パラメータ設定方法
JP5867456B2 (ja) 演奏情報表示装置、プログラム。
JP2017108198A (ja) 楽譜表示システム、動画データ供給装置、楽譜データ供給装置、及び画像表示装置、並びに楽譜表示プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070601

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100525

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350