JP4382045B2 - データ出力装置、データ出力方法、データ出力プログラム、および記録媒体 - Google Patents

データ出力装置、データ出力方法、データ出力プログラム、および記録媒体 Download PDF

Info

Publication number
JP4382045B2
JP4382045B2 JP2006015076A JP2006015076A JP4382045B2 JP 4382045 B2 JP4382045 B2 JP 4382045B2 JP 2006015076 A JP2006015076 A JP 2006015076A JP 2006015076 A JP2006015076 A JP 2006015076A JP 4382045 B2 JP4382045 B2 JP 4382045B2
Authority
JP
Japan
Prior art keywords
data
audio
audio data
output
electronic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006015076A
Other languages
English (en)
Other versions
JP2007200390A (ja
Inventor
充臣 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006015076A priority Critical patent/JP4382045B2/ja
Priority to US11/656,483 priority patent/US7933671B2/en
Priority to EP07250269.3A priority patent/EP1811523B1/en
Publication of JP2007200390A publication Critical patent/JP2007200390A/ja
Application granted granted Critical
Publication of JP4382045B2 publication Critical patent/JP4382045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B2020/10935Digital recording or reproducing wherein a time constraint must be met
    • G11B2020/10972Management of interruptions, e.g. due to editing

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、コンテンツデータを出力するデータ出力装置、データ出力方法、データ出力プログラム、および記録媒体に関する。
各種記録媒体の急速な発展に伴い、一般的に扱うことのできる情報量は飛躍的に向上している。かつては、磁気テープ、フロッピー(登録商標)ディスク、あるいはROM(Read Only Memory)に焼きこんでいた数メガの情報を利用して、音楽やゲーム等が販売されていた。一方、今日では、CD−R(Compact Disc Recordable)、DVD(Digital Video Disc)といった記録媒体によって、その豊富な記憶容量を活かした多種多様な情報が流通している。
記憶媒体の容量が増大したことを受けて、単純な写真集形式の静止画コンテンツに対してBGM(BackGround Music)を付加すること、あるいは、電子書籍、電子文書、ウェブ文書などの表示と同時に、音声データを再生させることなども、技術的に可能になっている。
このような電子的なコンテンツにおいて、音声データの取り扱いは、コンテンツ作成者の意図に反して、そのコンテンツを実際に再生するプレイヤーに依存する場合が多かった。
そこで、ユーザの手を煩わせることなく、長時間の連続再生を実現した技術が、たとえば特許文献1で開示されている。特許文献1の技術では、複数のプレイヤーを交互に利用することによって、ユーザの操作なく音声データを出力し続けることが可能となる。
また、音声データ間の無音状態を回避する技術が、特許文献2に開示されている。特許文献2の技術では、前後の曲に連続性が認められた時に、その曲間を無くして連続的に演奏する。したがって、曲間がほぼない状態で、次の曲を聴くことができる。
また、映像と音声の対応付けに関する技術が、特許文献3に開示されている。特許文献2の技術では、ビデオと音声とを対応付けした映像コンテンツにおいて、実際に音声を対応付けるオーサリング作業を効率化する。さらに、設定した時間だけBGMを再生する。これらにより、情報が目まぐるしく変化するビデオデータに対して、音声データが断続的に途切れてしまうことを防ぐことができる。
特開昭62−34356(1987年2月14日公開) 特開2005−44409(2005年2月17日公開) 特開2004−95100(2004年3月25日公開)
上述した各文献においては、異なる音声データをいかに連続して演奏するか、という部分に着目して問題を解決している。しかし、異なるデータ形式間の対応付けによって生じる、再生時間のずれについては考慮していない。
ビデオデータ等と異なり、電子文書や電子書籍などの文字ベースのデータは、読み進めるペースに個人差がある。そのため、再生時間を一意に決定できない。これにより、再生時間が足りずに音声データが終了してしまうことがある。また、コンテンツ作成者の意図しない部分において、演奏が中断される可能性もある。
前者の問題に関しては、設定された音声データを再び最初から再生することによって回避することができる。これは既存の技術として存在している。これに対して後者の問題は、さらに二つの状況に区別することができる。それは、中断する部分が明示的であるか非明示的であるかの違いである。
明示的に場面、状態、またはファイルが変更される場合、従来では、いったん再生を中断してから、再度、次の音声を再生させている。この場合、ユーザにとっては、コンテンツの区切りとBGMの区切りとは連動している。そのため、たとえば両者が同じ曲であっても、特に違和感はない。
一方、作成されたコンテンツファイルに、非明示的なグループ、ファイル、段落等の区切りが存在する場合がある。この区切りは、完成したコンテンツを閲覧する上では判断できない。ここで、区切られたそれぞれに対して、BGMが設定されているとする。このとき、従来技術のように、一時停止後に再生する処理を行うと、ユーザは、コンテンツの区切りを認識できない。そのため、ユーザが予期せぬ時点でBGMが中断され、再び再生される。このときユーザは、BGMを連続して再生されるものと思っているので、違和感を覚えることになる。
この問題について、図11を参照してより詳しく説明する。図11は、従来技術において生ずる、BGMの不連続再生を説明する図である。この図の110に示すように、表示装置112は、ページ画像113を表示している。このとき図示しないスピーカが、BGM115を鳴らしている。
ここで、ユーザが、表示する画像をページ画像113からページ画像114に切り替えるように、表示装置112に指示したとする。これにより、表示装置112は、表示する画像をページ画像113からページ画像114に切り替える。一方、スピーカは、BGM115の再生をいったん停止する。そして、表示装置112がページ画像114を表示するとき、ふたたび、BGM115を鳴らす。そのため、表示画像がページ画像113からページ画像114に切り替わるとき、BGM115が不連続に再生される。
また、閲覧するスピードが速ければ速いほど、非明示的な区切りに到達するまでの時間は短くなる。また、到達する頻度も高くなる。このとき、区切りごとに停止、再生の処理を繰り返すと、BGMが実際に再生される時間は、極端に短くなる。したがって、BGMとしての効果は、ほとんど得られない。
本発明は上記の課題を解決するためになされたものであり、その目的は、ユーザが認識できない(もしくは、あまり意識することのない)、コンテンツの再生が切り替わる時点において、連続して再生されるべき同一の音声の再生がいったん停止し、再び行われるといった、不自然な音声再生を防止するデータ出力装置、データ出力方法、データ出力プログラム、および記録媒体を提供することにある。
本発明に係るデータ出力装置は、上記の課題を解決するために、
コンテンツを表す電子データをコンテンツ再生装置に出力する電子データ出力手段と、
上記電子データに関連付けられている、音声を表す音声データを音声再生装置に出力する音声データ出力手段と、
上記電子データ出力手段が、上記コンテンツ再生装置に出力する上記電子データを、上記電子データと異なる他の電子データに切り替えたときに、上記音声データと、上記他の電子データに関連付けられている他の音声データとが同一であるか否かを判定する同一性判定手段とを備え、
上記音声データ出力手段は、
上記同一性判定手段が、上記音声データと上記他の音声データとを同一であると判定したとき、上記音声データを上記音声出力装置に出力し続けることを特徴としている。
上記の構成によれば、電子データ出力手段は、コンテンツを表す電子データをコンテンツ再生装置に出力する。ここでいう「コンテンツ」は、たとえば画像または動画である。そのため、電子データは、画像を表す電子データであったり、または動画を表す動画データであったりする。
コンテンツ再生装置は、入力された電子データに基づき、コンテンツを再生する。たとえば画像データが入力されると、画像を画面に表示する。動画データが入力されると、動画を画面に表示する。
音声データ出力手段は、音声データを音声再生装置に出力する。この音声データは、電子データに関連付けられているものである。具体的には、電子データ出力手段による電子データの出力に連動して、同時に出力されるように、関連付けられている。
音声データは、音声を表すデータである。この音声は、たとえば、BGMや効果音など、繰り替えし連続して発せられることを前提としたものである。音声再生装置は、音声データが入力されると、BGMなどの音声を再生する。
以上の処理により、データ出力装置が電子データおよび音声データを出力すると、コンテンツ再生装置がコンテンツを再生すると同時に、音声再生装置が音声を再生する。したがってユーザは、コンテンツ再生装置を通じて画像や動画などのコンテンツを視認するとともに、コンテンツに関連する音声を音声再生装置を通じて耳にする。
ここで、電子データ出力手段は、コンテンツ再生装置に出力する電子データを、異なる他の電子データに切り替えることができる。ここでいう「他の電子データ」には、他の音声データが関連付けられている。
電子データ出力手段による電子データ出力の切り替えが生じたとき、データ出力装置では、同一性判定手段が、音声データ出力手段が現在出力中の音声データと、上述した他の音声データとを比較する。これにより、音声データと、他の音声データとが同一であるか否かを判定する。
音声データ出力手段は、同一性判定手段による判定結果に基づき、音声データの出力を制御する。具体的には、同一性判定手段によって、上述した両音声データが互いに同じデータであると判定されたら、現在出力している音声データを、そのまま音声出力装置に出力し続ける。これにより、電子データの出力が切り替わったとしても、音声データの出力は切り替わらない。したがって、画像の表示が異なる他の画像に切り替わったり、動画の再生が他の異なる動画に切り替わったりしたとしても、音声の再生は継続する。
これにより、コンテンツの再生が切り替わる時点において、連続して再生されるべき同一の音声の再生がいったん停止し、再び行われるといった、不自然な音声再生を防止できる効果を奏する。したがってユーザは、コンテンツを切り替えて閲覧するとき、同じ音声(たとえばBGM)を連続して聞き続けることができる。すなわちデータ出力装置は、コンテンツに対応付けられた音声が有する効果(たとえば雰囲気や臨場感)を、ユーザに対して十分に伝えることができる。
本発明に係るデータ出力方法は、上記の課題を解決するために、
コンテンツを表す電子データをコンテンツ再生装置に出力する電子データ出力ステップと、
上記電子データに関連付けられている、音声を表す音声データを音声再生装置に出力する音声データ出力ステップと、
上記コンテンツ再生装置に出力する電子データを、上記電子データと異なる他の電子データに切り替える切り替えステップと、
上記電子データに関連付けられている音声データと、上記他の電子データに関連付けられている他の音声データとが同一であるか否かを判定する同一性判定ステップと、
上記同一性判定ステップにおいて、上記音声データと上記他の音声データとを同一であると判定したとき、上記音声データを上記音声出力装置に出力し続ける音声データ継続出力ステップとを含んでいることを特徴としている。
上記の構成によれば、上述したデータ出力装置1と、同様の作用効果を奏する。
また、本発明に係るデータ出力装置では、さらに、上記同一性判定手段は、上記音声データのファイル名と、上記他の音声データのファイル名とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することが好ましい。あるいは、上記音声データのデータ量と、上記他の音声データのデータ量とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することが好ましい。
または、上記同一性判定手段は、上記音声データの再生時間と、上記他の音声データの再生時間とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することが好ましい。あるいは、上記音声データに含まれている、上記音声データを特定する識別子と、上記他の音声データに含まれている、上記他の音声データを特定する識別子とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することが好ましい。
以上のいずれに処理によっても、同一性判定手段は、音声データ同士の同一性を、より効率よく判定できる。
また、本発明に係るデータ出力装置では、さらに
上記電子データおよび他の電子データは、いずれも音声を表す電子データであることが好ましい。
上記の構成によれば、電子データおよび他の電子データは、いずれも音声を表す電子データである。たとえば、どちらも、ユーザが閲覧する絵画を説明する解説音声を表すデータである。このとき電子データ出力手段が電子データとしての音声データを、音声再生装置としてコンテンツ再生装置に出力する。ユーザによる解説音声の切り替え指示があったとき、データ出力装置は、解説音声データの出力を切り替えるけれども、BGMなどの音声データの出力は継続する。
したがって上記構成のデータ出力装置は、美術館などにおいて、同じBGMを流し続けるとともに、解説音声を絵画別に切り替えるような状況において、好適に使用されうる。
また、本発明に係るデータ出力装置では、さらに
上記電子データ出力手段は、
上記音声を表す電子データおよび他の電子データを、いずれも、上記音声再生装置とは異なる他の音声再生装置に出力することが好ましい。
上記の構成によれば、電子データ出力手段は、音声を表す電子データおよび他の電子データを、いずれも、音声データ出力手段が音声データを出力する先の音声再生装置とは異なる、他の音声再生装置に出力する。これにより、2つの音声が、別々の音声再生装置によって再生され、重ねあわされる。そのため、1つの装置によって同時に2つの音声が発せされる場合に比べて、音声再生の臨場感をより向上させることができる効果を奏する。
また、本発明に係るデータ出力装置では、さらに、
上記コンテンツ再生装置は、上記音声再生装置であり、
上記音声を表す電子データ、上記音声を表す他の電子データ、上記音声データ、および上記他の音声データは、いずれもデジタルデータであり、
上記電子データ出力手段および上記音声データ出力手段は、1つの合成音声データ出力手段を構成し、
上記合成音声データ出力手段は、
上記電子データおよび上記音声データを合成して合成音声データを生成しながら、当該生成した合成音声データを上記音声再生装置に出力している際、上記同一性判定手段によって、上記音声データと上記他の音声データとが同一であると判定されたとき、上記電子データと上記音声データとの合成を停止して上記音声データを出力し続けつつ、上記出力し続ける上記音声データに上記切り替えを指示された上記他の電子データを合成して他の合成音声データを生成しながら、当該生成した他の合成音声データを上記音声再生装置に出力することが好ましい。
上記に構成によれば、データ出力装置は、デジタルデータとしての、たとえば解説音声データおよびBGM音声データを出力する。このとき、両データを合成して出力する。しかも、単に合成するのではなく、上記の構成ではBGM音声データの出力が途切れることなく、解説音声データの切り替えを続けることができる。これにより、連続して再生されるべきBGMが途切れることなく再生されるので、解説音声およびBGMを聴きながら絵画を閲覧している閲覧者に、音声についての違和感を与えることがない。すなわちデータ出力装置は、より音声品質の高いデジタル音声データを音声再生装置に出力する場合であっても、非連続に切り替わる可能性の高い解説音声が切り替わるタイミングにおいて、連続して再生されるべきBGMを中断させることがない。
なお、上記データ出力装置は、コンピュータによって実現してもよい。この場合、コンピュータを上記各手段として動作させることにより上記データ出力装置をコンピュータにおいて実現するデータ出力プログラム、かつ画像そのデータ出力プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
以上のように、本発明に係るデータ出力装置は、電子データ出力手段が、コンテンツ再生装置に出力する電子データを、上記電子データと異なる他の電子データに切り替えたときに、上記音声データと、上記他の電子データに関連付けられている他の音声データとが同一であるか否かを判定する同一性判定手段と、上記同一性判定手段が、上記音声データと上記他の音声データとを同一であると判定したとき、上記音声データを上記音声出力装置に出力し続ける音声データ出力手段とを備えているため、コンテンツの再生が切り替わる時点において、連続して再生されるべき同一の音声の再生がいったん停止し、再び行われるといった、不自然な音声再生を防止する効果を奏する。
本発明の一実施形態について、図1〜図10を参照して説明する。以下の説明では、同一の部材および構成要素には、それぞれ、同一の符号を付してある。それらの名称および機能も、同じである。したがってそれらについての詳細な説明は繰り返さない。
(用語の定義)
まず、本実施形態において用いられる用語の定義について説明する。
「クライアント」とは、本実施形態に係るデータ出力装置1に対して、データ出力装置1が実行する処理を依頼する立場にいるものである。たとえばクライアントは、実際に装置を利用する人間である。または、音声再生の要求を伝達する内外部の演算処理装置である。または、演算処理プログラムである。
「記録手段」は、情報を記録する手段を意味する。記録する情報が検索対象情報の場合、記録手段としては、たとえば主記憶装置やHDD(Hard Disk Drive)、CD−ROM(Compact Disk Read Only Memory)、メモリーカードに代表される外部記憶手段、並びに記録用メディアなどが該当する。
「入力装置」とは、CPUのような演算装置に対し、人間が情報を与える装置を意味する。キーボード、マウス、およびタブレットなど、その形態は問わない。
「入力情報」とは、クライアントによって入力された情報、あるいは記録手段上の記録範囲の情報の少なくともいずれかの情報を意味する。「クライアントによって入力された情報」とは、たとえばキーボードから入力された文字情報や、タブレットで入力されたストローク情報、およびストローク情報が文字認識処理されて得られた文字情報などである。他にも、紙に書かれた文字をカメラなどで撮影した画像や、その画像を文字認識した文字情報などでもある。
「表示装置」とは、CPUのような演算装置から与えられる情報を表示、および伝達する装置を意味する。すなわちディスプレイ全般をはじめ、自動販売機のように信号を受けて物品を供出する装置も該当する。
「表示手段」は、表示範囲を取得すること、および表示範囲の指定を行えるものであれば、その形態は問わない。検索対象情報を別に確保した状態の装置に対して、物理的にその位置を特定させるような場合も、この手段に含むものとする。
「通信装置」は、ゲートウェイ装置やルータまたは専用回線などを指す。処理装置内部にはない情報を、外部から受け取る目的で処理装置との間に設置するものであれば、その形態は問わない。
(データ出力装置1)
本発明に係るデータ出力装置1の構成について、図1を参照して以下に説明する。図1は、本発明に係るデータ出力装置1の要部構成を示すブロック図である。この図に示すように、データ出力装置1は、電子データ出力部10(電子データ出力手段)、同一性判定部11(同一性判定手段)、音声データ出力部12(音声データ出力手段)、操作命令処理部13、データ取得部14、およびコンテンツデータベース15を備えている。
また、データ出力装置1は、操作命令入力装置2、表示装置4(コンテンツ再生装置)、および音声再生装置6に接続されている。操作命令入力装置2は、キーボードやマウスなどのいわゆる入力装置である。クライアント(ユーザ)は操作命令入力装置2を操作することによって、データ出力装置に操作内容を入力する。表示装置4は、データ出力装置から入力された電子データが表すコンテンツを再生する。すなわちコンテンツを画面に表示する。音声再生装置6は、データ出力装置から入力された音声データが表す音声を再生する。
(各装置の外観)
データ出力装置1、操作命令入力装置2、表示装置4、および音声再生装置6の外観について、図2を参照して以下に説明する。図2は、データ出力装置1、操作命令入力装置2、表示装置4、および音声再生装置6の外観を説明する図である。
この図に示すように、データ出力装置1は、一般的なパーソナルコンピュータとして実現できる。また、操作命令出力装置2は、キーボードとして実現できる。操作命令入力装置2は、クライアントによって与えられる操作命令を、操作命令処理部13として機能するCPUに渡す。操作命令には特に指定の形式はなく、操作についての命令を記述きるものであれば、どのようなものでもよい。また、表示装置4は、液晶ディスプレイやプラズマディスプレイなどとして実現できる。また、音声再生装置6は、スピーカとして実現できる。
なお、本実施形態では、図2に示すように、データ出力装置1、操作命令入力装置2、表示装置4、および音声再生装置6が、それぞれ分離された個別の装置として実現されている。しかし、本発明は、このような個別の装置として実現されることに限定されない。たとえば、データ出力装置1、操作命令入力装置2、表示装置4、および音声再生装置6の全てが一体化された構成としても、本発明を実現できる。あるいは、データ出力装置1と、その他の一つ以上の装置が組み合わさった構成であってもよい。
なお、本文中において、データなどを「出力する」という動詞で表現している部分がある。これは実際に主語が目的語に対して働きかける場合のみを指しているわけではない。主語である部分に目的語である部分が働きかけてデータを得る場合も、便宜上「出力する」という言葉で表現している。
(データの表示および再生)
データ出力装置1は、電子データを出力する際に、何かしらのデータの区切りを挟んで、同じ音声データが対応付けされている状況を考慮して、データ出力するタイミングを制御する。具体的には、以下の通りである。
クライアントは、操作命令入力装置2を通じて、コンテンツの再生をデータ出力装置1に指示する。操作命令入力装置2は、入力された指示を操作命令処理部13に出力する。操作命令処理部13は、入力された指示を解釈する。これにより、どのような電子データが必要になるのかを解析し、その解析結果をデータ取得部14に出力する。すなわち、データ取得部14に対して、電子データおよび音声データの取得を指示する。これによりデータ取得部14は、コンテンツデータベース15から、指示された電子データ、および、この電子データに関連付けられている音声データを取得する。
データ取得部14は、取得した電子データを電子データ出力部10に出力する。一方、取得した音声データを、音声データ出力部12に出力する。電子データ出力部10は、入力された電子データを表示装置4に出力する。これにより表示装置4は、電子データが表すコンテンツ(たとえば画像や動画)を再生、すなわち画面に表示する。
音声データ出力部12は、入力された音声データから、所定の音声データ情報を抽出する。この音声データ情報は、音声データについての定量的情報を表すデータである。音声データ出力部12は、抽出した音声データ情報を同一性判定部11に出力する。さらに、もし、現在、何の音声データも出力していないのなら、入力された音声データをそのまま音声再生装置6に出力する。これにより音声再生装置6は、入力された音声データが表すBMGなどの音声を再生する。
(電子データ切り替え時における音声データの比較)
データ出力装置1は、出力する電子データを、他の電子データに切り替えることができる。このときデータ出力装置1は、以下の(1)から(3)の処理を実行する。
(1)データ取得部14は、新たな電子データ、および、新たな電子データに関連付けられた新たな音声データを取得する。
(2)電子データ出力部10が、出力する電子データを新たな電子データのに切り替えるとき、音声データ出力部12は、新たに取得した音声データについての音声データ情報を、同一性判定部11に出力する。
(3)同一性判定部11は、出力中の音声データの音声情報と、(2)の処理において入力された音声データ情報を比較する。同一の音声データ情報であると判定したとき、2つの音声データを同一の音声データであると判定する。これにより音声データ出力部12は、出力中の音声データの出力を継続する。
(データ出力装置1の構成の一例)
データ出力装置1を含んでいるシステムの構成について、図3を参照して以下に説明する。図3は、データ出力装置1を含むシステムの構成を示す図である。この図に示すように、データ出力装置1は、CPU30および主記憶装置31によって構成される。
(CPU30)
CPU(中央処理装置)30は、図1に示す電子データ出力部10、同一性判定部11、音声データ出力部12、操作命令処理部13、およびデータ取得部14として機能する。CPU30は、これらの部材が実行する処理手順を記述したプログラムを、主記憶装置31、外部記憶装置32または、通信装置34を経由したネットワークなどより取得する。なお、データの遣り取りは、有線無線の通信装置などデータを送受信できるものならば、どのようなものを利用してもよい。また、電子データ出力部10、同一性判定部11、音声データ出力部12、操作命令処理部13、およびデータ取得部14による処理手順についても、CPUに限らず、処理手順を実行可能であれば、どのような装置が実行してもよい。
(主記憶装置31)
主記憶装置31は、フラッシュメモリなどの一時記憶装置である。主に、電子データ出力部10、同一性判定部11、音声データ出力部12、操作命令処理部13、およびデータ取得部14が動作手順を読み込ませて情報の取得、抽出、および解析を行う。なお、CPU30に含まれるレジスタ領域なども、主記憶装置31の一種に相当する。
(外部記憶装置32)
外部記憶装置32は、HDD(ハードディスクドライブ)などの取り外し可能な記憶装置である。主に、CPU30が算出した解析結果や、主記憶装置31には一時的に必要のない退避対象のデータを保存する。また、CPU30とネットワーク35とを経由して、有線無線の接続によって利用可能な主記憶装置や外部記憶装置を外部記憶装置32として用いてもよい。
(情報記録媒体33)
情報記録媒体33は、フラッシュメモリやCD−Rなどの、独立した記録媒体であり、コンテンツデータベース15を記憶している。したがって、データ取得部14は、情報記録媒体33にアクセスし、コンテンツデータベース15に接続して、電子データおよび音声データを取得する。なお、コンテンツデータベース15は、外部記憶装置32に記憶されていてもよい。この場合、データ取得部14は、外部記憶装置32にアクセスし、コンテンツデータベース15に接続して、電子データおよび音声データを取得する。
(通信装置34)
通信装置34は、ネットワーク35に接続している。これにより、有線または無線の接続によって、他のネットワーク機器との間でデータのやりとりを行う。データ出力装置1では、データ取得部14は、通信装置34を通じて、ネットワーク35から電子データおよび音声データを取得することもできる。
(電子書籍の表示およびBGMの再生)
データ出力装置1が表示装置4に出力する電子データ、およびこの電子データに関連付けられている音声データの一例について、図4を参照して以下に説明する。図4は、電子データおよび音声データの出力制御の例を表す図である。具体的には、図4(a)は、ページデータ42とBGMデータ44とが関連付けられている状態、および、つぎに出力されるページデータ43と、BGMデータ44とが関連付けられている状態を表す図である。一方、図4(b)は、表示画像がページ画像47からページ画像48に切り替わるとき、BGM49が連続して再生される様子を説明する図である。
コンテンツデータベース15には、図4(a)に示す電子書籍データ40および電子書籍データ41が、あらかじめ記憶されている。図4(a)に示すように、電子書籍データ40は、ページデータ42(電子データ)およびBGMデータ44を含んでいる。すなわち、ページデータ42およびBGMデータ44は、互いに関連付けられている。一方、電子書籍データ41は、ページデータ43(電子データ)およびBGMデータ44を含んでいる。すなわち、ページデータ43およびBGMデータ44は、互いに関連付けられている。
データ出力装置1では、電子データ出力部10がページデータ42を表示装置4に出力する。また、音声データ出力部12がBGMデータ44を音声再生装置6に出力する。これにより、図4(b)の出力状況45に示すように、表示装置4は、ページデータ42が表すページ画像47を画面に表示する。一方、音声再生装置6は、BGMデータ44が表すBGM49を再生する。したがってユーザは、BGM49を聴きながら、ページ画像47を閲覧できる。
この状態において、ユーザが、電子書籍の表示を、次のページに切り替えるように指示したとする。この指示がなされたとき、電子データ出力部10は、出力する電子データをページデータ42からページデータ43に切り替える。一方、音声データ出力部12は、出力する音声データを切り替えない。なぜならこのとき同一性判定部11が、ページデータ42に関連付けられているBGMデータ44と、ページデータ43に関連付けられているBGMデータ44とを、同一のデータであると判定するからである。この判定を受けて、音声データ出力部12は、現在出力中のBGMデータ44の出力を継続する。したがって、図4(b)の出力状況46に示すように、表示装置4においてページ画像47がページ画像48に切り替わったとしても、音声再生装置6は、BGM49の再生を停止させることなく継続する。
以上の処理によって、連続して再生されることが前提となっているBGM49は、ページ画像の切り替えの際にも、一時停止することなく、鳴り続ける。したがってユーザは、ページ画像を切り替えるとき、耳にするBGM49について違和感を覚えることがない。すなわち、より快適な(自然な)状態で、ページ画像を閲覧できる。
(データ出力処理)
以上のデータ出力処理について、図5および図6を参照してより詳細に説明する。図5は、データ出力装置1が電子データおよび音声データを出力するときの処理の流れの一例を説明するフローチャートである。図5に示す処理は、本実施形態におけるデータ出力装置1のCPU30が、主記憶装置31や外部記憶装置32などに記憶されているプログラムを読み出して実行し、図3に示す各装置を制御することによって実行される。
図5に示すように、クライアントは、操作命令入力装置2を通じて、電子データの出力指示を入力する。これにより操作命令入力装置2は、電子データの出力指示を操作命令処理部13に出力する(ステップS50)。この指示が下ると、データ取得部14は、コンテンツデータベース15に接続して電子データを取得し、電子データ出力部10に出力する。さらに、取得した電子データに関連付けられている音声データを、同じくコンテンツデータベース15から取得し、音声データ出力部12に出力する。
電子データ出力部10は、入力された電子データを表示装置4に出力する(ステップS51)。一方、音声データ出力部12は、入力された音声データを、音声再生装置6に出力する(ステップS52)。このとき、音声データ出力部12は、さらに、入力された音声データから音声データ情報を取得し、同一性判定部11に出力する(ステップS53)。
音声データ出力部12が抽出する音声データ情報は、音声データのデータ出力装置1におけるファイル名であればよい。または、音声データのデータ量であってもよい。あるいは、音声データが表す音声の再生時間であってもよい。あるいは、音声データにあらかじめ含まれている、音声データを特定する識別子であってもよい。なお、音声データ情報は、音声データ本体の一部および全体などでも構わない。
以上の処理によって、データ出力装置1は、ユーザが最初に指示した電子データおよび音声データを、それぞれ、出力する。
つぎに、操作命令処理部13は、ユーザが、操作命令入力装置2を通じて、電子データの切り替え指示を入力したか否かを判定する(ステップS54)。この判定結果が「真」であるとき(Yes)、データ出力装置1は、音声データの切り替え処理を実行する(ステップS55)。この処理の詳細については、後述する。また、電子データ出力部10が、新たに取得した電子データを出力する(ステップS56)。これにより電子データ出力部10は、電子データの出力を切り替える。
一方、ステップS54における判定結果が「偽」であるとき(No)、操作命令処理部13は、クライアントが操作命令入力装置2を通じて、停止指示を入力したか否かを判定する(ステップS56)。この判定結果が「偽」であるとき(No)、処理はステップS54に戻って、操作命令処理部13は、クライアントが操作命令入力装置2を通じて、電子データの切り替え指示を入力したか否かを判定する(ステップS54)。すなわち、クライアントが停止指示を入力するまで、データ出力装置1は、ステップS54からステップS57の処理を繰り返し実行する。
一方、ステップS57における判定結果が「真」であるとき(Yes)、図5に示す処理は終了する。すなわち、電子データ出力部10は電子データの出力を停止し、音声データ出力部12は音声データの出力を停止する。これによりデータ出力装置1は、コンテンツデータの出力処理を終了する。したがって、表示装置4は画像表示を消し、音声再生装置6は音声再生を停止する。
(音声データの切り替え処理)
ステップS55においてデータ出力装置1が実行する、音声データの切り替え処理について、図6を参照して以下に説明する。図6は、音声データの切り替え処理の流れを説明するフローチャートである図6に示す処理は、本実施例におけるデータ出力装置1のCPU30が、主記憶装置31や外部記憶装置32などに記憶されているプログラムを読み出して実行し、図3に示す各装置を制御することによって実行される。
この図に示すように、ステップS54において、操作命令処理部13が、クライアントによる操作命令入力装置2からの電子データの切り替え指示を受け取った場合、データ取得部14は、新たに切り替えられる電子データを、コンテンツデータベース15から取得する(ステップS61)。さらに、この電子データに関連付けられた音声データも取得する(ステップS62)。
これによりデータ取得部14は、取得した電子データを電子データ出力部10に出力する。さらに、取得した音声データを音声データ出力部12に出力する。
音声データ出力部12は、入力された音声データから、音声データ情報を抽出する。これにより、抽出した音声データ情報を同一性判定部11に出力する。すなわち、同一性判定部11は、データ取得部14が新たに取得した音声データについての音声データ情報を取得する(ステップS63)。
同一性判定部11は、現在音声データ出力部12が出力している音声データについての音声データ情報を保持している。そこで、取得済み音声データ情報と、ステップS63において取得した新たな音声データ情報とを比較する(ステップS64)。これにより、同一性判定部11は、2つの音声データ情報が同一であるか否かを判定する(ステップS65)。
具体的には、同一性判定部11は、現在の音声データのファイル名と、新たな音声データのファイル名とが同一であるとき、音声データと、新たな音声データとを同一のデータであると判定する。現在の音声データのデータ量と、新たな音声データのデータ量とが同一であるときも、同様である。現在の音声データの再生時間と、新たな音声データの再生時間とが同一であるときも、同様である。現在の音声データを特定する識別子と、新たな音声データを特定する識別子とが同一であるときも、同様である。また、新旧の音声データ同士が完全に一致するとも、同様である。
(音声データ出力の継続)
ステップS65における判定結果が「真」であるとき(Yes)、同一性判定部11は、音声データ出力部12が現在出力している音声データと、音声データ出力部12に新たに入力された音声データとが、同一の音声データであると判定する。このとき同一性判定部11は、音声データ出力部12に、現在出力している音声データの出力を継続するように指示する。これにより音声データ出力部12は、出力中の音声データの出力を継続する(ステップS66)。
このとき、音声データ出力部12に入力された新たな音声データは、もはや不要である。したがって音声データ出力部12は、不要となった音声データをメモリから開放する(ステップS67)。さらに、同一性判定部11に入力された新たな音声データ情報も、もはや不要である。そこで同一性判定部11は、不要となった音声データ情報をメモリから開放する(ステップS67)。
(出力音声データの切り替え)
一方、S65における判定結果が「偽」であるとき(No)、同一性判定部11は、音声データ出力部12に対して、出力中の音声データの出力を中止し、ステップS62において新たに取得された音声データを出力するように指示する。これにより音声データ出力部12は、現在出力している音声データの出力を停止する。つぎに、ステップS62において入力された音声データを出力する。すなわち音声データ出力部12は、出力する音声データを、現在のものから新しいものに切り替える。(ステップS68)。
このとき、音声データ出力部12がそれまでに出力していた古い音声データは、もはや不要である。したがって音声データ出力部12は、不要となった古い音声データをメモリから開放する(ステップS67)。さらに、同一性判定部11がそれまでに保持していた古い音声データ情報も、もはや不要である。そこで同一性判定部11は、不要となった古い音声データ情報をメモリから開放する(ステップS67)。
ステップS67が終了すると、処理は図5のステップS56に進む。すなわち音声データ出力部12が、切り替えて出力するように指示された電子データを、表示装置4に出力する。
(画像の表示および音声の再生の例)
以上の処理を実行することによって、図7に示すような、画像の切り替え再生および音声の継続再生が可能となる。そこで、写真および風景画を表す電子データそれぞれに対してBGMを表す音声データが関連付けられている場合について、図7を参照して説明する。図7は、静止画の表示および対応するBGMの再生の様子を示す図である。
静止画である写真および風景画を表示する場合、それぞれの表示画像に対する閲覧する時間の長さは、個人差が大きい可能性が高い。特に、それぞれの表示画像を閲覧する時間が短いユーザにとっては、短時間で何度もBGMが停止と再生を繰り返すため、従来の技術では、BGMとしての効果がほとんど失われてしまう。
しかし、本実施形態に係るデータ出力装置1が、電子データを表示装置4に出力し、かつ、音声データを音声再生装置6に出力するとき、次のように、BGMの効果は保たれる。
図7の例では、画像70を表す電子データに、BGM73を表す音声データが関連付けられている。一方、画像71を表す電子データ、および画像72を表す電子データには、いずれも、同じBGM74を表す同じ音声データが関連付けられている。BGM73とBGM74とは、異なる音声である。そのため、BGM73を表す音声データと、BGM74を表す音声データとは、異なるデータである。
このとき、図7に示すように、表示装置4が画像70を表示するとき、音声再生装置6はBGM73を再生する。ユーザが、データ出力装置1に、画像71の表示を指示したとき、表示装置4は、表示する画像を画像70から画像71に切り替える。ここで、`画像71を表す電子データには、BGM74を表す音声データが関連付けられている。上述したように、BGM74を表す音声データと、BGM73を表す音声データとは、互いに異なる音声データである。したがって音声再生装置6は、BGM73の再生を停止し、BGM74を再生する。すなわち音声再生装置6は、再生する音声を、BGM73からBGM74に切り替える。
BGM73とBGM74とは、互いに異なる音声なので、一時的な停止状態を挟んで切り替わったとしても、ユーザに違和感を与えることはない。
ここで、さらに、ユーザにより表示画像の切り替え指示が入力されたとき、表示装置4は、表示する画像を画像71から画像72に切り替える。このとき、画像71を表す電子データ、および、画像72を表す電子データには、それぞれ、同じBGM74を表す同一音声データが関連付けられている。したがって、音声再生装置6は、BGM74の再生を停止することなく、継続する。
これにより、ユーザが異なる画像を切り替えて閲覧するとき、同一のBGMの再生が不自然に一時停止して再び再生することがない。したがって、ユーザは、違和感を憶えることなく画像の閲覧に集中できる。
(まとめ)
以上のように、データ出力装置1は、従来の手法には見られない、同一性判定部11を備えている。そのため、「現在表示中の電子データが異なるポイントへと移行する際に、再生中の音声データは停止させない」という、非同期的な動作が実現可能となる。つまり、データの最小単位に設定を付加しつつグループ化した処理も実現可能となることから、結果としてコンテンツ作成者の負担を軽減できる。また、完成したコンテンツを閲覧するクライアントの立場に立つと、従来の手法のままでは、電子データの境界で不自然に中断されていた音声再生を、その境界を全く意識せずに閲覧することができるようになる。
(データ出力装置1の変形例)
上述したように、データ出力装置1は、画像や動画を表す電子データを表示装置4に出力し、かつ、音声を表す音声データを音声再生装置6に出力する構成である。この構成のデータ出力装置1は、視覚を通じて認識できる情報と、聴覚を通じて認識できる情報とを組み合わせたコンテンツのデータを出力する状況に好適である。
しかし、本発明は、上記構成のデータ出力装置1に限定されるものではない。すなわち、不連続に切り替わることを前提した音声のデータと、連続して再生されることを前提した音声のデータとを、同時に出力する構成であってもよい。このような構成のデータ出力装置1aについて、図8を参照して以下に説明する。
(データ出力装置1a)
図8は、データ出力装置1aの要部構成を示すブロック図である。この図に示すように、データ出力装置1aは、同一性判定部11(同一性判定手段)、音声データ出力部12(音声データ出力手段)、操作命令処理部13、データ取得部14、コンテンツデータベース15、音声データ出力部81(電子データ出力手段)を備えている。また、データ出力装置1aは、操作命令入力装置2、および音声再生装置6に接続されている。
ここで、音声データ出力部81は、音声再生装置6に音声データを出力する。しかし、出力する音声データについての音声データ情報を、同一性判定部11に出力しない。すなわち、同一性判定部11は、音声データ出力部81が出力する音声データについては、切り替えの前後における同一性を判定することはない。すなわち音声データ出力部81は、入力された新たな音声データを、そのまま出力する。これは、音声データ出力部81に入力される音声データが、不連続に切り替わることを前提とした内容の音声についてのデータだからである。
(データ出力装置1aによる音声の再生)
データ出力装置1aは、2つの異なる音声を同時に出力する構成である。そのため、たとえば、美術館や博物館などにおいて、BGMを再生しながら、展示品に対する解説音声を再生するシステムにおいて、好適に適用できる。このとき、BGMは閲覧者の気持ちをリラックスさせる効果を持ち、一方、解説音声は、展示品に対する閲覧者の理解を深めるために活用される。
図9(a)は、絵画と、絵画の解説のための音声データと、BGMとの関連付けを示す図である。図9(a)の状況は、具体的には、ユーザが閲覧できる絵画として、絵画90、絵画91および絵画92が、美術館に展示されているというものである。このとき、データ出力装置1aにおいて、絵画90の内容を説明する解説音声データ93が、コンテンツデータベース15に記憶されている。また、絵画91の内容を説明する解説音声データ94も記憶されている。さらに、絵画92の内容を説明する解説音声データ95も記憶されている。
これらの解説音声データ93、解説音声データ94、および解説音声データ95には、いずれも、コンテンツデータベース15において、同一のBGMデータ96が関連付けられている。
図9(b)は、閲覧者97が、データ出力装置1aを用いて、絵画を鑑賞しながら解説音声およびBMGを聴いている状況を示す図である。この図に示すように、閲覧者97は、展示絵画を鑑賞しながら、データ出力装置1aと一体されている操作命令入力装置2を操作し、聞きたい解説音声を選択する。これにより、解説音声データが表す解説音声、および、解説音声データに関連付けられたBGMデータが表すBGMとを、ヘッドホンとしての音声再生装置6を通じて、同時に聴くことができる。
図10は、各絵画と、各絵画を説明する解説音声の再生と、BGMの再生との関係を説明する図である。この図において、解説音声100は、解説音声データ93によって表される音声である。また、解説音声101は、解説音声データ94によって表される音声である。また、解説音声102は、解説音声データ95によって表される音声である。また、BGM103は、BGMデータ96によって表される音声である。
閲覧者97は、絵画90を鑑賞しながら、絵画90に対する解説音声100を、音声再生装置6を通じて聴いている。このとき音声再生装置6は、解説音声100と同時に、BGM103を再生している。ここで閲覧者97が、絵画90の閲覧を止め、新たに絵画91を鑑賞するとする。このとき閲覧者97は、絵画91に対する解説音声101の再生を、操作命令入力装置2を通じてデータ出力装置1aに指示する。
このとき、データ出力装置1aでは、音声データ出力部81は、解説音声データ93の出力を停止し、解説音声データ94を出力する。したがって閲覧者97は、音声再生装置6を通じて、解説音声101を聴くことができる。
また、同一性判定部11は、解説音声データ93に関連付けられているBGMデータ96と、解説音声データ94に関連付けられているBGMデータ96とを、互いに同一であると判定する。したがって音声データ出力部12は、BGMデータ96の出力を停止せず、そのまま継続する。したがって、音声再生装置6は、再生する解説音声を、解説音声100から解説音声101に切り替えたとしても、BGM103の再生は継続する。したがって、閲覧者97は、解説音声が切り替わる前後において、BGM103を連続して、違和感なく聴くことができる。
つぎに、閲覧者97が、再生する解説音声を、絵画91についての解説音声101から、絵画92についての解説音声102に切り替える指示を、データ出力装置1に出したとする。このとき、音声データ出力部12が現在出力しているBGMデータ96と、新たに音声データ出力部12に入力された、解説音声102に関連付けられているBGMデータ96とは、同一のデータである。したがって音声データ出力部12は、現在出力しているBGMデータ96を、そのまま出力し続ける。これにより音声再生装置6は、絵画92に対する解説音声101を再生するとともに、解説音声を切り替えるときにも、BGM103を再生し続ける。
(まとめ)
以上のシステムを用いることによって、閲覧者97は、自分の閲覧している展示品に対応する解説音声を、自由なタイミングで視聴できる。このような状況においても、展示品を閲覧する速度には個人差がある。また、閲覧者97が解説を実際には全て聞くとは限らない。したがって、再生される解説音声の長さは、かなり不規則になる。
このため従来のシステムでは、このような音声情報に、さらにBGMなどの情報を重ねようとしても、ただ同時に録音しただけでは断続的に途切れてしまう。したがって、BGM本来の効果を得ることができない。しかし、美術館や博物館などで実際にはBGMが採用されていることから、本実施形態に係るデータ出力装置1aを、解説とともにBGMを流す仕様に適用することに意義がある。
なお、データ出力装置1aは、1つの同じ音声再生装置6に、解説音声データおよびBGMデータを重ねて出力することに限定されない。たとえば、音声データ出力部12がBGMデータを音声再生装置6に出力しつつ、音声データ出力部81が解説音声データを、音声再生装置6とは異なる他の音声再生装置に出力してもよい。この場合、音声再生装置6と、他の音声再生装置とは同じ場所にあり、それぞれ音声を再生することによって、解説音声とBGMとを重ねあわせて再生する。これにより、2つの音声が、別々の音声再生装置によって再生され、重ねあわされる。そのため、1つの装置によって同時に2つの音声が発せされる場合に比べて、音声再生の臨場感をより向上させることができる。
なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能 なお、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。
(デジタルデータの利用)
なお、データ出力装置1では、音声データ出力部12が出力する音声データと、音声データ出力部81が出力する音声データとは、いずれもデジタルデータであってもよい。一例を挙げれば、データ出力装置1は、デジタルデータとしての解説音声データ、および、デジタルデータとしてのBGMデータの両方を、音声再生装置6に出力する。このとき音声再生装置6は、デジタルデータが表す音声を再生できる装置であればよい。たとえば、デジタルの音声データを処理し、スピーカに出力するアナログ信号を生成できるアンプを内蔵した装置であればよい。
また、音声データ出力部12は、解説音声データとBMGデータとを合成して、1つの合成音声データを生成してもよい。そして、生成した合成音声データを、音声再生装置6に出力してもよい。このとき音声データ出力部12は、2つのデータを完全に合成してから出力するのではなく、合成しながら出来上がった合成データを順次、出力すればよい。もし、解説音声データを、データの最後までBGMデータに合成し終えたら、合成を停止し、以降は、BMGデータのみを出力し続ければよい。
以上の構成では、同一性判定部11は、解説音声データ出力の切り替え、および、BMGデータ出力の継続指示を、いずれも音声データ出力部12に通知する。この通知を受けたときに、音声データ出力部12は、現在合成中の解説音声データの合成を停止する。その一方で、BMGデータのみを出力し続ける。すなわち合成は一時的に中止するけれども、BGMデータの出力は停止せず、そのまま続ける。そして、切り替えるように指示された次の解説音声データを、現在出力しているBMGデータに、それまでのように先頭から合成し、合成が完了した箇所から順次、出力し続ける。
以上の処理によって、両データの合成処理、および合成音声データの出力は、解説音声が切り替わるタイミングにおいて、途切れることがない。これにより、連続して再生されるべきBMGが途切れることなく再生されるので、解説音声およびBGMを聴きながら絵画を閲覧している閲覧者に、音声についての違和感を与えることがない。結論として、データ出力装置1は、より音声品質の高いデジタル音声データを音声再生装置6に出力する場合であっても、非連続に切り替わる可能性の高い解説音声が切り替わるタイミングにおいて、連続して再生されるべき音声を中断させることがない。
(その他の構成)
なお、本発明は、以下に示す構成としても実現できる。
(第1の構成)
任意の単位で、音声データとの対応関係を定義している電子データを取得する、電子データ取得手段と、前記音声データを取得する音声データ取得手段と、前記電子データを出力する電子データ出力手段と、前記音声データを再生する音声データ再生手段と、前記音声データを前記電子データの単位間で比較する音声データ比較手段と、前記音声データ比較手段によって得られた結果に基づいて、前記音声データの再生を制御する音声データ再生制御手段とを備える音声情報制御装置。
(第2の構成)
操作命令を入力する操作命令入力手段と、前記操作命令を伝達する操作命令伝達手段によって、前記電子データの出力を制御することを特徴とする、前記第1の構成に係る音声情報制御装置。
(第3の構成)
前記操作命令により、前記音声データ再生制御手段の振る舞いを選択することを特徴とする、前記第1の構成に係る音声情報制御装置。
(第4の構成)
前記音声データ比較手段が、ファイル名を用いてデータの比較を行うことを特徴とする、前記第1の構成に係る音声情報制御装置。
(第5の構成)
前記音声データ比較手段が、前記音声データのデータ量を用いてデータの比較を行うことを特徴とする、前記第1の構成に係る音声情報制御装置。
(第6の構成)
前記音声データ比較手段が、前記音声データに埋め込まれた識別情報を用いてデータの比較を行うことを特徴とする、前記第1の構成に係る音声情報制御装置。
(第7の構成)
複数の音声データを取得する音声データ取得手段と、前記複数の音声データを重ね合わせて再生する少なくとも一つの音声データ再生手段と、前記複数の音声データを比較する音声データ比較手段と、前記音声データ比較手段によって得られた結果に基づいて、前記音声データの再生を制御する音声データ再生制御手段とを備える音声情報制御装置。
(第8の構成)
複数の音声データの間に対応関係を定義している電子データを取得する電子データ取得手段と、前記音声データを取得する音声データ取得手段と、前記複数の音声データを重ね合わせて再生する少なくとも一つの音声データ再生手段と、前記複数の音声データを前記電子データを用いて比較する音声データ比較手段と、前記音声データ比較手段によって得られた結果に従い、前記音声データの再生を制御する音声データ再生制御手段とを備える音声情報制御装置。
(第9の構成)
複数の装置を組み合わせることにより、前記複数の音声データを重ね合わせることを特徴とする、前記第7の構成に係る音声情報制御装置。
(第10の構成)
前記複数の音声データのそれぞれが、デジタル音声データである場合に、計算機上でデータを合成することにより、音声データを重ね合わせることを特徴とする、前記第7の構成に係る音声情報制御装置。
(第11の構成)
任意の単位で、音声データとの対応関係を定義している電子データを取得する、電子データ取得ステップと、前記音声データを取得する音声データ取得ステップと、前記電子データを出力する電子データ出力ステップと、前記音声データを再生する音声データ再生ステップと、前記音声データを前記電子データの単位間で比較する音声データ比較ステップと、前記音声データ比較ステップによって得られた結果に基づいて、前記音声データの再生を制御する音声データ再生制御ステップとを含んでいることを特徴とする音声情報制御方法。
(第12の構成)
複数の音声データの間に対応関係を定義している電子データを取得する電子データ取得ステップと、前記音声データを取得する音声データ取得ステップと、前記複数の音声データを重ね合わせて再生する少なくとも一つの音声データ再生ステップと、前記複数の音声データを前記電子データを用いて比較する音声データ比較ステップと、前記音声データ比較ステップによって得られた結果に基づいて、前記音声データの再生を制御する音声データ再生制御ステップとを含んでいることを特徴とする音声情報制御方法。
(第12の構成)
前記第1から第10のいずれ1つの構成に係る音声情報制御装置を動作させる音声情報制御プログラムであって、コンピュータを上記の各手段として機能させるための音声情報制御プログラム。
(第13の構成)
前記第12の構成に係る音声情報制御プログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
(プログラムおよび記録媒体)
最後に、データ出力装置1に含まれている各ブロックは、ハードウェアロジックによって構成すればよい。または、次のように、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
すなわち、データ出力装置1は、各機能を実現する制御プログラムの命令を実行するCPU、この制御プログラムを格納したROM(Read Only Memory)、上記制御プログラムを実行可能な形式に展開するRAM(Random Access Memory)、および、上記制御プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)を備えている。
この構成により、本発明の目的は、所定の記録媒体によっても、達成できる。この記録媒体は、上述した機能を実現するソフトウェアであるデータ出力装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録していればよい。データ出力装置1はに、この記録媒体を供給する。これにより、コンピュータとしてのデータ出力装置1(またはCPUやMPU)が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。
プログラムコードをデータ出力装置1に供給する記録媒体は、特定の構造または種類のものに限定されない。すなわち、この記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリーカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などとすることができる。
また、データ出力装置1を、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介してデータ出力装置1に供給する。この通信ネットワークは、データ出力装置1にプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等であればよい。
この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、IEEE1394、USB(Universal Serial Bus)、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
以上のプログラムに関する点は、データ出力装置1aにも同様に適用される。
本発明は、コンテンツを表す電子データと、関連する音声データとを同時に出力する各種の装置として、幅広く利用できる。
本発明に係るデータ出力装置の要部構成を示すブロック図である。 データ出力装置、操作命令入力装置、表示装置、および音声再生装置の外観を説明する図である。 データ出力装置を含むシステムの構成を示す図である。 (a)は、ページデータと音声データとが関連付けられている状態、および、つぎに出力されるページデータと、音声データとが関連付けられている状態を表す図であり、(b)は、表示画像がページ画像から、他のページ画像に切り替わるとき、BGMが連続して再生される様子を説明する図である。 データ出力装置が電子データおよび音声データを出力するの処理の流れの一例を説明するフローチャートである。 音声データの切り替え処理の流れを説明するフローチャートである。 静止画の表示および対応するBGMの再生の様子を示す図である。 データ出力装置の要部構成を示すブロック図である。 (a)は、絵画と、絵画の解説のための音声データと、BGMとの関連付けを示す図であり、(b)は、閲覧者が、データ出力装置を用いて、絵画を鑑賞しながら解説音声を聴いている状況を示す図である。 絵画と、解説音声の再生と、BGMの再生との関係を説明する図である。 従来技術において生ずる、BGMの不連続再生を説明する図である。
符号の説明
1 データ出力装置
1a データ出力装置
2 操作命令入力装置
4 表示装置(コンテンツ再生装置)
6 音声再生装置
10 電子データ出力部(電子データ出力手段)
11 同一性判定部(同一性判定手段)
12 音声データ出力部(音声データ出力手段)
13 操作命令処理部
14 データ取得部
15 コンテンツデータベース
81 音声データ出力部(電子データ出力手段)

Claims (11)

  1. コンテンツを表す電子データをコンテンツ再生装置に出力する電子データ出力手段と、
    上記電子データに関連付けられている、音声を表す音声データを音声再生装置に出力する音声データ出力手段と、
    上記電子データ出力手段が、上記コンテンツ再生装置に出力する上記電子データを、上記電子データと異なる他の電子データに切り替えたときに、上記音声データと、上記他の電子データに関連付けられている他の音声データとが同一であるか否かを判定する同一性判定手段とを備え、
    上記音声データ出力手段は、
    上記同一性判定手段が、上記音声データと上記他の音声データとを同一であると判定したとき、上記音声データを上記音声再生装置に出力し続けることを特徴とする
    電子データおよび当該電子データと関連付けられている音声データを出力するためのデータ出力装置。
  2. 上記同一性判定手段は、
    上記音声データのファイル名と、上記他の音声データのファイル名とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することを特徴とする請求項1に記載のデータ出力装置。
  3. 上記同一性判定手段は、
    上記音声データのデータ量と、上記他の音声データのデータ量とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することを特徴とする請求項1に記載のデータ出力装置。
  4. 上記同一性判定手段は、
    上記音声データの再生時間と、上記他の音声データの再生時間とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することを特徴とする請求項1に記載のデータ出力装置。
  5. 上記同一性判定手段は、
    上記音声データに含まれている、上記音声データを特定する識別子と、上記他の音声データに含まれている、上記他の音声データを特定する識別子とが同一であるとき、上記音声データと上記他の音声データとを同一であると判定することを特徴とする請求項1に記載のデータ出力装置。
  6. 上記電子データはおよび他の電子データは、いずれも、上記音声データとは異なる、音声を表す電子データであることを特徴とする請求項1に記載のデータ出力装置。
  7. 上記電子データ出力手段は、
    上記音声を表す電子データおよび他の電子データを、いずれも、上記音声再生装置とは異なる他の音声再生装置に出力することを特徴する請求項6に記載のデータ出力装置。
  8. 上記コンテンツ再生装置は、上記音声再生装置であり、
    上記音声を表す電子データ、上記音声を表す他の電子データ、上記音声データ、および上記他の音声データは、いずれもデジタルデータであり、
    上記電子データ出力手段および上記音声データ出力手段は、1つの合成音声データ出力手段を構成し、
    上記合成音声データ出力手段は、
    上記電子データおよび上記音声データを合成して合成音声データを生成しながら、当該生成した合成音声データを上記音声再生装置に出力している際、上記同一性判定手段によって、上記音声データと上記他の音声データとが同一であると判定されたとき、上記電子データと上記音声データとの合成を停止して上記音声データを出力し続けつつ、上記出力し続ける上記音声データに上記切り替えを指示された上記他の電子データを合成して他の合成音声データを生成しながら、当該生成した他の合成音声データを上記音声再生装置に出力することを特徴とする請求項7に記載のデータ出力装置。
  9. コンテンツを表す電子データをコンテンツ再生装置に出力する電子データ出力ステップと、
    上記電子データに関連付けられている、音声を表す音声データを音声再生装置に出力する音声データ出力ステップと、
    上記コンテンツ再生装置に出力する電子データを、上記電子データと異なる他の電子データに切り替える切り替えステップと、
    上記電子データに関連付けられている音声データと、上記他の電子データに関連付けられている他の音声データとが同一であるか否かを判定する同一性判定ステップと、
    上記同一性判定ステップにおいて、上記音声データと上記他の音声データとを同一であると判定したとき、上記音声データを上記音声再生装置に出力し続ける音声データ継続出力ステップとを含んでいることを特徴とする
    電子データおよび当該電子データと関連付けられている音声データを出力するためのデータ出力方法。
  10. 請求項1から8のいずれか1項に記載のデータ出力装置を動作させるデータ出力プログラムであって、コンピュータを上記の各手段として機能させるためのデータ出力プログラム。
  11. 請求項10に記載のデータ出力プログラムを記録しているコンピュータ読み取り可能な記録媒体。
JP2006015076A 2006-01-24 2006-01-24 データ出力装置、データ出力方法、データ出力プログラム、および記録媒体 Active JP4382045B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006015076A JP4382045B2 (ja) 2006-01-24 2006-01-24 データ出力装置、データ出力方法、データ出力プログラム、および記録媒体
US11/656,483 US7933671B2 (en) 2006-01-24 2007-01-23 Data outputting device, data outputting method, data outputting program, and recording medium
EP07250269.3A EP1811523B1 (en) 2006-01-24 2007-01-23 Data outputting device, data outputting method, data outputting program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006015076A JP4382045B2 (ja) 2006-01-24 2006-01-24 データ出力装置、データ出力方法、データ出力プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2007200390A JP2007200390A (ja) 2007-08-09
JP4382045B2 true JP4382045B2 (ja) 2009-12-09

Family

ID=38007224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006015076A Active JP4382045B2 (ja) 2006-01-24 2006-01-24 データ出力装置、データ出力方法、データ出力プログラム、および記録媒体

Country Status (3)

Country Link
US (1) US7933671B2 (ja)
EP (1) EP1811523B1 (ja)
JP (1) JP4382045B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010002275A2 (en) 2008-07-04 2010-01-07 Isoundtrack Limited Method and system for making and playing soundtracks
US20130297599A1 (en) * 2009-11-10 2013-11-07 Dulcetta Inc. Music management for adaptive distraction reduction
KR20120091325A (ko) * 2009-11-10 2012-08-17 둘세타 인코포레이티드 전자식 시각자료에 대한 사운드트랙의 동적 오디오 재생
EP2737481A4 (en) 2011-07-26 2016-06-22 Booktrack Holdings Ltd TONGUE FOR ELECTRONIC TEXTS

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2589463B2 (ja) 1985-08-08 1997-03-12 パイオニア株式会社 マルチデイスクプレーヤ
US5510901A (en) * 1989-12-28 1996-04-23 Canon Kabushiki Kaisha Signal recording system using sound memory
JP2002185928A (ja) 2000-12-08 2002-06-28 Baku:Kk サウンド同期画像再生方法、サウンド同期画像再生機能付きのコンピュータによって読み取り可能な記憶媒体、及び、サウンド同期画像作成方法
JP3925917B2 (ja) * 2002-09-02 2007-06-06 アルパイン株式会社 ビデオディスクプレーヤ
EP1422668B1 (en) * 2002-11-25 2017-07-26 Panasonic Intellectual Property Management Co., Ltd. Short film generation/reproduction apparatus and method thereof
JP2005044409A (ja) * 2003-07-24 2005-02-17 Pioneer Electronic Corp 情報再生装置、情報再生方法および情報再生プログラム
JP4348614B2 (ja) 2003-12-22 2009-10-21 カシオ計算機株式会社 動画再生装置、撮像装置及びそのプログラム
JP4274087B2 (ja) * 2004-09-14 2009-06-03 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4622479B2 (ja) * 2004-11-25 2011-02-02 ソニー株式会社 再生装置および再生方法
US20060177153A1 (en) * 2005-02-07 2006-08-10 Konica Minolta Technology U.S.A., Inc. Digital photo album producing apparatus

Also Published As

Publication number Publication date
EP1811523B1 (en) 2014-05-07
JP2007200390A (ja) 2007-08-09
US20070183753A1 (en) 2007-08-09
EP1811523A1 (en) 2007-07-25
US7933671B2 (en) 2011-04-26

Similar Documents

Publication Publication Date Title
KR100502709B1 (ko) 캡션 텍스트와 영상 화면을 동기화 시키는 방법 및 장치
JP4683116B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび撮像装置
WO2016202176A1 (zh) 一种媒体文件合成方法、装置和设备
JPH056251A (ja) コンピユータシステム上に上映を事前記録、編集及び再生するための装置
KR20140132209A (ko) 멀티 트랙 미디어 파일이 기록된 기록 매체, 멀티 트랙 미디어 파일 편집 방법, 및 멀티 트랙 미디어 파일 편집 장치
JP4382045B2 (ja) データ出力装置、データ出力方法、データ出力プログラム、および記録媒体
JP2003069938A (ja) プレゼンテーション生成実行システムおよび方法
JP2001236205A (ja) 情報処理装置および情報処理方法、ならびに情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2014156315A1 (ja) 情報処理装置、及び情報処理方法
JP3668364B2 (ja) 連続メディア情報アクセス方法、連続メディア情報アクセス装置及び連続メディア情報アクセスプログラムを記録した記録媒体
CN106303686A (zh) 视频生成方法、视频生成装置和终端设备
JP2005321706A (ja) 電子書籍の再生方法及びその装置
JP3507767B2 (ja) マルチメディアコンテンツ再生システム及びマルチメディアコンテンツ再生方法
JP2919484B2 (ja) 静止画像および音声の同期再生制御方法
KR20130092692A (ko) 사용자의 음성으로 구연될 수 있는 전자 도서 제작 방법 및 전자 도서 제작 프로그램이 저장된 컴퓨터 판독 가능한 기록 매체
JP2004343472A (ja) 再生情報ファイル生成プログラム
JP2005341511A (ja) 電子アルバム表示システム、電子アルバム表示方法、リモートコントローラ、及びリモートコントロールプログラム
JP2006092079A (ja) プレゼンテーションシステムおよび再生切替方法、プログラム
JP2006119362A (ja) eラーニング用の教材データ、編集装置および編集システム
JP2003046935A (ja) データ編集方法、情報処理装置、サーバ、データ編集プログラムおよび記録媒体
JP2004198959A (ja) 命令コード作成装置、および命令コード作成処理プログラム
JPH0627966B2 (ja) 語学教育装置
JP2005020202A (ja) 再生装置、再生方法、その記録媒体およびプログラム
TWI252042B (en) Image processing device with an audio real-time integrating function
JP3706621B2 (ja) マルチメディア・プレゼンテーション方法およびシステム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4382045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4