JP2007256456A - コンテンツ提供装置およびコンテンツ提供方法 - Google Patents

コンテンツ提供装置およびコンテンツ提供方法 Download PDF

Info

Publication number
JP2007256456A
JP2007256456A JP2006078821A JP2006078821A JP2007256456A JP 2007256456 A JP2007256456 A JP 2007256456A JP 2006078821 A JP2006078821 A JP 2006078821A JP 2006078821 A JP2006078821 A JP 2006078821A JP 2007256456 A JP2007256456 A JP 2007256456A
Authority
JP
Japan
Prior art keywords
voice
message
recorded
synthesized
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006078821A
Other languages
English (en)
Inventor
Shinichiro Sega
信一郎 瀬賀
Hirotoshi Iwasaki
弘利 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2006078821A priority Critical patent/JP2007256456A/ja
Publication of JP2007256456A publication Critical patent/JP2007256456A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 録音音声および合成音声により構成されるコンテンツを再生する際に音質の違いによる違和感を低減できるコンテンツ提供装置を提供する。
【解決手段】
コンテンツ提供装置1は、録音音声および合成音声により構成されるコンテンツを提供する装置であって、録音音声を再生する録音音声再生部34と、合成音声を再生する合成音声再生部36と、録音音声と合成音声とが切り替わることを知らせるメッセージとして、録音音声に対応する録音音声用のキャラクターまたは合成音声に対応する合成音声用のキャラクターがコンテンツを提供することを知らせる切替えのメッセージを記憶した録音音声メッセージファイル38および合成音声メッセージファイル40とを備えている。コンテンツ提供装置1は、録音音声と合成音声の切替えの際に、録音音声メッセージファイル38または合成音声メッセージファイル40から切替えのメッセージを読み出して再生する。
【選択図】 図1

Description

本発明は、録音音声および合成音声により構成されるコンテンツを提供するコンテンツ提供装置に関し、特に、音楽、ニュース、天気予報等のコンテンツを提供する装置に関する。
ラジオ放送等の番組においては、誰に対しても一律に同じコンテンツが提供されていたが、最近では、ユーザの嗜好や状況に合った番組を提供する技術が開発されている。特許文献1には、ユーザの好みに応じた音楽、情報等を提供する音楽・情報提供装置の発明が記載されている。
特許文献1に記載された発明では、ユーザのプロファイルをあらかじめ情報提供局に記憶しておく。音楽・情報提供装置は、音楽、情報を提供する際に、ユーザのプロファイルを情報提供局から取得する。次に、音楽・情報提供装置は、ユーザのプロファイル、番組の進行状況などに基づいて、情報提供局から取得した番組を選択し、ユーザに提供する。これにより、音楽・情報提供装置は、ユーザに応じた番組を提供する。
特開2001−343979号公報
特許文献1は、番組の進行に際し、ディジタル録音かテキストから合成した音声により、仮想的なディスクジョッキーを想定して繋ぎのスピーチを入れることに言及しているが、その詳細な構成は一切記載されていない。ディジタル録音による音声によってスピーチを入れる構成とした場合、あらかじめ録音されたメッセージ以外のスピーチを入れることができない。テキストから合成した音声によってスピーチを入れる構成とした場合、頻繁に使うフレーズも再生する度に合成しなくてはならない。
ナビゲーション装置の案内音声などでは、録音による音声と合成音声を組み合わせて再生する例も知られている。最近では、合成音声の音質を録音音声に近づける様々な技術が開発されているが、録音音声と合成音声を違和感なく捉えられる程度までは至っていない。従って、録音音声と合成音声とが混在した場合、ユーザは、録音音声と合成音声との音質の違いを認識してしまう。
案内音声の場合には、録音音声と合成音声との音質の相違によってユーザが違和感を感じたとしても、必要な情報を報知するという案内の目的を達せられる。しかし、コンテンツ提供の場合には、録音音声と合成音声との音質の相違によって、コンテンツ自体の価値を減殺してしまうおそれがある。
そこで、本発明は上記背景に鑑み、録音音声および合成音声により構成されるコンテンツを再生する際に音質の違いによる違和感を低減できるコンテンツ提供装置を提供することを目的とする。
本発明のコンテンツ提供装置は、録音音声および合成音声により構成されるコンテンツを提供するコンテンツ提供装置であって、前記録音音声を再生する録音音声再生部と、前記合成音声を再生する合成音声再生部と、前記録音音声再生部による録音音声の再生と前記合成音声再生部による合成音声の再生との切替えの際に、録音音声と合成音声とが切り替わることを知らせるメッセージを前記録音音声再生部または前記合成音声再生部によって再生するように制御する制御部とを備える。
このように制御部は、録音音声の再生と合成音声の再生との間に、録音音声と合成音声とが切り替わることを知らせるメッセージを再生するように制御するので、コンテンツの提供を受ける者は、録音音声と合成音声とが切り替わることを知ることができ、音質の変化に伴う違和感を低減できる。
本発明のコンテンツ提供装置は、録音音声と合成音声とが切り替わることを知らせるメッセージとして、録音音声に対応する録音音声用のキャラクターまたは合成音声に対応する合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを記憶した切替えメッセージ記憶部を備え、前記制御部は、前記切替えメッセージ記憶部から前記録音音声用のキャラクターまたは前記合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御してもよい。
このように録音音声用のキャラクターと合成音声用のキャラクターがコンテンツを提供することを知らせることにより、コンテンツの提供を受ける者は、音質の違いはキャラクターの違いによるものであると認識するので、音質の違いによる違和感をほとんど感じなくなる。
本発明のコンテンツ提供装置において、前記制御部は、切替え後に再生される音声の種類に対応したキャラクターが切替え後のコンテンツを提供することを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御してもよい。
このように切替え後のメッセージの音声に対応したキャラクターを知らせることにより、切替え後のコンテンツの音質がメッセージにより通知されたキャラクターの特徴であると認識するので、音質の違いによる違和感をほとんど感じなくなる。ここで、録音音声用のキャラクターを「A」、合成音声用のキャラクターを「B」として、具体例を示す。録音音声から合成音声へ切り替わるシナリオにおいては、切り替えを知らせるメッセージとして、例えば、次のようなメッセージを再生する。録音音声によるメッセージで「Bさん、曲紹介をお願いします。」と呼びかけるメッセージ、あるいは、合成音声によるメッセージで「Bが次の曲を紹介します。」と自己紹介するメッセージを再生する。これにより、コンテンツの提供を受ける者は、合成音声の声の主は、「B」であり、「A」とは異なると認識するので、音質の違いによる違和感をほとんど感じなくなる。
本発明のコンテンツ提供装置において、前記制御部は、切替え前に再生されていた音声の種類に対応したキャラクターが切替え前のコンテンツを提供したことを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御してもよい。
このように切替え前のメッセージの音声に対応したキャラクターを知らせることにより、切替え前のコンテンツの音質がメッセージにより通知されたキャラクターの特徴であったと認識するので、音質の違いによる違和感をほとんど感じなくなる。ここで、録音音声用のキャラクターを「A」、合成音声用のキャラクターを「B」として、具体例を示す。録音音声から合成音声へ切り替わるシナリオにおいては、切り替えを知らせるメッセージとして、例えば、次のようなメッセージを再生する。録音音声によるメッセージで「Aがお伝えしました。」と自己紹介をするメッセージ、あるいは、合成音声によるメッセージで「Aさん、どうもありがとう。」と前のコンテンツを提供したキャラクターを紹介するメッセージを再生する。これにより、コンテンツの提供を受ける者は、録音音声の声の主は、「A」であり、「B」とは異なると認識するので、音質の違いによる違和感をほとんど感じなくなる。
本発明のコンテンツ提供装置は、コンテンツを構成する録音音声および合成音声のメッセージの再生順序を規定したシナリオを記憶したシナリオ記憶部を備え、前記録音音声再生部および前記合成音声再生部は、前記シナリオ記憶部からシナリオを読み出し、読み出したシナリオに基づいて録音音声または合成音声の再生を行い、前記シナリオ記憶部に記憶されたシナリオは、録音音声と合成音声のメッセージの間に、前記録音音声用のキャラクターまたは前記合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを挿入することを規定してもよい。
このように録音音声と合成音声のメッセージの間に、録音音声用のキャラクターまたは合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを挿入するように規定したシナリオを記憶しておき、シナリオに従ってメッセージを再生することで、音質の違いによる違和感をほとんど感じないようにできる。
本発明の別の態様に係るコンテンツ提供装置は、品質に差のある複数の音声により構成されるコンテンツを提供するコンテンツ提供装置であって、前記コンテンツを構成するそれぞれの音声を再生する音声再生部と、一の音声の再生と他の音声の再生との切替えの際に、一の音声と他の音声とが切り替わることを知らせるメッセージを前記音声再生部によって再生するように制御する制御部とを備える。
このように制御部は、品質の異なる一の音声の再生と他の音声の再生との間に、音声が切り替わることを知らせるメッセージを再生するように制御するので、コンテンツの提供を受ける者は音声が切り替わることを知ることができ、音声の品質の変化に伴う違和感を低減できる。
本発明のコンテンツ提供方法は、録音音声および合成音声により構成されるコンテンツを提供するコンテンツ提供方法であって、録音音声再生部が録音音声を再生する録音音声再生ステップと、合成音声再生部が合成音声を再生する合成音声再生ステップと、録音音声と合成音声との切替えの際に、前記録音音声再生部または前記合成音声再生部が、録音音声と合成音声とが切り替わることを知らせるメッセージを再生する切替えメッセージ再生ステップとを備える。
このように録音音声の再生と合成音声の再生との間に、録音音声と合成音声とが切り替わることを知らせるメッセージを再生することにより、コンテンツの提供を受ける者は、録音音声と合成音声とが切り替わることを知ることができ、音質の変化に伴う違和感を低減できる。切替えを知らせるメッセージは、録音音声に対応する録音音声用のキャラクターまたは合成音声に対応する合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージであってもよい。
本発明のプログラムは、録音音声および合成音声により構成されるコンテンツを提供するためのプログラムであって、コンピュータに、録音音声を再生する録音音声再生ステップと、合成音声を再生する合成音声再生ステップと、録音音声と合成音声との切替えの際に、録音音声と合成音声とが切り替わることを知らせるメッセージを再生する切替えメッセージ再生ステップとを実行させる。
このように録音音声の再生と合成音声の再生との間に、録音音声と合成音声とが切り替わることを知らせるメッセージを再生することにより、コンテンツの提供を受ける者は、録音音声と合成音声とが切り替わることを知ることができ、音質の変化に伴う違和感を低減できる。切替えを知らせるメッセージは、録音音声に対応する録音音声用のキャラクターまたは合成音声に対応する合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージであってもよい。
本発明によれば、シナリオ生成部が録音音声のメッセージと合成音声のメッセージとの間に、録音音声と合成音声とが切り替わることを知らせるメッセージを配置したシナリオを生成するので、コンテンツの提供を受ける者は、録音音声と合成音声とが切り替わることを知ることができ、音質の変化に伴う違和感を低減できるというすぐれた効果を有する。
以下、本発明の実施の形態のコンテンツ提供装置について図面を用いて説明する。本実施の形態では、車両に搭載されるコンテンツ提供装置を例として説明するが、本発明のコンテンツ提供装置は車両に搭載するものに限定されない。
図1は、本発明の実施の形態のコンテンツ提供装置1の構成を示す図である。コンテンツ提供装置1は、番組センター50から番組の情報を受信する情報受信部10を備えている。情報受信部10は、番組で提供されるニュースや音楽等のコンテンツと、番組の構成を示す番組構成の情報を受信する。情報受信部10は、受信した番組構成の情報は番組管理部12に記憶すると共に、番組で提供されるニュース、音楽等のコンテンツを録音音声メッセージファイル38または合成音声メッセージファイル40に記憶する。
図2は、番組構成の例を示す図である。番組構成は、「開始時刻」「長さ」「コンテンツ」「メッセージタイプ」のデータを有している。「開始時刻」は、番組内でコンテンツの提供を開始する時刻を示すデータである。「開始時刻」は、番組の開始時刻を基準として規定されている。「長さ」は、提供されるコンテンツの長さを示すデータである。「コンテンツ」は、その時間帯に提供するコンテンツを特定するデータである。「メッセージタイプ」は、コンテンツを構成するメッセージが録音音声メッセージであるか、合成音声メッセージであるかを示すデータである。「メッセージタイプ」は、コンテンツにおける録音音声メッセージと合成音声メッセージの順番も規定する。例えば、「曲紹介」にある「録音→音声」は、コンテンツを構成するメッセージが、録音音声メッセージ、合成音声メッセージの順であることを示している。
番組管理部12は、番組構成に基づいてニュースや音楽等を提供し、番組の進行を管理する機能を有する。本実施の形態のコンテンツ提供装置1は、ニュースや音楽等のコンテンツの提供の際に、それぞれのユーザに対応したセリフのコンテンツを挿入することにより、それぞれのユーザに合った番組を提供する。図2に示す例では、「00:00:00」から開始される「オープニング」と「00:02:10」から開始される「曲紹介」の部分において、ユーザや状況に合ったセリフのコンテンツが挿入される。図2に示す例で、「00:00:10」から開始される「ニュース」の部分において、番組センター50から配信されるニュースのデータから合成音声を生成して出力する。
次に、ユーザに合ったセリフのコンテンツを生成するための構成について説明する。コンテンツ提供装置1は、シナリオ生成部20を有し、ユーザおよび状況に合ったシナリオを生成する。シナリオ生成部20には、複数のシナリオが記憶されたシナリオファイル22に接続されている。
図3は、シナリオファイル22に記憶されたデータの例を示す図である。シナリオファイル22には、「シナリオID」「メッセージ順序」のデータが記憶されている。「シナリオID」は、シナリオを特定するデータである。「メッセージ順序」は、シナリオIDで特定されるシナリオにおいて、メッセージを出力する順序を規定するデータである。図3に示す例では、録音音声メッセージの順序が規定されている。録音音声のメッセージのデータは、録音音声メッセージファイル38に記憶されている。
図4(a)および図4(b)は、録音音声メッセージファイル38に記憶されたデータの例を示す図である。コンテンツの提供において頻繁に用いられるメッセージについては、音質の良い録音音声メッセージとして録音音声メッセージファイル38に記憶しておくことが好ましい。図4(a)は、合成音声との切替えを知らせるメッセージの例を示している。図4(a)中の「ナビー」は、合成音声に対応するキャラクターであり、合成音声の声の主として設定されたキャラクターである。「Msg0001」では、「ナビーよろしくね」という呼びかけのメッセージとすることにより、そのメッセージの後は、「ナビー」というキャラクターがコンテンツを提供することを知らせる。「Msg0003」では、「ナビーありがとう」というメッセージにより、そのメッセージの前までは、「ナビー」というキャラクターがコンテンツを提供していたことを知らせると共に、メッセージの後からは「ナビー」とは異なるキャラクターがコンテンツを提供することを知らせる。図4(b)は切替えを知らせるメッセージ以外のメッセージの例を示している。録音音声メッセージファイル38には、番組センター50から送信された音楽データ等も記憶する。なお、ここでは音楽データ等の録音音声データによるコンテンツを録音音声メッセージファイル38に記憶することとしているが、別ファイルに記憶してもよい。
図5は、合成音声メッセージファイル40に記憶されたデータの例を示す図である。合成音声メッセージファイル40には、音声データではなく、テキストの形式でデータが記憶されている。図5は、録音音声との切替えを知らせるメッセージの例を示している。「Text0001」では、「ナビーが最新ニュースをお届けします。」というようにニュースを読み上げるキャラクターを紹介することにより、そのメッセージの後は、「ナビー」というキャラクターがコンテンツを提供することを知らせる。「Text0004」では、「以上ナビーがニュースをお届けしました」というように、そのメッセージの前までコンテンツを提供していたキャラクターを紹介することにより、その後は異なるキャラクターが登場することを知らせる。合成音声メッセージファイル40には、番組センター50から送信されたニュースや天気予報等のコンテンツのデータも記憶する。なお、ここではニュース等のテキストデータによるコンテンツを合成音声メッセージファイル40に記憶することとしているが、別ファイルに記憶してもよい。
シナリオ生成部20は、時間管理部14、シーン管理部16およびナビ情報管理部18に接続されており、時間、シーン、道路状況等の各種の状況を取得する。時間管理部14は、現在の時刻を取得し、普段のユーザのスケジュールより遅れているか、早いかを管理する。シーン管理部16は、通勤であるのか、レジャーであるのかといったシーンを管理する。ナビ情報管理部18は、ナビゲーション装置によって取得した道路や周辺施設などの情報を管理する。
また、シナリオ生成部20は、ユーザ情報ファイル24に接続されている。ユーザ情報ファイル24には、ユーザの「年齢」「性別」「職業」等の情報が記憶されている。
シナリオ生成部20は、時間管理部14、シーン管理部16およびナビ情報管理部18から取得した各種の状況とユーザ情報ファイル24から読み出したユーザの情報に基づいて、シナリオファイル22に記憶された複数のシナリオからユーザおよび状況に合ったシナリオを選択する。
シナリオ生成部20は、まず、「メッセージタイプ」の情報に基づいて、コンテンツ挿入部分のシナリオのタイプを決定する。具体的には、シナリオ生成部20は、コンテンツ挿入部分に録音音声と合成音声とが連続する箇所があるか否かを判定する。図2に示す番組構成の例では、「オープニング」と「ニュース」の間、「ニュース」と「曲紹介」との間はいずれも録音音声と合成音声とが連続している。また、「曲紹介」の中でも録音音声と合成音声とが連続している。このようにコンテンツ挿入部分において、録音音声と合成音声とが連続している場合には、シナリオ生成部20は、録音音声と合成音声とを切り替えるメッセージを含んだシナリオのタイプと判定する。そして、シナリオ生成部20は、切替えのメッセージを含んだシナリオ群から、シナリオを選択する。例えば、図3に示した「Senario0001」〜「Senario0003」のシナリオは、いずれも、「Msg0001」の「ナビーよろしくね」というメッセージを含んだシナリオである。
シナリオ生成部20が状況に基づいてシナリオを生成する具体的な処理を以下に説明する。シナリオ生成部20は、シナリオ決定用モデル記憶部26に記憶されたシナリオ決定用モデルを用いた確率推論によって、ユーザおよび状況に合ったシナリオを求める。
図6は、シナリオ決定用モデル記憶部26に記憶されたシナリオ決定用モデルの例を示す図である。シナリオ決定用モデルは、ベイジアンネットのモデルであり、観測されたノードから確率伝播による計算を行って、未観測ノードの確率値を求めるためのモデルである。シナリオ決定用モデルは、年齢を示すノードN1、性別を示すノードN2、職業を示すノードN3、時刻を示すノードN4、シーンを示すノードN5、道路状況を示すノードN6、シナリオの長さを示すノードN7を含んでおり、これらのノードN1〜N7がシナリオIDを示すノードN8に接続されている。すなわち、ノードN1〜N7に観測値を設定することにより、ノードN8の値を求めることができる。
シナリオ決定用モデル記憶部26には、ユーザ操作の操作履歴を記憶した操作履歴ファイル28が接続されている。操作履歴はユーザ操作取得部30にて取得され、操作履歴ファイル28に記憶される。コンテンツ提供装置1は、操作履歴ファイル28から読み出した操作履歴に基づいて、シナリオ決定用モデルを更新することができる。すなわち、ユーザがシナリオを受け入れたときと、シナリオを受け入れなかったときの状況から、ユーザが受け入れる確率の高い(ユーザ好みの)シナリオが選択されるように、シナリオ決定用モデルを更新する。最初にデフォルトのシナリオ決定用モデルを記憶しておき、操作履歴に応じてユーザに合ったモデルへと更新する構成とすることが好ましい。
コンテンツ提供装置1は、音声振分部32と、録音音声再生部34と、合成音声再生部36とを備え、シナリオ生成部20にて生成されたシナリオに従ってコンテンツを提供する。シナリオを生成するシナリオ生成部20と、シナリオに従ってメッセージの再生を制御する音声振分部32とが、切替えのメッセージを再生するように録音音声再生部34、合成音声再生部36を制御する制御部に相当する。
音声振分部32は、シナリオ中のメッセージが録音音声であるか合成音声であるかに基づいて、メッセージを特定するIDを録音音声再生部34、合成音声再生部36のそれぞれに振り分ける。
録音音声再生部34は、入力されたメッセージのIDに対応するメッセージデータを録音音声メッセージファイル38から読み出して再生する。同様に、合成音声再生部36は、入力されたメッセージのIDに対応するメッセージデータを合成音声メッセージファイル40から読み出して再生する。
図7は、本実施の形態のコンテンツ提供装置1の動作を示す図である。コンテンツ提供装置1は、番組センター50から番組構成および番組で提供されるコンテンツを受信する。コンテンツ提供装置1は、番組センター50から受信した番組構成を番組管理部12に記憶し、番組センター50から受信したコンテンツを録音音声メッセージファイル38または合成音声メッセージファイル40に記憶しておく。
コンテンツ提供装置1のシナリオ生成部20は、番組管理部12から番組構成を取得し(S10)、取得した番組構成を解析する(S12)。シナリオ生成部20は、番組構成を解析し、状況に合ったセリフのコンテンツを挿入する時間帯を特定すると共に、状況に合った曲を流す時間帯を特定する。例えば、図2に示す番組構成においては、ユーザに合ったセリフのコンテンツを挿入する時間帯は、「00:00:00」から開始される「オープニング」の10秒間の時間帯と「00:02:10」から開始される「曲紹介」の7秒間の部分である。また、状況に合った曲を流す時間帯は、「00:02:17」から開始される「曲演奏」の240秒間の部分である。
次に、シナリオ生成部20は、ユーザ情報ファイル24からユーザ情報を取得し(S14)、時間管理部14から時刻を取得し(S16)、シーン管理部16からシーンを取得し(S18)、ナビ情報管理部18からナビ情報を取得する(S20)。続いて、シナリオ生成部20は、コンテンツの挿入部分に入れるシナリオのタイプを決定する(S22)。シナリオ生成部20は、メッセージタイプの情報から、挿入部分に録音音声と合成音声とが連続する箇所があるか否かを判定し、連続する箇所がある場合には、録音音声と合成音声とが切り替わることを示すメッセージが含むタイプであると判定する。シナリオ生成部20は、ここで判定したタイプのシナリオ群から、状況に合ったシナリオを選択する。
シナリオ生成部20は、シナリオ決定用モデルのユーザの属性に関するノードN1〜N3にユーザ情報ファイル24から取得したユーザ情報を設定し、状況に関するノードN4〜N6に、それぞれ時間管理部14、シーン管理部16、ナビ情報管理部18から取得したデータを設定する。そして、挿入できるシナリオの長さをノードN7に設定する。挿入できるシナリオの長さは、例えば、図2に示す「オープニング」では、10秒間である。シナリオ生成部20は、ノードN1〜N6にデータを設定した後、確率推論によってユーザに受け入れられる確率の最も高いシナリオを選択する(S24)。シナリオ生成部20は、番組中にあるすべてのコンテンツの挿入部分についてシナリオを選択し、番組全体のシナリオを生成する。
シナリオ生成部20は、生成したシナリオのデータを音声振分部32に入力する。音声振分部32は、入力されたシナリオのデータに従って音声を再生する(S26)。音声振分部32は、シナリオにより規定されたメッセージIDを、録音音声であるか合成音声であるかに基づいて録音音声再生部34、合成音声再生部36のそれぞれに振り分ける。録音音声再生部34および合成音声再生部36は、録音音声メッセージファイル38または合成音声メッセージファイル40からメッセージIDに対応するメッセージデータを読み出して再生する。
図8は、本実施の形態のコンテンツ提供装置1によって再生されるコンテンツの例を示す図である。図8は、図2に示す番組構成において、「00:00:00」から「00:02:10」に提供されるシナリオ「Senario0001」(図3参照)の例を示している。まず、「Msg1001」が再生され、「おはようございます。」の録音音声メッセージが再生され、続いて、「Msg1011」「Msg1008」の順に録音音声メッセージが再生される(S30)。
次に、「ナビーよろしくね。」(Msg0001)のメッセージが再生される(S32)。このメッセージにより、ユーザは、次に「ナビー」というキャラクターがしゃべると認識し、同じ声質でのメッセージが続くことを予測しなくなる。
続いて、「ナビーが最新ニュースをお届けします。」(Text0001)のメッセージが再生され(S34)、ニュースのデータが合成音声によって再生される(S36)。ニュースの再生が終了すると、「以上、ナビーがニュースをお届けしました」(Text0004)のメッセージが再生される(S38)。このメッセージにより、ユーザは、「ナビー」というキャラクターがしゃべり終えたと認識し、同じ声質でのメッセージが続くことを予測しなくなる。
本実施の形態のコンテンツ提供装置1は、録音音声と合成音声とが連続する場合には、合成音声に対応する合成音声用のキャラクター「ナビー」が合成音声を出力すること、または合成音声を出力したことを知らせるメッセージを再生する。これにより、ユーザは、合成音声の声の主は「ナビー」であり、録音音声の声の主とは異なるを認識するので、録音音声と合成音声の音質の相違による違和感をほとんど感じなくなる。
これにより、些細な音質の変化でも違和感を覚える可能性のあるコンテンツ提供において、ユーザに違和感を感じさせないので、録音音声と合成音声とを混在させてコンテンツを提供できる。録音音声と合成音声を混在して用いることにより、提供するコンテンツの幅を広げると共に、頻繁に用いるメッセージは音質良く再生することができる。
以上、本発明のコンテンツ提供装置について、実施の形態を挙げて詳細に説明したが、本発明は上記した実施の形態に限定されるものではない。
上記した実施の形態では、ベイジアンネットのモデルによって、状況に合ったシナリオを求める例について説明したが、状況に合ったシナリオを求めるための手法は、ベイジアンネットに限定されない。例えば、マルコフモデル等の確率モデルによってシナリオを求めてもよい。また、確率モデルを用いないで単に過去の操作履歴からシナリオの選択回数を検索して、選択回数に基づいてシナリオを求めてもよい。また、状況に合ったシナリオではなく、シナリオをランダムに決定する構成にも、本発明を適用することができる。
上記した実施の形態では、あらかじめ切替えのメッセージを含むシナリオを準備しているが、切替えのメッセージをシナリオに含めない構成を採用してもよい。例えば、「録音音声→合成音声」の切替えを知らせるメッセージ、「合成音声→録音音声」の切替えを知らせるメッセージを準備しておき、録音音声から合成音声に替わるときに、切替えのメッセージを挿入することとしてもよい。
上記した実施の形態では、録音音声と合成音声の音質の違いによる違和感を低減する例を挙げて説明したが、本発明は、録音音声と合成音声に限らず、品質の異なる複数の音声を再生する構成に適用することができる。合成音声の再生方式は複数知られており、それぞれの方式ごとに品質が異なる。このように品質の異なる複数の音声で構成されたコンテンツを提供する際には、一の方式によって再生される音声と他の方式によって再生される音声との間に、切替えのメッセージを挿入することにより、品質の違いによる違和感を低減することができる。
上記した実施の形態では、コンテンツ提供装置1およびその動作について説明したが、本発明には、上記したコンテンツ提供装置1による処理をコンピュータによって実行させるプログラムも含まれる。
以上説明したように、本発明によれば、録音音声と合成音声の音質の変化に伴う違和感を低減できるというすぐれた効果を有し、音楽、ニュース、天気予報等のコンテンツを提供する装置等として有用である。
本発明の実施の形態のコンテンツ提供装置の構成を示す図である。 番組構成の例を示す図である。 シナリオファイルに記憶されたデータの例を示す図である。 (a)録音音声メッセージファイルに記憶された切替えを示すメッセージの例を示す図である。(b)録音音声メッセージファイルに記憶された切替え以外のメッセージの例を示す図である。 合成音声メッセージファイルに記憶されたデータの例を示す図である。 シナリオ決定用モデル記憶部に記憶されたデータの例を示す図である。 本発明の実施の形態のコンテンツ提供装置の動作の例を示す図である。 本発明の実施の形態のコンテンツ提供装置によるコンテンツの提供例を示す図である。
符号の説明
1 コンテンツ提供装置
10 情報受信部
12 番組管理部
14 時間管理部
16 シーン管理部
18 ナビ情報管理部
20 シナリオ生成部
22 シナリオファイル
24 ユーザ情報ファイル
26 シナリオ決定用モデル記憶部
28 操作履歴ファイル
30 ユーザ操作取得部
32 音声振分部
34 録音音声再生部
36 合成音声再生部
38 録音音声メッセージファイル
40 合成音声メッセージファイル
50 番組センター

Claims (8)

  1. 録音音声および合成音声により構成されるコンテンツを提供するコンテンツ提供装置であって、
    前記録音音声を再生する録音音声再生部と、
    前記合成音声を再生する合成音声再生部と、
    前記録音音声再生部による録音音声の再生と前記合成音声再生部による合成音声の再生との切替えの際に、録音音声と合成音声とが切り替わることを知らせるメッセージを前記録音音声再生部または前記合成音声再生部によって再生するように制御する制御部と、
    を備えるコンテンツ提供装置。
  2. 録音音声と合成音声とが切り替わることを知らせるメッセージとして、録音音声に対応する録音音声用のキャラクターまたは合成音声に対応する合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを記憶したメッセージ記憶部を備え、
    前記制御部は、前記メッセージ記憶部から前記録音音声用のキャラクターまたは前記合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御する、
    請求項1に記載のコンテンツ提供装置。
  3. 前記制御部は、切替え後に再生される音声の種類に対応したキャラクターが切替え後のコンテンツを提供することを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御する、
    請求項2に記載のコンテンツ提供装置。
  4. 前記制御部は、切替え前に再生されていた音声の種類に対応したキャラクターが切替え前のコンテンツを提供したことを知らせるメッセージを読み出し、読み出したメッセージを再生するように前記録音音声再生部または前記合成音声再生部を制御する、
    請求項2に記載のコンテンツ提供装置。
  5. コンテンツを構成する録音音声および合成音声のメッセージの再生順序を規定したシナリオを記憶したシナリオ記憶部を備え、
    前記録音音声再生部および前記合成音声再生部は、前記シナリオ記憶部からシナリオを読み出し、読み出したシナリオに基づいて録音音声または合成音声の再生を行い、
    前記シナリオ記憶部に記憶されたシナリオは、録音音声と合成音声のメッセージの間に、前記録音音声用のキャラクターまたは前記合成音声用のキャラクターがコンテンツを提供することを知らせるメッセージを挿入することを規定している請求項2に記載のコンテンツ提供装置。
  6. 品質に差のある複数の音声により構成されるコンテンツを提供するコンテンツ提供装置であって、
    前記コンテンツを構成するそれぞれの音声を再生する音声再生部と、
    一の音声の再生と他の音声の再生との切替えの際に、一の音声と他の音声とが切り替わることを知らせるメッセージを前記音声再生部によって再生するように制御する制御部と、
    を備えるコンテンツ提供装置。
  7. 録音音声および合成音声により構成されるコンテンツを提供するコンテンツ提供方法であって、
    録音音声再生部が録音音声を再生する録音音声再生ステップと、
    合成音声再生部が合成音声を再生する合成音声再生ステップと、
    録音音声と合成音声との切替えの際に、前記録音音声再生部または前記合成音声再生部が、録音音声と合成音声とが切り替わることを知らせるメッセージを再生する切替えメッセージ再生ステップと、
    を備えるコンテンツ提供方法。
  8. 録音音声および合成音声により構成されるコンテンツを提供するためのプログラムであって、コンピュータに、
    録音音声を再生する録音音声再生ステップと、
    合成音声を再生する合成音声再生ステップと、
    録音音声と合成音声との切替えの際に、録音音声と合成音声とが切り替わることを知らせるメッセージを再生する切替えメッセージ再生ステップと、
    を実行させるプログラム。
JP2006078821A 2006-03-22 2006-03-22 コンテンツ提供装置およびコンテンツ提供方法 Pending JP2007256456A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006078821A JP2007256456A (ja) 2006-03-22 2006-03-22 コンテンツ提供装置およびコンテンツ提供方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006078821A JP2007256456A (ja) 2006-03-22 2006-03-22 コンテンツ提供装置およびコンテンツ提供方法

Publications (1)

Publication Number Publication Date
JP2007256456A true JP2007256456A (ja) 2007-10-04

Family

ID=38630782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006078821A Pending JP2007256456A (ja) 2006-03-22 2006-03-22 コンテンツ提供装置およびコンテンツ提供方法

Country Status (1)

Country Link
JP (1) JP2007256456A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008273497A (ja) * 2007-03-30 2008-11-13 Denso It Laboratory Inc 情報提供支援方法及び情報提供支援装置
JP2009194532A (ja) * 2008-02-13 2009-08-27 Fuji Xerox Co Ltd 情報配信システム、情報配信装置及びプログラム
JP2013161038A (ja) * 2012-02-08 2013-08-19 Denso Corp 音声出力装置、および、音声出力システム
WO2022185551A1 (ja) * 2021-03-05 2022-09-09 株式会社ネイン 音声アシストシステム、音声アシスト方法およびコンピュータプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0712581A (ja) * 1993-06-25 1995-01-17 Aqueous Res:Kk 車輌用音声出力装置
JP2000242289A (ja) * 1998-10-07 2000-09-08 Meidensha Corp 音声応答システムの文字列管理方式
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
JP2005056170A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 対話型操作支援システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0712581A (ja) * 1993-06-25 1995-01-17 Aqueous Res:Kk 車輌用音声出力装置
JP2000242289A (ja) * 1998-10-07 2000-09-08 Meidensha Corp 音声応答システムの文字列管理方式
JP2001343991A (ja) * 2000-05-31 2001-12-14 Sharp Corp 音声合成処理装置
JP2005056170A (ja) * 2003-08-05 2005-03-03 Matsushita Electric Ind Co Ltd 対話型操作支援システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008273497A (ja) * 2007-03-30 2008-11-13 Denso It Laboratory Inc 情報提供支援方法及び情報提供支援装置
JP2009194532A (ja) * 2008-02-13 2009-08-27 Fuji Xerox Co Ltd 情報配信システム、情報配信装置及びプログラム
JP2013161038A (ja) * 2012-02-08 2013-08-19 Denso Corp 音声出力装置、および、音声出力システム
WO2022185551A1 (ja) * 2021-03-05 2022-09-09 株式会社ネイン 音声アシストシステム、音声アシスト方法およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
KR100240637B1 (ko) 다중매체와의 연동을 위한 텍스트/음성변환 구현방법 및 그 장치
JP2004347943A (ja) データ処理装置、楽曲再生装置、データ処理装置の制御プログラムおよび楽曲再生装置の制御プログラム
JP2008096483A (ja) 音響出力制御装置、音響出力制御方法
JP5198688B1 (ja) メッセージ編集装置、メッセージ通信端末及びメッセージ通信システム
KR100805308B1 (ko) 이동통신 단말기에서의 컨텐츠 추천 서비스 방법 및 이를위한 이동통신 단말기
JP2007256456A (ja) コンテンツ提供装置およびコンテンツ提供方法
JPH09311850A (ja) マルチメディア情報プレゼンテーションシステム
JP5426133B2 (ja) 音声出力装置、音声出力方法及びプログラム
JP2006171579A (ja) 音声再生プログラムおよびその記録媒体、音声再生装置ならびに音声再生方法
JP4965371B2 (ja) 音声再生装置
JP2008172421A (ja) 記録装置および方法、再生装置および方法、並びにプログラム
JP2007094751A (ja) エージェントシステム、情報提供装置、及び端末装置
JP2005135519A (ja) 音楽再生装置
JP2005285285A (ja) コンテンツ読出装置及び楽曲再生装置
JP6781636B2 (ja) 情報出力装置及び情報出力方法
JP5126627B2 (ja) カラオケ装置
KR101129974B1 (ko) 객체 기반 오디오 컨텐츠 생성/재생 방법 및 그 장치
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JP6601615B2 (ja) 動画処理システム、動画処理プログラム、及び、携帯端末
JP4263151B2 (ja) コンテンツ再生パターン生成装置、コンテンツ再生システム及びコンテンツ再生パターン生成方法
JP3545065B2 (ja) 通信カラオケシステム
JP2019109321A (ja) カラオケシステム
WO2022075418A1 (ja) 通信方法およびシステム
JP2007336085A (ja) 予告生成装置、予告生成方法、予告生成サーバ、予告生成プログラム、および記録媒体
JP2008108076A (ja) 音声メッセージ出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100910

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101012