JP2009544247A - オーデイオ情報を配信するための改良された方法及び装置 - Google Patents

オーデイオ情報を配信するための改良された方法及び装置 Download PDF

Info

Publication number
JP2009544247A
JP2009544247A JP2009520927A JP2009520927A JP2009544247A JP 2009544247 A JP2009544247 A JP 2009544247A JP 2009520927 A JP2009520927 A JP 2009520927A JP 2009520927 A JP2009520927 A JP 2009520927A JP 2009544247 A JP2009544247 A JP 2009544247A
Authority
JP
Japan
Prior art keywords
information
speech
speech synthesis
broadcast
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009520927A
Other languages
English (en)
Inventor
レーン、フランク・エー.
ラロイア、ラジブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009544247A publication Critical patent/JP2009544247A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

エンハンスド・オーデイオを提供するための方法及び装置が記載される。幾つかの実施の形態では、音声合成情報は、言語、トーン、性別、及びボリュームのような受信放送尾根意の属性のユーザ制御を提供するために用いられる。他の実施の形態では、音声合成情報は、放送オーデイオ信号より前に送信され、オーデイオ信号に中断が存在する場合には、受信ノードが放送オーデイオ信号の代わりに合成された音声を用いることができるようにする。さらに他の実装は、背景情報、関連したローカル情報、タイトル、著者、等のような、放送オーデイオ信号とは異なる音声の合成を許容する。他の実施の形態は、単一の送信ストリームにおいて多音声プログラミングの同時送信を許容し、選択されたプログラムを表わす音声を合成するための送信された組のプログラムから1つのプログラムをユーザが選択できるようにする。

Description

本発明は、通信システムに関し、さらに詳細には、エンハンスド・オーデイオ情報(enhanced audio information)の配信(delivery)を改良するための方法及び装置に関する。
オーデイオ・プログラミングは、通常、1つの中央局(a central point)から複数の受信局(multiple receiving points)に放送される。放送ラジオ又はTV(衛星又は地上)のような無線システム、又は無線セルラー放送システムでは、オーデイオ・プログラミングは、放送のためにサンプル(sampled)されかつ圧縮(compressed)される。それは、オーデイオ・プログラミングを再生するために、受信エンドで処理される。このプロセスは、特に高忠実度オーデイオ再生のためには、大きな送信帯域幅を用いる。音声がオーデイオ・プログラミングである場合には、話者は受信エンドにおいて再生オーデイオから識別可能である。しかし、高忠実度オーデイオを送信するために必要とされる高帯域幅と共に、受信デバイスは一般にオリジナルを再生するにすぎない。受信エンドにおけるユーサは、放送オーデイオ音声の性別(gender)、抑揚、トーン、スピード、言語、等をコントロールできない。さらに、高帯域幅が必要とされるために、オーデイオ・セレクションの限定されたアレイを送信するために利用できるチャンネルは、ほんの限られた数しか存在しない。
オーデイオ音声をテキスト又は音声記号で表示することは技術的に良く知られている。それらの表示は、可聴音声を生成するために音声合成器で処理されうる。性別、抑揚、スピード、トーン、ボリューム、等のような種々の選択的属性をもって音声を生成するために、種々のパラメータを合成処理に適用することも良く知られている。表示記号からの音声合成は、選択的音声表示(alternative phonetic representations)を用いることによるように記号体系選択を変更することによって、任意の言語で達成されうることも知られている。
放送TV及びラジオ局はネットワーク化及びシンジケート化されることが多く、全国的な放送となることも知られている。このプロセスにおいては、ローカル情報(ローカル・スポーツ、ニュース、天気、等)は視聴者には提供されないことが多い。
放送オーデイオの一般的な問題は、車両がトンネルに入ったり、あるいは、構造物の背後に行く場合のように送信が中断される可能性である。それが放送情報である(受信デバイスは、放送送信者に再送信を依頼する信号を送ることは一般的にできない)から、その中断時に送信されたオーデイオは失われることになる。
上記の論述を考慮して、オーデイオ情報を単独で又は送信ビデオ・プログラミングと組合せて送信する新規であって改良された方法の必要性があることが認識されるべきである。
上記の問題及び制限は種々の実装により大きく緩和される。幾つかの実施の形態は、通常は放送シナリオにおいて、放送オーデイオに代えて又はそれに加えて、音声合成情報を送信することを必要とする。音声合成情報は、音声のテキスト又は音声表示でありうる。テキスト・ベースの場合には、合成された音声の表記を修正するために、制御情報(音声パラメータのような)が、受信エンドで適用されうる。例えば、得られた合成ボイスをさらに美的に快くするために、音声合成情報は、種々の訛り(例えば、米国南部の抑揚)で、種々のトーン(例えば、とげとげしい厳しいボイス、あるいは、柔らかい気分が安らぐボイス)で、選択されたスピード、等で、男性のボイスと女性のボイスとして交互に提供されてもよい。これらのパラメータは、音声合成情報と一緒に放送されてもよく、又は、受信デバイスによって供給されてもよく、あるいは、それら2つの組合せであってもよい。受信音声合成情報は、リアルタイムで合成されてもよく、あるいは、後で回収するために記憶されてもよい。さらに、記憶された音声合成情報は、ユーザが合成されたボイスを停止、巻き戻し、又は早送りできるようにするために利用されうる。
幾つかの実施の形態では、テキスト・ベースの音声合成情報は、複数の受信ノード又は局に送られ、そして、各局は、音声合成情報に適用すべき音声パラメータを選択し、種々の受信ノードにおいて種々の可能なオーデイオ音声出力を生ずるようにできる。オーデイオとは異なり、音声合成情報を送信するために必要とされる帯域幅は比較的小さいから、複数のプログラミングが同時に送られうる(又は実効的に同時に、それにより、各プログラムは、受信エンドにおいて“リアルタイム”で合成されうる)。例えば、音声は、音声合成情報を送信することによって達成される場合には、最小の帯域幅で、幾つかの言語で同時に放送されうる。あるいは、ローカル・ニュース、スポーツ、及び天気は、複数の地方に放送でき、そして、各受信デバイスは、それのボイス合成のために用いるべきプログラミングを選択できる。あるいは、1つまたは複数の書籍が、リアルタイム・オーデイブル・レンダリング(real time audible rendering)のために、あるいは、ダウンロードして後で聴くために、ニュース又はスポーツと一緒に送信されてもよい。
さらに、必要帯域幅は比較的小さいので、ターゲット音声を表わす音声合成情報と一緒に、付加情報が送られうる。例えば、テキスト・ベースの音声合成情報と一緒に、音声制御パラメータが送られうる。プログラムについての情報は、付加音声合成情報として含まれうるので、この情報(例えば、著者、タイトル、区分)は、受信ユーザの要求で音声に合成されうる。また、同期化情報、暗号制御、著作権情報、等が、音声合成情報送信と一緒に含まれうる。
他の実施の形態は、放送オーデイオに合致する又は部分的に合致する音声合成情報と一緒に放送オーデイオを送信することを含む。放送オーデイオ信号に合致する音声合成情報が対応する放送音声より先に送信され、そして、放送オーデイオ送信が中断されると、受信デバイスは、先に受信された音声合成情報に戻り、それを合成器に送り、そして放送オーデイオが中断された時点における合成音声と一緒にピックアップすることができる。
他の実施の形態では、音声合成情報は、それが異なる言語であろう点を除いて、ビデオ/オーデイオ放送のオーデイオ部分のような放送オーデイオに合致しうるであろう。それぞれ異なる言語の複数の音声合成情報ストリームを同時に送ることにより、受信ユーザは、ビデオ・プログラミングを見ながら、彼が聞きたい言語を選択できるであろう(その言語に関連した音声合成情報を選択しかつその情報を合合成して音声とすることによって)。これは、例えば、MPEG送信の通信チャンネルに音声合成情報を取り入れることによるような既存の技術で達成されうる。
本発明の付加的特徴及び利益は、下記の詳細な説明において論述される。
種々の実施の形態に従って実装される例示的な通信システムのネットワーク図を示す。 種々の実施の形態に従って実装される例示的な基地局を示す。 種々の実施の形態に従って実装される例示的なモバイルノード(mobile node)を示す。 種々の実施の形態によるオーデイオ材料セグメンテーション・プロセス(audio material segmentation process)を示す。 種々の実施の形態によるオーデイオ材料セグメンテーション・プロセスを示す。 種々の実施の形態による送信音声合成情報に関連した識別情報を示す。 種々の実施の形態によるオーデイオ/ビデオ及び関連する音声合成情報をセグメント化するプロセスを示す。 種々の実施の形態によるオーデイオ/ビデオ及び関連する音声合成情報をセグメント化するプロセスを示す。 種々の実施の形態によるオーデイオ/ビデオ及び関連する音声合成情報をセグメント化するプロセスを示す。 種々の実施の形態によるオーデイオ及び関連する音声合成情報を受信しかつ提供するプロセスを示す。 種々の実施の形態による通信デバイス、例えば、基地局を動作する例示的な方法のフローチャート図である。 種々の実施の態様によるユーザデバイス、例えば、モバイルノードのような無線端末を動作する例示的な方法のフローチャートの図である。 種々の実施の形態による無線端末を動作する例示的な方法のフローチャートの図である。 種々の実施の形態による無線端末を動作する例示的な方法のフローチャートである。 種々の実施の形態による無線端末を動作する例示的な方法のフローチャートの図である。 種々の実施の形態に従って実装される例示的な基地局の図である。 種々の実施の形態に従って実装される例示的な無線端末、例えば、モバイル・ノードの図である。
詳細な説明
エンハンスド・オーデイオ機能(enhanced audio capabilities)のための種々の実施の形態の方法及び装置は、広い範囲のデジタル通信システムに用いられうる。例えば、本発明は、デジタル衛星ラジオ/テレビ放送、デジタル地上波ラジオ/テレビ放送、又はデジタル・セルラー・ラジオ・システムに用いることができる。モデムを備えたノートブック・コンピュータ、PDAs、及びデバイス移動性の観点で無線インターフェースを支持する種々の他のデバイスのようなモバイル通信デバイスをサポートするシステムもまた、種々の実施の形態の方法及び装置を利用できる。
図1は、種々の実施の形態に従って実装された例示的な通信システム10、例えば、通信リンクによって相互接続された複数のノードを具備するセルラー通信ネットワーク(cellular communication network)を示す。通信システムは、図1に示されているタイプの複数の(multiple)セルを含んでよい。通信セル10は、基地局12と、矢印13、15によって示されるように無線で基地局12とデータ及び信号を交換するN個のモバイルノード(mobile nodes)14、16を含む。このネットワークは、無線リンクで情報を伝達するためにOFDM信号を用いてよい。しかし、他のタイプの信号、例えば、CDMA信号が代わりに用いられてもよい。例示的通信システム100におけるノードは、通信プロトコル、例えば、インターネット・プロトコル(IP)に基づいて、信号、例えば、メッセージを用いて情報を交換する。
システム10の通信リンクは、例えば、ワイヤ、ファイバ・オプテイック・ケーブル、及び(又は)無線通信技法を用いて実装されてもよい。種々の実施の形態によれば、基地局12及びモバイルノード14、16は、伝達されているデータ信号、例えば音声又は他のプレイロード(payload)情報とのは独立に制御シグナリング(control signaling)を実行及び(又は)維持できる。制御シグナリングの例は、音声の音声表示、タイミング情報、合成パラメータ(トーン、性別、ボリューム、発話率、その地域の抑揚、等)、及び背景情報(主題分類、タイトル、著者、著作権、デジタル著作権管理、等)を含みうる音声合成情報(speech synthesis information)を含む。発話の表示は、ASCII又は他の記号論(symbology)、フォネメス(phonemes)、又は他の発音表示を利用してよい。
図2は、種々の実施の形態に従って実装された例示的な基地局を示す。図示のように、例示基地局12は、種々の要素がデータ及び情報を交換できるバス207によって互いに結合された受信モジュール202、送信モジュール204、プロセッサ206、メモリ210、及びネットワーク・インターフェース208を含む。受信機モジュール202は、モバイルノードから信号を受信するためのアンテナ203に結合される。送信機モジュール204は、信号をモバイルノードに放送するために用いられうる送信アンテナ205に結合される。ネットワーク・インターフェース208は、基地局12を1つ又は複数のネットワーク要素、例えば、ルータ及び(又は)インターネットに結合するために用いられる。このようにして、基地局12は、基地局12によってサービス(serviced)されるモバイルノードと他のネットワーク要素との間の通信要素として作用できる。このような実施の形態は、ブロードキャスト・オンリ・モード(broadcast-only mode)で実施可能であり、ある場合には実施され、このような場合には、受信モジュール202又はアンテナ203に対する必要性はない。
基地局12の動作は、メモリ210に記憶された1つ又は複数のルーチンの指示のもとでプロセッサ206によって制御される。メモリ210は、通信ルーチン223、データ220、オーデイオ及び音声合成情報、及びアクテイブ・ユーザ情報212(これはブロードキャスト・オンリ・インプルメンテーション(broadcast-only implementation)でも不必要でありうる)を含む。データ220は、1つ又は複数のモバイルノードに送信されるべきデータをすくみ、放送オーデイオ信号(broadcast audio signals)(通常はサンプリングされ、圧縮されたフォーマットで)及び音声合成情報を備える。放送オーデイオ(broadcast audio)は、関連する放送オーデイオ(例えば、MPEGフォーマット化された材料)を伴う放送ビデオ(broadcast video)で置き換えられてもよく、ある実施の形態では置き換えられる。この場合には、音声合成情報は、このような送信の制御チャンネルで搬送されうる。
オーデイオ及び音声合成情報コントローラ(audio and speech synthesis information controller)222は、アクテイブユーザ情報212及びデータ220と関連して動作する。コントローラ222は、モバイルノードがエンハンスド・オーデイオ・サービス(enhanced audio services)を必要としうるかどうか、そしていつ必要としうるかを決定することに関与する。それは、それの決定の基礎を、エンハンスド・オーデイオを要求するモバイルノードからの要求、使用可能なリソース、使用可能なデータ、モバイル優先(mobile priorities)等のような種々の基準に置く。これらの基準により、基地局はそれに接続されたモバイルノードに対して異なる品質のサービス(QOS)をサポートできるであろう。あるいは、基地局12は、放送のみモード(broadcast-only mode)で動作することができ、その場合には、それは、エンハンスド・オーデイオ・サービス(enhanced audio services)を全てのモバイルノードに送信して、それにより、アクテイブユーザ情報212の必要性を除去するであろう。
エンハンスド(ボイス合成がサポートされた)オーデイオ・サービス(enhanced (voice synthesis supported) audio services)が提供されるべき場合には、コントローラ222は、データ220から適切なデータを抽出するであろう。例えば、1つのタイプのエンハンスド・オーデイオは、複数の言語での複数のモバイルノードに対するオーデイオ音声(audio speech)の選択を表わす音声合成情報を放送することを備えてよい。このシナリオでは、各受信モバイルノードは、好ましい言語を選択し、そして、音声合成のためにその言語に対応する音声合成情報を除去(strip out)することができるであろう。これを達成するために、コントローラ222は、送信機204による放送のための適切な音声合成情報を構成するためにデータ220から適切なデータを選択するであろう。
他のタイプのエンハンスド・オーデイオは、オーデイオ音声信号(サンプルされかつ圧縮された)の時間遅延放送が後に続く音声の一部分に対応する音声合成情報を複数のモバイルノードに放送するためであってよい。このようにして、受信ノードは、音声を表わす受信音声合成情報を記憶し、そして後で受信ノードデバイスにおいて、そのオーデイオ音声をユーザに対して再生できるであろう。受信無線信号を遮断するトンネルにユーザが入ったようなことによってオーデイオ音声の受信が中断された場合には、受信ノードはその中断を検知し、そして、その中断が生じた時点から始まって、先に受信された音声の音声合成情報表示から音声を合成することを始める。このようにして、放送オーデイオ音声によって表わされるように、合成音声がオリジナル・スピーカの音声になくても、そのモバイルノードにおけるユーザは、その音声のいかなる部分をも見逃すことはないであろう。エンハンスド・オーデイオ・サービスのこの実装(implementation)では、コントローラ222は、データ220から適切な音声合成情報及びそれの対応するオーデイオ信号を選択するであろう。
さらに他のタイプのエンハンスド・オーデイオは、オーデイオ音声の一部分に対応する音声合成情報を複数(multiple)のモバイルノードに放送するためであってよく、その場合、音声合成制御情報は、性別、トーン、ボリューム、発話率、地域の抑揚、等を種々に表わす合成パラメータを含む。あるいは、合成パラメータの幾つか又は全てがモバイルノードによって局所的に供給されうる。このようにして、受信モバイルノードは、音声の音声合成情報表示を受信し、関連したパラメータの中から選択し、そして選択されたパラメータに従って音声を合成することができる。このようにして、モバイルノードにおけるユーザは、基地局12からのオーデイオ情報の配信の態様を制御することができる。これにより、1つのモバイルノードは、他のモバイルノードとは異なる音声のオーデイオ表現(audio rendition)を生成できる。例えば、あるユーザは話者を男性として合成することができ、他のユーザは同じ受信内容を女性のボイスで合成することができるであろう。
さらに他のタイプのエンハンスド・オーデイオは、送信された音声合成情報に含まれた対応する背景情報と一緒に、オーデイオ信号を複数のモバイルノードに放送するためであってよい。このような背景情報は、オーデイオ分類(スポーツ、天気、本、等)、タイトル、著者、著作権、デジタル著作権管理、暗号化制御、等であってよい。背景情報は、セキュリテイ制御、暗号化、オーデイオ区分(audio classification)、等のような合成プロセスを制御するためにモバイルノードによって使用されるべきデータを含んでいてもよく、或いは、放送の又は合成されたオーデイオ・プログラム材料(audio program material)のようなモバイルノードにおいてユーザに対して入手可能な追加オーデイオ材料として合成を受けるデータであってもよい。
アクテイブユーザ情報212は、基地局12によってサービスを提供される各アクテイブユーザ及び/又はモバイルノードに対する情報を含む。各モバイルノード及び/又はユーザに対して、それは、そのユーザに利用可能なエンハンスド・オーデイオ・サービスを含み、また、音声合成パラメータに関するユーザ・プリファレンス(user preferences)を、それらのパラメータが基地局12において実行される程度だけ、含む。例えば、1つのサブセットのユーザは、早口の男性のボイスによるスペイン語のエンハンスド・オーデイオを好むかも知れない。他の部類のユーザは、女性のボイスで、米国南部の訛り又は抑揚での英語のエンハンスド・オーデイオを好むかも知れない。基地局12は、上記の他のプレファレンス(preferences)のそれぞれに対する合成制御パラメータと一緒に、各言語の音声合成情報を全てのモバイルノードに送ることができ、あるいは、同様の好みを有する複数のサブセットの受信機に対する送信を調整することができる。
図3は、例示的な無線端末、例えば、種々の実施の形態に従って実装されるモバイルノード14を示す。モバイルノード14は、図3に示されているように互いに結合された受信機302、送信機304、音声合成器308、アンテナ303、305、メモリ310、ユーザI/Oデバイス309、及びプロセッサ306を含む。モバイルノードは、基地局12へ情報を送信しかつ基地局12から情報を受信するためにそれの送信機306、受信機302、及びアンテナ303、305を用いる。この場合にも、放送のみ実装では、送信機304及びアンテナ305は必要ではにであろう。
メモリ310は、ユーザ/デバイス情報312、データ320、セグメント又はタイミング制御モジュール324、オーデイオ及び音声合成制御モジュール326、及び音声合成パラメータ制御モジュール328を含む。モバイルノード14は、プロセッサ306によって実行されるモジュールの制御のもとで動作する。ユーザ/デバイス情報312は、デバイス情報、例えば、デバイス識別子、ネットワーク・アドレス又は電話番号を含む。この情報は、例えば、通信チャンネルを割当てる場合に、モバイルノードを識別するために基地局12によって使用されうる。データ320は、例えば、音声合成パラメータの間での選択に関するユーザ・プリファレンス、及び局部的に記憶された音声合成パラメータを含む(もしあれば)。
オーデイオ及び音声合成制御モジュール326は、基地局12から受信された信号及びユーザ入力データと関連して、モバイルノードがエンハンスド・オーデイオ・サービス信号(enhanced audio service signals)を受信しているであろうか否か、その信号のフォーマット、音声合成パラメータの位置(どのパラメータが基地局12において制御されているか及びどのパラメータがモバイルノード14において制御されているか)、及び任意の背景情報の制御を決定する。セグメント又はタイミング制御モジュール324と関連して、モジュール326は、ユーザへの配信(受信放送オーデイオのような)及び音声合成器308への配信(音声合成情報)、又は両方のための適切な入来データ・ストリームをプロセッサ306に選択させるであろう。
音声合成パラメータ制御モジュール328は、基地局12から受信された及び(又は)データ320から局部的に抽出された)適切な合成パラメータを、処理及びモバイルデバイス14のユーザへの配信のために、音声合成器308に入力する。データ320はまた、受信された音声合成情報を、後の合成及び再生のために記憶するためにも用いられることができる。
図4は、セグメント放送オーデイオ信号及び放送オーデイオに対応する音声合成情報の図である。前述のように、1つの実装(implementation)は、音声プログラムに関連した音声合成情報を複数(multiple)の受信ノードに送信し、そして、ある遅延の後で、オーデイオ音声プログラムを受信ノードに放送することである。このようにして、受信ノードが(例えば、トンネルに入ったり又は建物や丘の背後を通ることにより)送信ノードとの無線接触を失ったことのより、放送オーデイオ・プログラムが中断された場合には、受信ノードはその中断を検知し、放送オーデイオに対応する受信され記憶された音声合成情報における中断点を識別し、そして合成しそしてその中断点で始まって合成されたオーデイオを受信デバイスのユーザに提示することを開始する。一方、無線接触を失わなかった他の受信デバイスは、放送オーデイオをユーザに提供し続けるであろう。同様にして、中断を受けた受信デバイスは、放送オーデイオの再開を識別して、そして直ちにその信号に戻ることができるであろう。
セグメント・データ41は、放送オーデイオ・プログラムに関連した音声合成情報の番号を付けたセグメントを表わす。セグメント・オーデイオ・ストリーム(Segmented audio stream)42は、サンプル(sampled)され、圧縮(compressed)された放送オーデイオ・プログラムのセグメンテーションを表わし、各セグメントは、番号を付けられ、同じ番号の音声合成情報セグメントと関連する。しかし、受信ノードへのストリーム42セグメントの送信は、セグメント・ストリーム41から時間的に遅延される。この遅延は、1秒より小さい遅延から数分までの任意の遅延であってよく、放送オーデイオの受信における中断の場合に合成オーデイオの継続を許容することを意図される。
これを達成する1つの方法は、少なくとも最長の予想送信中断と同じ長さだけストリーム12の送信を遅延させることであろう。例えば、各セグメントが2秒の長さであり、かつ予想中断が4秒の長さでありうる場合には、図4に示されているように、遅延は4秒、すなわち、2セグメントとなるであろう。図4において、バッファ・サイズが2セグメントであるとして、合成セグメント41が受信される場合にバッファされ又は記憶されるならば、そして、ストリーム42のオーデイオ・セグメント1及び2(従ってストリーム41の合成情報セグメント3及び4)の送信が受信されないならば、バッファは合成情報セグメント1及び2を含むであろう。受信ノードは、バッファド・セグメント(buffered segments)(1及び2)を合成し、それらをユーザに再生することができ、そして、送信がストリーム43のオーデイオ・セグメント3で回復されると、ユーザに再生するためにそのオーデイオ・セグメント及び後続のオーデイオ・セグメントに戻ることができる。このようにして、セグメント1及び2はオーデイオ・セグメント・ストリームの圧縮されたオーデイオではなくて合成されたボイスであろうが、ユーザは、オーデイオ・プログラムの全てのセグメントを受信するであろう。
あるいは、ストリームを物理的にセグメント化する代わりに、記憶された合成情報がユーザに再生されるべき時点を、中断の時点に一致するように、遅延に基づいて指定するためにタイミングが用いられうる。また、それは、合成情報を受信ノードに送信し、そして、オーデイオ・セグメントを送信する前にそれらを記憶するための種々の実施の形態と一致する。このようにして、オーデイオの任意の長さの中断は、中断部分の合成オーデイオでもって修復されうる。
図5は、他の実施の形態に役立つための1つの手法を示す。前述のように、プログラミングは、MPEG技術を用いることにより、ビデオ及びオーデイオでああってもよい。この説明は、ボイス・オーバー・データ・システム(voice over data systems)のような、データを同時に送信するデジタル・オーデイオ送信にも等しく該当する。MPEG音声の場合には、番号によってセグメントに分けられたビデオのストリーム53、及び対応する識別番号をもってセグメントに分けられたオーデイオの同時ストリーム52が存在するであろう。さらに、オーデイオの全て又は一部を表わし、かつ合成制御パラメータ及び(又は)背景情報をさらに含む信号の制御データ部分(オーバーヘッド、メンテナンス、又は低速データ部分と呼ばれる場合がある)に音声合成情報の同時送信が存在しうる。
これは、ノード供給された合成制御パラメータを受信することと関連して、ユーザがプログラムのオーデイオ部分に関する種々のエンハンスド・オプション(enhanced options)を提供されうるようにするであろう。これらのオプションは、言語、性別、トーン、音声レート、タイトル、著者、区分、ローカル・ニュース、又は天気、等のようなプログラムに関する付加的情報を含んでよい。これらの選択は、例えば、キーパッド又は他の制御デバイスから入力することにより、ユーザによってなされうる。さらに、音声合成情報における背景情報は、このようなキーパッド又は他の制御デバイスでユーザに提示される選択を含むことができるであろう。
図6は、基地局からの送信の1つの実施の形態の実行を示す。この実施の形態では、音声合成情報は、幾つかの音声プログラムの多くの音声表示を含んでよい。音声の音声表示(ならびに音声のテキスト表示(text representations))は、音声の典型的なサンプルされ圧縮されたオーデイオ表現(audio renditions)と比較して非常に小さな帯域幅を用いるから、同じ音声プログラム又は異なる音声プログラムの多くのバージョンが複数の受信ノードに同時に放送されうる。例えば、セルラー無線環境では、OFDM技術が、オーデイオ音声(audio speech)の種々のストリームを同時に送信するために使用できる。さらに、背景情報及び(又は)合成制御情報は、同じ送信内にインターレースされうる又は織り込まれうる。
図6は、受信ノードに放送される音声合成情報の背景情報の一部を図面600に示す。具体的には、それは関連する音声合成情報の識別情報を示す。各行は、音声プログラムの表示を含む音声合成情報のストリームと関連付けられている。音声プログラムは、音声の音声表示を含む音声合成情報によって又は関連合成パラメータと共に、音声のテキスト表示によって表わすことができる。前者の場合には、音声合成器は、音声を直接生成するために情報を用いるであろう。後者の場合には、パラメータは、音声を生成するためにテキスト表示と一緒に、音声合成器によって使用されうる。合成パラメータが使用される場合には、それらは、受信ノードによって供給される音声合成情報の一部として、又は両者の組合せとして送信されることができる。
各行は、生成された音声の種々の属性(音声合成器によって生成される)を記述する。特定の例示的属性が、例示のために第1の2つの行に記載されている。例えば、行610は、関連した音声合成情報が、速度番号2に設定された音声レートを有し、かつ地域1(例えば、米国南部のような)の訛り又は抑揚を有する男性のボイスを表わす。行612に関連する音声合成情報は、音声レート2であるが地域2(例えば、米国中西部のような)の訛りのある女性のボイスを表わしているとして列608に識別されている。上述のように、これらの組の音声の属性は、音声の音声表示に取り込まれてもよく(その場合には、行610及び612属性の各組は発音記号の関連した送信ストリームを有するであろう)、或いは、合成パラメータを適用することにより音声のテキスト表示に追加されてもよい(その場合には、行610及び612に対しては、音声のテキスト表示の送信は1回だけであり、行610及び612に関連した属性の2つの組の何れかを合成器が生成できるようにする)。行308の他の列614、616、618、620、622は、これらの音声属性の他の組合せ、又は音量、他の言語、等のような他の属性を表わす。
列602は、各行に関連する音声合成情報に関連した地域の識別(郵便番号、名称、等による)を表わす。行610の音声属性は地域1の訛りを表わすから、列602は行610うぃ地域1に関係するとして識別する。列604は、各行に関連した音声合成情報の区分を示す。音声属性の第1のストリーム(行610)は、スポーツのプログラミングを含む。音声属性の第2の組(行612)は、天気の音声プログラミングを含む。列606は、各行に表示されたプログラミングの地理的区分を識別する。行610は、スポーツ(列604で識別された)は、全国的又は国際的ではなく、ローカルであることを示す。同様に、列606の行612は、関連する音声が、全国的又は国際的な天気ではなくて、地域2からのローカル天気に関することを示す。
図6における情報は、受信ノードがユーザに選択を提供できて、ユーザが図6に関連して上述された属性から選択できるようにするために、音声合成情報ストリームと一緒に放送される。例えば、ユーザが“速度2”及び地域2の訛りの女性のボイスでローカル天気を聞きたい場合には、ユーザは行612の属性を選択するであろう。音声の音声表示を含む音声合成情報の場合には、受信ノードは、行612に関連した音声合成情報ストリームを選択して、それを音声合成器に送るであろう。音声のテキスト表示を含む音声合成情報の場合には、受信ノードは、行612に関連した音声合成情報を選択し、そして、列608のパラメータ(音声合成情報ストリームの一部として局所的に記憶されるか或いは受信される)を適用し、両方を音声合成器に提供する。このようにして、原文音声合成情報の同じストリームが、列608、行610の属性を生成するために1つの受信ノードによって用いられることができ、そして、他の受信ノードは、列608、行612の属性を有する音声を生成することができるであろう。
図7A及び図7Bの組合せよりなる図7は、図4及び5に示されたように放送送信のためのオーデイオ/ビデオ材料及び添付情報をセグメント化するプロセス700を示す。手順700の動作はステップ701で開始し、そしてステップ711へと進む。702の材料及び情報の第1の部分はステップ711で回収されるであろう。ビデオ材料は処理されかつ符号化されて、ステップ703における送信に適したセグメントとなされ、そして、ステップ704は、セグメントのタイミング、セグメント識別表示、等のようなセグメント同期化情報を追加するであろう。ビデオ・セグメントは次にステップ705で記憶されるであろう。
オーデイオ材料部分は、ステップ712で処理され、そこで、符号化され(サンプルされる、圧縮される、等)、送信に適したセグメントとなされるであろう。ステップ713は、セグメントのタイミング、セグメント識別表示、等のようなセグメント同期化情報を追加するであろう。オーデイオ・セグメントは次にステップ714において記憶されるであろう。
入力情報の情報部分は、ステップ712のオーデイオ部分に対応する音声合成情報を生成するために、ステップ721において使用されるであろう。例えば、音声合成情報は、材料のオーデイオ部分を表わしてもよく、あるいは、ビデオ/オーデイオ材料(他の言語、背景情報、区分又は識別情報、等)のための他のオーデイオを表わしてもよい。さらに、その情報は、セキュリテイ目的で、又はタイミング及び同期化目的で関連の材料を識別するため、又は音声合成パラメータを取り入れるため又は制御するために、受信ノード又は受信ノードのユーザによって使用されるべき情報を含んでよい。ステップ722は、セグメントのタイミング、セグメント識別表示、等のようなセグメント同期化情報を追加するであろう。情報セグメントは次にステップ723において記憶されるであろう。動作は、ステップ705、714及び723から、接続ノードB715を経由してステップ717へと進む。ステップ717では、ビデオ、オーデイオ、及び情報セグメントが送信目的のために調整(coordinated)される。あるいは、セグメンテーションではなくてタイミング情報が用いられる場合には、ステップ717は、そのようなタイミング情報に従って材料及び情報の送信を調整するであろう。
図8は、放送オーデイオ信号及び関連する音性合成情報を受信かつ提供するためのプロセス800を示す。その信号及び情報は、ステップ802において受信され、そしてステップ803においてタイプ(放送オーデイオおよび音性合成情報)によって解析(parsed)される。オーデイオ信号は、ステップ810において、それの符号化された状態から回復され、そして、ステップ811において受信デバイスにおけるスピーカに送られる。ステップ812において、ステータス信号がコントローラに送られ、放送オーデイオが使用可能であるかどうか、及びスピーカに送られたオーデイオのタイミング/セグメントを識別する。
一方、ステップ820は、種々の音声合成情報ストリームを抽出する。例えば、1つのストリームは、放送オーデイオと同等であるが、異なる言語の音声を含んでもよい。他のストリームは、合成されかつ要請によってユーザに再生されうる放送に関する付加的情報を含んでよい。他の音声号再情報は、音声パラメータ、セキュリテイ情報、コンテンツ区分、等を含んでよい。
ユーザ・プリファレンス及び局所的に記憶されたパラメータ830がステップ821において回収される。ユーザ・プリファレンスは、リアルタイムでユーザにより記憶される又はキー・インされうる。これらのプレファレンス、及び種々のタイプの受信された音声合成情報に基づいて、ステップ822は音声合成器に適切な音声合成情報を送る。これは、音声のテキストベース又は音声表示、及び局所記憶器からの又はステップ802において音声合成情報内に受信された任意適切な音声パラメータを含んでよい。
ステップ823では、合成器コンテンツ及び関連する制御音声合成情報の記述はコントローラには送られない。コントローラは、放送オーデイオに代えて、合成器の出力をスピーカに送るべきかどうかを決定する状態にある。例えば、システムが、ステップ802におけるオーデイオの受信より前に、放送オーデイオの所定のセグメントに関連した音声合成情報を受信するように設定され、かつオーデイオが中断されたことをステップ812においてコントローラが知る場合には、コントローラは合成器からの適切な出力をスピーカに送ることができるので、ユーザはオーデイオ材料を聞きそこなうことがない。
他の実施の形態では、放送オーデイオが英語であり、かつユーザがステップ821において彼の好みの言語としてスペイン語を指定した(従って、ステップ822において、放送オーデイオのスペイン語相当に関連した音声合成情報が合成器に送られた)場合には、コントローラは、放送オーデイオに代えて、合成器の出力をスピーカに送ることができる。
さらに他の実施の形態では、ステップ820において抽出された音声合成情報がローカル天気のようなローカル情報を含み、そして、ユーザがステップ821において放送オーデイオではなくて天気を聞くためのプレファレンスを表示した(従って、この音声合成情報はステップ822において合成器に送られた)場合には、コントローラは、放送オーデイオに代えて合成器からの出力をスピーカに送ることができる。
図9は、種々の実施の形態による通信デバイス、例えば、基地局を動作させる例示的な方法のフローチャート900の図である。動作がステップ902で開始し、通信デバイスがパワーオン(powered on)されかつ初期化される。動作は開始ステップ902からステップ904へと進む。ステップ904において、通信デバイスは、無線通信チャンネルによって、音声合成情報を放送し、前記音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示及び音声合成器制御情報のうちの少なくとも1つを含む。動作は、ステップ904からステップ906へと進む。ステップ906において、通信デバイスは、前記音声合成情報に対応するオーデイオ信号を放送する。
幾つかの実施の形態では、音声合成情報は、合成パラメータの1つのグループからの少なくとも1つの合成パラメータを含み、前記合成パラメータのグループは、トーン、性別、ボリューム、及び音声レートを含む。幾つかの実施の形態では、音声合成情報は、書籍の一部分のコンテンツ及び天気情報のうちの少なくとも1つを伝達する情報を含む。
幾つかの実施の形態では、放送情報の一部分に対応する音声合成情報が、対応する放送オーデイオ信号の送信より前に送信される。種々の実施の形態において、音声合成情報は、少なくとも一部分が対応する放送オーデイオ信号に既に存在する音声を合成する場合に使用されるべき情報を含む。
種々の実施の形態において、音声合成情報は、少なくとも一部分が対応する放送オーデイオ信号に既に存在する音声を合成する場合に使用されるべき情報を含む。幾つかの実施の形態では、音声合成情報は、対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に使用されるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権、及びデジタル著作権管理情報のうちの少なくとも1つを提供する。種々の実施の形態では、音声合成情報は、対応するオーデイオ信号に存在しない情報を伝達する音声を合成する場合に使用されるべき情報を含み、前記音声合成情報は、対応するオーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報、交通情報、ヘッドライン・ニュース情報、及び株式市場情報のうちの少なくとも1つを含む。
幾つかの実施の形態では、音声合成情報は、前記オーデイオ放送とは異なる言語で伝達する音声を合成するための情報を含み、オーデイオ放送信号及び音声を合成するための対応する情報のうちの少なくとも幾つかは同一である。
図10は、種々の実施の形態によるユーザデバイス(user device)、例えば、モバイルノードのような無線端末を動作させる例示的な方法のフローチャート1000の図である。動作はステップ1002で開始し、ユーザデバイスがパワーオン(powered on)されかつ初期化される。ステップ1004において、ユーザデバイスは、無線通信チャンネルによって、音声合成情報を受信し、前記音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示及び音声合成器制御情報のうちの少なくとも1つを含む。動作はステップ1004からステップ1006へと進む。ステップ1006では、ユーザデバイスは、オーデイオ情報の一部分を回復させることを試行する。動作はステップ1006からステップ1008へと進み、ユーザデバイスは、オーデイオ情報の一部分が首尾よく回復されたかどうかを決定する。オーデイオ情報の一部分が首尾よく回復された場合には、動作はステップ1008からステップ1010へと進み、オーデイオ情報の一部分が首尾よく回復されなかった場合には、動作はステップ1008からステップ1012へと進む。
ステップ1010において、ユーザデバイスは、受信された放送オーデイオ信号部分からオーデイオ信号を生成する。動作はステップ1010から1014へと進み、ユーザデバイスは、受信された放送オーデイオ信号部分から生成されたオーデイオを再生する。
ステップ1012において、ユーザデバイスは、首尾よく受信されなかったオーデイオ情報の前記部分の少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成する。動作はステップ1012からステップ1016へと進み、ユーザデバイスは、音声合成情報から生成されたオーデイオを再生する。
動作はステップ1014又はステップ1016からステップ1004へと進み、ユーザデバイスは付加的音声合成情報を受信する。
図11は、種々の実施の形態による無線端末を動作させる例示的な方法のフローチャート1100の図である。動作はステップ1102で開始し、無線端末はパワーオンされかつ初期化される。動作はステップ1102からステップ1104へと進み、無線端末は音声合成情報を受信する。動作はステップ1104からステップ1106へと進み、無線端末は、放送オーデイオ信号の1つ又は複数のセグメントに対応する音声合成情報を記憶する。動作はステップ1106からステップ1104及びステップ1108へと進む。従って、ステップ1104及び1106の動作は継続的に反復される。
ステップ1108において、無線端末は、オーデイオ情報のセグメントを受信することを試行する。ステップ1108は継続的ベースで(on an ongoing basis)実行される。各オーデイオ・セグメント回復試行のために、動作はステップ1108からステップ1110へと進む。
ステップ1110において、無線端末は、放送オーデイオ情報のセグメントが無線端末によって首尾よく受信されたかどうかを決定する。放送オーデイオ情報のセグメントが首尾よく回復された場合には、動作はステップ1110からステップ1112へと進み、放送オーデイオのセグメントが首尾よく回復されなかった場合には、動作はステップ1110からステップ1114へと進む。
ステップ1112では、無線端末は、受信された放送オーデイオ信号からオーデイオ信号を生成し、そしてステップ1116では、受信された放送オーデイオ信号セグメントから生成されたオーデイオを再生する。
ステップ1114では、無線端末は、首尾よく受信されなかったオーデイオ情報のセグメントの少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成する。動作はステップ1114からステップ1118へと進み、ステップ1118において、無線端末は、音声合成情報から生成されたオーデイオを再生する。動作はステップ1116又はステップ1118からステップ1120へと進み、ステップ1120において、無線端末は、再生されたセグメントに対応する記憶された受信音声合成情報を削除する。
図12は、種々の実施の形態による無線端末を動作させる例示的な方法のフローチャート1300である。動作はステップ1302で開始し、無線端末がパワーオンされかつ初期化される。動作は開始ステップ1302からステップ1306及び1304へと進む。ステップ1306において、無線端末は、無線通信チャンネルによって音声合成情報を受信する。ステップ1304において、ローカル・ユーザ・プリファレンス(local user preference)を受信し、例えば、無線端末のユーザは、音声合成動作に関する1つ又は複数の選択を実行し、1306において音声合成パラメータがユーザによって設定されることになる。幾つかの実施の形態では、選択された音声合成パラメータのうちの少なくとも幾つかは、訛り(dialect)、音声レート(speech rate)、及びボイス性別(voice gender)のうちの少なくとも1つを表示する。
動作はステップ1306からステップ1308へと進む。ステップ1308では、無線端末は、前記音声合成情報から可聴音声を生成する。ステップ1308は、サブステップ1310を含む。サブステップ1310では、無線端末は、無線端末のユーザによって設定された少なくとも幾つかの音声合成パラメータを適用する。
図13は、種々の実施の形態のよる無線端末を動作させる例示的な方法のフローチャート1400の図である。動作はステップ1402において開始し、無線端末がパワーオンされかつ初期化される。動作は開始ステップ1402からステップ1404へと進み、ステップ1404において、無線端末は音声合成情報を受信し、前記音声合成情報は音声に対するテキスト表示を含む。幾つかの実施の形態では、音声に対するテキスト表示を含む受信放送音声合成情報の加えて又はそれに変えて、無線端末は、音声に対する音声表示を含む放送音声合成情報を受信する。幾つかの実施の形態では、無線端末は、音声合成器制御パラメータ情報を含む放送音声合成情報を受信する。幾つかの実施の形態では、動作はまた、ステップ1402からステップ1424へと進み、ステップ1424において、無線端末は、ローカル・ユーザ・プリファレンスを受信し、1425において、音声合成パラメータがユーザによって設定されることになる。
動作は、ステップ1404からステップ1406へと進み、ステップ1406において、無線端末は、放送オーデイオ信号の1つ又は複数のセグメントに対応する受信音声合成情報を記憶する。ステップ1404及び1406の動作は、繰り返しベースで(on a recurring basis)で実行される。動作は、ステップ1406からステップ1408へと進み、ステップ1408は、繰り返しベース(on a recurring basis)で実行される。ステップ1408では、無線端末は放送オーデイオ情報を受信することを試行する。各オーデイオ・セグメント回復試行のために、動作はステップ1408からステップ1410へと進む。
ステップ1410において、無線端末は、オーデイオ・セグメントが首尾よく受信されたかどうかを決定する。放送オーデイオ・セグメントが首尾よく受信された場合には、動作はステップ1410からステップ1412へと進む。オーデイオ・セグメントが首尾よく受信されなかった場合には、動作はステップ1410からステップ1418へと進む。
ステップ1412において、無線端末は、受信放送オーデイオ信号セグメントからオーデイオ信号を生成する。動作は、ステップ1412からステップ1416及びステップ1414へと進む。ステップ1414において、無線端末は、受信放送オーデイオ信号の関数として音声合成器パラメータを生成しかつ(又は)更新し、例えば、ボイス・モデル情報(voice model information)を生成する。ステップ1414の結果は、受信オーデイオの関数としての音声合成器パラメータ1417である。ステップ1416に戻ると、ステップ1416において、無線端末は、受信放送オーデイオ・セグメントから生成されたオーデイオを再生する。動作はステップ1416からステップ1422へと進む。
ステップ1418に戻ると、ステップ1418において、無線端末は、首尾よく受信されなかった放送オーデイオ情報のセグメントの少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成する。ステップ1418は、オーデイオ信号を生成する場合に、記憶されたデフォルト音声合成パラメータ1413、ユーザによって設定された音声合成パラメータ1425、及び受信オーデイオの関数としての音声合成パラメータのうちの少なくとも1つを用いる。幾つかの実施の態様では、ステップ1418において利用される音声合成パラメータのうちの少なくとも幾つかは、フィルタされたパラメータ(filtered parameters)であり、例えば、そのフィルタさらたパラメータは、受信放送オーデイオ信号に基づいて生成ボイス・モデルに関連した品質レベルに応答して再調整される。
動作はステップ1418からステップ1420へと進む。ステップ1420において、無線端末は、音声合成情報から生成されたオーデイオを再生する。動作はステップ1420からステップ1422へと進む。ステップ1422において、無線端末は、再生されたオーデイオに対応する記憶された受信音声合成情報を削除する。
種々の実施の形態において、音声合成パラメータの少なくとも幾つかは、訛り(dialect)、ボイス・レベル、アクセント、音声レート(speech rate)、ボイスの性別(voice gender)、及びボイス・モデル(voice model)のうちの少なくとも1つを示す。
種々の実施の形態において、無線端末は、OFDM受信機を含む携帯通信デバイスである。幾つかのこのような実施の形態では、音声合成情報及び放送オーデイオ情報のうちの少なくとも1つがOFDM信号によって伝達される。幾つかのこのような実施の形態では、前記音声合成情報及び放送オーデイオ情報の両方がOFDM信号によって、例えば、異なる通信チャンネルによって伝達される。
図14は、種々の実施の形態に従って実装された例示的な基地局1500の図である。例示的な基地局1500は、図1の例示的な基地局12であってよい。例示的な基地局1500は、図9の方法を実行する例示的な基地局であってよい。
例示的な基地局1500は、種々の要素がデータ及び情報をするバス1512によって互いに結合される受信機モジュール1502、送信機モジュール1504、プロセッサ1506、I/Oインタフェース1508、及びメモリ1510を含むメモリ1510は、ルーチン1518及びデータ/情報1520を含む。プロセッサ1506、例えば、CPUは、ルーチン1518を実行し、そして、基地局1500の動作を制御しかつ方法を実行するために、メモリ1510におけるデータ/情報を用いる。
受信機モジュール1502、例えば、OFDM受信機は、基地局500が無線端末からアップリンク信号を受信する受信アンテナに結合される。幾つかの実施の形態では、アップリンク信号は、登録要求信号、放送チャンネル有効性及び(又は)プログラミング情報の要求、放送チャンネルへのアクセスの要求、キー情報の要求、無線端末アイデンテイテイ情報、ユーザ/デバイス・パラメータ情報、他の状態情報、及び(又は)ペイ・パー・ビュー・ハンドシェーキング情報(pay per view handshaking information)を含む。幾つかの実施の形態、例えば、基地局が無線端末に対するダウンリンク放送信号伝達(downlink broadcast signaling)をサポートするが、無線端末からのアップリンク信号伝達受信をサポートしない幾つかの実施の形態では、受信機モジュール1502は含まれない。受信機モジュール1502は、受信アップリンク信号の少なくとも幾つかを復号するための復号器1514を含む。
送信機モジュール1504、例えば、OFDM無線送信機は、基地局がダウンリンク信号をそれによって無線端末に送信する送信アンテナに結合される。送信機モジュール1504は、ダウンリンク信号の少なくとも幾つかを復号するための復号器を含む。送信機モジュール1504は、記憶された音声合成情報1540の少なくとも幾つかを、無線通信チャンネルによって送信する。送信機モジュール1504はまた、記憶された圧縮オーデイオ情報1538の少なくとも幾つかを、無線通信チャンネルによって送信する。ダウンリンク信号は、例えば、タイミング/同期化信号、圧縮オーデイオ情報を搬送する放送信号、及び音声合成情報を搬送する放送信号を含む。幾つかの実施の形態では、ダウンリンク信号はまた、登録応答信号、キー情報、プログラミング有効性及び(又は)プログラミング・デイレクトリ情報、及び(又は)ハンドシェーキング信号(handshaking signals)を含む。
幾つかの実施の形態では、圧縮オーデイオ情報と音声合成情報が両方とも、同じ技術、例えば、OFDM信号伝達(OFDM signaling)を用いて伝達される。幾つかの実施の形態では、送信機モジュール1504は、複数の信号伝達技術、例えば、OFDM及びCDMAをサポートする。幾つかの実施の形態では、圧縮オーデイオ情報及び音声合成情報のうちの一方は、1つのタイプの技術を用いて伝達され、そして、他方は、異なる技術を用いて伝達される。
I/Oインタフェース1508は、基地局をネットワーク・ノード、例えば、ルータ、他の基地局、コンテンツ・プロバイダ・サーバ、等、及び(又は)インターネットに結合する。基地局1500によって放送されるべきプログラム情報は、インタフェース1508によって受信される。
ルーチン1518は、通信ルーチン1522、及び基地局制御ルーチン1524を含む。通信ルーチン1522は、基地局1500によって用いられる種々の通信プロトコルを実行する。基地局制御ルーチン1524は、放送送信制御モジュール1526、オーデイオ圧縮モジュール1528、セグメンテーション・モジュール1530、プログラム・モジュール1532、I/Oインタフェース制御モジュール1534、及び、幾つかの実施の形態では、ユーザ制御モジュール1535を含む。
放送送信制御モジュール1526は、記憶された圧縮オーデイオ情報1538及び記憶された音声合成情報1540の送信を制御する。放送送信制御モジュール1526は、放送送信スケジュール情報1542に従って、記憶された圧縮オーデイオ情報及び記憶された音声合成情報の送信を制御する。放送圧縮オーデイオ情報の少なくとも幾つかは、放送音声合成情報の少なくとも幾つかに対応する。幾つかの実施の形態では、放送送信制御モジュール1526は、放送送信モジュール構成情報1544に従って、音声合成情報が対応する放送圧縮オーデイオ信号の送信より前に送信されるように、例えば、音声合成情報の1つのセグメントが圧縮オーデイオ情報の対応するセグメントより前に送信されるべく制御されるように、放送圧縮オーデイオ情報の一部分に対応する音声合成情報の送信を制御する構成とされる。
オーデイオ圧縮モジュール1528は、オーデイオ情報1536を圧縮オーデイオ情報1538に変換する。幾つかの実施の形態では、圧縮オーデイオ情報が直接I/Oインタフェース1508によって受信され、モジュール1528をバイパスする。
セグメンテーション・モジュール1530は、記憶された圧縮オーデイオ情報1538のセグメンテーション及び送信されるべき記憶された音声合成情報1540のセグメンテーション、例えば、コンテンツ・プロバイダからの受信プログラム情報の送信セグメントへのセグメンテーションに関連した部分を制御する。プログラム・モジュール1532は、基地局によって使用されている種々の包装無線通信チャンネルに対するプログラム・コンテンツのトラッキング及びプログラム・デイレクトリ関連動作を制御する。
I/Oインタフェース制御モジュール1534は、I/Oインタフェース1508の動作、例えば、後で放送されるべき受信プログラム・コンテンツを制御する。受信モジュール1502を有する幾つかの実施の形態に含まれるユーザ制御モジュール1535は、無線端末登録、無線端末アクセス、キー送信、ペイ・パー・ビュー、デイレイクトリ配信(directory delivery)、及びハンドシェーキング動作に関連した動作を制御する。
データ/情報1520は、記憶されたオーデイオ情報1536、記憶された圧縮オーデイオ情報1538、記憶された音声合成情報1540、記憶された放送送信スケジュール情報1542、放送送信モジュール構成情報1544、及び、幾つかの実施の形態では、ユーザ・データ/情報1545を含む。
記憶された音声合成情報1540は、音声情報の音声表示1546、音声のテキスト表示1548、及び音声合成器制御情報1550を含む。音声合成器制御情報1550は、合成パラメータ情報1552を含む。音声合成器パラメータ情報1552は、トーン情報1554、性別情報1556、ボリューム情報1558、音声レート情報1560、訛り情報1562、声情報1563、アクセント情報1564、及び地域情報1566を含む。
幾つかの実施の形態では、記憶された音声合成情報1540は、書籍の一部分のコンテンツ及び天気情報の少なくとも1つを伝達する情報を含む。幾つかの実施の形態では、記憶された音声合成情報1540は、書籍の一部分のコンテンツ、記事の一部分、記事論評(editorial commentary)、ニュース情報、天気情報、及び広告を含む。
種々の実施の形態において、音声合成情報1540は、少なくとも一部分が対応する放送オーデイオ信号に既に存在している音声を合成する場合に用いられるべき情報を含む。種々の実施の形態において、音声合成情報1540は、少なくとも一部分が対応する放送オーデイオ信号にまだ存在していない音声を合成する場合に用いられるべき情報を含む。幾つかの実施の形態では、音声合成情報1540は、対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権及びデジタル著作権(digital rights)管理情報の少なくとも1つを提供する。幾つかの実施の形態では、音声合成情報1540は、対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、対応するオーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報(regional weather information)、ローカル天気情報(local weather information)、交通情報、ヘッドライン・ニュース情報及び株式市場情報のうちの少なくとも1つを含む。
幾つかの実施の形態では、音声合成情報は、前記オーデイオ放送とは異なる言語で搬送する音声を合成するための情報を含み、オーデイオ放送信号によって搬送される情報の少なくとも幾つかと音声を合成するための対応する情報は同一である。
幾つかの実施の形態に含まれるユーザ・データ/情報1545は、例えば、登録情報、アクセス情報、キー、セッション・トラッキング情報、プログラム選択情報、コスト情報、チャージ情報のようなアカウンテイング情報、ユーザ識別情報、及び他のユーザ状態情報を含む。ユーザ・データ/情報1545は、基地局1500接続ポイント(attachment point)を用いる1つ又は複数の無線端末に対応する情報を含む。
図15は、種々の実施の形態に従って実装される例示的な無線端末1600、例えば、モバイルノードの図である。例示的無線端末1600は、図1のシステムの無線端末のうちの何れかであってよい。例示的無線端末1600は、図10、11、12又は13による方法を実行する無線端末のうちの何れかであってよい。
例示的無線端末1600は、種々の要素がデータ及び情報を交換できるバス1612によって互いに結合される受信機モジュール1602、送信機モジュール1604、プロセッサ1606、I/Oデバイス1608、及びメモリ1610を含む。メモリ1610は、ルーチン1618及びデータ/情報1620を含む。プロセッサ1606、例えば、CPUは、ルーチン1618を実行し、そして、無線端末の動作を制御しかつ方法を実行するためにメモリ1610におけるデータ/情報1620を用いる。
受信機モジュール1602、例えば、OFDM受信機は、受信アンテナ1603によって基地局、例えば、基地局1500からダウンリンク信号を受信する。受信ダウンリンク信号は、タイミング/同期化信号、オーデイオ信号、例えば、圧縮オーデイオ信号を搬送する放送信号、音声合成情報を搬送する放送信号を含む。幾つかの実施の形態では、受信信号は、登録応答信号、キー情報、放送プログラム・デイレクトリ情報、ハンドシェーキング情報、及び(又は)アクセス情報を含んでよい。幾つかの実施の形態では、受信機モジュール1602は、複数のタイプの技術、例えば、OFDM及びCDMAをサポートする。受信機モジュール1602は、受信ダウンリンク信号の少なくとも幾つかを復号する復号器を含む。
送信機モジュール1604、例えば、OFDM送信機は、無線端末がアップリンク信号を基地局に送信する送信アンテナに結合される。アップリンク信号は、例えば、登録要求信号、放送チャンネルへのアクセスの要求、キー、例えば、暗号キーの要求、放送デイレクトリ情報の要求、放送プログラム、セッション情報、アカウンテイング情報、識別情報に関する選択オプションの要求、等を含む。幾つかの実施の形態では、受信機及び送信機に対して、例えば、デユプレクサ・モジュールに関連して、同じアンテナが用いられる。幾つかの実施の形態では、無線端末1600は、送信機モジュール1604を含まず、そして、その無線端末はダウンリンク放送情報を受信するが、それがダウンリンク放送信号を受信している基地局にはアップリンク信号を伝達しない。
I/Oデバイス1608は、ユーザがデータ/情報を入力すること、例えば、音声合成で用いられる制御パラメータを含むオプションを選択すること、データ/情報を出力すること、例えば、オーデイオ出力を聞くことを可能にする。
I/Oデバイス1608は、例えば、キーパッド、キーボード、タッチスクリーン、マイクロフォン、スピーカ、デイスプレイ、等である。幾つかの実施の形態では、音声合成器は、少なくとも部分的にハードウエアで実装され、そして、I/Oデバイス1608の一部として含まれる。
ルーチン1618は、通信ルーチン1622及び無線端末制御ルーチン1624を含む。通信ルーチン1622は、無線端末1600によって用いられる種々の通信プロトコルを実行する。無線端末制御ルーチン1624は、受信機制御モジュール1626、放送オーデイオ受信品質決定モジュール1627、オーデイオ信号生成モジュール1628、再生モジュール1630、音声合成情報記憶モジュール1632、音声合成情報削除モジュール1634、ユーザ・プリファレンス・モジュール1636、音声合成パラメータ生成/更新モジュール1638、及びアクセス制御モジュール1640を含む。
受信機制御モジュール1624は、受信機モジュール1602動作を制御する。受信機制御モジュール1626は、音声合成情報回復モジュール1642及びオーデイオ放送信号回復モジュール1644を含む。音声合成放送情報回復モジュール1642は、放送スケジュール情報1673に従って放送音声情報を受信するために無線端末を制御する。音声合成情報記憶モジュール1632は、モジュール1642から回復された情報を、例えば、受信放送音声合成情報(セグメント1)1660・・・受信放送音声合成情報(セグメントN)1662として記憶する。オーデイオ放送信号回復モジュール1644は、放送スケジュール情報1673に従って、例えば、1つのセグメントに対応する放送オーデイオ信号を受信するために受信機モジュール1602を制御する。放送オーデイオ受信品質決定モジュール1627は、例えば、放送圧縮オーデイオ情報の1つのセグメントの試行受信(attempted reception)に対して、回復が成功であったかどうかを決定する。回復の結果は、オーデイオ・セグメント回復成功/失敗決定1664であり、動作フローを、例えば、成功の場合には受信放送オーデイオ信号ベース生成モジュールへと、そして、失敗の場合には音声合成ベース生成モジュール1648へと向けるために用いられる。従って、モジュール1627は切替えモジュールとして作用する。例えば、失敗は、トンネル、地下道、又は死点を通過することにより信号が一時的に弱くなったりロスしたりすることに基因しうる。
オーデイオ信号生成モジュール1628は、受信放送オーデイオ信号ベース生成モジュール1646及び音声合成ベース生成モジュール1648を含む。受信放送オーデイオ信号ベース生成モジュール1646は、例えば、解凍モジュール及び出力スピーカ・デバイスを駆動するための信号を生成する信号生成モジュールである。回復放送オーデイオ情報1666は、モジュール1646への入力であり、一方、回復放送オーデイオ1668に基づく生成オーデイオ出力情報はモジュール1646の出力である。音声合成ベース生成モジュール1648、例えば、音声合成器は、受信放送音声合成情報の少なくとも幾つか、例えば、情報1660の幾つかを用いて、合成に基づいてオーデイオ信号情報を生成する1670。幾つかの実施の形態では、ある時間の間、音声合成ベース生成モジュール1648はまた、デフォルト音声合成パラメータ1654、ユーザによって設定された音声合成パラメータ1656、及び受信放送オーデイオの関数としての音声合成パラメータ1658のうちの少なくとも1つを用いる。
再生モジュール1630は、放送オーデイオ信号再生モジュール1650及び音声合成再生モジュール1652を含む。放送オーデイオ信号再生モジュール1650は、生成モジュール1646に結合され、そして、例えば、首尾よく回復された放送オーデイオ・セグメントに対応するオーデイオを再生するために情報1668を用いる。音声合成再生モジュール1652は、モジュール1648に結合され、そして、例えば、対応する放送オーデイオ信号が首尾よく受信されなかった場合に、音声合成から生成されたオーデイオをユーザに再生するために情報1670を用いる。
音声合成情報削除モジュール1634は、特定のセグメントに対応する情報(1660、・・・、1662)のうちの1つを、そのセグメントに対応してオーデイオがユーザに対して再生された後で、削除する。ユーザ・プリファレンス・モジュール1636は、モジュール1648によって用いられるべき音声合成パラメータのうちの少なくとも幾つかを設定するために、例えば、メニュー上のアイテムを選択して無線端末1600のユーザから得られたローカル・ユーザ・プリファレンスを受信する。ユーザ1656によって設定された音声合成パラメータは、ユーザ・プリファレンス・モジュール1636の出力である。音声合成器パラメータ生成/更新モジュール1638は、モジュール1648によって用いられる音声合成パラメータのうちの少なくとも幾つかを、受信放送オーデイオ情報に基づいて、生成しかつ(又は)更新する。例えば、幾つかの実施の形態においては、モジュール1638は、放送オーデイオ信号受信の休止中に実行される合成音声が放送オーデイオ音声に密接に類似するように、合成器によって使用されるべきボイス・モデルのパラメータを生成する。受信オーデイオの関数としての音声合成パラメータ1658は、モジュール1638の出力である。アクセス制御モジュール1640は、データが回復されている選択された放送チャンネルを制御する。幾つかの実施の形態では、アクセス制御モジュール1640はまた、アクセス要求、キーの要求、デイレクトリ情報の要求を生成し、ペイ・フォア・ビュー要求(pay for view requests)を識別しかつ生成し、レスポンスを処理し、かつ(又は)基地局が放送プログラムを送信している状態でハンドシェーキング動作を行う。
データ/情報1620は、デフォルト音声合成パラメータ1654、ユーザによって設定される音声合成パラメータ1656、受信放送オーデイオの関数としての音声合成パラメータ1658、受信放送音声合成情報(セグメント1)1660、・・・、受信放送音声合成情報(セグメントN)1662、オーデイオ・セグメント回復成功/失敗決定1664、回復放送オーデイオ情報1666、回復放送オーデイオに基づく生成オーデイオ出力情報1668、合成に基づく生成オーデイオ出力情報1670、アクセス・データ/情報1672、及び放送スケジュール情報1673を含む。
受信放送音声合成情報1660は、音声の音声表示1674、音声のテキスト表示1676、及び音声合成器制御情報1678を含む。音声合成器制御情報1678は、合成パラメータ情報を含む。情報1678、1654、1656、及び(又は)1658に含まれた合成パラメータ情報は、トーン情報、性別情報、ボリューム情報、音声レート情報、アクセント情報、訛り情報、地域情報、ボイス情報、及び民族性情報のうちの少なくとも1つを含む。
幾つかの実施の形態では、音声合成情報(1660、・・・1662)は、書籍の一部分のコンテンツ及び天気情報のうちの少なくとも1つを伝達する情報を含む。幾つかの実施の形態では、音声合成情報(1660、・・・1662)は、書籍の一部分のコンテツ、記事の一部分、記事論評(editorial commentary)、ニュース情報、天気情報、及び広告のうちの少なくとも1つを伝達する情報を含む。
種々の実施の形態において、音声合成情報(1660、・・・1662)は、少なくとも一部分が対応放送オーデイオ信号に既に存在する音声を合成する場合に使用されるべき情報を含む。種々の実施の形態において、音声合成情報(1660、・・・1662)は、少なくとも一部分が対応放送オーデイオ信号にまだ存在しない音声を合成する場合に使用されるべき情報を含む。幾つかの実施の形態では、音声合成情報(1660、・・・1662)は、対応放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に使用されるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権、デジタル著作権管理情報の少なくとも1つを提供する。幾つかの実施の形態では、音声合成情報(1660、・・・1662)は、対応放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に使用されるべき情報を含み、前記音声合成情報は、対応オーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報(regional weather information)、ローカル天気情報(local weather information)、交通情報、ヘッドライン。ニュース情報及び株式市場情報のうちの少なくとも1つを含む。
幾つかの実施の形態では、音声合成情報(1660、・・・1662)は、前記オーデイオ放送とは異なる言語で搬送する音声を合成するための情報を含み、オーデイオ放送信号によって搬送される情報及び音声を合成するための対応情報のうちの少なくとも幾つかは同一である。
種々の実施の形態において、ここに記載されるノードは、1つ又は複数の方法に対応するステップ、例えば、信号処理、音声合成情報処理、及び(又は)音声合成パラメータ及びタイミング制御ステップを実行するための1つ又は複数のモジュールを用いて実装される。従って、幾つかの実施の形態では、種々の特徴が、モジュール又はコントローラを用いて実装される。このようなモジュール又はコントローラは、ソフトウエア、ハードウエア又はソフトウエア及びハードウエアの組合せを用いて実装されうる。上記の方法又は方法ステップの多くは、上記の方法の全部又は部分を、例えば、1つ又は複数のノードで実行するための機械、例えば、付加ハードウエアを有する又は有しない汎用コンピュータを制御するための、例えば、RAM、フロッピー(登録商標)デイスク、等のような機械読取り可能媒体に含まれたソフトウエアのような機械実行可能命令を用いて実行されうる。従って、特に、種々の実施の形態は、機械、例えば、プロセッサ及び関連するハードウエアに上記の方法のステップの1つ又はそれより多くを実行させるための機会実行可能命令を含む機械読取り可能媒体に関する。
上述した種々の実施の形態の方法及び装置に対する多数の付加的変更が、上記の説明をより当業者には明らかであろう。そのような変更は範囲内であると考えられるべきである。それらの方法及び装置は、CDMA、直交周波数分割多重化(OFDM)、又はアクセスノードとモバイルノードの間に無線通信リンクを提供するために使用されうる種々の他のタイプの通信技法に対して使用されてもよく、そして、種々の実施の形態において、使用される。種々の実施の形態において、モバイルノード、又は他の放送受信デバイスは、ノートブックコンピュータ、携帯情報端末(PDAs)、又は受信機/送信機回路及び方法を実行するためのロジック及び(又は)ルーチンを含む携帯又は非携帯デバイスとして実装されうる。

Claims (94)

  1. 情報を伝達する方法であって、
    無線通信チャンネルで音声合成情報を送信することを備え、前記音声合成情報は、i)音声の音声表示及びii)音声のテキスト情報及び音声合成器制御情報のうちの少なくとも一方を含む、方法。
  2. 前記音声合成情報は、トーン、性別、ボリューム、及び音声レートを含む合成パラメータのグループからの少なくとも1つの合成パラメータを含む、請求項1の方法。
  3. 前記音声合成情報は、書籍の一部分のコンテンツ及び天気情報のうちの少なくとも一方を含む、請求項2の方法。
  4. 前記送信することは、前記音声合成情報を複数のユーザに放送することを含み、
    前記方法は、
    前記音声合成情報に加えて、前記音声合成情報に対応するオーデイオ信号を放送することをさらに備える、請求項1の方法。
  5. 前記放送オーデイオ信号の一部分に対応する音声合成情報が、前記対応する放送オーデイオ信号の送信より先に送信される、請求項4の方法。
  6. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号に既に存在する音声を合成する場合に用いられるべき情報を含む、請求項4の方法。
  7. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号にまだ存在していない音声を合成する場合に用いられるべき情報を含む、請求項4の方法。
  8. 前記音声合成情報は、前記対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権及びデジタル著作権管理情報のうちの少なくとも1つを提供する、請求項4の方法。
  9. 前記音声合成情報は、前記対応する放送オーデイオ信号存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、前記対応するオーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報、ローカル天気情報、交通情報、ヘッドライン・ニュース情報及び株式市場情報のうちの少なくとも1つを含む、請求項4の方法。
  10. 前記音声合成情報は、前記オーデイオ放送とは異なる言語で搬送する音声を合成するための情報を含み、前記オーデイオ放送信号によって搬送される情報の少なくとも幾つかと音声を合成するための対応する情報は同じである、請求項4の方法。
  11. 前記音声合成情報を受信するための複数のユーザデバイスを動作させること、および、
    少なくとも幾つかのローカル音声合成生成情報を用いて前記音声合成情報から音声を生成するために前記複数のデバイスのうちの少なくとも幾つかを動作させることをさらに備え、前記ローカル音声合成生成情報は前記複数のデバイスのうちの少なくとも幾つかに対して異なっている、請求項1の方法。
  12. 前記ローカル音声合成生成情報のうちの少なくとも幾つかは、訛り、音声レート、ボイス性別のうちの少なくとも1つを示すユーザ選択音声合成パラメータを含む、請求項11の方法。
  13. 前記音声合成情報を受信するためのユーザデバイスを動作させること、
    前記オーデイオ情報の一部分を受信するために前記ユーザデバイスを動作させること、
    前記オーデイオ情報の一部分が首尾よく受信されなかったことを検知するために前記ユーザデバイスを動作させること、
    首尾よく受信されなかった前記オーデイオ情報の前記部分の少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成すること、
    をさらに備える、請求項2の方法。
  14. 前記ユーザデバイスは、前記放送オーデイオ信号から生成されたオーデイオを再生すること及び前記オーデイオ信号の受信におけるロスの関数として前記音声合成情報からオーデイオ信号を生成することとの間で切替え、前記合成されたオーデイオは、前記対応するオーデイオ信号の受信が失われる場合に用いられる、請求項13の方法。
  15. 通信デバイスであって、
    記憶された音声合成情報であって、i)音声の音声表示及びii)音声のテキスト表示及び音声合成器制御情報のうちの少なくとも一方を含む音声合成情報と、
    記憶されたオーデイオ情報及び対応する音声合成情報の送信を制御するための放送送信制御モジュールと、
    前記記憶された音声合成情報の少なくとも幾つかを無線通信チャンネルで送信するための無線送信機と、
    を備える通信デバイス。
  16. 記憶された放送送信スケジュール情報をさらに備え、
    前記放送送信制御モジュールは、前記放送送信スケジュール情報に従って、前記記憶された音声情報の送信を制御する、請求項15の通信デバイス。
  17. 前記少なくとも幾つかの記憶された音声合成情報に対応する記憶された圧縮オーデイオをさらに備え、前記放送送信制御モジュールは、前記幾つかの記憶された音声合成情報の送信に加えて、送信される合成情報に対応する記憶された圧縮オーデイオの送信を制御する、請求項15の通信デバイス。
  18. 前記音声合成情報は、トーン、性別、ボリューム、及び音声レートを含む合成パラメータのグループからの少なくとも1つの合成パラメータを含む、請求項15の通信デバイス。
  19. 前記記憶された音声合成情報は、書籍の一部分のコンテンツ及び天気情報のうちの少なくとも一方を伝達する情報を含む、請求項16の通信デバイス。
  20. 前記通信デバイスは基地局であり、
    前記送信機はOFDM信号送信機であり、
    前記送信機は、前記オーデイオ及び前記音声合成情報の両方を放送する、請求項15の方法。
  21. 前記放送送信制御モジュールは、前記放送圧縮オーデイオ信号の一部分に対応する音声合成情報が前記対応する放送圧縮オーデイオ信号の送信より前に送信されるように圧縮オーデイオ情報に対応する音声合成情報の送信を制御する構成とされる、請求項20の通信デバイス。
  22. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号に既に存在する音声を合成する場合に用いられるべき情報を含む、請求項20の通信デバイス。
  23. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号にまだ存在していない音声を合成する場合に用いられるべき情報を含む、請求項20の通信デバイス。
  24. 前記音声合成情報は、前記対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権及びデジタル著作権管理情報のうちの少なくとも1つを提供する、請求項20の通信デバイス。
  25. 前記音声合成情報は、前記対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、前記対応するオーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報、ローカル天気情報、交通情報、ヘッドライン・ニュース情報及び株式市場情報のうちの少なくとも1つを含む、請求項20の通信デバイス。
  26. 前記音声合成情報は、前記オーデイオ放送とは異なる言語で搬送する音声を合成するための情報を含み、前記オーデイオ放送信号によって搬送される情報の少なくとも幾つか及び音声を合成するための対応する情報とは同じである、請求項20の通信デバイス。
  27. 通信デバイスであって、
    記憶された音声合成情報であって、i)音声の音声表示及びii)音声のテキスト表示及び音声合成器制御情報のうちの少なくとも一方を含む音声合成情報と、
    記憶されたオーデイオ情報および対応する音声合成情報の少なくとも放送送信を制御するために放送送信を制御するための手段と、
    前記記憶された音声合成情報の少なくとも幾つかを無線通信チャンネルで送信するために送信するための手段と、
    を備える通信デバイス。
  28. 記憶された放送送信スケジュール情報をさらに備え、
    放送送信を制御するための前記手段は、前記放送送信スケジュール情報に従って、前記記憶された音声情報の送信を制御する、請求項27の通信デバイス。
  29. 前記少なくとも幾つかの記憶された音声合成情報に対応する記憶された圧縮オーデイオをさらに備え、放送送信を制御するための前記手段は、前記少なくとも幾つかの記憶された音声合成情報の送信に加えて、送信される合成情報に対応する記憶された圧縮オーデイオの送信を制御する、請求項27の通信デバイス。
  30. 前記音声合成情報は、トーン、性別、ボリューム、及び音声レートを含む合成パラメータのグループからの少なくとも1つの合成パラメータを含む、請求項27の通信デバイス。
  31. 前記音声合成情報は、書籍の一部分のコンテンツ及び天気情報のうちの少なくとも一方を伝達する情報を含む、請求項28の通信デバイス。
  32. 前記通信デバイスは基地局であり、
    前記送信するための手段は、OFDM信号送信機であり、
    前記送信するための手段は、前記オーデイオ及び前記音声合成情報の両方を放送する、請求項27の通信デバイス。
  33. 放送送信を制御するための手段は、前記放送される圧縮オーデイオ信号の一部分に対応する音声合成情報が前記対応する放送圧縮オーデイオ信号の送信より前に送信されるように圧縮オーデイオ情報に対応する音声合成情報の送信を制御する構成とされる、請求項32の通信デバイス。
  34. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号に既に存在する音声を合成する倍に用いられるべき情報を含む、請求項32の通信デバイス。
  35. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号にまだ存在していない音声を合成する場合にもちいられるべき情報を含む、請求項32の通信デバイス。
  36. 前記音声合成情報は、前記対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、著者、タイトル、著作権、及びデジタル著作権管理情報のうちの少なくとも1つを提供する、請求項32の通信デバイス。
  37. 前記音声合成情報は、前記対応する放送オーデイオ信号に存在しない情報を伝達する音声を合成する場合に用いられるべき情報を含み、前記音声合成情報は、前記対応するオーデイオ情報に含まれない少なくとも幾つかのニュース情報を提供し、前記ニュース情報は、地域天気情報、ローカル天気情報、交通情報、ヘッドライン・ニュース情報及び株式市場情報のうちの少なくとも1つを含む、請求項32の通信デバイス。
  38. 前記音声合成情報は、前記オーデイオ放送とは異なる言語で搬送する音声を合成するための情報を含み、前記オーデイオ放送信号によって搬送される情報の少なくとも幾つか及び音声を合成するための前記情報は同じである、請求項32の通信デバイス。
  39. 情報を複数のユーザに伝達する方法を実行するための機械実行可能命令を具現するコンピュータ読取り可能媒体であって、
    前記方法は、
    無線通信チャンネルで、音声合成情報を放送することを備え、前記音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示及び音声合成器制御情報の少なくとも一方を含む、コンピュータ読取り可能媒体。
  40. 前記音声合成情報は、トーン、性別、ボリューム、及び音声レートを含む合成パラメータのグループからの少なくとも1つの合成パラメータを含む、請求項39のコンピュータ読取り可能媒体。
  41. 前記音声合成情報は、書籍の一部分のオンテンツ及び天気情報のすく案区とも一方を伝達する情報を含む、請求項40のコンピュータ読取り可能媒体。
  42. 前記音声合成情報に対応するオーデイオ信号を放送する
    ための機械実行可能命令をさらに備える、請求項39のコンピュータ読取り可能媒体。
  43. 前記放送オーデイオ信号の一部分に対応する音声合成情報が、前記対応する放送オーデイオ信号の送信より前に送信される、請求項42のコンピュータ読取り可能媒体。
  44. 前記音声合成情報は、少なくとも一部分が前記対応する放送オーデイオ信号に既に存在する音声を合成する場合に用いられるべき情報を含む、請求項42のコンピュータ読取り可能媒体。
  45. 無線端末を動作させる方法であって、
    無線通信チャンネルから音声合成情報を受信すること、
    前記音声合成情報から可聴音声を生成することを備え、可聴音声を生成するステップは、少なくとも幾つかの音声合成パラメータを適用することを含む、無線端末を動作させる方法。
  46. 前記音声合成パラメータの少なくとも幾つかは、前記デバイスのユーザによって設定され、
    前記受信音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示の少なくとも一方を含む、請求項45の方法。
  47. 前記受信音声合成情報は、少なくとも幾つかの音声合成器制御情報をさらに含む、請求項46の方法。
  48. 前記デバイスのユーザによって設定される少なくとも幾つかの音声合成パラメータを適用する前記ステップより前に、
    前記少なくとも幾つかの音声合成パラメータを設定するユーザ・プリファレンス情報を無線端末のユーザから受信する
    ステップを実行することをさらに備える、請求項46の方法。
  49. 前記無線端末のユーザによって設定される少なくとも幾つかの音声合成パラメータは、訛り、音声レート、ボイス性別、アクセント、トーン、及び言語の少なくとも1つを表示する、請求項48の方法。
  50. 無線通信チャンネルからの前記受信音声合成情報は、書籍の一部分のコンテンツ及び天気情報の少なくとも一方を含む、請求項49の方法。
  51. 放送音声合成情報を受信するための無線受信機モジュールと、
    音声合成制御パラメータのユーザ・プリファレンス設定を受信するユーザ・プリファレンス・モジュールと、
    前記受信放送音声合成情報及び前記ユーザ・プリファレンスに応答して設定される前記音声合成器制御パラメータを用いてオーデイオ出力を生成するためのオーデイオ出力生成モジュールと、
    を備える通信デバイス。
  52. 前記音声合成制御パラメータは、訛り、音声レート、ボイス性別、ボイス・モデル、及びアクセント、トーン、及び言語の少なくとも1つを表示する、請求項51の通信デバイス。
  53. 前記無線端末受信機は、OFDM受信機である、請求項51の通信デバイス。
  54. 前記OFDM受信機は、音声のテキスト表示を含む放送音声合成情報を第1のOFDM通信チャンネルで受信し、かつ、前記OFDM受信機は、圧縮オーデイオを第2のOFDM通信チャンネルで受信する、請求項53の通信デバイス。
  55. テキスト表示を含む前記放送音声合成情報の少なくとも幾つかは、回復を試行している前記無線端末に送信されている放送圧縮オーデイオ信号の一部分として同じ情報を表わす、請求項54の通信デバイス。
  56. 放送音声合成情報を受信するための手段と、
    音声合成制御パラメータのユーザ・プリファレンス設定を受信するための手段と、
    前記受信放送音声合成情報及び前記ユーザ・プリファレンスに応答して設定される前期音声合成器制御パラメータを用いてオーデイオ出力を生成するための手段と、
    を備える通信デバイス。
  57. 前記音声合成器制御パラメータは、訛り、音声レート、ボイス性別、ボイス・モデル、及びアクセント、トーン、及び言語の少なくとも1つを表示する、請求項56の通信デバイス。
  58. 前記受信するための手段は、OFDM受信機である、請求項56の通信デバイス。
  59. 前記OFDM受信機は、音声のテキスト表示を含む放送音声合成情報を第1のOFDM通信チャンネルで受信し、そして、前記OFDM受信機は、圧縮オーデイオを第2のOFDM通信チャンネルで受信する、請求項58の通信デバイス。
  60. テキスト表示を含む前記放送音声合成情報の少なくとも幾つかは、回復を試行している前記無線端末に送信されている放送圧縮オーデイオ信号の一部分として同じ情報を表示する、請求項59の通信デバイス。
  61. 無線通信チャンネルから音声合成情報を受信すること、
    前記音声合成情報から可聴音声を生成することを備え、可聴音声を生成する前記ステップは、前記デバイスのユーザによって設定される少なくとも幾つかの音声合成パラメータを適用することを含む方法を実行するために無線端末を制御するための機械実行可能命令を具現するコンピュータ読取り可能媒体。
  62. 前記受信された音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示の少なくとも一方を含む、請求項61のコンピュータ読取り可能媒体。
  63. 前記受信された音声合成情報は、少なくとも幾つかの音声合成器制御情報を含む、請求項62のコンピュータ読取り可能媒体。
  64. 前記デバイスのユーザによって設定される少なくとも幾つかの音声合成情報を適用することを含む前記ステップの前に、前記少なくとも幾つかの音声合成情報を設定するユーザ・プリファレンスを無線端末のユーザから受信すること付加的ステップを実行するための命令をさらに具現する、請求項62のコンピュータ読取り可能媒体。
  65. 前記無線端末のユーザによって設定される前期少なくとも幾つかの音声合成パラメータは、訛り、音声レート、ボイス性別、ボイス・モデル、アクセント、トーン、及び言語のうちの少なくとも1つを示す、請求項64のコンピュータ読取り可能媒体。
  66. 無線通信チャンネルからの受信された音声合成情報は、書籍の一部分のコンテンツ及び天気情報の少なくとも一方を含む、請求項65のコンピュータ読取り可能媒体。
  67. 音声合成情報を受信すること、
    オーデイオ情報の一部分を受信すること、
    オーデイオ情報の一部分が首尾よく受信されていないことを検知すること、
    及び、首尾よく受信されなかった前記オーデイオ情報の前記部分の少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成すること、
    を備える、ユーザデバイスを動作させる方法。
  68. 前記ユーザデバイスは、放送オーデイオ信号から生成されるオーデイオを再生すること及び前記オーデイオ信号の受信におけるロスの関数として音声合成情報からオーデイオ信号を生成することの間で切替わり、前記合成されるオーデイオは、対応するオーデイオ信号の受信が失われる場合に、用いられる、請求項67の方法。
  69. 放送オーデイオ信号の対応するセグメントを受信するより前に受信される放送オーデイオ信号の1つのセグメントに対応する受信音声合成情報を記憶することをさらに備える、請求項68の方法。
  70. 対応するオーデイオ・セグメントの首尾よい受信に続いて前記記憶された受信音声合成情報を削除することをさらに備える、請求項69の方法。
  71. 前記記憶された受信音声合成情報の前記削除は、対応する方法オーデイオ・セグメントが可聴信号として前記デバイスのユーザに提供されたる後に行われる、請求項70の方法。
  72. 前記ユーザデバイスは無線端末である、請求項71の方法。
  73. 前記無線端末はOFDM受信機を含む携帯可能通信デバイスである、請求項72の方法。
  74. 前記受信音声合成情報は、i)音声の音声表示及びii)音声のテキスト表示の少なくとも一方を含む、請求項68の方法。
  75. 前記受信音声合成情報は、音声合成器制御情報をさらに含む、請求項74の方法。
  76. 少なくとも幾つかの音声合成パラメータを首尾よく受信されたオーデイオ信号の関数として更新すること、
    及び、音声のテキスト表示を含む受信放送音声合成器情報を用いるオーデイオ信号の後続の生成において前記更新された音声合成パラメータの少なくとも幾つかを用いること、
    さらに備える請求項68の方法。
  77. 放送圧縮オーデイオ信号と、i)音声の音声表示及びii)音声のテキスト表示の少なくとも一方を含む放送音声合成情報とを受信するための受信機と、
    記憶された放送送信スケジュール情報と、
    前記放送送信スケジュール情報に従って前記放送圧縮オーデイオ信号及び前記放送音声合成情報を受信するために前記受信機を制御するための受信器制御モジュールと、
    首尾よく受信される放送圧縮オーデイオ信号に基づいてオーデイオを出力するために信号を生成するためのオーデイオ信号ベース生成モジュールと、
    受信音声合成情報に基づいてオーデイオを出力するために信号を生成するための音声合成ベース生成モジュールと、
    前記無線端末が受信しようとしている放送オーデイオ信号の一部分が受信されるか又は首尾よく受信されないかを決定するための及び前記決定に基づいて前記オーデイオ信号ベース生成モジュール及び前記音声合成ベース生成モジュールの間で動作を切替えるためのオーデイオ信号受信品質モジュールと、
    を備える無線端末。
  78. 前記受信放送音声合成情報は、合成器制御パラメータ情報をさらに含む、請求項77の無線端末。
  79. 放送オーデイオ信号の対応するセグメントを受信する前に受信される放送オーデイオ信号のセグメントに対応する受信音声合成情報を記憶するための音声合成記憶モジュールをさらに備える、請求項77の無線端末。
  80. 放送オーデイオ信号再生モジュールと、
    音声合成信号再生モジュールと、
    前記放送オーデイオ信号再生モジュール及び前記音声合成再生モジュールのうちの1つにより1つのセグメントを表わすオーデイオ情報をユーザに提供する後で前記セグメントに対応する音声合成情報を削除するための音声合成情報削除モジュールと、
    をさらに備える、請求項79の無線端末。
  81. 少なくとも幾つかの音声合成器制御パラメータを首尾よく受信された圧縮オーデイオ信号の関数として生成する及び(又は)更新するための音声合成器パラメータ更新モジュールをさらに備える、請求項77の無線端末。
  82. ユーザ入力に応答して少なくとも幾つかの音声合成器制御パラメータを設定するためのユーザ・プリファレンス・モジュールをさらに備える、請求項77の無線端末。
  83. 前記無線端末はモバイル通信デバイスであり、そして、前記受信器はOFDM受信器である、請求項77の無線端末。
  84. 放送圧縮オーデイオ信号と、i)音声の音声表示及びii)音声のテキスト表示の少なくとも一方を含む放送音声合成情報とを受信するための手段と、
    放送送信スケジュール情報を記憶するための手段と、
    前記放送送信スケジュール情報に従って前記放送圧縮オーデイオ信号及び前記放送音声合成情報を受信するために前記受信機を制御するための手段と、
    首尾よく受信される放送圧縮オーデイオ信号に基づいてオーデイオを出力するために信号を生成するための手段と、
    受信音声合成情報に基づいてオーデイオを出力するために信号を生成するための音声合成手段と、
    前記無線端末が受信しようとしている放送オーデイオ信号の一部分が受信されるか又は首尾よく受信されないかを決定するための及び前記決定に基づいて前記オーデイオ信号ベース生成モジュール及び前記音声合成ベース生成モジュールの間で動作を切替えるためのオーデイオ信号受信品質手段と、
    を備える無線端末。
  85. 前記受信放送音声合成情報は、合成器制御パラメータ情報をさらに含む、請求項84の無線端末。
  86. 放送オーデイオ信号の対応するセグメントを受信する前に受信される放送オーデイオ信号のセグメントに対応する受信音声合成情報を記憶するための音声合成記憶手段をさらに備える、請求項84の無線端末。
  87. 少なくとも幾つかの音声合成器制御パラメータを首尾よく受信された圧縮オーデイオ信号の関数として生成する及び(又は)更新するための音声合成器パラメータ更新手段をさらに備える、請求項84の無線端末。
  88. ユーザ入力に応答して少なくとも幾つかの音声合成器制御パラメータを設定するための手段をさらに備える、請求項84の無線端末。
  89. 音声合成情報を受信すること、
    オーデイオ情報の一部分を受信すること、
    オーデイオ情報の一部分が首尾よく受信されていないことを検知すること、
    及び、首尾よく受信されなかった前記オーデイオ情報の前記部分の少なくとも幾つかに対応する音声合成情報からオーデイオ信号を生成すること、
    を備える方法を実行するためにユーザデバイスを制御するための機械実行可能命令を具現するコンピュータ読取り可能媒体。
  90. 機械実行可能命令は、放送オーデイオ信号から生成されるオーデイオを再生すること及び前記オーデイオ信号の受信におけるロスの関数として音声合成情報からオーデイオ信号を生成することの間で切替わるように前記ユーザデバイスを制御し、前記合成されるオーデイオは、対応するオーデイオ信号の受信が失われる場合に、用いられる、請求項89の機械読取り可能媒体。
  91. 放送オーデイオ信号の対応するセグメントを受信するより前に受信される放送オーデイオ信号の1つのセグメントに対応する受信音声合成情報を記憶する付加的ステップを実行するためにユーザデバイスを制御するための命令をさらに備える、請求項90の機械読取り可能媒体。
  92. 対応するオーデイオ・セグメントの首尾よい受信に続いて前記記憶された受信音声合成情報を削除する付加的ステップを実行するためにユーザデバイスを制御するための命令をさらに備える、請求項91の機械読取り可能媒体。
  93. 前記記憶された受信音声合成情報の前記削除は、対応する方法オーデイオ・セグメントが可聴信号として前記デバイスのユーザに提供されたる後に行われる、請求項92の機械読取り可能媒体。
  94. 前記ユーザ・デバイスは無線端末である、請求項93の方法。
JP2009520927A 2006-07-14 2007-07-13 オーデイオ情報を配信するための改良された方法及び装置 Pending JP2009544247A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/487,261 US7822606B2 (en) 2006-07-14 2006-07-14 Method and apparatus for generating audio information from received synthesis information
PCT/US2007/073527 WO2008008992A2 (en) 2006-07-14 2007-07-13 Improved methods and apparatus for delivering audio information

Publications (1)

Publication Number Publication Date
JP2009544247A true JP2009544247A (ja) 2009-12-10

Family

ID=38924250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009520927A Pending JP2009544247A (ja) 2006-07-14 2007-07-13 オーデイオ情報を配信するための改良された方法及び装置

Country Status (7)

Country Link
US (1) US7822606B2 (ja)
EP (1) EP2047458A2 (ja)
JP (1) JP2009544247A (ja)
KR (1) KR20090033474A (ja)
CN (1) CN101490739A (ja)
TW (1) TW200820216A (ja)
WO (1) WO2008008992A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013246742A (ja) * 2012-05-29 2013-12-09 Azone Co Ltd 受動型出力装置及び出力データ生成システム
JP2020086003A (ja) * 2018-11-19 2020-06-04 トヨタ自動車株式会社 情報処理装置、情報処理方法およびプログラム

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934684B2 (en) * 2000-03-24 2005-08-23 Dialsurf, Inc. Voice-interactive marketplace providing promotion and promotion tracking, loyalty reward and redemption, and other features
WO2008132533A1 (en) * 2007-04-26 2008-11-06 Nokia Corporation Text-to-speech conversion method, apparatus and system
US8019276B2 (en) * 2008-06-02 2011-09-13 International Business Machines Corporation Audio transmission method and system
US9076145B2 (en) * 2008-11-05 2015-07-07 At&T Intellectual Property I, L.P. Systems and methods for purchasing electronic transmissions
CN103345467B (zh) * 2009-10-02 2017-06-09 独立行政法人情报通信研究机构 语音翻译***
TWI416367B (zh) * 2009-12-16 2013-11-21 Hon Hai Prec Ind Co Ltd 電子裝置及音訊資料的版權保護方法
GB2484919A (en) * 2010-10-25 2012-05-02 Cambridge Silicon Radio Directional display device arranged to display visual content toward a viewer
TWI413105B (zh) 2010-12-30 2013-10-21 Ind Tech Res Inst 多語言之文字轉語音合成系統與方法
CN102324230A (zh) * 2011-06-09 2012-01-18 民航数据通信有限责任公司 面向空中交通管制服务的气象信息语音合成***和方法
CN102426838A (zh) * 2011-08-24 2012-04-25 华为终端有限公司 语音信号处理方法和用户设备
US20130124190A1 (en) * 2011-11-12 2013-05-16 Stephanie Esla System and methodology that facilitates processing a linguistic input
US9824695B2 (en) * 2012-06-18 2017-11-21 International Business Machines Corporation Enhancing comprehension in voice communications
US9640173B2 (en) * 2013-09-10 2017-05-02 At&T Intellectual Property I, L.P. System and method for intelligent language switching in automated text-to-speech systems
US9628207B2 (en) * 2013-10-04 2017-04-18 GM Global Technology Operations LLC Intelligent switching of audio sources
US20150103016A1 (en) * 2013-10-11 2015-04-16 Mediatek, Inc. Electronic devices and method for near field communication between two electronic devices
KR102188090B1 (ko) * 2013-12-11 2020-12-04 엘지전자 주식회사 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
US9633649B2 (en) * 2014-05-02 2017-04-25 At&T Intellectual Property I, L.P. System and method for creating voice profiles for specific demographics
CN104021784B (zh) * 2014-06-19 2017-06-06 百度在线网络技术(北京)有限公司 基于大语料库的语音合成方法和装置
JP5887446B1 (ja) * 2014-07-29 2016-03-16 ヤマハ株式会社 情報管理システム、情報管理方法およびプログラム
JP5871088B1 (ja) * 2014-07-29 2016-03-01 ヤマハ株式会社 端末装置、情報提供システム、情報提供方法およびプログラム
JP6484958B2 (ja) 2014-08-26 2019-03-20 ヤマハ株式会社 音響処理装置、音響処理方法およびプログラム
CN104200803A (zh) * 2014-09-16 2014-12-10 北京开元智信通软件有限公司 一种语音播放方法、装置及***
CN105337897B (zh) * 2015-10-31 2019-01-22 广州海格通信集团股份有限公司 一种基于rtp报文的音频ptt同步传输***
US11120342B2 (en) 2015-11-10 2021-09-14 Ricoh Company, Ltd. Electronic meeting intelligence
CN105451134B (zh) * 2015-12-08 2019-02-22 深圳天珑无线科技有限公司 一种音频传输方法和终端设备
US10079021B1 (en) * 2015-12-18 2018-09-18 Amazon Technologies, Inc. Low latency audio interface
US10572858B2 (en) 2016-10-11 2020-02-25 Ricoh Company, Ltd. Managing electronic meetings using artificial intelligence and meeting rules templates
US11307735B2 (en) 2016-10-11 2022-04-19 Ricoh Company, Ltd. Creating agendas for electronic meetings using artificial intelligence
US10860985B2 (en) 2016-10-11 2020-12-08 Ricoh Company, Ltd. Post-meeting processing using artificial intelligence
US10304447B2 (en) * 2017-01-25 2019-05-28 International Business Machines Corporation Conflict resolution enhancement system
CN107437413B (zh) * 2017-07-05 2020-09-25 百度在线网络技术(北京)有限公司 语音播报方法及装置
US11062271B2 (en) 2017-10-09 2021-07-13 Ricoh Company, Ltd. Interactive whiteboard appliances with learning capabilities
US10552546B2 (en) 2017-10-09 2020-02-04 Ricoh Company, Ltd. Speech-to-text conversion for interactive whiteboard appliances in multi-language electronic meetings
US10956875B2 (en) 2017-10-09 2021-03-23 Ricoh Company, Ltd. Attendance tracking, presentation files, meeting services and agenda extraction for interactive whiteboard appliances
US10553208B2 (en) 2017-10-09 2020-02-04 Ricoh Company, Ltd. Speech-to-text conversion for interactive whiteboard appliances using multiple services
US11030585B2 (en) 2017-10-09 2021-06-08 Ricoh Company, Ltd. Person detection, person identification and meeting start for interactive whiteboard appliances
US10757148B2 (en) * 2018-03-02 2020-08-25 Ricoh Company, Ltd. Conducting electronic meetings over computer networks using interactive whiteboard appliances and mobile devices
CN109712646A (zh) * 2019-02-20 2019-05-03 百度在线网络技术(北京)有限公司 语音播报方法、装置和终端
US11263384B2 (en) 2019-03-15 2022-03-01 Ricoh Company, Ltd. Generating document edit requests for electronic documents managed by a third-party document management service using artificial intelligence
US11080466B2 (en) 2019-03-15 2021-08-03 Ricoh Company, Ltd. Updating existing content suggestion to include suggestions from recorded media using artificial intelligence
US11720741B2 (en) 2019-03-15 2023-08-08 Ricoh Company, Ltd. Artificial intelligence assisted review of electronic documents
US11392754B2 (en) 2019-03-15 2022-07-19 Ricoh Company, Ltd. Artificial intelligence assisted review of physical documents
US11573993B2 (en) 2019-03-15 2023-02-07 Ricoh Company, Ltd. Generating a meeting review document that includes links to the one or more documents reviewed
US11270060B2 (en) 2019-03-15 2022-03-08 Ricoh Company, Ltd. Generating suggested document edits from recorded media using artificial intelligence
US11735156B1 (en) * 2020-08-31 2023-08-22 Amazon Technologies, Inc. Synthetic speech processing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6290061A (ja) * 1985-06-13 1987-04-24 Sumitomo Electric Ind Ltd 音声情報伝達方法
JPH10319992A (ja) * 1997-05-22 1998-12-04 Fujitsu Ten Ltd 車載用音声合成装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2246273A (en) 1990-05-25 1992-01-22 Microsys Consultants Limited Adapting teletext information for the blind
US5406626A (en) 1993-03-15 1995-04-11 Macrovision Corporation Radio receiver for information dissemenation using subcarrier
AU6380496A (en) * 1995-06-07 1996-12-30 E-Comm Incorporated Handheld remote computer control and methods for secured int eractive real-time telecommunications
JP3287281B2 (ja) 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
US7027568B1 (en) 1997-10-10 2006-04-11 Verizon Services Corp. Personal message service with enhanced text to speech synthesis
US7003463B1 (en) * 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
US20020055844A1 (en) 2000-02-25 2002-05-09 L'esperance Lauren Speech user interface for portable personal devices
FI115868B (fi) 2000-06-30 2005-07-29 Nokia Corp Puhesynteesi
JP2002149320A (ja) * 2000-10-30 2002-05-24 Internatl Business Mach Corp <Ibm> 入力装置、通信用端末、携帯型通信用端末、音声フィードバックシステム、音声フィードバックサーバ
US6980953B1 (en) * 2000-10-31 2005-12-27 International Business Machines Corp. Real-time remote transcription or translation service
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
US6985857B2 (en) * 2001-09-27 2006-01-10 Motorola, Inc. Method and apparatus for speech coding using training and quantizing
US7610556B2 (en) * 2001-12-28 2009-10-27 Microsoft Corporation Dialog manager for interactive dialog with computer user
US7672436B1 (en) * 2004-01-23 2010-03-02 Sprint Spectrum L.P. Voice rendering of E-mail with tags for improved user experience

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6290061A (ja) * 1985-06-13 1987-04-24 Sumitomo Electric Ind Ltd 音声情報伝達方法
JPH10319992A (ja) * 1997-05-22 1998-12-04 Fujitsu Ten Ltd 車載用音声合成装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013246742A (ja) * 2012-05-29 2013-12-09 Azone Co Ltd 受動型出力装置及び出力データ生成システム
JP2020086003A (ja) * 2018-11-19 2020-06-04 トヨタ自動車株式会社 情報処理装置、情報処理方法およびプログラム
JP7119939B2 (ja) 2018-11-19 2022-08-17 トヨタ自動車株式会社 情報処理装置、情報処理方法およびプログラム
US11837218B2 (en) 2018-11-19 2023-12-05 Toyota Jidosha Kabushiki Kaisha Information processing device, information processing method, and program for generating synthesized audio content from text when audio content is not reproducible

Also Published As

Publication number Publication date
EP2047458A2 (en) 2009-04-15
US20080015860A1 (en) 2008-01-17
WO2008008992A3 (en) 2008-11-06
KR20090033474A (ko) 2009-04-03
CN101490739A (zh) 2009-07-22
WO2008008992A2 (en) 2008-01-17
TW200820216A (en) 2008-05-01
US7822606B2 (en) 2010-10-26

Similar Documents

Publication Publication Date Title
US7822606B2 (en) Method and apparatus for generating audio information from received synthesis information
US20190028746A1 (en) Synchronous and Multi-Sourced Audio and Video Broadcast
JP4456004B2 (ja) メディア・サービスの再生自動同期化方法および装置
EP2084908B1 (en) Adaptive insertion of content in streaming media
KR100735233B1 (ko) 개인방송 서비스 제공 시스템
US7792998B2 (en) System and method for providing real-time streaming service between terminals
US8180277B2 (en) Smartphone for interactive radio
US20080092164A1 (en) Providing a supplemental content service for communication networks
US20080092201A1 (en) Providing a supplemental content service for communication networks
US20070174871A1 (en) Method and device for providing brief information on data broadcasting service in digital multimedia broadcasting receiving terminal
US7768578B2 (en) Apparatus and method of receiving digital multimedia broadcasting
KR100783267B1 (ko) Dmb 부가 서비스 제공 시스템 및 방법
JP4894896B2 (ja) 音声信号処理装置及び音声信号処理方法
KR20070111798A (ko) 휴대용 단말기의 방송 정보 공유 방법
JP6733990B2 (ja) 解説音声再生装置、解説音声生成装置及び解説音声再生プログラム
KR20040063425A (ko) 멀티미디어 광고 서비스 시스템
US20070277194A1 (en) Digital broadcasting system and method for providing digital broadcasts using the same
KR100840908B1 (ko) 영상 통화 경로를 이용하여 실시간 tv 방송 시청서비스를 제공하는 통신 시스템 및 방법
JP4385710B2 (ja) 音声信号処理装置及び音声信号処理方法
JP5672873B2 (ja) 携帯端末装置、フレーム受信方法及びフレーム受信プログラム
KR100652699B1 (ko) Dmb기능을 구비한 휴대단말기의 채널변경방법
KR100800433B1 (ko) 휴대 이동 방송을 이용한 외부 프로그램의 동기화 방법
JP2003116119A (ja) 視聴者参加型放送番組配信方法、この方法に用いる送信システム及び受信システム
KR20050017133A (ko) 멀티미디어 콘텐츠 전달을 위한 슬라이드 메타정보처리장치 및 그 방법
WO2001071987A1 (en) Audio distribution and playback system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110215