JP4895759B2 - 音声メッセージ出力装置 - Google Patents

音声メッセージ出力装置 Download PDF

Info

Publication number
JP4895759B2
JP4895759B2 JP2006290532A JP2006290532A JP4895759B2 JP 4895759 B2 JP4895759 B2 JP 4895759B2 JP 2006290532 A JP2006290532 A JP 2006290532A JP 2006290532 A JP2006290532 A JP 2006290532A JP 4895759 B2 JP4895759 B2 JP 4895759B2
Authority
JP
Japan
Prior art keywords
voice
data
voice message
user
output device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006290532A
Other languages
English (en)
Other versions
JP2008108076A (ja
Inventor
一朗 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2006290532A priority Critical patent/JP4895759B2/ja
Publication of JP2008108076A publication Critical patent/JP2008108076A/ja
Application granted granted Critical
Publication of JP4895759B2 publication Critical patent/JP4895759B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)

Description

この発明は、音声メッセージを出力することができる装置に関し、例えば、テレビ放送受信装置や携帯電話などとして利用される。
従来より、操作ガイドを音声で行う音声メッセージ出力装置を搭載したテレビ放送受信録画装置などが提案されている。このようなテレビ放送受信録画装置では、例えば、録画予約に関する設定手順を音声案内する(特許文献1,特許文献2参照)。
特開平11−69283号公報 特開2005−338665号公報
しかしながら、従来の音声メッセージ出力では、予め登録されている音声(音色)に従って音声ガイダンスが出力されるため、ユーザが望む音声ガイダンスを作成できるものではなかった。なお、音声ガイダンスとして、「標準語」と「地方語」とを用意しておいてユーザが任意の語を選択できたりするものは存在するが(特許文献2参照)、登録済みのものを単にユーザが選択したり、或いはネット上に存在する(登録済みの)音声データを単に選択できるに過ぎず、ユーザが自身で編集した好みの音声ガイダンスを聞くことができるものではなかった。
この発明は、上記事情に鑑み、ユーザが自身で編集した好みの音声ガイダンスを聞くことができる音声メッセージ出力装置を提供することを目的とする。
この発明の音声メッセージ出力装置は、上記の課題を解決するために、発生したイベントに応じた音声メッセージを選択して音声出力する音声メッセージ出力装置において、各イベントに対してどのような音声メッセージが現在選択されているかをユーザに提示するか又は音声メッセージの設定が可能であるイベントをユーザに提示する手段と、音声認識によって音声データから文字データ又は語句データを生成する手段と、生成された文字データ又は語句データとその生成の原因とされた音声データとを対応付ける手段と、前記生成された文字データ又は語句データに基づく文字又は語句をユーザ選択のために表示する手段と、ユーザにより選択された文字又は語句により文字列を生成する文字列生成手段と、生成された文字列に対する登録操作がユーザによりなされたかどうかを判断する手段と、前記登録操作がなされた場合には対応イベントに対して前記ユーザにより作成された文字列に基づく前記音声データの繋ぎ合わせによって音声出力がなされるように音声メッセージの変更登録を実行する手段と、を備えたことを特徴とする。
上記の構成であれば、例えば、ユーザが好きな歌手の音声データから、文字や語句データを得て、該文字や語句を組み合わせることで文字列(メッセージ文)を作成し、この文字列に基づく音声出力を音声メッセージとして出力させることができる。すなわち、ユーザが自身で編集した好みの音声メッセージを聞くことができる。
上記構成の音声メッセージ出力装置において、前記音声データを、通信、放送受信、データ転送、装着されたメモリからの読出のいずれか一つ又は複数により取得するように構成されていてもよい。
また、この発明の音声メッセージ出力装置は、発生したイベントに応じた音声メッセージを選択して音声出力する音声メッセージ出力装置において、各イベントに対してどのような音声メッセージが現在選択されているかをユーザに提示するか又は音声メッセージの設定が可能であるイベントをユーザに提示する手段と、文字データ又は語句データに基づいて音声データを生成出力する音源手段と、ユーザによる文字又は語句の入力を受け付けて文字列を生成する文字列生成手段と、生成された文字列に対する登録操作がユーザによりなされたかどうかを判断する手段と、前記登録操作がなされた場合には対応イベントに対して前記ユーザにより作成された文字列に基づく前記音声データの繋ぎ合わせによって音声出力がなされるように音声メッセージの変更登録を実行する手段と、を備えたことを特徴とする。
上記の構成であれば、例えば、ユーザは文字や語句を自由に組み合わせて文字列(メッセージ文)を作成し、この文字列に基づく音声出力を音声メッセージとして出力させることができる。すなわち、ユーザが自身で編集した好みの音声メッセージを聞くことができる。
上記構成の音声メッセージ出力装置において、少なくとも47種の音節の音声データが格納された五十音テーブルを前記音源手段として予め保持するか、又は該五十音テーブルをデータ通信、データ放送受信、データ転送、メモリ装着のいずれか一つ又は複数により後で保持できるように構成されており、前記文字列に基づく音声生成を前記五十音テーブルの音声データに基づいて行うこととしてもよい。かかる構成であれば、ユーザが好きな歌手やタレントの五十音テーブルを用いて、ユーザが自身で編集した好みの音声メッセージを聞くことができる。
前記五十音テーブルを少なくとも二以上保持し、ユーザによって選択された五十音テーブルを用いて前記文字列に基づく音声生成を行うこととしてもよい。
また、各数字キーに一つ又は複数の文字が割り当てられたテンキーを備えており、前記テンキーを用いて文字入力が行えるように構成されていてもよい。
また、これら音声メッセージ出力装置が携帯電話として構成されており、電話着信音及び/又はメール着信音を前記文字列に基づく音声生成によって出力するようにしてもよい。
この発明によれば、ユーザが自身で編集した好みの音声メッセージを聞くことができるという効果を奏する。
以下、この発明の実施形態を図1乃至図7に基づいて説明する。
図1はこの実施形態の音声メッセージ出力装置を搭載する携帯電話(地上ディジタル放送受信能付)2のブロック図である。
図1に示すように、携帯電話2は、地上波ディジタルチューナ230による放送受信により得られた符号化映像音声データ、或いは、スロット201に差し込まれたメモリカード3等から読み出した符号化映像音声データにより、映像を液晶表示パネル202上に映し出すとともに、音声をスピーカ203から出力するようになっている。また、地上波ディジタルチューナ230による放送受信により得られた符号化映像音声データを前記メモリカード3等に記録することもできる。なお,この実施形態では符号化映像音声データはH.264データであるとする。
メモリカード3から読み出したH.264データは、PCMCIAインターフェイス220、及びシステムバス213を経てビデオデコーダ204に供給される。また、地上ディジタル放送を受信するチューナ230は、この地上ディジタル放送で放送されるビットストリームデータを取り出し、ビデオデコーダ204やオーディオデコーダ(MPEG4−AAC)206に与える。
ビデオデコーダ204は、ビットストリームデータを復号して量子化係数や動きベクトルを求め、逆DCT変換や動きベクトルに基づく動き補償制御などを行うことによって得た映像データをグラフィックスコントローラ205に供給する。グラフィックスコントローラ205は映像データ(例えば、R,G,Bデータ)に対して色調整等の処理を施す。また、グラフィックスコントローラ205はCPU209から出力指示された文字等を液晶表示パネル202に表示するOSD(オンスクリーンディスプレイ)処理も行う。このOSD処理により、メニュー画面や文字入力画面などの生成が行える。オーディオデコーダ206は、ビットストリーム中の音声符号データを復号して音声データを生成する。SDRAM210は、ビデオデコーダ204の上記処理において利用される。
LCDコントローラ207は、グラフィックスコントローラ205から供給された映像データに基づいてLCDパネル202を駆動する。D/A変換器208は、オーディオデコーダ206から出力された音声データを受け取ってD/A変換を行い、アナログ信号を生成してスピーカ203に与える。
本体キー214に対する操作情報は、インターフェイス215及びシステムバス213を介してCPU209に与えられる。CPU209は上記操作情報に基づいて必要な処理を実行する。本体キー214には、テンキー等の他、テレビ視聴開始キー、録画(録音)開始キー、方向キー(矢印キー)なども設けられている。
また、近距離無線ネットワークを可能にするために、通信ブロック216及びインターフェイス217が設けられている。更に、FlashROM218やSDRAM219も備える。電池221は二次電池であり、図示しない充電器から電力の供給を得てこれを蓄える。携帯電話部231は電話や電子メール等に係わる処理を行う。携帯電話部231における電話番号入力や文字入力には本体キー214におけるテンキーが用いられる。一方、テレビ視聴モードが選択されたときには、前記本体キー214におけるテンキーはチャンネル番号入力のためのキー等として機能する。
音声認識部232は、オーディオデコーダ206から出力される音声データを入力し、音声認識処理を行う。その詳細は後で説明する。音声認識結果は例えばFlashROM218などの書き換え可能な不揮発性メモリに格納される。また、音声メッセージとなる音声データがD/A変換部208に供給されると、スピーカ203を介して音声が出力される。
CPU209は、無線ネットワークのための処理、受信データに基づく各機能部の制御、FlashROM218やSDRAM219のリード/ライト制御なども行う。CPU209を動作させるブートプログラムやアプリケーションプログラムは書き換え可能な不揮発性メモリに格納されており、これらブートプログラムやアプリケーションプログラムは揮発性メモリ上に展開される。音声メッセージ(音声ガイダンス)となる音声データファイルも、前記書き換え可能な不揮発性メモリに格納されており、音声データファイル単位(メッセージ単位)で書き換えることが可能である。なお、この実施形態では、後述するように、現在の選択ガイド文を提示(表示)するようにしているため、音声データファイルだけでなく、音声メッセージの文字列ファイル(テキストファイル)も前記不揮発性メモリに格納している。また、後でも説明するが、音声メッセージの変更登録においては、変更音声メッセージの文字列ファイルと該文字列の音声読み上げ処理にて得られた音声データファイルとを登録すればよいのであるが、該音声データファイルの登録を省くことも可能である。すなわち、文字列ファイルを有していれば、その文字列によって必要な時点で音声読み上げ処理を行うことでメッセージの音声出力が行えるからである。
CPU209は、放送受信などの基本処理の他、音声ガイダンス出力処理、音声ガイダンスのための編集処理、前記編集のための発話データ生成処理、前記発話データ生成のための音声認識処理等も行う。
[音声ガイダンス出力処理]
CPU209は、音声ガイダンス(音声メッセージ)出力を要するイベントが発生したときに、該イベントに対応付けられている識別番号を得て、この識別番号で示されるファイルを得る。識別番号で示されるファイルの中身は、文字列に基づいて作成された(作成済みの)音声データでもよいし、音声データとされる前の文字列データであってもよい。音声データはD/A変換器208に供給されて音声となる。音声ガイダンスの例としては、例えば、受信番組を録画する指令がユーザによってなされたときや音楽映像の再生指令がユーザによってなされたときに、CPU209はメモリカード3がスロット201に装着されているかどうかを判断するが、このときにメモリカード3が装着されていなければ、「メモリカードをセットしてください」といった音声ガイダンスを行う。
[音声ガイダンスのための編集処理]
例えば、メニュー画面において、「音声ガイダンス編集」といった項目を用意しておく。図2に編集画面の一例を示す。この画面では、イベント内容と現在選択されている音声ガイダンスとを表示している。この状態において例えば上下方向キーの操作をCPU209が検出すると、該CPU209は画面内容をスクロールさせる。これにより、現在表示されている内容以外のイベント内容と現在選択されている音声ガイダンス文を画面上に表示させていくことができる。そして、CPU209は、決定キーの押下を検出すると、その時点でカーソルが載せられているイベント内容と現在選択されている音声ガイダンスが、ユーザが編集を希望するイベント内容と現在選択されている音声ガイダンスであると判断する。上記決定キーが押下されると、図3に示す画面に切り替わる。
図3に示す表示画面では、画面の上半分側には選択されたイベント内容と現在選択されている音声ガイダンスとが表示され、画面下半分側にはメッセージ文入力領域が形成される。この状態では、CPU209は本体キー214におけるテンキーの押下を文字入力操作として受け付ける。CPU209は電子メール文の作成(編集)時と同様に、ユーザによって入力された文字を画面(液晶表示パネル202)に表示していく処理を行う。図2に示している例では、イベントが「カード未装着時の警告ガイド」であり、現在の選択ガイド文が「メモリカードをセットしてください」であり、ユーザによって入力されたガイド文が「カードいれてんか」となっている。CPU209は、この状態で決定キーの押下を検出すると、「カード未装着時の警告ガイド」のイベントについて、ガイダンス文を「カードいれてね」に変更する処理、すなわち、ガイド文字列の記憶及びイベントと当該ガイド文字列との対応付けを行う。この対応付けとは、現在編集中の識別番号(図の例では[0001])のファイルの中身を前記ガイド文字列(「カードいれてね」)に変更する処理でもある。なお、先にも述べたが、ガイド文字列は音声データに変換できるので、現在編集中の識別番号(図の例では[0001])のファイルの中身を前記音声データファイルに変更することとしてもよい。以下に示す例においても同様である。一方、前記ガイド文字列を記憶するのであれば、その読み上げ処理において用いる後述の五十音テーブルがどれであるかについての情報も現在編集中の識別番号(図の例では[0001])のファイルに保持しておくことになる。
ガイド文字列に対応した音声出力は、いわゆる読み上げソフトウェアを用いることで実現できる。ガイド文における各語の発話は、音声合成音でもよいし、或いは例えばテレビタレントに入力してもらった五十音テーブルに基づいて行うこととしてもよい。この五十音テーブルは、少なくとも日本語の47種の音節の音声データが格納されていればよいが、濁音,半濁音,拗音の音声データが含まれているのが望ましい。更に、例えば、同じ「で」でも、上げ調子の「で」と下げ調子の「で」の音声データを持つのが望ましい。更に、五十音テーブルが「あー」、「いー」、・・のごとく長音の音声データを持つことにより、カードにおける「かー」の発話が行えることになる。例えば、タレントの○○花子の五十音テーブルを用いれば、あたかも○○花子が「カードいれてね」と言ってくれているように聴こえることになる。
前記五十音テーブルは通信ブロック216を用いてインターネット上のサイトからダウンロードしてもよいし、携帯電話部231におけるファイル転送機能を用いてインターネット上のサイトからダウンロードしてもよいし、ディジタル放送におけるデータ放送で提供されているダウンロード用のデータをダウンロードしてもよい。勿論、五十音テーブルの提供は有料であってもよい。また、メーカーとタレントとが提携して、幾人かのタレントの五十音テーブルを予めメモリやメモリカードに格納しておくようにしてもよい。また、メーカー側では、数十人程度のタレントの五十音テーブルを提供できるようにしておき、ユーザから希望のあった5人程度のタレントの五十音テーブルを商品受け渡し時にメモリに格納するようにしてもよい。このような処理は、携帯電話の機種交換時におけるメールアドレス等のデータ転送の際に行うことができる。なお、或るファイルが五十音テーブルのファイルかどうかの判断のために、ファイル名中の識別子として五十音テーブルであることを示す特有の識別子を持たせることとすればよい。
図4に編集画面の他の例を示す。この図4の画面は、先述の図3に示した編集画面に遷移する前段階で例えば「五十音テーブルから編集」の項目と「ユーザ録音から編集」の項目とを表示し、後者の「ユーザ録音から編集」が選択された場合に表示されることとしている。なお、「五十音テーブルから編集」が選択された場合に、a.○○花子、b.○○太郎、c.○○五郎のごとく、五十音テーブルの主体表示を行い、このうちの誰かがユーザによって選択された後に前記図3の画面に遷移するようにすればよい。
図4に示す編集画面においては、イベント内容と現在選択されている音声ガイダンスとを画面の上半分側に表示している。そして、画面の下半分側には、音声ソース選択のための画面を表示している。この画面表示例では、音声ソースとして、「○○五郎/ユーザ録音/○年○月○日/ミュージック歌合戦」のタイトルが付された音声認識ファイルと、「○○花子/ユーザ録音/○年○月○日/ドラマ○○山河」のタイトルが付された音声認識ファイルとが存在している。CPU209は決定キーが押下された時点でカーソルが載せられている方のファイルを開く処理を行う。
選択されたファイル内には、図5に示すように、例えば、「します」、「できません」、「操作」、「メニュー」、「ディジタル」、「設定」、「カード」、「下さい」、「手紙」、「来た」、「が」といった語句(文字列)及びこれらに対応する音声データが存在している。ユーザは、この編集画面上で、語句を順次選択してガイダンス文を作成する。例えば、「できません」、「カード」、「下さい」の語句を順次選択していくと、「できませんカード下さい」のガイダンス文ができあがり、○○五郎の声で「できませんかーどください」の音声出力が行えることになる。ユーザが個人的に使う機器におけるガイダンス文であるから、ユーザが理解できればガイダンス文として十分に成立する。語句の選択はカーソル移動のための方向キー操作と決定キーの操作で行うことができる。
図6に携帯電話用ガイダンスにおける編集画面の一例を示す。画面の上半分側には、選択されたイベント内容と現在選択されている音声ガイダンスとが表示され、画面下半分側には、メッセージ入力領域が形成される。この状態では、CPU209は本体キー214におけるテンキーの押下を文字入力として受け付ける。CPU209は電子メール文の作成(編集)時と同様に、ユーザによって入力された文字を画面に表示していく処理を行う。図6に示している例では、イベントが「メール着信音出力」で、メッセージ文は存在しておらず、着信メロディとして○○が設定されていることを示している。ユーザは、文字入力によって、例えば、「メールがきましたよ すぐみてくださいね」といった文言を入力する。CPU209は、上記の状態で決定キーの押下を検出すると、イベントが「メール着信音出力」で、音声メッセージを「メールがきましたよ すぐみてくださいね」に変更する処理を行う。
メッセージ文における各語の発話は、先述のごとく、テレビタレントに入力してもらった五十音テーブルに基づいて行うこととしてもよい。例えば、タレントの○○花子の五十音テーブルを用いれば、あたかも○○花子が「メールがきましたよ すぐみてくださいね」と言ってくれているように聴こえることになる。また、「携帯電話用ガイダンス」における編集においても、図4及び図5に示したごとく、音声ソースとして、「○○五郎/ユーザ録音/○年○月○日/ミュージック歌合戦」のタイトルが付されたファイルを用いてメッセージ文を作成することができる。例えば、「手紙が来た」といったメッセージ文を作成すれば、○○五郎の声で「てがみがきた」の音声出力が行われる。
また、或る条件で登録されているメール発信者用のメール着信音(グループ1のメール着信音)、他の条件で登録されているメール発信者用のメール着信音(グループ2のメール着信音)のごとく、或いは、送信者個人単位で、異なる着信音声メッセージを作成できるようにしておいてもよい。個人単位の場合は、図7に示すように、例えば、「じろうさんからメールです」といったガイダンス文を作成することが考えられる。これらのことは電話着信についても同様に適用できる。なお、このような処理を実行する場合においては、基本(共通)となる識別番号で示される音声データファイル(例えば、[0110])と共に、枝番が付された識別番号(例えば、○○次郎については[0110−1])の音声データファイルを併存させることになる。CPU209は、メール着信があったときに(イベントが発生したときに)、送信者メールアドレスとメールリストとに基づいて誰からのメールかを判断し、特定できた相手に対して音声ガイダンスの識別番号が存在するかどうかを判断し(例えば、○○次郎からのメールであれば、上記識別番号[0110−1]が得られる)、識別番号が存在すれば、その識別番号の音声データファイルを再生することになる。なお、個人単位の編集を容易にするために、メールアドレスの選択を経て(メールリスト画面を経て)、上記メール着信音編集処理のための画面に移行できるようにしておいてもよい。
また、ディジタルカメラ付きの構成とする場合には、シャッタ押下時に「撮るよ」といった音声メッセージを出力することが可能である。そして、上記「撮るよ」に代えて、「撮るでー」といったメッセージ文をユーザが作成編集して前記五十音テーブルを用いて読み上げさせることも可能である。
[編集のための発話データ生成処理]
先述した「○○五郎/ユーザ録音/○年○月○日/ミュージック歌合戦」の音声認識ファイルを作成する処理について説明していく。携帯電話2はユーザ操作に基づいて、「ミュージック歌合戦」という番組をディジタル放送受信によって受信録音する。これにより、録音ファイルが作成される。すなわち、ユーザは、TV番組から好きなタレントの音声を録音する。勿論、インターネット上で提供される音声ファイルをダウンロードしてもよい。また、他の放送受信装置で「ミュージック歌合戦」を受信してメモリカードに録音を行い、このメモリカードをスロット201に装着することとしてもよい。
例えば、メニュー画面上に「音声認識ファイル作成」といった項目を用意しておく。CPU209は、「音声認識ファイル作成」の項目が選択されたことを検出すると、録音ファイル一覧画面を表示する。CPU209は、ユーザによって選択された録音ファイルを開いて音声データを生成し、この音声データを音声認識処理にかけ、これによって得られた音声認識ファイルを書き換え可能な不揮発性メモリ上に記録する。すなわち、ユーザは、TV番組から好きなタレントの音声を録音し、この録音データから好きなタレントの発話データ(文字データ及び音声データ)を獲得できたことになる。音声認識とは、音声データを文字データに変換する処理であり、いわゆる「書き起こし」とも呼ばれているが、CPU209は、かかる処理に加えて、音声認識で得られた文字データと、該文字データに対応している音声データ部分とを対応付ける処理(音声認識結果を得る原因となった音声データ部分と音声認識結果(文字データ)との対応付け)も行う。ただし、いわゆる音声認識というときには、言葉の意味の識別(語句(複数文字単位)の識別)が基本的には必要となるが、本願の音声認識では言葉の意味の識別は特に必要ではない。一文字単位で音声データ部分と文字とを対応付ければ足りる。例えば、「これからかえります」という音声認識結果が得られたとしたなら、「こ」の音声データ部分、「れ」の音声データ部分、「か」の音声データ部分、・・のごとく、一文字とその音声データとの対応がとれればよい。
例えば、「こ」の文字コード及び「こ」の音声データは、「○○五郎/ユーザ録音/○年○月○日/ミュージック歌合戦」の認識ファイル内で対のファイルとして保存され、また、それぞれのファイルにはデータ種の識別のために識別子が付される。「こ」の文字コードは、ユーザが文字列を作成する際の文字提示(或いは語句提示,図5参照)のために用いられ、「こ」の音声データは、作成された文字列に「こ」が含まれる音声ガイダンスの音声出力において用いられる。
なお、ユーザが、「これから」の一連部分を指定した場合に、CPU209が「こ」「れ」「か」「ら」の複数音声データを一纏まりとして結合することにより、音声認識ファイル内に「これから」という語句(文字列)及びこれらに対応する音声データを存在させることもできる。勿論、辞書データを備えることにより、語句単位での音声認識が可能となる。
また、いわゆる電話音声認識システムにおいては、電話の音声の全てを文字データに変換するのではなく、音声認識の困難性に鑑み、あらかじめ用意したキーワードだけを探し出す(認識する)ことが行われている。本願発明においても、「します」、「できません」、「そうさ」、「めにゅー」、「でぃじたる」、「せってい」、「かーど」、「ください」といった語句(文字列)をキーワードとして登録しておき、これらに一致する認識結果だけに基づいて語句(文字列)及びこれらに対応する音声データを保存するようにしてもよい。
また、音声部分の途切れ(アナログ放送音声であれば判断することが可能)を認識することにより、音声(文)を分割することができる。例えば、「これからかえります」ではなく、「これから」「かえります」のごとく、分割して認識することが可能である。
なお、録音ファイルを再生して得た音声データ(非圧縮)を音声認識処理にかけることに限定するものではない。放送受信などで得られた音声データをリアルタイムで音声認識処理にかけることも可能である。また、字幕文データが得られる場合には、この字幕文データを参照して音声認識の精度を高めることもできる。例えば、音声認識結果が「今日駅で待ってて」であったとし、この音声認識結果を得た時点或いはその前後の所定時間の範囲において出力された字幕文データとして「東京駅で待ってて」が存在しているとする。CPU209は、文字一致判定を実行することで、「駅で待ってて」において一致し、「今日」と「東京」とで不一致との判断結果を得る。CPU209は、不一致部分について字幕文データで示される語句が正しいとして文字認識結果を修正する。
また、上記の例では、テレビタレントが五十音テーブルを提供する例を示したが、これに限らず、テレビタレントが、「します」、「できません」、「操作」、「メニュー」、「ディジタル」、「設定」、「カード」、「下さい」といった語句の音声データを提供することとしてもよい。
また、上記の例では、各イベントに対してどのような音声メッセージが現在選択されているかをユーザに提示したが、現在選択されている音声メッセージの提示を省いてもよい。すなわち、音声メッセージの設定が可能である各イベント(イベント内容)をユーザに提示するだけとしてもよい。
また、前記音声メッセージとなる文字列の読み上げにおいて、読み上げの速度調整等が行えるようにしておいてもよい。
また、上記の例では、携帯電話を例示したが、これに限るものではなく、車載型のテレビ受信装置、通信機能付きのカーナビゲーションシステム、レコーダやプレーヤ、据え置き型のテレビ受信装置として構成することができる。また、ディジタル放送受信に限らず、アナログ放送受信を行う装置としてもよい。データ登録のためには、アナログ音声をディジタル信号に変換する。
また、上記の例では、テンキーを用いて文字入力を行ったが、これに限るものではなく、例えば、比較的大きなディスプレイを有する場合には、その画面にキーボードを表示し、方向キーと決定キーの操作で文字を特定して入力が行えるようにしてもよい。勿論、キーボードを備える構成も採用できる。
ところで、固定的なデータとしての音声ガイドデータをハードディスクなどに記録する機器では、前記音声ガイドデータ(固定的データ)をファイルとして管理するファイルシステムを搭載している。アプリケーションソフトは、ファイルシステムが提供するAPI(アプリケーション・プログラミング・インターフェイス)を用いて、ハードディスにアクセスする。ファイルシステムは、アプリケーションソフトが読み書きをすることを許容する一般パーティションと、特殊操作によってのみ書き込みが可能でアプリケーションソフトは通常は読み出しかできない特殊パーティションとに分けてファイルを管理している。ただし、特殊パーティションでも、書き込み許可モードに変更すると書き込みは可能になる。従って、特殊パーティションに音声ガイドデータを書き込む時には、特殊パーティションを書き込み許可モードに変更した上でデータを書き込み、データを書き込んだ後に再び特殊パーティションを書き込み禁止にする手順を取ることとする。
この発明の実施形態の携帯電話(音声メッセージ出力装置)の構成を示したブロック図である。 この発明の実施形態の編集画面例を示した説明図である。 この発明の実施形態の編集画面例を示した説明図である。 この発明の実施形態の編集画面例を示した説明図である。 この発明の実施形態の編集画面例を示した説明図である。 この発明の実施形態の編集画面例を示した説明図である。 この発明の実施形態の編集画面例を示した説明図である。
符号の説明
2 携帯電話
202 LCDパネル
205 グラフィックスコントローラ
207 LCDコントローラ
209 CPU
230 地上波ディジタルチューナ
231 携帯電話部
232 音声認識部

Claims (7)

  1. 発生したイベントに応じた音声メッセージを選択して音声出力する音声メッセージ出力装置において、各イベントに対してどのような音声メッセージが現在選択されているかをユーザに提示するか又は音声メッセージの設定が可能であるイベントをユーザに提示する手段と、音声認識によって音声データから文字データ又は語句データを生成する手段と、生成された文字データ又は語句データとその生成の原因とされた音声データとを対応付ける手段と、前記生成された文字データ又は語句データに基づく文字又は語句をユーザ選択のために表示する手段と、ユーザにより選択された文字又は語句により文字列を生成する文字列生成手段と、生成された文字列に対する登録操作がユーザによりなされたかどうかを判断する手段と、前記登録操作がなされた場合には対応イベントに対して前記ユーザにより作成された文字列に基づく前記音声データの繋ぎ合わせによって音声出力がなされるように音声メッセージの変更登録を実行する手段と、を備えたことを特徴とする音声メッセージ出力装置。
  2. 請求項1に記載の音声メッセージ出力装置において、前記音声データを、通信、放送受信、データ転送、装着されたメモリからの読出のいずれか一つ又は複数により取得するように構成されたことを特徴とする音声メッセージ出力装置。
  3. 発生したイベントに応じた音声メッセージを選択して音声出力する音声メッセージ出力装置において、各イベントに対してどのような音声メッセージが現在選択されているかをユーザに提示するか又は音声メッセージの設定が可能であるイベントをユーザに提示する手段と、文字データ又は語句データに基づいて音声データを生成出力する音源手段と、音声認識によって音声データから文字データ又は語句データを生成する手段と、生成された文字データ又は語句データとその生成の原因とされた音声データとを対応付ける手段と、前記生成された文字データ又は語句データに基づく文字又は語句をユーザ選択のために表示する手段と、ユーザにより選択された文字又は語句により文字列を生成するか又はユーザによる文字又は語句の入力を受け付けて文字列を生成する文字列生成手段と、生成された文字列に対する登録操作がユーザによりなされたかどうかを判断する手段と、前記登録操作がなされた場合には対応イベントに対して前記ユーザにより作成された文字列に基づく前記音声データの繋ぎ合わせによって音声出力がなされるように音声メッセージの変更登録を実行する手段と、を備えたことを特徴とする音声メッセージ出力装置。
  4. 請求項3に記載の音声メッセージ出力装置において、少なくとも47種の音節の音声データが格納された五十音テーブルを前記音源手段として予め保持するか、又は該五十音テーブルをデータ通信、データ放送受信、データ転送、メモリ装着のいずれか一つ又は複数により後で保持できるように構成されており、前記文字列に基づく音声生成を前記五十音テーブルの音声データに基づいて行うことを特徴とする音声メッセージ出力装置。
  5. 請求項4に記載の音声メッセージ出力装置において、前記五十音テーブルを少なくとも二以上保持し、ユーザによって選択された五十音テーブルを用いて前記文字列に基づく音声生成を行うことを特徴とする音声メッセージ出力装置。
  6. 請求項4又は請求項5に記載の音声メッセージ出力装置において、各数字キーに一つ又は複数の文字が割り当てられたテンキーを備えており、前記テンキーを用いて文字入力が行えるように構成されていることを特徴とする音声メッセージ出力装置。
  7. 請求項1乃至請求項6のいずれかに記載の音声メッセージ出力装置は携帯電話として構成されており、電話着信音及び/又はメール着信音を前記文字列に基づく音声生成によって出力することを特徴とする音声メッセージ出力装置。
JP2006290532A 2006-10-25 2006-10-25 音声メッセージ出力装置 Expired - Fee Related JP4895759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006290532A JP4895759B2 (ja) 2006-10-25 2006-10-25 音声メッセージ出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006290532A JP4895759B2 (ja) 2006-10-25 2006-10-25 音声メッセージ出力装置

Publications (2)

Publication Number Publication Date
JP2008108076A JP2008108076A (ja) 2008-05-08
JP4895759B2 true JP4895759B2 (ja) 2012-03-14

Family

ID=39441373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006290532A Expired - Fee Related JP4895759B2 (ja) 2006-10-25 2006-10-25 音声メッセージ出力装置

Country Status (1)

Country Link
JP (1) JP4895759B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767096B2 (en) * 2014-05-30 2017-09-19 General Electric Company Systems and methods for internationalization support
CN110491367B (zh) * 2019-08-16 2022-04-12 东方明珠新媒体股份有限公司 智能电视的语音转换方法及设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1032628A (ja) * 1996-07-18 1998-02-03 Mitsubishi Electric Corp 電話機
JPH10233833A (ja) * 1997-02-17 1998-09-02 Kenwood Corp 携帯電話機
JP2002358092A (ja) * 2001-06-01 2002-12-13 Sony Corp 音声合成システム
JP2004038461A (ja) * 2002-07-02 2004-02-05 Ricoh Co Ltd 操作部情報提示装置、プログラムおよびそれを用いた電子機器
JP2004056372A (ja) * 2002-07-18 2004-02-19 Pioneer Electronic Corp 番組編成装置、番組提供システム、それらの方法、それらのプログラムおよびそれらのプログラムを記録した記録媒体
JP2004221746A (ja) * 2003-01-10 2004-08-05 Yamaha Corp 発声機能を有する携帯端末装置
JP4286583B2 (ja) * 2003-05-15 2009-07-01 富士通株式会社 波形辞書作成支援システムおよびプログラム
JP2005062308A (ja) * 2003-08-08 2005-03-10 Murata Mach Ltd 文書処理装置と文書処理システム
JP4595577B2 (ja) * 2005-02-08 2010-12-08 ソニー株式会社 監視・制御用装置
JP4461047B2 (ja) * 2005-03-31 2010-05-12 株式会社ケンウッド ナビゲーション装置、av装置、アシスタント表示方法、アシスタント表示用プログラム、および電子機器システム

Also Published As

Publication number Publication date
JP2008108076A (ja) 2008-05-08

Similar Documents

Publication Publication Date Title
US10720145B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
CN100409700C (zh) 利用语音转文本辅助的多媒体和文本消息传送
JP6128146B2 (ja) 音声検索装置、音声検索方法及びプログラム
KR20010076508A (ko) Mp3 플레이어 겸용 휴대폰에서 음성 인식에 의한 선곡방법
CN100536552C (zh) 数字视频再现设备
JP4895759B2 (ja) 音声メッセージ出力装置
US20090055167A1 (en) Method for translation service using the cellular phone
JP2007028368A (ja) 録画番組再生装置、録画番組再生方法および録画番組再生プログラム
JP2006227225A (ja) コンテンツ提供装置及び方法
JP2007323512A (ja) 情報提供システム、携帯端末及びプログラム
JP2007094751A (ja) エージェントシステム、情報提供装置、及び端末装置
JP2009116107A (ja) 情報処理装置及び方法
JP2006031205A (ja) 情報処理装置および方法、プログラム記録媒体、並びにプログラム
JP6587459B2 (ja) カラオケイントロにおける曲紹介システム
KR100879684B1 (ko) 휴대용 단말기를 이용한 외국어 학습 방법 및 외국어 학습기능을 구비한 휴대용 단말기
WO2019069997A1 (ja) 情報処理装置、画面出力方法及びプログラム
CN112236816B (zh) 信息处理装置、信息处理***以及影像装置
KR101576683B1 (ko) 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법
JP5242856B1 (ja) 音楽再生プログラム及び音楽再生システム
JP2009171015A (ja) 字幕付映像再生装置及びプログラム
JP2004266577A (ja) メディア同期再生装置、サーバ装置、およびメディア同期再生処理プログラム、サーバ処理プログラム
JP2006165846A (ja) 携帯電話装置
KR100686053B1 (ko) 티브이의 텍스트 정보 출력장치 및 방법
KR100837542B1 (ko) 정보 통신망을 이용한 음악 콘텐츠 제공 방법 및 그 시스템
JP2003309786A (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees