JP2003219332A - 番組予約装置及びその方法、プログラム - Google Patents

番組予約装置及びその方法、プログラム

Info

Publication number
JP2003219332A
JP2003219332A JP2002014637A JP2002014637A JP2003219332A JP 2003219332 A JP2003219332 A JP 2003219332A JP 2002014637 A JP2002014637 A JP 2002014637A JP 2002014637 A JP2002014637 A JP 2002014637A JP 2003219332 A JP2003219332 A JP 2003219332A
Authority
JP
Japan
Prior art keywords
program
program reservation
voice
reservation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002014637A
Other languages
English (en)
Inventor
Kenichiro Nakagawa
賢一郎 中川
Hiroki Yamamoto
寛樹 山本
Shinichi Yamazaki
信一 山▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002014637A priority Critical patent/JP2003219332A/ja
Publication of JP2003219332A publication Critical patent/JP2003219332A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Television Systems (AREA)

Abstract

(57)【要約】 【課題】 公衆回線網を介したユーザと番組予約装置間
の音声対話を実現することにより、ユーザが外出先など
遠く離れた場所からでも番組予約を行うことが可能とな
り、かつ効率的な番組予約を実現することができる番組
予約装置を提供する。 【解決手段】 公衆回線網102を介して電話機101
から入力された音声に基づいて、番組予約を行う番組予
約装置104であって、この番組予約装置104は、合
成音を作成する音声合成部107と入力された音声を認
識する音声認識部108とを制御して、番組予約に関す
る情報を導出する対話生成部109を備え、この対話生
成部109の制御によって得られる番組予約に関する情
報に基づいて、予約対象の電子番組情報と検索するため
の検索キーを取得する。次に、取得された検索キーに基
づいて、該検索キーに該当する電子番組情報を電子番組
情報検索部114で検索する。そして、その検索された
電子番組情報に基づいて、番組予約データを番組予約デ
ータ作成部115で作成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子番組情報(EP
G = Electronic Programming Guide)を利用した音声認
識による番組予約装置及びその方法、プログラムに関す
るものである。特に、電話回線で接続されたユーザと音
声及びプッシュトーン信号を用いた音声対話により、番
組を予約する番組予約装置及びその方法、プログラムに
関するものである。
【0002】
【従来の技術】デジタル放送が開始され、ユーザが選択
できるテレビ番組の数は飛躍的に多くなっている。これ
に伴い、従来の紙面だけの番組情報の配信/提供から電
子番組情報と呼ばれるものが配信されるようになってき
ている。この電子番組情報を用いれば、電子的な検索を
用いて目的の番組情報を探すことが可能であり、すでに
これに対応したテレビやチューナが発表されている。現
在、市場に出ている製品では、電子番組情報をテレビ画
面に表示し、マウス、テレビリモコンといったデバイス
を用いてユーザに番組情報を選択させるものが多い。
【0003】また、音声認識/音声合成技術を用い、対
話的に目的の番組情報を検索する技術も提案されている
(特開2000−250575号)。音声認識は、多数
の候補から一つを選択するというタスクに優れることか
ら、番組情報の検索とは相性がよい。このため、音声認
識を使用する番組予約/番組選択の機能を持つ製品は、
市場で採用される可能性が高くなることが予想される。
【0004】
【発明が解決しようとする課題】従来、提案されている
音声対話(音声認識、音声合成)を用いた番組予約装置
では、ユーザは、その番組予約装置あるいはマイク/テ
レビリモコンなどのデバイスの前で、番組予約に係る発
声をすることが要求される。そのため、ユーザが録画予
約を忘れて外出した場合などは、例えば、電話回線を介
して外出先から番組予約装置と音声対話を行うことがで
きなかった。
【0005】本発明は上記の課題を解決するためになさ
れたものであり、公衆回線網を介したユーザと番組予約
装置間の音声対話を実現することにより、ユーザが外出
先など遠く離れた場所からでも番組予約実現することが
できる番組予約装置及びその方法、プログラムを提供す
ることを目的とする。
【0006】また、電話回線を介して番組予約装置に送
信される音声は帯域が狭く送信可能な情報量が少ないた
め、音声認識率が低くなる恐れがある。特に、「いち
じ」、「しちじ」のような放送時間やチャンネル番号等
の連続数字認識は非常に困難になることが予想される。
そのため、本発明では音声入力とプッシュトーン信号入
力を併用しており、より効果的な番組予約を実現するこ
とが可能である。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による番組予約装置は以下の構成を備える。
即ち、公衆回線網を介して電話機から入力された音声に
基づいて、番組予約を行う番組予約装置であって、合成
音を作成する音声合成手段と、前記入力された音声を認
識する音声認識手段と、前記音声合成手段と前記音声認
識手段を制御して、番組予約に関する情報を導出する対
話生成手段と、前記対話生成手段の制御によって得られ
る番組予約に関する情報に基づいて、予約対象の電子番
組情報と検索するための検索キーを取得する取得手段
と、前記取得手段で取得された検索キーに基づいて、該
検索キーに該当する電子番組情報を検索する検索手段
と、前記検索手段で検索された電子番組情報に基づい
て、番組予約データを作成する作成手段と、を備える。
【0008】また、好ましくは、前記電話機から出力さ
れるプッシュトーン信号を検出する検出手段とを更に備
える。
【0009】また、好ましくは、前記検出手段は、前記
作成手段の実行の有無を指示することを表すプッシュト
ーン信号を検出する。
【0010】また、好ましくは、前記検出手段は、前記
音声合成手段の再実行を指示することを表すプッシュト
ーン信号を検出する。
【0011】また、好ましくは、前記検出手段は、前記
プッシュトーン信号列を、チャンネル番号あるいは放送
時間として検出する。
【0012】また、好ましくは、前記検出手段は、前記
プッシュトーン信号列を電子番組情報候補に割当られた
認識候補番号として検出する。
【0013】また、好ましくは、前記検出手段は、前記
音声の入力中に動作する。
【0014】また、好ましくは、前記対話生成手段は、
前記音声認識手段の音声認識結果と前記検出手段の検出
結果が異なる場合、該検出手段の検出結果を前記番組予
約に関する情報とする。
【0015】また、好ましくは、前記検出手段は、前記
合成音を出力中に動作する。
【0016】また、好ましくは、それぞれが番組録画装
置を有する複数の番組予約クライアントと接続するネッ
トワークと、前記複数の番組予約クライアントそれぞれ
を特定するためのユーザデータを保持する保持手段と、
前記ユーザデータに基づいて、前記電話機を介して当該
番組予約装置にアクセスを要求するユーザを認証する認
証手段とを更に備える。
【0017】また、好ましくは、前記番組予約データ
を、前記番組予約クライアントへ送信する送信手段とを
更に備える。
【0018】上記の目的を達成するための本発明による
番組予約方法は以下の構成を備える。即ち、公衆回線網
を介して電話機から入力された音声に基づいて、番組予
約を行う番組予約方法であって、合成音を作成する音声
合成工程と、前記入力された音声を認識する音声認識工
程と、前記音声合成工程と前記音声認識工程を制御し
て、番組予約に関する情報を導出する対話生成工程と、
前記対話生成工程の制御によって得られる番組予約に関
する情報に基づいて、予約対象の電子番組情報と検索す
るための検索キーを取得する取得工程と、前記取得工程
で取得された検索キーに基づいて、該検索キーに該当す
る電子番組情報を検索する検索工程と、前記検索工程で
検索された電子番組情報に基づいて、番組予約データを
作成する作成工程と、を備える。
【0019】上記の目的を達成するための本発明による
プログラムは以下の構成を備える。即ち、公衆回線網を
介して電話機から入力された音声に基づいて、番組予約
を行う番組予約をコンピュータに機能させるためのプロ
グラムであって、合成音を作成する音声合成工程のプロ
グラムコードと、前記入力された音声を認識する音声認
識工程のプログラムコードと、前記音声合成工程と前記
音声認識工程を制御して、番組予約に関する情報を導出
する対話生成工程のプログラムコードと、前記対話生成
工程の制御によって得られる番組予約に関する情報に基
づいて、予約対象の電子番組情報と検索するための検索
キーを取得する取得工程のプログラムコードと、前記取
得工程で取得された検索キーに基づいて、該検索キーに
該当する電子番組情報を検索する検索工程のプログラム
コードと、前記検索工程で検索された電子番組情報に基
づいて、番組予約データを作成する作成工程のプログラ
ムコードと、を備える。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。 [実施形態1]図1は本発明の実施形態1の放送番組予約
装置の機能構成図である。
【0021】尚、本発明で説明する放送番組とは、テレ
ビ放送、ラジオ放送、BS/CS放送等の各種放送で提
供される番組である。
【0022】図1において、放送番組予約装置104
(以降、予約装置)は、ユーザと音声を介して対話し、
ユーザが要求する番組を予約するための番組予約データ
116を生成する。この番組予約データ116は、外部
の番組録画装置117(汎用のビデオ録画機やビデオ録
画機能を有するパーソナルコンピュータ/セットトップ
ボックス等)に送信され、この番組予約データ116に
基づいて、番組録画装置117はその番組予約データが
指定する番組の録画を行う。
【0023】予約装置104は、公衆回線網102を介
して電話機101(固定電話あるいは移動電話)と接続
されている。ユーザは、この電話機101を用いて予約
装置104にアクセスすることが可能である。予約装置
104が用いる電子番組情報(EPG:Electronic Pro
gramming Guide)113は、電子番組情報受信部112
により外部ネットワーク103上のサーバ等の外部端末
(不図示)から取得される。電子番組情報113の更新
は、リアルタイムに行われてもよいし、一日一回のよう
な定期的な間隔で行われてもよい。本発明で用いる電子
番組情報の一例については、後述する。
【0024】尚、電話機101は、「0」〜「9」の数
字ボタン、「*」、「#」ボタンを少なくとも有する通
常の電話機が有するボタン群を有している。
【0025】公衆回線網102の一端は、予約装置10
4内の音声入出力部105に接続されている。ここで
は、公衆回線網102を介して音声の入力/出力を行
う。ここで、入力される音声は、声による発声の他に、
プッシュトーン信号のような規格化された音声信号の可
能性もある。
【0026】プッシュトーン検出部106は、電話機1
01が出力するプッシュトーン信号を検出し、電話機1
01のどのプッシュボタンが押されたかを判定する。音
声合成部107は公知である音声合成技術を用い、指定
された漢字かな混じりのテキストデータを音声波形に変
換する処理を行う。音声認識部108は、公知である音
声認識技術を用いて、入力された音声データを解析し、
電子番組情報113から作成された認識文法データと比
較することにより、音声認識結果を出力する。電子番組
情報113を用いた認識語彙の作成に関しては、後述す
る。音声認識結果は、電子番組情報検索キー追加部11
1に送信され、電子番組情報検索キーとして電子番組情
報検索キーバッファ110に格納される。
【0027】対話生成部109では、プッシュトーン検
出部106、音声合成部107、音声認識部108を制
御して、適切な対話処理によってユーザが要求する電子
番組情報を導出するためのUIを提供する。
【0028】例えば、音声認識結果が「8チャンネルの
9時のドラマ番組」の場合、対話生成部109は、現在
格納されている電子番組情報検索キー(例えば、8チャ
ンネル、9時、ドラマ)を用い、電子番組情報検索部1
14に対して電子番組情報検索を依頼する。電子番組情
報検索の結果が一意に決まらなかった場合、対話生成部
109は、他の検索キーをユーザに促すような応答文を
生成する。このような対話を繰り返し、検索結果が全電
子番組情報の中で唯一になった時点で、番組予約データ
生成部115が番組予約データを作成し、対話が終了す
る。
【0029】尚、予約装置104は、パーソナルコンピ
ュータやワークステーション等の汎用コンピュータに搭
載される標準的な構成要素(例えば、CPU、RAM、
ROM、ハードディスク、外部記憶装置、ネットワーク
インタフェース、ディスプレイ、キーボード、マウス
等)で構成されている。また、以下に説明する予約装置
104で実現される各種機能は、予約装置104内部の
ROMや外部記憶装置に記憶されるプログラムがCPU
によって実行されることによって実現されても良いし、
専用のハードウェアで実現されても良い。
【0030】また、番組録画装置117が汎用コンピュ
ータで実現される場合には、予約装置104と同様に、
その汎用コンピュータに搭載される標準的な構成要素
(例えば、CPU、RAM、ROM、ハードディスク、
外部記憶装置、ネットワークインタフェース、ディスプ
レイ、キーボード、マウス等)で構成されている。
【0031】次に、電子番組情報113について、図2
を用いて説明する。
【0032】図2は本発明の実施形態1の電子番組情報
の例を示す図である。
【0033】尚、図2で示す電子番組情報201a、2
01bは、音声認識に特化した独自の形式である。
【0034】ここでは、電子番組番組情報201aに対
して説明する。電子番組番組情報201aは、「番組
名」、「チャンネル番号」、「ジャンル」、「放送時
間」、「出演者」からなるスロット名202と、それに
対応するスロット値203を有している。尚、「出演
者」スロットは、複数あってもよいし、全くなくてもよ
い。各スロットのスロット値には、表記204と読み2
05が管理されており、この読み205と入力音声を比
較することにより音声認識を行う。
【0035】また、番組名、出演者等は「ポケットモン
スター」が「ポケモン」というように、省略形や別名等
で発声されることがある。これを吸収するために、スロ
ット値の表記204に対する読み205は複数持つこと
ができ、その表記205の中で想定される発声に対する
読み205が構成されている。省略形や別名等は時代の
流行の影響を受けて新しく生成されることがあるため、
電子番組情報113の中に含めることが望ましい。
【0036】次に、音声認識部108が使用する電子番
組情報を取り入れた認識文法データについて、図3を用
いて説明する。
【0037】図3は本発明の実施形態1の電子番組情報
を取り入れた認識文法データの例を示す図である。
【0038】一般的な音声認識処理では、入力された音
声と認識文法上の音素系列(テンプレート)を比較し、
最も尤度が高いものを認識結果とする。本発明では、こ
のようなテンプレートに、電子番組情報113の語彙を
埋め込んだものを認識文法データとしている。また、こ
の認識文法データは、音声認識部108内部で管理され
ても良いし、別に管理されていても良い。
【0039】図3(a)の例では、番組名を受理するテ
ンプレートであり、「番組名」と書かれたボックスに
は、電子番組情報113の番組名のスロット値の読みが
入力される。図2の例の電子番組情報201a、201
bの場合は、番組名のスロット値として、「ワラッテイ
イトモ」、「イイトモ」、「ボケットモンスター」、
「ポケモン」が入る。
【0040】ここで、GBと書かれたボックスはGarbag
eモデルと呼ばれ、音声中の不要語(ユーザの呼吸音、
咳、「えー」、「あのー」、「お願いします」等)を吸
収する機能である。このGBボックスは、スキップする
こともできるようになっている。このように、ユーザの
発声を想定したテンプレートを多数用意し、それらを認
識文法とすることで、ユーザにとっては自然な発声によ
り情報を入力することが可能となる。
【0041】尚、図3(b)〜図3(d)は、それぞれ
出演者・ジャンルを受理するテンプレート、チャンネル
番号・ジャンルを受理するテンプレート、放送時間・ジ
ャンルを受理するテンプレートであり、その動作につい
ては、図3(a)の説明に準ずる。
【0042】次に、予約装置104の動作について、図
4を用いて説明する。
【0043】図4は本発明の実施形態1の予約装置の動
作フローを示すフローチャートである。
【0044】尚、予約装置104は、不定期にアクセス
されるユーザ入力を処理するサーバとして動作するた
め、開始(スイッチを入れる)すると常に動作し続け
る。また、図4中のステップで作成される合成音は、音
声合成部107で作成され、その合成音は音声入出力部
105よりユーザに通知する。
【0045】まず、スイッチを入れると、ユーザからの
電話待ち状態に入る(ステップS401)。ユーザから
の電話機101が予約装置104にかかると、ユーザと
の回線を接続する(ステップS402)。その後、例え
ば、「こちらは録画予約システムです」という合成音を
作成し、それをユーザに通知する(ステップS40
3)。そして、予約処理ルーチンに入る(ステップS4
04)。この予約処理ルーチンは、対話生成部109に
よって実現される対話処理により、ユーザが要求する番
組情報を決定する処理であり、その詳細については後述
する。
【0046】ユーザとの対話が終了し、予約対象の番組
が決定すると、例えば、「ご利用ありがとうございまし
た」という合成音を作成して、それをユーザに通知する
(ステップS405)。次に、実際に予約する番組予約
データ116を作成する(ステップS406)。これら
の一連の処理が終わると、予約装置104はユーザとの
回線を切断し(ステップS407)、次のユーザ入力に
備えて待機する。
【0047】尚、予約装置104は、公衆回線網102
を通してユーザからアクセスを受け付けるため、処理中
にもユーザ側から回線が切断される可能性がある。この
ような場合、予約装置104は処理を中断し、ユーザ待
ち状態に戻る。また、図4中のステップ内の”「 」”
内の文字列は、予約装置104が作成する合成音による
通知内容を示している。
【0048】次に、ステップS404の予約処理ルーチ
ンの詳細について、図5を用いて説明する。
【0049】図5は本発明の実施形態1の予約処理ルー
チンの詳細を示すフローチャートである。
【0050】尚、この予約処理ルーチンは、ユーザとの
回線接続が確立された後に行う処理である。また、図5
中のステップで作成される合成音は、音声合成部107
で作成され、その合成音(図中の”「 」”内に示され
る文字列)は音声入出力部105よりユーザに通知す
る。
【0051】まず、本処理が始まると、電子番組情報検
索キーバッファ110をクリアする(ステップS50
1)。電子番組情報検索キーバッファ110は、図6に
示すように、認識結果の読みとその認識結果の(電子番
組情報113上での)スロット名が対応づけられたデー
タから構成されている。図6では、チャンネル番号の読
み「テレトー」とそのスロット名「チャンネル番号」、
ジャンルの読み「アニメ」とそのスロット名「ジャン
ル」が対応づけられたデータが格納されていることを示
している。
【0052】電子番組情報検索キーバッファ110がク
リアされると、例えば、「録画する番組情報を発声して
下さい」という合成音を作成して、それをユーザに通知
する(ステップS502)。次に、音声認識部108に
て、ユーザが入力する音声の音声認識処理を開始する
(ステップS503)。ここでは、例えば、ユーザが
「えーっと、テレ東のアニメをよろしく」と発声したと
仮定する。音声認識処理により、このユーザが入力する
音声は、チャンネル番号・ジャンルを受理するテンプレ
ートを有する認識文法データにマッチし、「チャンネ
ル」=「テレトー」、「ジャンル」=「アニメ」が取得
され、図6に示すように、この2つの対が電子番組情報
検索キーバッファ110に追加される。
【0053】次に、電子番組情報検索部114にて、現
在の電子番組情報検索キーバッファ110の内容全てを
含む電子番組情報を、電子番組情報113から検索する
(ステップS504)。次に、検索後に検索された電子
番組情報候補数に基づいて、各処理を実行する。
【0054】まず、検索された電子番組情報候補数が0
である場合、例えば、「該当する番組は見つかりません
でした」という合成音を作成して、それをユーザに通知
する(ステップS508)。そして、ステップS501
に戻り、予約処理を再度実行する。
【0055】また、検索された電子番組情報候補数が1
である場合、例えば、「〜でよろしいでしょうか」
(「〜」は、その番組名)という合成音を作成して、そ
れをユーザに通知する(ステップS509)。次に、音
声認識部108にて、ユーザが入力する音声の音声認識
処理を行って、音声認識結果によってその通知に対する
確認を行う(ステップS510)。
【0056】ここで、音声認識結果が「いいえ」の場合
(ステップS511でNO)、ステップS501に戻
り、予約処理を再度実行する。一方、音声認識結果が
「はい」の場合(ステップS511でYES)、予約処
理を終了する。
【0057】また、検索された電子番組情報候補数がN
(N=5前後が適当である)以上である場合、例えば、
「該当する番組はN個見つかりました」(「N」=検索
された電子情報番組候補数)という合成音を作成して、
それをユーザに通知する(ステップS506)。続い
て、例えば、「さらに絞り込む情報を発声して下さい」
という合成音を作成して、それをユーザに通知し(ステ
ップS512)、ステップS503に戻る。
【0058】また、検索された電子番組情報候補数が1
以上N未満である場合、その番組名を通知するための合
成音を作成して、それをユーザに通知する(ステップS
507)。例えば、「該当番組は、テレビ朝日22時放
送のニュースステーションと、フジテレビ21時放送の
ニュースの森の二つです。」と通知する。その後、ステ
ップS512を経て、ステップS503に戻る。
【0059】尚、図4や図5における予約装置104の
音声合成部107がユーザに通知するために生成する合
成文は一例であり、図4や図5で説明する予約装置10
4とユーザ間での処理が成立する(つまり、番組予約に
関する情報の入力を促す)ような合成文であれば、どの
ようなものでも構わない。
【0060】また、図4や図5における音声認識の語彙
セットも一例であり、ステップS510において、認識
対象音声である「はい」/「いいえ」を「YES」/
「NO」に置き換えたり、「はい」/「いいえ」に対応
する英語以外の言語(例えば、フランス語(「Oui」
/「Non」))に置き換えることも可能である。この
ようにすることで、日本人以外のユーザにも本発明を適
用することができる。
【0061】更に、図4及び図5の処理の具体的な対話
例を示すと、図7(a)のようになる。
【0062】以上説明したように、実施形態1によれ
ば、公衆電話網102を介して接続されたユーザと予約
装置104間で音声対話を実現することにより、ユーザ
は、自身が所有する番組録画装置117から遠く離れた
場所からでも番組予約を行うことが可能となる。 [実施形態2]実施形態1の図5の処理において、ユーザ
と予約装置104との対話の実現を、音声認識処理のか
わりに、電話機101の各種ボタンによって出力される
プッシュトーン信号を補助的に用いることも可能であ
る。例えば、予約処理ルーチンを初めからやり直す機能
を、例えば、電話機101の「*」ボタンに割り当てて
おくと、ユーザはいつでも処理を初めからやり直すこと
ができるようになる。
【0063】尚、プッシュトーン信号の検出は、上述し
たプッシュトーン検出部106によって実現される。
【0064】また、図5のステップS503において、
ユーザから入力される電子番組情報を予約するための音
声を音声認識する場合に、「○○#」という一連のプッ
シュトーン信号の入力を、チャンネル数あるいは放送時
間とすることを定めておくことも可能である。音声によ
る連続数字の認識は、他のタスクに比べて比較的に難し
い処理であるため、音声認識の代わりにプッシュトーン
信号で入力できるようにすることは、ユーザから見ても
メリットは大きい。
【0065】また、「はい」/「いいえ」のかわりに、
例えば、電話機101の「7」/「9」のボタンを割り
振ることも有効である。これらのプッシュトーン信号
を、予約装置104による合成音の通知中(ステップS
509)にも検出できるようにしておくと、通知をスキ
ップすることができ、慣れたユーザは短い時間で予約処
理を終わらせることが可能となる。
【0066】また、ステップS507において、予約装
置104が予約候補番組の番組名を通知する場合に、
「該当する番組は、1.ポケットモンスター、2.ドラ
エモン、3.ノラクロの3つです。」のように各番組に
認識候補番号を付けたタイトルを通知し、ユーザが希望
の番組の数字を対応する電話機101の数字ボタンで入
力することも可能である。
【0067】また、音声では「はい」と発声し、同時に
「いいえ」を表すプッシュトーン信号の「9」が押され
ることが多々ある。このように、音声入力とプッシュト
ーン入力が同時になされた場合、プッシュトーン信号の
入力を優先し、こちらを入力として受け付けることも可
能である。これは、プッシュトーン信号の検出が音声認
識よりも信頼性が高いからである。
【0068】以上のような構成における、図4及び図5
の対話例を示すと、図7(b)のようになる。
【0069】以上説明したように、実施形態2によれ
ば、実施形態1の構成に加えて、電話機101が出力す
るプッシュトーン信号の検出も行えるため、音声よりも
プッシュトーン信号で入力したほうが正確な情報(放送
時間、チャンネル番号、はい/いいえ等)を入力できる
場合には、プッシュトーン信号による入力を採用するこ
とができるので、対話の状況に併せてより精度の高い情
報入力を実現することができる。 [実施形態3]実施形態1の図5のステップS502で、
予約装置104は、例えば、「録画する番組情報を発声
して下さい」という合成音をユーザに通知しているが、
一回目以降に検索キーを決定するための音声入力を促す
場合、この通知を変更して、現在の電子番組情報検索キ
ーバッファ110に格納されていないスロット名を質問
することも可能である。
【0070】例えば、一度目のユーザの発声で「テレ東
のアニメ」と入力された場合、電子番組情報検索キーバ
ッファ110は図6に示すような状況になる。そこで、
予約装置104は、現時点で電子番組情報検索キーバッ
ファ110に格納されていないスロット名のスロット値
の入力を促すために、「放送時間を発声して下さい」の
ような通知を行うことができる。また、認識文法のテン
プレートも放送時間を含んだものだけを用いるようにす
ることで、認識語彙が削減でき、認識率の向上も見込ま
れる。
【0071】更に、現在の電子番組情報検索キーバッフ
ァ110内の検索キーに該当している電子番組情報も、
上記通知に取り入れることで、ユーザの入力のガイドと
なる。
【0072】例えば、上記の例では、「12チャンネル
のアニメに該当する番組は12時、13時、19時、2
2時にあります。放送時間を発声して下さい」のような
通知に変更することが可能である。さらに、音声認識の
語彙をこの4つ(「12時」、「13時」、「19
時」、「22時」)に限定すれば、音声認識の成功率も
向上する。
【0073】以上のような構成における、図4及び図5
の対話例を示すと、図7(c)のようになる。
【0074】以上説明したように、実施形態3によれ
ば、電子番組情報検索キーバッファ110内の検索キー
に基づいて、ユーザに通知する通知内容を適宜変更する
ことで、より効率的な対話を実現でき、かつ音声認識の
成功率を向上することができる。 [実施形態4]予約装置104は、番組録画装置117と
物理的に離れていてもよく、さらに複数の番組録画装置
117と接続されて構成してもよい。
【0075】図8は、予約装置104を有する番組予約
サーバ803を構成し、それぞれが番組録画装置を有す
る複数の番組予約クライアント群810に番組の録画予
約を行う番組予約システムの構成例である。
【0076】番組予約サーバ803は、インターネット
や公衆回線網のような外部ネットワーク809を介して
複数の番組予約クライアント群810と接続されてい
る。番組予約サーバ803は、例えば、番組予約サービ
ス会社によって運営/管理され、番組予約クライアント
群810は、この番組予約サーバ803を利用するユー
ザの自宅で所有されていると想定することができる。
【0077】番組予約装置804は、実施形態1の番組
予約装置104に対応し、実施形態1で説明したよう
に、電話機801を介してユーザとの対話実現する。
【0078】番組予約サーバ803には、接続されたユ
ーザが正規のユーザか否かを判定するユーザ認証部80
5を備えている。ユーザ認証部805では、契約された
ユーザのみが番組予約サーバ803を利用できるように
するための認証処理を行う。番組予約サーバ803は、
図9に示すような、この認証処理のためのユーザID、
暗証番号、IPアドレスからなるユーザデータ807を
管理している。これらのユーザデータ807は、ユーザ
が番組予約サーバ803を利用するための契約を行った
時点で、番組予約サーバ803が作成する。
【0079】番組予約サーバ803に番組予約クライア
ント810がアクセスすると、「ユーザIDをプッシュ
ボタンで入力して下さい」、「暗証番号をプッシュボタ
ンで入力してください」等の合成音を作成して、ユーザ
に通知し、これら2つのデータの入力を促す。入力され
た2つのデータが、ユーザデータ807と一致した場合
のみ、番組予約装置804での予約処理ルーチンを実行
する。このユーザデータ807は、ユーザデータ更新部
808から更新することができる。
【0080】番組予約データ送信部806は、番組予約
データをユーザデータ中のIPアドレスに対応する番組
予約クライアント810に送信する。これにより、ユー
ザは、家庭の番組予約クライアント810のIPアドレ
スを前もってユーザデータ807に登録しておくことに
より、番組予約データ811を自分の家庭の番組予約ク
ライアント810に送信することが可能となる。
【0081】尚、番組予約サーバ803は、パーソナル
コンピュータやワークステーション等の汎用コンピュー
タに搭載される標準的な構成要素(例えば、CPU、R
AM、ROM、ハードディスク、外部記憶装置、ネット
ワークインタフェース、ディスプレイ、キーボード、マ
ウス等)で構成されている。また、上述の番組予約サー
バ803で実現される各種機能は、番組予約サーバ80
3内部のROMや外部記憶装置に記憶されるプログラム
がCPUによって実行されることによって実現されても
良いし、専用のハードウェアで実現されても良い。
【0082】また、番組予約クライアント群810が汎
用コンピュータで実現される場合には、番組予約サーバ
803と同様に、汎用コンピュータに搭載される標準的
な構成要素(例えば、CPU、RAM、ROM、ハード
ディスク、外部記憶装置、ネットワークインタフェー
ス、ディスプレイ、キーボード、マウス等)で構成され
ている。
【0083】以上説明したように、実施形態4によれ
ば、番組予約サーバ803を構築することで、外部ネッ
トワーク809上に接続される複数の番組予約クライア
ントそれぞれに対する番組予約を一元管理することがで
きる。
【0084】尚、本発明は、前述した実施形態の機能を
実現するソフトウェアのプログラム(実施形態では図に
示すフローチャートに対応したプログラム)を、システ
ム或いは装置に直接或いは遠隔から供給し、そのシステ
ム或いは装置のコンピュータが該供給されたプログラム
コードを読み出して実行することによっても達成される
場合を含む。その場合、プログラムの機能を有していれ
ば、形態は、プログラムである必要はない。
【0085】従って、本発明の機能処理をコンピュータ
で実現するために、該コンピュータにインストールされ
るプログラムコード自体も本発明を実現するものであ
る。つまり、本発明は、本発明の機能処理を実現するた
めのコンピュータプログラム自体も含まれる。
【0086】その場合、プログラムの機能を有していれ
ば、オブジェクトコード、インタプリタにより実行され
るプログラム、OSに供給するスクリプトデータ等、プ
ログラムの形態を問わない。
【0087】プログラムを供給するための記録媒体とし
ては、例えば、フロッピー(登録商標)ディスク、ハー
ドディスク、光ディスク、光磁気ディスク、MO、CD
−ROM、CD−R、CD−RW、磁気テープ、不揮発
性のメモリカード、ROM、DVD(DVD−ROM,
DVD−R)などがある。
【0088】その他、プログラムの供給方法としては、
クライアントコンピュータのブラウザを用いてインター
ネットのホームページに接続し、該ホームページから本
発明のコンピュータプログラムそのもの、もしくは圧縮
され自動インストール機能を含むファイルをハードディ
スク等の記録媒体にダウンロードすることによっても供
給できる。また、本発明のプログラムを構成するプログ
ラムコードを複数のファイルに分割し、それぞれのファ
イルを異なるホームページからダウンロードすることに
よっても実現可能である。つまり、本発明の機能処理を
コンピュータで実現するためのプログラムファイルを複
数のユーザに対してダウンロードさせるWWWサーバ
も、本発明に含まれるものである。
【0089】また、本発明のプログラムを暗号化してC
D−ROM等の記憶媒体に格納してユーザに配布し、所
定の条件をクリアしたユーザに対し、インターネットを
介してホームページから暗号化を解く鍵情報をダウンロ
ードさせ、その鍵情報を使用することにより暗号化され
たプログラムを実行してコンピュータにインストールさ
せて実現することも可能である。
【0090】また、コンピュータが、読み出したプログ
ラムを実行することによって、前述した実施形態の機能
が実現される他、そのプログラムの指示に基づき、コン
ピュータ上で稼動しているOSなどが、実際の処理の一
部または全部を行ない、その処理によっても前述した実
施形態の機能が実現され得る。
【0091】さらに、記録媒体から読み出されたプログ
ラムが、コンピュータに挿入された機能拡張ボードやコ
ンピュータに接続された機能拡張ユニットに備わるメモ
リに書き込まれた後、そのプログラムの指示に基づき、
その機能拡張ボードや機能拡張ユニットに備わるCPU
などが実際の処理の一部または全部を行ない、その処理
によっても前述した実施形態の機能が実現される。
【0092】
【発明の効果】以上説明したように、本発明によれば、
公衆回線網を介したユーザと番組予約装置間の音声対話
を実現することにより、ユーザが外出先など遠く離れた
場所からでも番組予約を行うことが可能となり、かつ効
率的な番組予約を実現することができる番組予約装置及
びその方法、プログラムを提供できる。
【図面の簡単な説明】
【図1】本発明の実施形態1の放送番組予約装置の機能
構成図である。
【図2】本発明の実施形態1の電子番組情報の例を示す
図である。
【図3】本発明の実施形態1の電子番組情報を取り入れ
た認識文法データの例を示す図である。
【図4】本発明の実施形態1の予約装置の動作フローを
示すフローチャートである。
【図5】本発明の実施形態1の予約処理ルーチンの詳細
を示すフローチャートである。
【図6】本発明の実施形態1の検索キーバッファのデー
タ構成例を示す図である。
【図7】本発明の各実施形態のユーザと予約装置間との
対話例を示す図である。
【図8】本発明の実施形態4の番組予約システムの機能
構成図である。
【図9】本発明の実施形態4のユーザデータの例を示す
図である。
【符号の説明】
101 電話機 102 公衆回線網 103 外部ネットワーク 104 放送番組予約装置 105 音声入出力部 106 プッシュトーン検出部 107 音声合成部 108 音声認識部 109 対話生成部 110 電子番組情報検索部キーバッファ 111 電子番組情報検索キー追加部 112 電子番組情報受信部 113 電子番組情報 114 電子番組情報検索部 115 番組予約データ作成部 116 番組予約データ 117 番組録画装置 801 電話機 802 公衆回線網 803 番組予約サーバ 804 番組予約装置 805 ユーザ認証部 806 番組予約データ送信部 807 ユーザデータ 808 ユーザデータ交信部 809 外部ネットワーク 810 番組予約クライアント 811 番組予約クライアント 812 番組録画装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/20 G10L 3/00 551A 15/28 551G H04N 5/44 571H 7/025 531Q 7/03 R 7/035 (72)発明者 山▲崎▼ 信一 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 Fターム(参考) 5C025 BA30 CA02 CB08 DA01 DA05 DA10 5C052 AB03 DD06 DD10 EE02 EE03 5C063 AA01 AB05 AB09 AC01 AC05 AC10 DA03 DA07 DA13 EB32 EB33 5D015 AA05 KK02 KK04 LL06 5D045 AB26

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 公衆回線網を介して電話機から入力され
    た音声に基づいて、番組予約を行う番組予約装置であっ
    て、 合成音を作成する音声合成手段と、 前記入力された音声を認識する音声認識手段と、 前記音声合成手段と前記音声認識手段を制御して、番組
    予約に関する情報を導出する対話生成手段と、 前記対話生成手段の制御によって得られる番組予約に関
    する情報に基づいて、予約対象の電子番組情報と検索す
    るための検索キーを取得する取得手段と、 前記取得手段で取得された検索キーに基づいて、該検索
    キーに該当する電子番組情報を検索する検索手段と、 前記検索手段で検索された電子番組情報に基づいて、番
    組予約データを作成する作成手段と、 を備えることを特徴とする番組予約装置。
  2. 【請求項2】 前記電話機から出力されるプッシュトー
    ン信号を検出する検出手段と を更に備えることを特徴とする請求項1に記載の番組予
    約装置。
  3. 【請求項3】 前記検出手段は、前記作成手段の実行の
    有無を指示することを表すプッシュトーン信号を検出す
    ることを特徴とする請求項2に記載の番組予約装置。
  4. 【請求項4】 前記検出手段は、前記音声合成手段の再
    実行を指示することを表すプッシュトーン信号を検出す
    ることを特徴とする請求項2に記載の番組予約装置。
  5. 【請求項5】 前記検出手段は、前記プッシュトーン信
    号列を、チャンネル番号あるいは放送時間として検出す
    ることを特徴とする請求項2に記載の番組予約装置。
  6. 【請求項6】 前記検出手段は、前記プッシュトーン信
    号列を電子番組情報候補に割当られた認識候補番号とし
    て検出することを特徴とする請求項2に記載の番組予約
    装置。
  7. 【請求項7】 前記検出手段は、前記音声の入力中に動
    作することを特徴とする請求項2に記載の番組予約装
    置。
  8. 【請求項8】 前記対話生成手段は、前記音声認識手段
    の音声認識結果と前記検出手段の検出結果が異なる場
    合、該検出手段の検出結果を前記番組予約に関する情報
    とすることを特徴とする請求項2に記載の番組予約装
    置。
  9. 【請求項9】 前記検出手段は、前記合成音を出力中に
    動作することを特徴とする請求項2に記載の番組予約装
    置。
  10. 【請求項10】 それぞれが番組録画装置を有する複数
    の番組予約クライアントと接続するネットワークと、 前記複数の番組予約クライアントそれぞれを特定するた
    めのユーザデータを保持する保持手段と、 前記ユーザデータに基づいて、前記電話機を介して当該
    番組予約装置にアクセスを要求するユーザを認証する認
    証手段とを更に備えることを特徴とする請求項1に記載
    の番組予約装置。
  11. 【請求項11】 前記番組予約データを、前記番組予約
    クライアントへ送信する送信手段とを更に備えることを
    特徴とする請求項10に記載の番組予約装置。
  12. 【請求項12】 公衆回線網を介して電話機から入力さ
    れた音声に基づいて、番組予約を行う番組予約方法であ
    って、 合成音を作成する音声合成工程と、 前記入力された音声を認識する音声認識工程と、 前記音声合成工程と前記音声認識工程を制御して、番組
    予約に関する情報を導出する対話生成工程と、 前記対話生成工程の制御によって得られる番組予約に関
    する情報に基づいて、予約対象の電子番組情報と検索す
    るための検索キーを取得する取得工程と、 前記取得工程で取得された検索キーに基づいて、該検索
    キーに該当する電子番組情報を検索する検索工程と、 前記検索工程で検索された電子番組情報に基づいて、番
    組予約データを作成する作成工程と、 を備えることを特徴とする番組予約方法。
  13. 【請求項13】 前記電話機から出力されるプッシュト
    ーン信号を検出する検出工程とを更に備えることを特徴
    とする請求項12に記載の番組予約方法。
  14. 【請求項14】 前記検出工程は、前記作成工程の実行
    の有無を指示することを表すプッシュトーン信号を検出
    することを特徴とする請求項13に記載の番組予約方
    法。
  15. 【請求項15】 前記検出工程は、前記音声合成工程の
    再実行を指示することを表すプッシュトーン信号を検出
    することを特徴とする請求項13に記載の番組予約方
    法。
  16. 【請求項16】 前記検出工程は、前記プッシュトーン
    信号列を、チャンネル番号あるいは放送時間として検出
    することを特徴とする請求項13に記載の番組予約方
    法。
  17. 【請求項17】 前記検出工程は、前記プッシュトーン
    信号列を電子番組情報候補に割当られた認識候補番号と
    して検出することを特徴とする請求項13に記載の番組
    予約方法。
  18. 【請求項18】 前記検出工程は、前記音声の入力中に
    動作することを特徴とする請求項13に記載の番組予約
    方法。
  19. 【請求項19】 前記対話生成工程は、前記音声認識手
    段の音声認識結果と前記検出手段の検出結果が異なる場
    合、該検出手段の検出結果を前記番組予約に関する情報
    とすることを特徴とする請求項13に記載の番組予約方
    法。
  20. 【請求項20】 前記検出工程は、前記合成音を出力中
    に動作することを特徴とする請求項13に記載の番組予
    約方法。
  21. 【請求項21】 ネットワークを介して接続されるそれ
    ぞれが番組録画装置を有する複数の番組予約クライアン
    トそれぞれを特定するためのユーザデータを保持する保
    持工程と、 前記ユーザデータに基づいて、前記電話機を介して当該
    番組予約装置にアクセスを要求するユーザを認証する認
    証工程とを更に備えることを特徴とする請求項12に記
    載の番組予約方法。
  22. 【請求項22】 前記番組予約データを、前記番組予約
    クライアントへ送信する送信工程とを更に備えることを
    特徴とする請求項21に記載の番組予約方法。
  23. 【請求項23】 公衆回線網を介して電話機から入力さ
    れた音声に基づいて、番組予約を行う番組予約をコンピ
    ュータに機能させるためのプログラムであって、 合成音を作成する音声合成工程のプログラムコードと、 前記入力された音声を認識する音声認識工程のプログラ
    ムコードと、 前記音声合成工程と前記音声認識工程を制御して、番組
    予約に関する情報を導出する対話生成工程のプログラム
    コードと、 前記対話生成工程の制御によって得られる番組予約に関
    する情報に基づいて、予約対象の電子番組情報と検索す
    るための検索キーを取得する取得工程のプログラムコー
    ドと、 前記取得工程で取得された検索キーに基づいて、該検索
    キーに該当する電子番組情報を検索する検索工程のプロ
    グラムコードと、 前記検索工程で検索された電子番組情報に基づいて、番
    組予約データを作成する作成工程のプログラムコード
    と、 を備えることを特徴とするプログラム。
JP2002014637A 2002-01-23 2002-01-23 番組予約装置及びその方法、プログラム Withdrawn JP2003219332A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002014637A JP2003219332A (ja) 2002-01-23 2002-01-23 番組予約装置及びその方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002014637A JP2003219332A (ja) 2002-01-23 2002-01-23 番組予約装置及びその方法、プログラム

Publications (1)

Publication Number Publication Date
JP2003219332A true JP2003219332A (ja) 2003-07-31

Family

ID=27651259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002014637A Withdrawn JP2003219332A (ja) 2002-01-23 2002-01-23 番組予約装置及びその方法、プログラム

Country Status (1)

Country Link
JP (1) JP2003219332A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157894A (ja) * 2003-11-27 2005-06-16 Sony Corp 情報処理装置、利用環境提供方法及び利用環境提供プログラム
JP2006189799A (ja) * 2004-12-31 2006-07-20 Taida Electronic Ind Co Ltd 選択可能な音声パターンの音声入力方法及び装置
JP2007251711A (ja) * 2006-03-17 2007-09-27 Mitsubishi Electric Corp テレビジョン受像機
CN108766429A (zh) * 2018-06-05 2018-11-06 北京百度网讯科技有限公司 语音交互方法和装置
JP6462936B1 (ja) * 2018-06-18 2019-01-30 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置
CN112567757A (zh) * 2019-07-31 2021-03-26 海信视像科技股份有限公司 具备通知功能的电子装置及电子装置的控制方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157894A (ja) * 2003-11-27 2005-06-16 Sony Corp 情報処理装置、利用環境提供方法及び利用環境提供プログラム
JP2006189799A (ja) * 2004-12-31 2006-07-20 Taida Electronic Ind Co Ltd 選択可能な音声パターンの音声入力方法及び装置
JP2007251711A (ja) * 2006-03-17 2007-09-27 Mitsubishi Electric Corp テレビジョン受像機
JP4657127B2 (ja) * 2006-03-17 2011-03-23 三菱電機株式会社 テレビジョン受像機
US7982806B2 (en) 2006-03-17 2011-07-19 Mitsubishi Electric Corporation Broadcast receiver
CN108766429A (zh) * 2018-06-05 2018-11-06 北京百度网讯科技有限公司 语音交互方法和装置
CN108766429B (zh) * 2018-06-05 2020-08-21 北京百度网讯科技有限公司 语音交互方法和装置
JP6462936B1 (ja) * 2018-06-18 2019-01-30 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置
CN112567757A (zh) * 2019-07-31 2021-03-26 海信视像科技股份有限公司 具备通知功能的电子装置及电子装置的控制方法
CN112567757B (zh) * 2019-07-31 2024-04-02 海信视像科技股份有限公司 具备通知功能的电子装置及电子装置的控制方法
US12035006B2 (en) 2019-07-31 2024-07-09 Hisense Visual Technology Co., Ltd. Electronic apparatus having notification function, and control method for electronic apparatus

Similar Documents

Publication Publication Date Title
US6553345B1 (en) Universal remote control allowing natural language modality for television and multimedia searches and requests
US7519534B2 (en) Speech controlled access to content on a presentation medium
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
US8635073B2 (en) Wireless multimodal voice browser for wireline-based IPTV services
CN108063969B (zh) 显示设备、控制显示设备的方法、服务器以及控制服务器的方法
US6314398B1 (en) Apparatus and method using speech understanding for automatic channel selection in interactive television
US11966442B2 (en) Recommending language models for search queries based on user profile
KR20050023941A (ko) 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
CN1389852A (zh) 使用语音识别和自然语言对家居活动的自动控制
US11620340B2 (en) Recommending results in multiple languages for search queries based on user profile
US20080124046A1 (en) Video recording/playing apparatus
EP1333425A2 (en) Interface apparatus and task control method for a device using recognition technology
JP7488192B2 (ja) 受信装置および制御方法
US20100064322A1 (en) Apparatus, method, and program for information processing and recording medium for the same
KR20240084531A (ko) 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
JP2003219332A (ja) 番組予約装置及びその方法、プログラム
KR20200008341A (ko) 화면을 제어하는 미디어 재생 장치, 방법 및 화면을 분석하는 서버
CN112567757A (zh) 具备通知功能的电子装置及电子装置的控制方法
KR102307330B1 (ko) 수신 장치 및 수신 방법
JP2019071061A (ja) 映像表示装置
JP2002252813A (ja) 番組検索装置及び番組検索プログラム
EP3625794B1 (en) Recommending results in multiple languages for search queries based on user profile
JP2007199480A (ja) プログラム及びサーバ
JP2021182068A (ja) 映像表示装置
CN112236816A (zh) 信息处理装置、信息处理***以及影像装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405