JP4175141B2 - Program information display device having voice recognition function - Google Patents
Program information display device having voice recognition function Download PDFInfo
- Publication number
- JP4175141B2 JP4175141B2 JP2003048915A JP2003048915A JP4175141B2 JP 4175141 B2 JP4175141 B2 JP 4175141B2 JP 2003048915 A JP2003048915 A JP 2003048915A JP 2003048915 A JP2003048915 A JP 2003048915A JP 4175141 B2 JP4175141 B2 JP 4175141B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- display
- character string
- information
- program information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、テレビ受信機、テレビ受信機用リモコン送信機およびテレビ受信機システムに関し、具体的には、ユーザが音声により番組の検索を行うことができるシステムに関する。
【0002】
【従来の技術】
従来の技術としては、音声認識によってテレビの操作を行うことが可能な音声理解システムが公開されている(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開2000−250575号公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の音声認識機能を有するテレビ受信機等は、ユーザがテレビ受信機等を制御するために発声したコマンド音声を音声認識し、認識結果である認識結果文字列に指示代名詞や連体詞が含まれる場合の処理を行っていなかった。このため、ユーザは、指示代名詞や連体詞を含んだコマンドを発声しテレビ受信機の操作や番組情報を検索、表示することができなかった。
【0005】
本発明は、このような従来の問題点に鑑みてなされたものであって、その目的は、テレビ受信機に表示している番組や番組検索結果に含まれる番組の番組情報を予め取得しておき、指示代名詞や連体詞が音声認識された場合、予め取得しておいた番組情報を参照することにより、ユーザが指示代名詞や連体詞を含んだ自然な話し言葉で番組情報を検索し、表示できる音声認識機能を有する番組情報表示装置を提供することである。
【0006】
【課題を解決するための手段】
本発明の請求項1の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または前記番組の番組情報画面を表示する表示手段と、表示している番組の入力元や放送局、現在時刻等の機器の状態を記憶する機器情報記憶手段と、前記機器情報記憶手段に記憶されている機器の状態を用いて、前記表示手段で視聴または再生している番組の番組情報を前記番組データベースから取得し記憶する表示番組情報取得手段と、前記番組や前記番組の番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、前記表示番組情報取得手段に記憶されている番組情報を読み出し前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0007】
本発明の請求項2の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記表示情報記憶手段から番組情報を読み出す表示情報取得手段と、前記表示情報取得手段により読み出された番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0008】
本発明の請求項3の発明は、請求項2に記載の音声認識機能を有する番組情報表示装置において、番組検索手段により取得された番組情報は、複数の番組の番組情報であることを特徴とするものである。
【0009】
本発明の請求項4の発明は、請求項3記載の音声認識機能を有する番組情報表示装置において、表示情報取得手段は、指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、表示情報記憶手段から複数番組の情報を読み込んだ場合には、番組検索結果を表示できない旨の警告画面情報または、警告音声を生成して、表示手段に表示させることを特徴とする。
【0010】
本発明の請求項5の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、番組情報が入力されると、入力された番組情報を表示画面情報に変換して記憶し、前記表示画面情報を前記表示手段に出力する表示画面作成手段と、前記表示手段に複数の番組情報が表示されている場合、話者が前記複数の番組情報から選択した番組情報の前記表示手段における表示位置を入力する入力手段と、前記表示画面作成手段に記憶されている表示画面情報を読み出し、前記入力手段から入力された位置情報に対応する番組情報を前記表示画面情報から特定し、特定した番組情報の番組に関する番組情報を前記表示情報記憶手段から取得し記憶する選択番組情報検出手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記選択番組情報検出手段から番組情報を読み出して前記表示記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0011】
上記の手段では、表示手段に表示されている番組の番組情報を表示番組情報取得手段により予め取得しておき、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出され、表示手段に番組検索画面が表示されていない場合、予め取得しておいた番組情報を表示することにより、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示手段に表示されている番組の番組情報を表示することができる。
【0012】
また、番組検索手段により一番組に関する番組情報が検索された場合、表示情報取得手段により検索された番組情報を表示情報記憶手段に記憶しておき、検索された番組情報が表示手段に表示されている場合、次に、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出された場合、予め表示情報記憶手段に記憶しておいた番組情報を表示することにより、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組情報と異なる他の番組情報を表示することができる。
【0013】
また、表示手段に複数番組の番組情報が表示され、表示されている複数番組の番組情報を表示情報記憶手段に記憶しておき、次に、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出された場合、予め表示情報記憶手段に記憶しておいた複数番組の番組情報を読み込み、複数番組の番組情報が表示手段に表示されていることを表示情報取得手段が検知することにより、指示代名詞や連体詞が指し示す番組を特定できないため番組情報を表示することができない旨を表す表示画面や応答音声を話者に示すことができる。
【0014】
また、表示手段に複数番組の番組情報が表示され、表示されている複数番組の番組情報を表示情報記憶手段に記憶しておき、話者が表示手段に表示されている複数の番組から番組を選択するために入力手段から入力した位置情報と表示手段に表示している表示画面情報とから話者が選択した番組を特定し、特定した番組の番組情報を選択番組情報検出手段により表示情報記憶手段から取得し、取得した番組情報を表示することにより、話者は表示されている複数番組から一番組を選択し、指示代名詞や連体詞を含んだコマンドを発話して、選択した番組の番組情報を表示することができる。
【0015】
【発明の実施の形態】
(実施の形態1)
以下、本発明の実施の形態1による音声認識機能を有する番組情報表示装置について、図面を参照しながら説明する。
【0016】
図1は本発明の実施の形態1における音声認識機能を有する番組情報表示装置の構成図である。本実施の形態の番組情報表示装置は、番組データベース101、表示番組情報取得手段102、機器情報記憶手段103、認識辞書104、マイクロホン105、音声認識手段106、指示文字列記憶手段107、指示文字列検出手段108、表示情報記憶手段109、表示情報取得手段110、表示画面作成手段111、表示手段112、検索キーワード抽出手段113、番組検索手段114で構成される。
【0017】
番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納するものである。機器情報記憶手段103は、テレビに表示している番組の入力元や放送局、現在時刻等のテレビの状態を記憶するものである。表示番組情報取得手段102は、機器情報記憶手段103から入力元と放送局、現在時刻を取得し、取得した入力元と放送局と現在時刻を用いて、番組データベース101から現在テレビに表示している番組の番組情報と番組情報名を取得するものである。認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶するものである。マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力するものである。音声認識手段106は、マイクロホン105から入力される音声信号を、認識辞書104を用いて認識結果文字列を認識結果文字列に対応した意味文字列に変換し、認識結果文字列と意味文字列とを認識結果として出力するものである。
【0018】
指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶するものである。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出された場合は入力された認識結果と検出された指示文字列とを表示情報取得手段110に出力し、指示文字列が検出されなかった場合は認識結果を表示情報取得手段110と検索キーワード抽出手段113に、出力するものである。
【0019】
表示情報記憶手段109は、表示手段112に表示されている検索結果画面の番組の番組情報を番組情報名と対応付けて記憶するものである。表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されていない場合、表示番組情報取得手段102から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、表示番組情報取得手段102から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されている場合、表示情報記憶手段109から番組情報名と番組情報とを読み込み、読み込んだ番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力するものである。
【0020】
表示手段112は、CRTディスプレイ、液晶ディスプレイ(LCD)、プラズマディスプレイパネル(PDP)等で構成され、入力される情報を表示するものである。表示画面作成手段111は、表示情報取得手段110から番組情報と番組情報名と認識結果が入力されると入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示手段112に表示するものである。検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報を抽出するものである。番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段110に出力するものである。
【0021】
このように構成された本実施の形態による音声認識機能を有する番組情報表示装置の動作例について説明する。図1において、番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納する。
【0022】
番組データベース101の内容を(表1)に示す。
【0023】
【表1】
【0024】
表示番組情報取得手段102は、機器情報記憶手段103から入力元や放送局、現在時刻を取得し、取得した入力元と放送局と現在時刻を用いて、番組データベース101から現在テレビに表示している番組の番組情報と番組情報名を取得し、表示情報取得手段110に出力する。上記の例では、2002年1月1日午前10時30分に放送局10000において放送中の番組名「スペシャル」という番組を話者が視聴しているとする。この場合、機器情報記憶手段103には、テレビに表示している番組の入力元と放送局、現在時刻として(TV、10000、2002.1.1/AM10:30)が格納されている。ここで機器情報記憶手段103の内容を(表2)に示す。
【0025】
【表2】
【0026】
表示番組情報取得手段102は、(表2)の機器情報記憶手段103から入力元、放送局、現在時刻を取得し、取得した(TV、10000、2002.1.1/AM10:30)を用いて、(表1)の番組データベース101から放送局10000で2002年1月1日午前10時30分に放送している番組の番組情報名(放送日時、放送局、番組名、番組内容)と番組情報名に対応した番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)を取得し、表示情報取得手段110に出力する。認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶する。上記の例では、認識辞書104は、認識対象文字列と意味文字列とを一組とし、(この,指示語),(これの,指示語),(この時間の,指示語),(松下ニュース,番組名),(スペシャル,番組名),(松下スポーツ,番組名),(内容は?,内容表示命令),(何時から?,内容表示命令),・・,(見たい,選局命令)を記憶する。(表3)に認識辞書104の内容を示す。
【0027】
【表3】
【0028】
マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力する。上記の例では、話者が、「これの内容は?」と発声し、マイクロホン105から音声信号「これの内容は?」が入力されたとする。音声認識手段106は、マイクロホン105から音声信号が入力されると、入力された音声信号を、認識辞書104を用いて認識結果文字列と認識結果文字列に対応した意味文字列とに変換し、認識結果文字列と意味文字列とを認識結果として指示文字列検出手段108に出力する。上記の例では、音声認識手段106は、マイクロホン105から音声信号「これの内容は?」が入力されると、音声信号「これの内容は?」を(表3)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」に変換し、認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶する。上記の例では、指示文字列記憶手段107の一例を(表4)に示す。
【0029】
【表4】
【0030】
(表4)に示すように、指示文字列として、(この、これの、・・、この時間の)が記憶されている。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出された場合は入力された認識結果と検出された指示文字列とを表示情報取得手段110に出力する。上記の例では、音声認識手段106から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、音声認識手段106から入力された認識結果と検出された指示文字列「これの」を表示情報取得手段110に出力する。表示情報記憶手段109は、表示手段112に表示されている検索結果画面の番組の番組情報を番組情報名に対応付けて記憶する。上記の例では、表示手段112に検索結果画面が表示されていないため、表示情報記憶手段109には番組情報を記憶していないとする。表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されていない場合、表示番組情報取得手段102から入力された番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに、表示番組情報取得手段102から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力されると、表示番組情報取得手段102から入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)とを対応付けて表示情報記憶手段109に記憶し、さらに、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と指示文字列検出手段108から入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを表示画面作成手段111に出力する。ここで、表示情報取得手段110により更新された表示情報記憶手段109の内容を(表5)に示す。
【0031】
【表5】
【0032】
表示手段112は、入力される情報を表示する。表示画面作成手段111は、表示情報取得手段110から番組情報と番組情報名と認識結果が入力されると、入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示手段112に番組情報を表示する。上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から番組内容を表示する画面を作成し、表示手段112に表示する。図2に、番組内容が表示された表示手段112の一例を示す。
【0033】
さらに、上記の例において、話者が「スペシャルは何時から?」と発話したとし、マイクロホン105から音声信号「スペシャルは何時から?」が入力され、この音声信号「スペシャルは何時から?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「スペシャルは何時から?」を(表3)の認識辞書104を用いて認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出されなかった場合は、認識結果を表示情報取得手段110と検索キーワード抽出手段113に出力する。上記の例では、指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「スペシャル/何時から?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列は検出されないので、音声認識手段106から入力された認識結果のみを表示情報取得手段110と検索キーワード抽出手段113に出力する。
【0034】
検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報を抽出し、抽出した番組情報名と番組情報を番組検索手段114に出力する。上記の例では、検索キーワード抽出手段113は、指示文字列検出手段108から認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」が入力されると、入力された意味文字列を参照して番組情報名「番組名」と番組情報名「番組名」に対応した番組情報「スペシャル」を抽出し、番組情報名「番組名」と番組情報「スペシャル」を番組検索手段114に出力する。番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段110に出力する。上記の例では、番組検索手段114は、検索キーワード抽出手段113から番組情報名「番組名」と番組情報「スペシャル」が入力されると、番組名「スペシャル」を検索条件として(表1)の番組データベース101を検索し、その結果、番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを取得し、表示情報取得手段110に出力する。
【0035】
表示情報取得手段110は、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」のみ入力されると、番組検索手段114から入力される番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と指示文字列検出手段108から入力された認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」とを表示画面作成手段111に出力する。(表5)に、表示情報取得手段110により更新された表示情報記憶手段109の内容を示す。
【0036】
さらに上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」が入力されると、意味文字列「番組名/時間表示命令」に時間表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から時間情報を表示する画面を作成し、表示手段112に表示する。図3に、時間情報が表示された表示手段112の一例を示す。
【0037】
さらに、上記の例において、話者が「これの内容は?」と発話したとし、マイクロホン105から音声信号「これの内容は?」が入力され、この音声信号「これの内容は?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「これの内容は?」を(表3)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と検出された指示文字列「これの」を表示情報取得手段110に出力する。
【0038】
表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されている場合、表示情報記憶手段109から番組情報名と番組情報とを読み込み、読み込んだ番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力され、(表5)の表示情報記憶手段109に番組情報が記憶されているので、表示情報記憶手段109から番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを読み込み、読み込んだ番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と指示文字列検出手段108から入力された認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを表示画面作成手段111に出力する。
【0039】
さらに上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から番組内容を表示する画面を作成し、表示手段112に表示する。ここで、番組内容が表示された表示手段112の一例を図2に示す。
【0040】
なお、表示手段112に番組検索結果として複数の番組の番組情報が表示されており、表示されている複数番組の番組情報が表示情報記憶手段109に記憶されているとした場合、表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109から複数番組の番組情報を読み込んだ場合、番組検索結果を表示手段112に表示できない旨の警告画面を表示手段112に表示したり、また、番組検索結果を表示手段112に表示できない旨の警告音声を生成してスピーカから再生するようにしてもよい。
【0041】
本実施の形態によれば、テレビに表示している番組や番組検索結果の番組の番組情報をあらかじめ取得しておき、入力されたコマンド音声を音声認識した結果、認識結果に指示代名詞や連体詞が検出された場合、あらかじめ取得しておいた番組情報を用いて番組検索結果画面を作成し、表示することで、話者が指示代名詞や連体詞を含んだコマンドを発話し、テレビ受信機の操作や番組情報を検索、表示することができる。
【0042】
(実施の形態2)
本発明の実施の形態2における音声認識機能を有する番組情報表示装置について、図面を参照しながら説明する。前述した実施の形態1では、話者が指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組や検索結果の番組の番組情報を検索、表示する装置として述べた。しかし、本実施の形態の音声認識機能を有する番組情報表示装置では、表示手段に複数番組の番組情報が表示されている場合に、話者が複数の番組から一番組を選択し、この選択された番組の表示されている番組情報と異なる番組情報を指示代名詞や連体詞を含むコマンドを話者が発話することにより、表示させることを特徴とする。
【0043】
図4は実施の形態2による音声認識機能を有する番組情報表示装置の構成を示す図である。ここで、実施の形態1と同一符号のブロックは同じ動作を行うものとし、それらの詳細な説明は省略する。本実施の形態の音声認識機能を有する番組情報表示装置は、番組データベース101、認識辞書104、マイクロホン105、音声認識手段106、指示文字列記憶手段107、指示文字列検出手段108、表示情報記憶手段109、表示画面作成手段111、表示手段112、検索キーワード抽出手段113、番組検索手段114、入力手段201、選択番組情報検出手段202、表示情報取得手段203を含んで構成される。
【0044】
入力手段201は、マウスやタッチパネル、キーボード、リモートコントローラ等で構成され、話者が表示手段112に複数番組の番組情報が表示されている場合に、複数の番組から一つの番組を選択するために、表示手段112の画面において選択する番組が表示されている位置情報を入力するものである。選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報を表示画面情報から抽出し、抽出した番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、検出した番組情報と番組情報名とを表示情報取得手段203に出力するものである。表示情報取得手段203は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に複数番組の番組情報が記憶されている場合、選択番組情報検出手段202から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に一番組の番組情報が記憶されている場合、表示情報記憶手段109に記憶されている番組情報名と番組情報を読み出し、表示情報記憶手段109から読み出した番組情報名と番組情報と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力するものである。
【0045】
このように構成された本実施の形態による音声認識機能を有する番組情報表示装置の動作例について説明する。図4において、番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納する。番組データベース101の具体的な一例を(表6)に示す。
【0046】
【表6】
【0047】
認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶する。上記の例では、認識辞書104は、認識対象文字列と意味文字列とを一組とし、(この,指示語),(これの,指示語),(この時間の,指示語),(松下ニュース,番組名),(スペシャル,番組名),(10時,放送日時),(内容は?,内容表示命令),(番組は?,番組一覧表示命令),・・,(見たい。,選局命令)を記憶する。認識辞書104の内容を(表7)に示す。
【0048】
【表7】
【0049】
マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力する。上記の例では、2002年1月1日に話者が、「10時の番組は?」と発話し、マイクロホン105から音声信号「10時の番組は?」が入力されたとする。音声認識手段106は、マイクロホン105から音声信号が入力されると、入力された音声信号を、認識辞書104を用いて認識結果文字列と認識結果文字列に対応した意味文字列とに変換し、認識結果文字列と意味文字列とを認識結果として指示文字列検出手段108に出力する。上記の例では、音声認識手段106は、マイクロホン105から音声信号「10時の番組は?」が入力されると、音声信号「10時の番組は?」を(表7)の認識辞書104を用いて認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」に変換し、認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶する。上記の例では、指示文字列記憶手段107の一例を(表4)に示す。(表4)に示すように、指示文字列として、(この、これの、・・、この時間の)が記憶されている。
【0050】
指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出されなかった場合は、認識結果を表示情報取得手段203と検索キーワード抽出手段113に出力する。上記の例では、指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「10時/番組は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列は検出されないので、音声認識手段106から入力された認識結果のみを表示情報取得手段203と検索キーワード抽出手段113に出力する。検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報とを抽出し、抽出した番組情報名と番組情報を番組検索手段114に出力する。上記の例では、検索キーワード抽出手段113は、指示文字列検出手段108から認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」が入力されると、入力された意味文字列を参照して番組情報名「放送日時」と番組情報名「放送日時」に対応した番組情報「10時」を抽出し、番組情報名「放送日時」と番組情報「10時」を番組検索手段114に出力する。
【0051】
番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段203に出力する。上記の例では、番組検索手段114は、検索キーワード抽出手段113から番組情報名「放送日時」と番組情報「10時」が入力されると、番組情報「10時」を検索条件として(表6)の番組データベース101を検索し、その結果、番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)とを取得し、表示情報取得手段203に出力する。表示情報取得手段203は、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段203は、指示文字列検出手段108から認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」のみ入力されると、番組検索手段114から入力される番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と指示文字列検出手段108から入力された認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」とを表示画面作成手段111に出力する。(表8)に、表示情報取得手段203により更新された表示情報記憶手段109の内容を示す。
【0052】
【表8】
【0053】
表示手段112は、入力される情報を表示する。表示画面作成手段111は、表示情報取得手段203から番組情報と番組情報名と認識結果が入力されると、入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示画面情報を選択番組情報検出手段202と表示手段112に出力する。上記の例では、表示画面作成手段111は、表示情報取得手段203から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」が入力されると、意味文字列「放送日時/番組一覧表示命令」に番組一覧表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)から番組を一覧表示する表示画面情報を作成し、作成した表示画面情報を選択番組情報検出手段202と表示手段112に出力する。ここで、番組一覧が表示された表示手段112の一例を図5に示す。
【0054】
入力手段201は、話者が表示手段112に表示されている複数の番組から1つの番組を選択するために、表示手段112の画面において選択する番組が表示されている位置情報が入力される。上記の例では、図5の表示手段112に表示されている番組から、番組名「松下ニュース」を選択するために、番組名「松下ニュース」をマウスでクリックしたとすると、表示手段112の画面においてマウスでクリックされた位置情報が選択番組情報検出手段202に出力される。選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報を表示画面情報から抽出し、抽出した番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、検出した番組情報と番組情報名とを表示情報取得手段203に出力する。上記の例では、選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報(松下ニュース、10001)を表示画面情報から抽出し、抽出した番組情報(松下ニュース、10001)に対応した番組の番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを表示情報記憶手段109から検出し、検出した番組の番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを表示情報取得手段203に出力する。
【0055】
さらに、上記の例において、話者が「これの内容は?」と発話したとし、マイクロホン105から音声信号「これの内容は?」が入力され、音声信号「これの内容は?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「これの内容は?」を(表7)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とに変換し、生成した認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と検出された指示文字列「これの」を表示情報取得手段203に出力する。
【0056】
表示情報取得手段203は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に複数番組の番組情報が記憶されている場合、選択番組情報検出手段202から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段203は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力され、表示情報記憶手段109に複数番組の番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)が記憶されているので、選択番組情報検出手段202から入力される番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。ここで、表示情報取得手段203により更新された表示情報記憶手段109の内容を(表9)に示す。
【0057】
【表9】
【0058】
さらに、上記の例では、表示画面作成手段111は、表示情報取得手段203から番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)から番組内容を表示する表示画面情報を作成し、作成した表示画面情報を選択番組情報検出手段202と表示手段112に出力する。ここで、番組内容が表示された表示手段112の一例を図6に示す。
【0059】
なお、表示画面作成手段111は、表示情報取得手段203から複数の番組情報と番組情報名と認識結果が入力されると、入力された番組情報を認識結果に応じて一覧表示し、一覧表示した番組の一つを強調表示した表示画面情報に変換し、さらに、入力手段201から位置情報が入力されると、入力された位置情報に対応する番組情報を強調表示した表示画面情報を表示情報取得手段203から入力された複数の番組情報と番組情報名と認識結果から変換し直し表示手段112に出力するようにしてもよい。
【0060】
また、表示手段112に複数番組の番組情報が表示され、選択されている番組情報が強調表示されている場合に、入力手段201は、ボタンが備わった機器で構成されており、選択されている番組を変更するため話者によりボタンが押下された場合、押下されたボタンの情報を表示画面作成手段111に出力し、表示画面作成手段111は、入力手段201から入力されるボタン情報に対応して、強調表示する番組情報を変更した表示画面情報を表示情報取得手段203から入力された複数の番組情報と番組情報名と認識結果から変換し直し表示手段112と選択番組情報検出手段202に出力し、選択番組情報検出手段202は、表示画面作成手段111から表示画面情報が入力されると、入力された表示画面情報に強調表示された番組情報が存在する場合、強調表示された番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、表示情報記憶手段109から検出された番組情報と番組情報名とを表示情報取得手段203に出力するようにしてもよい。
【0061】
また、本発明では、番組データベース101、表示情報記憶手段109は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時を格納しているとして説明したが、この例に限定されることなく、番組データベース101に、さらに、番組情報として番組の属するジャンル、出演者名を格納するようにしてもよい。
【0062】
本実施の形態によれば、複数番組の番組検索結果が表示されており、話者が複数の番組から選択した番組の番組情報をあらかじめ取得しておき、入力されたコマンド音声を音声認識した結果、認識結果に指示代名詞や連体詞が検出された場合、あらかじめ取得しておいた番組情報を用いて番組検索結果画面を作成し、表示することで、話者が表示されている複数の番組から選択した番組の番組情報を指示代名詞や連体詞を含んだコマンドを発話し、表示することができる。
【0063】
【発明の効果】
以上のように、本発明の音声認識機能を有する番組情報表示装置によれば、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示手段に表示されている番組の番組情報を表示することができる。
【0064】
また、本発明の音声認識機能を有する番組情報表示装置によれば、一番組に関する番組情報の一部分が表示手段に表示されている場合、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組情報と異なる他の番組情報を表示することができる。
【0065】
また、本発明の音声認識機能を有する番組情報表示装置によれば、複数番組の番組情報が表示手段に表示され、指示代名詞や連体詞を含んだコマンドを話者が発話した場合、番組情報を表示することができない旨を表す表示画面や応答音声を話者に示すことができる。
【0066】
また、本発明の音声認識機能を有する番組情報表示装置によれば、複数番組の番組情報が表示手段に表示されている場合、話者は表示されている複数番組から一番組を選択し、指示代名詞や連体詞を含んだコマンドを発話して、選択した番組の表示されている番組情報と異なる他の番組情報を表示することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声認識機能を有する番組情報表示装置の構成を示す図
【図2】同番組情報表示装置の動作を表す表示例を示す図
【図3】同番組情報表示装置の動作を表す他の表示例を示す図
【図4】本発明の実施の形態2における音声認識機能を有する番組情報表示装置の構成を示す図
【図5】同番組情報表示装置の動作を表す表示例を示す図
【図6】同番組情報表示装置の動作を表す他の表示例を示す図
【符号の説明】
101 番組データベース
102 表示番組情報取得手段
103 機器情報記憶手段
104 認識辞書
105 マイクロホン
106 音声認識手段
107 指示文字列記憶手段
108 指示文字列検出手段
109 表示情報記憶手段
110、203 表示情報取得手段
111 表示画面作成手段
112 表示手段
113 検索キーワード抽出手段
114 番組検索手段
201 入力手段
202 選択番組情報検出手段[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a television receiver, a remote control transmitter for a television receiver, and a television receiver system. More specifically, the present invention relates to a system that allows a user to search for a program by voice.
[0002]
[Prior art]
As a conventional technique, a voice understanding system capable of operating a television by voice recognition has been disclosed (for example, see Patent Document 1).
[0003]
[Patent Document 1]
JP 2000-250575 A
[0004]
[Problems to be solved by the invention]
However, a conventional television receiver or the like having a voice recognition function recognizes a command voice uttered in order to control the television receiver or the like by a user, and includes a pronoun or a conjunction in the recognition result character string as a recognition result. The case was not done. For this reason, the user cannot utter a command including a demonstrative pronoun or a conjunction and search for and display a TV receiver operation and program information.
[0005]
The present invention has been made in view of such conventional problems, and its purpose is to previously acquire program information of a program displayed on a television receiver or a program included in a program search result. In addition, when a demonstrative pronoun or a conjunction is recognized by voice recognition, the user can search and display program information with natural spoken words including a demonstrative pronoun or a conjunction by referring to previously acquired program information. It is to provide a program information display device having a function.
[0006]
[Means for Solving the Problems]
According to the first aspect of the present invention, there is provided a recognition dictionary for storing a speech recognition target word, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition of the speech signal using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit Detection means; display means for displaying a program or a program information screen of the program; equipment information storage means for storing the status of the equipment such as the input source, broadcast station, and current time of the displayed program; Using the state of the device stored in the device information storage means, the display program information acquisition means for acquiring and storing program information of the program being viewed or played on the display means from the program database, the program and the Display screen creating means for converting program information of the program into display screen information and outputting it to the display means, and when the instruction character string detecting means detects a character string including a pronoun or a conjunction, the display program information acquiring means And a display information acquisition means for reading out the program information stored in the display screen and outputting it to the display screen creation means.
[0007]
According to a second aspect of the present invention, there is provided a recognition dictionary for storing a target word for speech recognition, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit Detection means, display means for displaying a program or program information screen, display information storage means for storing program information displayed on the display means, and indication by the instruction character string detection means When a character string including a noun or a conjunction is not detected, search keyword extraction means for extracting a keyword indicating program information from the recognition result character string obtained by the voice recognition means, and a keyword extracted by the search keyword extraction means The program search means for acquiring and storing all program information of the corresponding program from the program database, and when the instruction character string detection means does not detect a character string including a pronoun or a noun is stored in the program search means. The program information is read and stored in the display information storage means, and when the instruction character string detection means detects a character string including an indicating pronoun or a conjunction, a display for reading the program information from the display information storage means Information acquisition means and program information read by the display information acquisition means as display screen information Further comprising a display screen creation means for outputting converted into the display means is a program information display device having a voice recognition function, characterized in.
[0008]
According to a third aspect of the present invention, in the program information display device having the voice recognition function according to the second aspect, the program information acquired by the program search means is program information of a plurality of programs. To do.
[0009]
According to a fourth aspect of the present invention, in the program information display device having the voice recognition function according to the third aspect, the display information acquisition means detects a character string including a pronoun or noun by the instruction character string detection means. When the information of a plurality of programs is read from the display information storage means, warning screen information or warning sound indicating that the program search result cannot be displayed is generated and displayed on the display means.
[0010]
According to a fifth aspect of the present invention, there is provided a recognition dictionary for storing a target word for speech recognition, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit If the detection means, the display means for displaying the program or the program information screen, and the character string including the pronoun or noun is not detected by the instruction character string detection means, the voice recognition means Search keyword extraction means for extracting a keyword indicating program information from the obtained recognition result character string, and all program information of programs corresponding to the keyword extracted by the search keyword extraction means is acquired from the program database and stored. Program search means, display information storage means for storing program information displayed on the display means, and when the program information is input, the input program information is converted into display screen information and stored, and the display Display screen generating means for outputting screen information to the display means, and a display position of the program information selected by the speaker from the plurality of program information on the display means when a plurality of program information is displayed on the display means Input means for reading the display screen information stored in the display screen creation means, and the positional information input from the input means Corresponding program information is specified from the display screen information, program information relating to the program of the specified program information is acquired from the display information storage means and stored, and a designated pronoun or When a character string including a conjunction is not detected, program information stored in the program search means is read out and stored in the display information storage means, the program information is output to the display screen creation means, and the instruction When a character string including a demonstrative pronoun or a conjunction is detected by the character string detection means, program information is read from the selected program information detection means and stored in the display storage means, and the program information is generated in the display screen creation means Display information acquisition means for outputting to a program information display device having a voice recognition function.
[0011]
In the above means, the program information of the program displayed on the display means is acquired in advance by the display program information acquisition means, the command speech uttered by the speaker is recognized by the voice recognition means, and the voice recognition result is indicated. When a character string including pronouns and conjunctions is detected by the instruction character string detection means and the program search screen is not displayed on the display means, the speaker can indicate the instruction pronoun by displaying the program information acquired in advance. Or a command including a conjunction, and the program information of the program displayed on the display means can be displayed.
[0012]
When program information relating to one program is retrieved by the program retrieval means, the program information retrieved by the display information acquisition means is stored in the display information storage means, and the retrieved program information is displayed on the display means. Next, when the command speech uttered by the speaker is recognized by the speech recognition means, and the character string including the pronoun or noun in the speech recognition result is detected by the instruction character string detection means, the display information is displayed in advance. By displaying the program information stored in the storage means, the speaker can speak a command including a demonstrative pronoun and a conjunction and display other program information different from the displayed program information.
[0013]
In addition, program information of a plurality of programs is displayed on the display means, the program information of the displayed plurality of programs is stored in the display information storage means, and then the command voice uttered by the speaker is voiced by the voice recognition means. When the instruction character string detection means detects a character string that includes a pronoun or a noun in the speech recognition result, the program information of a plurality of programs stored in the display information storage means is read in advance. When the display information acquisition means detects that the program information is displayed on the display means, a display screen or response sound indicating that the program information cannot be displayed because the program indicated by the pronoun or synjunction cannot be specified. Can be shown to the speaker.
[0014]
The program information of a plurality of programs is displayed on the display means, the program information of the displayed plurality of programs is stored in the display information storage means, and a program is selected from the plurality of programs displayed on the display means. The program selected by the speaker is specified from the position information input from the input means for selection and the display screen information displayed on the display means, and the program information of the specified program is stored as display information by the selected program information detection means. By acquiring the program information and displaying the acquired program information, the speaker selects one program from a plurality of displayed programs, utters a command including a pronoun or a conjunction, and program information of the selected program Can be displayed.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
(Embodiment 1)
Hereinafter, a program information display apparatus having a voice recognition function according to Embodiment 1 of the present invention will be described with reference to the drawings.
[0016]
FIG. 1 is a configuration diagram of a program information display apparatus having a voice recognition function according to Embodiment 1 of the present invention. The program information display apparatus according to the present embodiment includes a
[0017]
The
[0018]
The instruction character
[0019]
The display
[0020]
The display means 112 is composed of a CRT display, a liquid crystal display (LCD), a plasma display panel (PDP) or the like, and displays input information. When the display
[0021]
An operation example of the program information display apparatus having the voice recognition function according to this embodiment configured as described above will be described. In FIG. 1, a
[0022]
The contents of the
[0023]
[Table 1]
[0024]
The display program
[0025]
[Table 2]
[0026]
The display program
[0027]
[Table 3]
[0028]
The
[0029]
[Table 4]
[0030]
As shown in (Table 4), (this, this, ..., this time) is stored as the instruction character string. When the recognition result is input from the
[0031]
[Table 5]
[0032]
The
[0033]
Further, in the above example, if the speaker utters “What time is the special?”, An audio signal “What time is the special?” Is input from the
[0034]
When the recognition result is input from the instruction character
[0035]
When only the recognition result is input from the instruction character
[0036]
Further, in the above example, the display
[0037]
Furthermore, in the above example, it is assumed that the speaker utters “What is this?”, And the voice signal “What is this?” Is input from the
[0038]
When the recognition result and the instruction character string are input from the instruction character
[0039]
Further, in the above example, the display
[0040]
In the case where program information of a plurality of programs is displayed on the
[0041]
According to this embodiment, the program information of the program displayed on the TV or the program search result program is acquired in advance, and the command voice input is recognized as a result of speech recognition. If detected, a program search result screen is created and displayed using the program information acquired in advance, so that the speaker speaks a command including a pronoun or a synonym, and operates the TV receiver. Program information can be searched and displayed.
[0042]
(Embodiment 2)
A program information display apparatus having a voice recognition function according to Embodiment 2 of the present invention will be described with reference to the drawings. In the first embodiment described above, the apparatus is described as a device in which a speaker speaks a command including a pronoun or a conjunction, and searches and displays program information of a displayed program or a search result program. However, in the program information display apparatus having the voice recognition function of the present embodiment, when program information of a plurality of programs is displayed on the display means, the speaker selects one program from the plurality of programs, and this selection is made. Program information different from the displayed program information of the selected program is displayed when a speaker speaks a command including a pronoun or a conjunction.
[0043]
FIG. 4 is a diagram showing a configuration of a program information display apparatus having a voice recognition function according to the second embodiment. Here, blocks having the same reference numerals as those in Embodiment 1 perform the same operations, and detailed descriptions thereof are omitted. The program information display apparatus having a voice recognition function according to the present embodiment includes a
[0044]
The
[0045]
An operation example of the program information display apparatus having the voice recognition function according to this embodiment configured as described above will be described. In FIG. 4, a
[0046]
[Table 6]
[0047]
The
[0048]
[Table 7]
[0049]
The
[0050]
When the recognition result is input from the
[0051]
When the program information name and the program information are input from the search
[0052]
[Table 8]
[0053]
The
[0054]
The
[0055]
Further, in the above example, it is assumed that the speaker utters “What is this?”, The voice signal “What is this?” Is input from the
[0056]
The display information acquisition means 203 receives the recognition result and the instruction character string from the instruction character string detection means 108, and inputs from the selected program information detection means 202 when the program information of a plurality of programs is stored in the display information storage means 109. The program information and the program information name are stored in the display information storage means 109 in association with each other, and the program information, program information name, and instruction character string detection means 108 inputted from the selected program information detection means 202 are inputted. The recognition result is output to the display
[0057]
[Table 9]
[0058]
Further, in the above example, the display
[0059]
When a plurality of program information, program information names, and recognition results are input from the display
[0060]
Further, when program information of a plurality of programs is displayed on the
[0061]
In the present invention, it is assumed that the
[0062]
According to the present embodiment, the program search result of a plurality of programs is displayed, the program information of the program selected by the speaker from the plurality of programs is acquired in advance, and the input command voice is recognized as a result of voice recognition. When a pronoun or synonym is detected in the recognition result, a program search result screen is created using the program information acquired in advance and displayed, so that the speaker can be selected from multiple programs displayed The program information of the selected program can be spoken and displayed by a command including a pronoun or a synonym.
[0063]
【The invention's effect】
As described above, according to the program information display device having the voice recognition function of the present invention, the speaker speaks a command including a pronoun or a synonym and displays program information of the program displayed on the display means. be able to.
[0064]
Further, according to the program information display device having the voice recognition function of the present invention, when a part of the program information related to one program is displayed on the display means, the speaker utters a command including a pronoun or a synonym, Other program information different from the displayed program information can be displayed.
[0065]
Further, according to the program information display device having the voice recognition function of the present invention, the program information of a plurality of programs is displayed on the display means, and the program information is displayed when a speaker utters a command including a directive pronoun or a conjunction. It is possible to show the speaker a display screen and a response voice that indicate that the user cannot do it.
[0066]
Further, according to the program information display apparatus having a voice recognition function of the present invention, when program information of a plurality of programs is displayed on the display means, the speaker selects one program from the displayed plurality of programs and gives an instruction. A command including pronouns and conjunctions can be uttered to display other program information different from the program information displayed for the selected program.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a program information display device having a voice recognition function according to Embodiment 1 of the present invention.
FIG. 2 is a diagram showing a display example representing the operation of the program information display device
FIG. 3 is a view showing another display example showing the operation of the program information display apparatus;
FIG. 4 is a diagram showing a configuration of a program information display device having a voice recognition function according to Embodiment 2 of the present invention.
FIG. 5 is a diagram showing a display example representing the operation of the program information display device
FIG. 6 is a view showing another display example showing the operation of the program information display device.
[Explanation of symbols]
101 program database
102 Display program information acquisition means
103 Device information storage means
104 recognition dictionary
105 microphone
106 Voice recognition means
107 Instruction character string storage means
108 Instruction character string detection means
109 Display information storage means
110, 203 Display information acquisition means
111 Display screen creation means
112 Display means
113 Search keyword extraction means
114 Program search means
201 Input means
202 Selected program information detection means
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003048915A JP4175141B2 (en) | 2003-02-26 | 2003-02-26 | Program information display device having voice recognition function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003048915A JP4175141B2 (en) | 2003-02-26 | 2003-02-26 | Program information display device having voice recognition function |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004260544A JP2004260544A (en) | 2004-09-16 |
JP4175141B2 true JP4175141B2 (en) | 2008-11-05 |
Family
ID=33114742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003048915A Expired - Fee Related JP4175141B2 (en) | 2003-02-26 | 2003-02-26 | Program information display device having voice recognition function |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4175141B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007324866A (en) * | 2006-05-31 | 2007-12-13 | Funai Electric Co Ltd | Electronic apparatus and television receiver |
KR102009316B1 (en) * | 2013-01-07 | 2019-08-09 | 삼성전자주식회사 | Interactive server, display apparatus and controlling method thereof |
JP6440513B2 (en) | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Information providing method and device control method using voice recognition function |
KR102049833B1 (en) * | 2019-08-05 | 2019-11-29 | 삼성전자주식회사 | Interactive server, display apparatus and controlling method thereof |
JP7241142B1 (en) * | 2021-09-27 | 2023-03-16 | Tvs Regza株式会社 | Receiving device and tuning system |
-
2003
- 2003-02-26 JP JP2003048915A patent/JP4175141B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004260544A (en) | 2004-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4459267B2 (en) | Dictionary data generation apparatus and electronic device | |
US8924853B2 (en) | Apparatus, and associated method, for cognitively translating media to facilitate understanding | |
JP4127668B2 (en) | Information processing apparatus, information processing method, and program | |
TWI233026B (en) | Multi-lingual transcription system | |
US6321196B1 (en) | Phonetic spelling for speech recognition | |
JP5178109B2 (en) | Search device, method and program | |
KR100378898B1 (en) | A pronunciation setting method, an articles of manufacture comprising a computer readable medium and, a graphical user interface system | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
CN102378050B (en) | Broadcast system using text-to-speech conversion | |
US20100082344A1 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
JP2010072507A (en) | Speech recognition search system and speech recognition search method | |
US9576581B2 (en) | Metatagging of captions | |
KR20160111275A (en) | Foreign language learning system and foreign language learning method | |
JPWO2005122016A1 (en) | Input assist device, information retrieval device, input assist method, and program | |
JP2008083459A (en) | Speech translation device, speech translation method, and speech translation program | |
JP2007171809A (en) | Information processor and information processing method | |
KR101100191B1 (en) | A multimedia player and the multimedia-data search way using the player | |
JP2009042968A (en) | Information selection system, information selection method, and program for information selection | |
CN110781649A (en) | Subtitle editing method and device, computer storage medium and electronic equipment | |
JP4157418B2 (en) | Data browsing support device, data browsing method, and data browsing program | |
JP4175141B2 (en) | Program information display device having voice recognition function | |
JP2007503747A (en) | Real-time media dictionary | |
JP2007199315A (en) | Content providing apparatus | |
JP2002189483A (en) | Voice input-type musical composition search system | |
JP2007257134A (en) | Speech search device, speech search method and speech search program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060227 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060314 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080811 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130829 Year of fee payment: 5 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |