JP4175141B2 - Program information display device having voice recognition function - Google Patents

Program information display device having voice recognition function Download PDF

Info

Publication number
JP4175141B2
JP4175141B2 JP2003048915A JP2003048915A JP4175141B2 JP 4175141 B2 JP4175141 B2 JP 4175141B2 JP 2003048915 A JP2003048915 A JP 2003048915A JP 2003048915 A JP2003048915 A JP 2003048915A JP 4175141 B2 JP4175141 B2 JP 4175141B2
Authority
JP
Japan
Prior art keywords
program
display
character string
information
program information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003048915A
Other languages
Japanese (ja)
Other versions
JP2004260544A (en
Inventor
貴史 續木
良宏 小島
砂子 朝山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2003048915A priority Critical patent/JP4175141B2/en
Publication of JP2004260544A publication Critical patent/JP2004260544A/en
Application granted granted Critical
Publication of JP4175141B2 publication Critical patent/JP4175141B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To display program information by voices containing demonstrative pronouns and adnominal nouns. <P>SOLUTION: A display program information obtaining means 102 obtains the program information of a program that is viewed and listened from a program database 101, by using the apparatus information stored in an apparatus information storing means 103. When the voices are input from a microphone 105, a voice-recognition means 106 recognizes, by using a recognition dictionary 104, the voices through an indication line memorizing information, where an indication string detecting means 108 is stored in an indication string storing means 107. When the voices containing the demonstrative pronouns and the adnominal nouns are recognized, a display information obtaining means 110 reads out the program information from the display program information obtaining means 102; while on a display means 112, a display screen making means 111 displays the program information read out by the display information obtaining means 110. <P>COPYRIGHT: (C)2004,JPO&amp;NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、テレビ受信機、テレビ受信機用リモコン送信機およびテレビ受信機システムに関し、具体的には、ユーザが音声により番組の検索を行うことができるシステムに関する。
【0002】
【従来の技術】
従来の技術としては、音声認識によってテレビの操作を行うことが可能な音声理解システムが公開されている(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開2000−250575号公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の音声認識機能を有するテレビ受信機等は、ユーザがテレビ受信機等を制御するために発声したコマンド音声を音声認識し、認識結果である認識結果文字列に指示代名詞や連体詞が含まれる場合の処理を行っていなかった。このため、ユーザは、指示代名詞や連体詞を含んだコマンドを発声しテレビ受信機の操作や番組情報を検索、表示することができなかった。
【0005】
本発明は、このような従来の問題点に鑑みてなされたものであって、その目的は、テレビ受信機に表示している番組や番組検索結果に含まれる番組の番組情報を予め取得しておき、指示代名詞や連体詞が音声認識された場合、予め取得しておいた番組情報を参照することにより、ユーザが指示代名詞や連体詞を含んだ自然な話し言葉で番組情報を検索し、表示できる音声認識機能を有する番組情報表示装置を提供することである。
【0006】
【課題を解決するための手段】
本発明の請求項1の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または前記番組の番組情報画面を表示する表示手段と、表示している番組の入力元や放送局、現在時刻等の機器の状態を記憶する機器情報記憶手段と、前記機器情報記憶手段に記憶されている機器の状態を用いて、前記表示手段で視聴または再生している番組の番組情報を前記番組データベースから取得し記憶する表示番組情報取得手段と、前記番組や前記番組の番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、前記表示番組情報取得手段に記憶されている番組情報を読み出し前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0007】
本発明の請求項2の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記表示情報記憶手段から番組情報を読み出す表示情報取得手段と、前記表示情報取得手段により読み出された番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0008】
本発明の請求項3の発明は、請求項2に記載の音声認識機能を有する番組情報表示装置において、番組検索手段により取得された番組情報は、複数の番組の番組情報であることを特徴とするものである。
【0009】
本発明の請求項4の発明は、請求項3記載の音声認識機能を有する番組情報表示装置において、表示情報取得手段は、指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、表示情報記憶手段から複数番組の情報を読み込んだ場合には、番組検索結果を表示できない旨の警告画面情報または、警告音声を生成して、表示手段に表示させることを特徴とする。
【0010】
本発明の請求項5の発明は、音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、番組情報が入力されると、入力された番組情報を表示画面情報に変換して記憶し、前記表示画面情報を前記表示手段に出力する表示画面作成手段と、前記表示手段に複数の番組情報が表示されている場合、話者が前記複数の番組情報から選択した番組情報の前記表示手段における表示位置を入力する入力手段と、前記表示画面作成手段に記憶されている表示画面情報を読み出し、前記入力手段から入力された位置情報に対応する番組情報を前記表示画面情報から特定し、特定した番組情報の番組に関する番組情報を前記表示情報記憶手段から取得し記憶する選択番組情報検出手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記選択番組情報検出手段から番組情報を読み出して前記表示記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置である。
【0011】
上記の手段では、表示手段に表示されている番組の番組情報を表示番組情報取得手段により予め取得しておき、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出され、表示手段に番組検索画面が表示されていない場合、予め取得しておいた番組情報を表示することにより、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示手段に表示されている番組の番組情報を表示することができる。
【0012】
また、番組検索手段により一番組に関する番組情報が検索された場合、表示情報取得手段により検索された番組情報を表示情報記憶手段に記憶しておき、検索された番組情報が表示手段に表示されている場合、次に、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出された場合、予め表示情報記憶手段に記憶しておいた番組情報を表示することにより、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組情報と異なる他の番組情報を表示することができる。
【0013】
また、表示手段に複数番組の番組情報が表示され、表示されている複数番組の番組情報を表示情報記憶手段に記憶しておき、次に、話者が発話したコマンド音声を音声認識手段により音声認識し、音声認識結果に指示代名詞や連体詞を含んだ文字列が指示文字列検出手段により検出された場合、予め表示情報記憶手段に記憶しておいた複数番組の番組情報を読み込み、複数番組の番組情報が表示手段に表示されていることを表示情報取得手段が検知することにより、指示代名詞や連体詞が指し示す番組を特定できないため番組情報を表示することができない旨を表す表示画面や応答音声を話者に示すことができる。
【0014】
また、表示手段に複数番組の番組情報が表示され、表示されている複数番組の番組情報を表示情報記憶手段に記憶しておき、話者が表示手段に表示されている複数の番組から番組を選択するために入力手段から入力した位置情報と表示手段に表示している表示画面情報とから話者が選択した番組を特定し、特定した番組の番組情報を選択番組情報検出手段により表示情報記憶手段から取得し、取得した番組情報を表示することにより、話者は表示されている複数番組から一番組を選択し、指示代名詞や連体詞を含んだコマンドを発話して、選択した番組の番組情報を表示することができる。
【0015】
【発明の実施の形態】
(実施の形態1)
以下、本発明の実施の形態1による音声認識機能を有する番組情報表示装置について、図面を参照しながら説明する。
【0016】
図1は本発明の実施の形態1における音声認識機能を有する番組情報表示装置の構成図である。本実施の形態の番組情報表示装置は、番組データベース101、表示番組情報取得手段102、機器情報記憶手段103、認識辞書104、マイクロホン105、音声認識手段106、指示文字列記憶手段107、指示文字列検出手段108、表示情報記憶手段109、表示情報取得手段110、表示画面作成手段111、表示手段112、検索キーワード抽出手段113、番組検索手段114で構成される。
【0017】
番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納するものである。機器情報記憶手段103は、テレビに表示している番組の入力元や放送局、現在時刻等のテレビの状態を記憶するものである。表示番組情報取得手段102は、機器情報記憶手段103から入力元と放送局、現在時刻を取得し、取得した入力元と放送局と現在時刻を用いて、番組データベース101から現在テレビに表示している番組の番組情報と番組情報名を取得するものである。認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶するものである。マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力するものである。音声認識手段106は、マイクロホン105から入力される音声信号を、認識辞書104を用いて認識結果文字列を認識結果文字列に対応した意味文字列に変換し、認識結果文字列と意味文字列とを認識結果として出力するものである。
【0018】
指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶するものである。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出された場合は入力された認識結果と検出された指示文字列とを表示情報取得手段110に出力し、指示文字列が検出されなかった場合は認識結果を表示情報取得手段110と検索キーワード抽出手段113に、出力するものである。
【0019】
表示情報記憶手段109は、表示手段112に表示されている検索結果画面の番組の番組情報を番組情報名と対応付けて記憶するものである。表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されていない場合、表示番組情報取得手段102から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、表示番組情報取得手段102から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されている場合、表示情報記憶手段109から番組情報名と番組情報とを読み込み、読み込んだ番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力するものである。
【0020】
表示手段112は、CRTディスプレイ、液晶ディスプレイ(LCD)、プラズマディスプレイパネル(PDP)等で構成され、入力される情報を表示するものである。表示画面作成手段111は、表示情報取得手段110から番組情報と番組情報名と認識結果が入力されると入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示手段112に表示するものである。検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報を抽出するものである。番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段110に出力するものである。
【0021】
このように構成された本実施の形態による音声認識機能を有する番組情報表示装置の動作例について説明する。図1において、番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納する。
【0022】
番組データベース101の内容を(表1)に示す。
【0023】
【表1】

Figure 0004175141
【0024】
表示番組情報取得手段102は、機器情報記憶手段103から入力元や放送局、現在時刻を取得し、取得した入力元と放送局と現在時刻を用いて、番組データベース101から現在テレビに表示している番組の番組情報と番組情報名を取得し、表示情報取得手段110に出力する。上記の例では、2002年1月1日午前10時30分に放送局10000において放送中の番組名「スペシャル」という番組を話者が視聴しているとする。この場合、機器情報記憶手段103には、テレビに表示している番組の入力元と放送局、現在時刻として(TV、10000、2002.1.1/AM10:30)が格納されている。ここで機器情報記憶手段103の内容を(表2)に示す。
【0025】
【表2】
Figure 0004175141
【0026】
表示番組情報取得手段102は、(表2)の機器情報記憶手段103から入力元、放送局、現在時刻を取得し、取得した(TV、10000、2002.1.1/AM10:30)を用いて、(表1)の番組データベース101から放送局10000で2002年1月1日午前10時30分に放送している番組の番組情報名(放送日時、放送局、番組名、番組内容)と番組情報名に対応した番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)を取得し、表示情報取得手段110に出力する。認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶する。上記の例では、認識辞書104は、認識対象文字列と意味文字列とを一組とし、(この,指示語),(これの,指示語),(この時間の,指示語),(松下ニュース,番組名),(スペシャル,番組名),(松下スポーツ,番組名),(内容は?,内容表示命令),(何時から?,内容表示命令),・・,(見たい,選局命令)を記憶する。(表3)に認識辞書104の内容を示す。
【0027】
【表3】
Figure 0004175141
【0028】
マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力する。上記の例では、話者が、「これの内容は?」と発声し、マイクロホン105から音声信号「これの内容は?」が入力されたとする。音声認識手段106は、マイクロホン105から音声信号が入力されると、入力された音声信号を、認識辞書104を用いて認識結果文字列と認識結果文字列に対応した意味文字列とに変換し、認識結果文字列と意味文字列とを認識結果として指示文字列検出手段108に出力する。上記の例では、音声認識手段106は、マイクロホン105から音声信号「これの内容は?」が入力されると、音声信号「これの内容は?」を(表3)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」に変換し、認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶する。上記の例では、指示文字列記憶手段107の一例を(表4)に示す。
【0029】
【表4】
Figure 0004175141
【0030】
(表4)に示すように、指示文字列として、(この、これの、・・、この時間の)が記憶されている。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出された場合は入力された認識結果と検出された指示文字列とを表示情報取得手段110に出力する。上記の例では、音声認識手段106から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、音声認識手段106から入力された認識結果と検出された指示文字列「これの」を表示情報取得手段110に出力する。表示情報記憶手段109は、表示手段112に表示されている検索結果画面の番組の番組情報を番組情報名に対応付けて記憶する。上記の例では、表示手段112に検索結果画面が表示されていないため、表示情報記憶手段109には番組情報を記憶していないとする。表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されていない場合、表示番組情報取得手段102から入力された番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに、表示番組情報取得手段102から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力されると、表示番組情報取得手段102から入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)とを対応付けて表示情報記憶手段109に記憶し、さらに、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と指示文字列検出手段108から入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを表示画面作成手段111に出力する。ここで、表示情報取得手段110により更新された表示情報記憶手段109の内容を(表5)に示す。
【0031】
【表5】
Figure 0004175141
【0032】
表示手段112は、入力される情報を表示する。表示画面作成手段111は、表示情報取得手段110から番組情報と番組情報名と認識結果が入力されると、入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示手段112に番組情報を表示する。上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から番組内容を表示する画面を作成し、表示手段112に表示する。図2に、番組内容が表示された表示手段112の一例を示す。
【0033】
さらに、上記の例において、話者が「スペシャルは何時から?」と発話したとし、マイクロホン105から音声信号「スペシャルは何時から?」が入力され、この音声信号「スペシャルは何時から?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「スペシャルは何時から?」を(表3)の認識辞書104を用いて認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出されなかった場合は、認識結果を表示情報取得手段110と検索キーワード抽出手段113に出力する。上記の例では、指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「スペシャル/何時から?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列は検出されないので、音声認識手段106から入力された認識結果のみを表示情報取得手段110と検索キーワード抽出手段113に出力する。
【0034】
検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報を抽出し、抽出した番組情報名と番組情報を番組検索手段114に出力する。上記の例では、検索キーワード抽出手段113は、指示文字列検出手段108から認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」が入力されると、入力された意味文字列を参照して番組情報名「番組名」と番組情報名「番組名」に対応した番組情報「スペシャル」を抽出し、番組情報名「番組名」と番組情報「スペシャル」を番組検索手段114に出力する。番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段110に出力する。上記の例では、番組検索手段114は、検索キーワード抽出手段113から番組情報名「番組名」と番組情報「スペシャル」が入力されると、番組名「スペシャル」を検索条件として(表1)の番組データベース101を検索し、その結果、番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを取得し、表示情報取得手段110に出力する。
【0035】
表示情報取得手段110は、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」のみ入力されると、番組検索手段114から入力される番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と指示文字列検出手段108から入力された認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」とを表示画面作成手段111に出力する。(表5)に、表示情報取得手段110により更新された表示情報記憶手段109の内容を示す。
【0036】
さらに上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「スペシャル/何時から?」と意味文字列「番組名/時間表示命令」が入力されると、意味文字列「番組名/時間表示命令」に時間表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から時間情報を表示する画面を作成し、表示手段112に表示する。図3に、時間情報が表示された表示手段112の一例を示す。
【0037】
さらに、上記の例において、話者が「これの内容は?」と発話したとし、マイクロホン105から音声信号「これの内容は?」が入力され、この音声信号「これの内容は?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「これの内容は?」を(表3)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と検出された指示文字列「これの」を表示情報取得手段110に出力する。
【0038】
表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に番組情報が記憶されている場合、表示情報記憶手段109から番組情報名と番組情報とを読み込み、読み込んだ番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段110は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力され、(表5)の表示情報記憶手段109に番組情報が記憶されているので、表示情報記憶手段109から番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)とを読み込み、読み込んだ番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と指示文字列検出手段108から入力された認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを表示画面作成手段111に出力する。
【0039】
さらに上記の例では、表示画面作成手段111は、表示情報取得手段110から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)から番組内容を表示する画面を作成し、表示手段112に表示する。ここで、番組内容が表示された表示手段112の一例を図2に示す。
【0040】
なお、表示手段112に番組検索結果として複数の番組の番組情報が表示されており、表示されている複数番組の番組情報が表示情報記憶手段109に記憶されているとした場合、表示情報取得手段110は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109から複数番組の番組情報を読み込んだ場合、番組検索結果を表示手段112に表示できない旨の警告画面を表示手段112に表示したり、また、番組検索結果を表示手段112に表示できない旨の警告音声を生成してスピーカから再生するようにしてもよい。
【0041】
本実施の形態によれば、テレビに表示している番組や番組検索結果の番組の番組情報をあらかじめ取得しておき、入力されたコマンド音声を音声認識した結果、認識結果に指示代名詞や連体詞が検出された場合、あらかじめ取得しておいた番組情報を用いて番組検索結果画面を作成し、表示することで、話者が指示代名詞や連体詞を含んだコマンドを発話し、テレビ受信機の操作や番組情報を検索、表示することができる。
【0042】
(実施の形態2)
本発明の実施の形態2における音声認識機能を有する番組情報表示装置について、図面を参照しながら説明する。前述した実施の形態1では、話者が指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組や検索結果の番組の番組情報を検索、表示する装置として述べた。しかし、本実施の形態の音声認識機能を有する番組情報表示装置では、表示手段に複数番組の番組情報が表示されている場合に、話者が複数の番組から一番組を選択し、この選択された番組の表示されている番組情報と異なる番組情報を指示代名詞や連体詞を含むコマンドを話者が発話することにより、表示させることを特徴とする。
【0043】
図4は実施の形態2による音声認識機能を有する番組情報表示装置の構成を示す図である。ここで、実施の形態1と同一符号のブロックは同じ動作を行うものとし、それらの詳細な説明は省略する。本実施の形態の音声認識機能を有する番組情報表示装置は、番組データベース101、認識辞書104、マイクロホン105、音声認識手段106、指示文字列記憶手段107、指示文字列検出手段108、表示情報記憶手段109、表示画面作成手段111、表示手段112、検索キーワード抽出手段113、番組検索手段114、入力手段201、選択番組情報検出手段202、表示情報取得手段203を含んで構成される。
【0044】
入力手段201は、マウスやタッチパネル、キーボード、リモートコントローラ等で構成され、話者が表示手段112に複数番組の番組情報が表示されている場合に、複数の番組から一つの番組を選択するために、表示手段112の画面において選択する番組が表示されている位置情報を入力するものである。選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報を表示画面情報から抽出し、抽出した番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、検出した番組情報と番組情報名とを表示情報取得手段203に出力するものである。表示情報取得手段203は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に複数番組の番組情報が記憶されている場合、選択番組情報検出手段202から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に一番組の番組情報が記憶されている場合、表示情報記憶手段109に記憶されている番組情報名と番組情報を読み出し、表示情報記憶手段109から読み出した番組情報名と番組情報と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。また、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力するものである。
【0045】
このように構成された本実施の形態による音声認識機能を有する番組情報表示装置の動作例について説明する。図4において、番組データベース101は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時等、番組に関する番組情報を番組毎に番組情報名と対応付けて格納する。番組データベース101の具体的な一例を(表6)に示す。
【0046】
【表6】
Figure 0004175141
【0047】
認識辞書104は、音声認識の対象語の文字列である認識対象文字列と認識対象文字列の意味を表す意味文字列とを対応付けて記憶し、認識対象文字列が番組情報の場合は、意味文字列として番組情報名を対応付けて記憶する。上記の例では、認識辞書104は、認識対象文字列と意味文字列とを一組とし、(この,指示語),(これの,指示語),(この時間の,指示語),(松下ニュース,番組名),(スペシャル,番組名),(10時,放送日時),(内容は?,内容表示命令),(番組は?,番組一覧表示命令),・・,(見たい。,選局命令)を記憶する。認識辞書104の内容を(表7)に示す。
【0048】
【表7】
Figure 0004175141
【0049】
マイクロホン105は、話者によって発話された音声を入力し、音声信号を出力する。上記の例では、2002年1月1日に話者が、「10時の番組は?」と発話し、マイクロホン105から音声信号「10時の番組は?」が入力されたとする。音声認識手段106は、マイクロホン105から音声信号が入力されると、入力された音声信号を、認識辞書104を用いて認識結果文字列と認識結果文字列に対応した意味文字列とに変換し、認識結果文字列と意味文字列とを認識結果として指示文字列検出手段108に出力する。上記の例では、音声認識手段106は、マイクロホン105から音声信号「10時の番組は?」が入力されると、音声信号「10時の番組は?」を(表7)の認識辞書104を用いて認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」に変換し、認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」を認識結果として指示文字列検出手段108に出力する。指示文字列記憶手段107は、指示代名詞または連体詞を含む文字列を指示文字列として記憶する。上記の例では、指示文字列記憶手段107の一例を(表4)に示す。(表4)に示すように、指示文字列として、(この、これの、・・、この時間の)が記憶されている。
【0050】
指示文字列検出手段108は、音声認識手段106から認識結果が入力されると、認識結果の認識結果文字列から指示文字列記憶手段107に記憶されている指示文字列を検出し、指示文字列が検出されなかった場合は、認識結果を表示情報取得手段203と検索キーワード抽出手段113に出力する。上記の例では、指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「10時/番組は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列は検出されないので、音声認識手段106から入力された認識結果のみを表示情報取得手段203と検索キーワード抽出手段113に出力する。検索キーワード抽出手段113は、指示文字列検出手段108から認識結果が入力されると、入力された認識結果から番組情報名と番組情報とを抽出し、抽出した番組情報名と番組情報を番組検索手段114に出力する。上記の例では、検索キーワード抽出手段113は、指示文字列検出手段108から認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」が入力されると、入力された意味文字列を参照して番組情報名「放送日時」と番組情報名「放送日時」に対応した番組情報「10時」を抽出し、番組情報名「放送日時」と番組情報「10時」を番組検索手段114に出力する。
【0051】
番組検索手段114は、検索キーワード抽出手段113から番組情報名と番組情報が入力されると、入力された番組情報に合った番組を番組データベース101から検索し、検索された番組の番組情報と番組情報名を表示情報取得手段203に出力する。上記の例では、番組検索手段114は、検索キーワード抽出手段113から番組情報名「放送日時」と番組情報「10時」が入力されると、番組情報「10時」を検索条件として(表6)の番組データベース101を検索し、その結果、番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)とを取得し、表示情報取得手段203に出力する。表示情報取得手段203は、指示文字列検出手段108から認識結果のみ入力される場合、番組検索手段114から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段203は、指示文字列検出手段108から認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」のみ入力されると、番組検索手段114から入力される番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)とを対応付けて表示情報記憶手段109に記憶し、番組検索手段114から入力された番組情報名(放送日時、放送局、番組名、番組内容)と番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と指示文字列検出手段108から入力された認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」とを表示画面作成手段111に出力する。(表8)に、表示情報取得手段203により更新された表示情報記憶手段109の内容を示す。
【0052】
【表8】
Figure 0004175141
【0053】
表示手段112は、入力される情報を表示する。表示画面作成手段111は、表示情報取得手段203から番組情報と番組情報名と認識結果が入力されると、入力された番組情報を入力された認識結果に応じて表示画面情報に変換し、表示画面情報を選択番組情報検出手段202と表示手段112に出力する。上記の例では、表示画面作成手段111は、表示情報取得手段203から番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「10時/番組は?」と意味文字列「放送日時/番組一覧表示命令」が入力されると、意味文字列「放送日時/番組一覧表示命令」に番組一覧表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)から番組を一覧表示する表示画面情報を作成し、作成した表示画面情報を選択番組情報検出手段202と表示手段112に出力する。ここで、番組一覧が表示された表示手段112の一例を図5に示す。
【0054】
入力手段201は、話者が表示手段112に表示されている複数の番組から1つの番組を選択するために、表示手段112の画面において選択する番組が表示されている位置情報が入力される。上記の例では、図5の表示手段112に表示されている番組から、番組名「松下ニュース」を選択するために、番組名「松下ニュース」をマウスでクリックしたとすると、表示手段112の画面においてマウスでクリックされた位置情報が選択番組情報検出手段202に出力される。選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報を表示画面情報から抽出し、抽出した番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、検出した番組情報と番組情報名とを表示情報取得手段203に出力する。上記の例では、選択番組情報検出手段202は、入力手段201から位置情報が入力され、表示画面作成手段111から表示画面情報が入力されると、入力された位置情報に対応する番組情報(松下ニュース、10001)を表示画面情報から抽出し、抽出した番組情報(松下ニュース、10001)に対応した番組の番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを表示情報記憶手段109から検出し、検出した番組の番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを表示情報取得手段203に出力する。
【0055】
さらに、上記の例において、話者が「これの内容は?」と発話したとし、マイクロホン105から音声信号「これの内容は?」が入力され、音声信号「これの内容は?」が音声認識手段106に出力されたとする。音声認識手段106は、マイクロホン105から入力された音声信号「これの内容は?」を(表7)の認識辞書104を用いて認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とに変換し、生成した認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」とを認識結果として指示文字列検出手段108に出力する。指示文字列検出手段108は、音声認識手段106から入力された認識結果文字列「これの/内容は?」から(表4)の指示文字列記憶手段107に記憶されている指示文字列「これの」を検出し、入力された認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と検出された指示文字列「これの」を表示情報取得手段203に出力する。
【0056】
表示情報取得手段203は、指示文字列検出手段108から認識結果と指示文字列が入力され、表示情報記憶手段109に複数番組の番組情報が記憶されている場合、選択番組情報検出手段202から入力される番組情報と番組情報名とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報と番組情報名と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。上記の例では、表示情報取得手段203は、指示文字列検出手段108から認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」と指示文字列「これの」が入力され、表示情報記憶手段109に複数番組の番組情報(2002.1.1/AM10:00〜AM11:00,10000,スペシャル,××××××)、(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)が記憶されているので、選択番組情報検出手段202から入力される番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)とを対応付けて表示情報記憶手段109に記憶し、さらに選択番組情報検出手段202から入力された番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と指示文字列検出手段108から入力された認識結果を表示画面作成手段111に出力する。ここで、表示情報取得手段203により更新された表示情報記憶手段109の内容を(表9)に示す。
【0057】
【表9】
Figure 0004175141
【0058】
さらに、上記の例では、表示画面作成手段111は、表示情報取得手段203から番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)と番組情報名(放送日時、放送局、番組名、番組内容)と認識結果である認識結果文字列「これの/内容は?」と意味文字列「指示語/内容表示命令」が入力されると、意味文字列「指示語/内容表示命令」に内容表示命令が含まれるため、入力された番組情報(2002.1.1/AM10:00〜AM11:00,10001,松下ニュース,○○○○○○)から番組内容を表示する表示画面情報を作成し、作成した表示画面情報を選択番組情報検出手段202と表示手段112に出力する。ここで、番組内容が表示された表示手段112の一例を図6に示す。
【0059】
なお、表示画面作成手段111は、表示情報取得手段203から複数の番組情報と番組情報名と認識結果が入力されると、入力された番組情報を認識結果に応じて一覧表示し、一覧表示した番組の一つを強調表示した表示画面情報に変換し、さらに、入力手段201から位置情報が入力されると、入力された位置情報に対応する番組情報を強調表示した表示画面情報を表示情報取得手段203から入力された複数の番組情報と番組情報名と認識結果から変換し直し表示手段112に出力するようにしてもよい。
【0060】
また、表示手段112に複数番組の番組情報が表示され、選択されている番組情報が強調表示されている場合に、入力手段201は、ボタンが備わった機器で構成されており、選択されている番組を変更するため話者によりボタンが押下された場合、押下されたボタンの情報を表示画面作成手段111に出力し、表示画面作成手段111は、入力手段201から入力されるボタン情報に対応して、強調表示する番組情報を変更した表示画面情報を表示情報取得手段203から入力された複数の番組情報と番組情報名と認識結果から変換し直し表示手段112と選択番組情報検出手段202に出力し、選択番組情報検出手段202は、表示画面作成手段111から表示画面情報が入力されると、入力された表示画面情報に強調表示された番組情報が存在する場合、強調表示された番組情報に対応した番組の番組情報と番組情報名とを表示情報記憶手段109から検出し、表示情報記憶手段109から検出された番組情報と番組情報名とを表示情報取得手段203に出力するようにしてもよい。
【0061】
また、本発明では、番組データベース101、表示情報記憶手段109は、録画されている番組や放送中の番組、放送予定の番組の番組名、番組内容、放送局、放送日時を格納しているとして説明したが、この例に限定されることなく、番組データベース101に、さらに、番組情報として番組の属するジャンル、出演者名を格納するようにしてもよい。
【0062】
本実施の形態によれば、複数番組の番組検索結果が表示されており、話者が複数の番組から選択した番組の番組情報をあらかじめ取得しておき、入力されたコマンド音声を音声認識した結果、認識結果に指示代名詞や連体詞が検出された場合、あらかじめ取得しておいた番組情報を用いて番組検索結果画面を作成し、表示することで、話者が表示されている複数の番組から選択した番組の番組情報を指示代名詞や連体詞を含んだコマンドを発話し、表示することができる。
【0063】
【発明の効果】
以上のように、本発明の音声認識機能を有する番組情報表示装置によれば、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示手段に表示されている番組の番組情報を表示することができる。
【0064】
また、本発明の音声認識機能を有する番組情報表示装置によれば、一番組に関する番組情報の一部分が表示手段に表示されている場合、話者は指示代名詞や連体詞を含んだコマンドを発話し、表示されている番組情報と異なる他の番組情報を表示することができる。
【0065】
また、本発明の音声認識機能を有する番組情報表示装置によれば、複数番組の番組情報が表示手段に表示され、指示代名詞や連体詞を含んだコマンドを話者が発話した場合、番組情報を表示することができない旨を表す表示画面や応答音声を話者に示すことができる。
【0066】
また、本発明の音声認識機能を有する番組情報表示装置によれば、複数番組の番組情報が表示手段に表示されている場合、話者は表示されている複数番組から一番組を選択し、指示代名詞や連体詞を含んだコマンドを発話して、選択した番組の表示されている番組情報と異なる他の番組情報を表示することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声認識機能を有する番組情報表示装置の構成を示す図
【図2】同番組情報表示装置の動作を表す表示例を示す図
【図3】同番組情報表示装置の動作を表す他の表示例を示す図
【図4】本発明の実施の形態2における音声認識機能を有する番組情報表示装置の構成を示す図
【図5】同番組情報表示装置の動作を表す表示例を示す図
【図6】同番組情報表示装置の動作を表す他の表示例を示す図
【符号の説明】
101 番組データベース
102 表示番組情報取得手段
103 機器情報記憶手段
104 認識辞書
105 マイクロホン
106 音声認識手段
107 指示文字列記憶手段
108 指示文字列検出手段
109 表示情報記憶手段
110、203 表示情報取得手段
111 表示画面作成手段
112 表示手段
113 検索キーワード抽出手段
114 番組検索手段
201 入力手段
202 選択番組情報検出手段[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a television receiver, a remote control transmitter for a television receiver, and a television receiver system. More specifically, the present invention relates to a system that allows a user to search for a program by voice.
[0002]
[Prior art]
As a conventional technique, a voice understanding system capable of operating a television by voice recognition has been disclosed (for example, see Patent Document 1).
[0003]
[Patent Document 1]
JP 2000-250575 A
[0004]
[Problems to be solved by the invention]
However, a conventional television receiver or the like having a voice recognition function recognizes a command voice uttered in order to control the television receiver or the like by a user, and includes a pronoun or a conjunction in the recognition result character string as a recognition result. The case was not done. For this reason, the user cannot utter a command including a demonstrative pronoun or a conjunction and search for and display a TV receiver operation and program information.
[0005]
The present invention has been made in view of such conventional problems, and its purpose is to previously acquire program information of a program displayed on a television receiver or a program included in a program search result. In addition, when a demonstrative pronoun or a conjunction is recognized by voice recognition, the user can search and display program information with natural spoken words including a demonstrative pronoun or a conjunction by referring to previously acquired program information. It is to provide a program information display device having a function.
[0006]
[Means for Solving the Problems]
According to the first aspect of the present invention, there is provided a recognition dictionary for storing a speech recognition target word, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition of the speech signal using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit Detection means; display means for displaying a program or a program information screen of the program; equipment information storage means for storing the status of the equipment such as the input source, broadcast station, and current time of the displayed program; Using the state of the device stored in the device information storage means, the display program information acquisition means for acquiring and storing program information of the program being viewed or played on the display means from the program database, the program and the Display screen creating means for converting program information of the program into display screen information and outputting it to the display means, and when the instruction character string detecting means detects a character string including a pronoun or a conjunction, the display program information acquiring means And a display information acquisition means for reading out the program information stored in the display screen and outputting it to the display screen creation means.
[0007]
According to a second aspect of the present invention, there is provided a recognition dictionary for storing a target word for speech recognition, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit Detection means, display means for displaying a program or program information screen, display information storage means for storing program information displayed on the display means, and indication by the instruction character string detection means When a character string including a noun or a conjunction is not detected, search keyword extraction means for extracting a keyword indicating program information from the recognition result character string obtained by the voice recognition means, and a keyword extracted by the search keyword extraction means The program search means for acquiring and storing all program information of the corresponding program from the program database, and when the instruction character string detection means does not detect a character string including a pronoun or a noun is stored in the program search means. The program information is read and stored in the display information storage means, and when the instruction character string detection means detects a character string including an indicating pronoun or a conjunction, a display for reading the program information from the display information storage means Information acquisition means and program information read by the display information acquisition means as display screen information Further comprising a display screen creation means for outputting converted into the display means is a program information display device having a voice recognition function, characterized in.
[0008]
According to a third aspect of the present invention, in the program information display device having the voice recognition function according to the second aspect, the program information acquired by the program search means is program information of a plurality of programs. To do.
[0009]
According to a fourth aspect of the present invention, in the program information display device having the voice recognition function according to the third aspect, the display information acquisition means detects a character string including a pronoun or noun by the instruction character string detection means. When the information of a plurality of programs is read from the display information storage means, warning screen information or warning sound indicating that the program search result cannot be displayed is generated and displayed on the display means.
[0010]
According to a fifth aspect of the present invention, there is provided a recognition dictionary for storing a target word for speech recognition, a microphone for converting speech uttered by a speaker into a speech signal, and speech recognition using the recognition dictionary. Voice recognition means for converting into a recognition result character string that is a character string of the target word, a program database for storing program information such as program name, program content, broadcast station name, broadcast date and time, and a pronoun or noun An instruction character string storage unit for storing a character string, and an instruction character string for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from the recognition result character string obtained by the voice recognition unit If the detection means, the display means for displaying the program or the program information screen, and the character string including the pronoun or noun is not detected by the instruction character string detection means, the voice recognition means Search keyword extraction means for extracting a keyword indicating program information from the obtained recognition result character string, and all program information of programs corresponding to the keyword extracted by the search keyword extraction means is acquired from the program database and stored. Program search means, display information storage means for storing program information displayed on the display means, and when the program information is input, the input program information is converted into display screen information and stored, and the display Display screen generating means for outputting screen information to the display means, and a display position of the program information selected by the speaker from the plurality of program information on the display means when a plurality of program information is displayed on the display means Input means for reading the display screen information stored in the display screen creation means, and the positional information input from the input means Corresponding program information is specified from the display screen information, program information relating to the program of the specified program information is acquired from the display information storage means and stored, and a designated pronoun or When a character string including a conjunction is not detected, program information stored in the program search means is read out and stored in the display information storage means, the program information is output to the display screen creation means, and the instruction When a character string including a demonstrative pronoun or a conjunction is detected by the character string detection means, program information is read from the selected program information detection means and stored in the display storage means, and the program information is generated in the display screen creation means Display information acquisition means for outputting to a program information display device having a voice recognition function.
[0011]
In the above means, the program information of the program displayed on the display means is acquired in advance by the display program information acquisition means, the command speech uttered by the speaker is recognized by the voice recognition means, and the voice recognition result is indicated. When a character string including pronouns and conjunctions is detected by the instruction character string detection means and the program search screen is not displayed on the display means, the speaker can indicate the instruction pronoun by displaying the program information acquired in advance. Or a command including a conjunction, and the program information of the program displayed on the display means can be displayed.
[0012]
When program information relating to one program is retrieved by the program retrieval means, the program information retrieved by the display information acquisition means is stored in the display information storage means, and the retrieved program information is displayed on the display means. Next, when the command speech uttered by the speaker is recognized by the speech recognition means, and the character string including the pronoun or noun in the speech recognition result is detected by the instruction character string detection means, the display information is displayed in advance. By displaying the program information stored in the storage means, the speaker can speak a command including a demonstrative pronoun and a conjunction and display other program information different from the displayed program information.
[0013]
In addition, program information of a plurality of programs is displayed on the display means, the program information of the displayed plurality of programs is stored in the display information storage means, and then the command voice uttered by the speaker is voiced by the voice recognition means. When the instruction character string detection means detects a character string that includes a pronoun or a noun in the speech recognition result, the program information of a plurality of programs stored in the display information storage means is read in advance. When the display information acquisition means detects that the program information is displayed on the display means, a display screen or response sound indicating that the program information cannot be displayed because the program indicated by the pronoun or synjunction cannot be specified. Can be shown to the speaker.
[0014]
The program information of a plurality of programs is displayed on the display means, the program information of the displayed plurality of programs is stored in the display information storage means, and a program is selected from the plurality of programs displayed on the display means. The program selected by the speaker is specified from the position information input from the input means for selection and the display screen information displayed on the display means, and the program information of the specified program is stored as display information by the selected program information detection means. By acquiring the program information and displaying the acquired program information, the speaker selects one program from a plurality of displayed programs, utters a command including a pronoun or a conjunction, and program information of the selected program Can be displayed.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
(Embodiment 1)
Hereinafter, a program information display apparatus having a voice recognition function according to Embodiment 1 of the present invention will be described with reference to the drawings.
[0016]
FIG. 1 is a configuration diagram of a program information display apparatus having a voice recognition function according to Embodiment 1 of the present invention. The program information display apparatus according to the present embodiment includes a program database 101, display program information acquisition means 102, device information storage means 103, recognition dictionary 104, microphone 105, voice recognition means 106, instruction character string storage means 107, instruction character string. It comprises detection means 108, display information storage means 109, display information acquisition means 110, display screen creation means 111, display means 112, search keyword extraction means 113, and program search means 114.
[0017]
The program database 101 stores program information related to a program such as a recorded program, a program being broadcast, a program name of a program scheduled to be broadcast, a program content, a broadcast station, a broadcast date and time, and the program information name for each program. To do. The device information storage means 103 stores the state of the television such as the input source of the program displayed on the television, the broadcasting station, and the current time. The display program information acquisition unit 102 acquires the input source, the broadcasting station, and the current time from the device information storage unit 103, and displays them on the current TV from the program database 101 using the acquired input source, the broadcasting station, and the current time. The program information and program information name of a program that is present are acquired. The recognition dictionary 104 stores a recognition target character string that is a character string of a target word for speech recognition in association with a semantic character string that represents the meaning of the recognition target character string, and when the recognition target character string is program information, A program information name is associated and stored as a semantic character string. The microphone 105 inputs voice uttered by a speaker and outputs a voice signal. The voice recognition means 106 converts the voice signal input from the microphone 105 into a semantic character string corresponding to the recognition result character string using the recognition dictionary 104, and recognizes the recognition result character string and the semantic character string. Is output as a recognition result.
[0018]
The instruction character string storage unit 107 stores a character string including an instruction pronoun or a conjunction as an instruction character string. When the recognition result is input from the voice recognition unit 106, the instruction character string detection unit 108 detects the instruction character string stored in the instruction character string storage unit 107 from the recognition result character string of the recognition result, and indicates the instruction character string. If the detected character is detected, the input recognition result and the detected instruction character string are output to the display information acquisition means 110. If the instruction character string is not detected, the recognition result is displayed on the display information acquisition means 110 and the search keyword. This is output to the extraction means 113.
[0019]
The display information storage unit 109 stores the program information of the program on the search result screen displayed on the display unit 112 in association with the program information name. The display information acquisition unit 110 receives the recognition result and the instruction character string from the instruction character string detection unit 108, and the program input from the display program information acquisition unit 102 when the program information is not stored in the display information storage unit 109. The information and the program information name are associated with each other and stored in the display information storage unit 109, and the program information input from the display program information acquisition unit 102, the program information name, and the recognition result input from the instruction character string detection unit 108 are displayed. Output to the screen creation means 111. When the recognition result and the instruction character string are input from the instruction character string detection unit 108 and the program information is stored in the display information storage unit 109, the program information name and the program information are read from the display information storage unit 109. The read program information, the program information name, and the recognition result input from the instruction character string detection unit 108 are output to the display screen creation unit 111. When only the recognition result is input from the instruction character string detection unit 108, the program information input from the program search unit 114 and the program information name are stored in the display information storage unit 109 in association with each other. The input program information, the program information name, and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111.
[0020]
The display means 112 is composed of a CRT display, a liquid crystal display (LCD), a plasma display panel (PDP) or the like, and displays input information. When the display information acquisition unit 110 receives the program information, the program information name, and the recognition result, the display screen creation unit 111 converts the input program information into display screen information according to the input recognition result, and displays the display unit. 112 is displayed. When the recognition result is input from the instruction character string detection unit 108, the search keyword extraction unit 113 extracts the program information name and the program information from the input recognition result. When the program information name and the program information are input from the search keyword extracting unit 113, the program search unit 114 searches the program database 101 for a program that matches the input program information, and the program information and program of the searched program are searched. The information name is output to the display information acquisition unit 110.
[0021]
An operation example of the program information display apparatus having the voice recognition function according to this embodiment configured as described above will be described. In FIG. 1, a program database 101 stores program information related to a program such as a recorded program, a program being broadcast, a program name of a program scheduled to be broadcast, a program content, a broadcast station, a broadcast date and time, and the program information name for each program. Store in association.
[0022]
The contents of the program database 101 are shown in (Table 1).
[0023]
[Table 1]
Figure 0004175141
[0024]
The display program information acquisition unit 102 acquires the input source, broadcast station, and current time from the device information storage unit 103, and displays the input source, broadcast station, and current time on the current TV from the program database 101. The program information and program information name of the existing program are acquired and output to the display information acquisition means 110. In the above example, it is assumed that a speaker is watching a program called “Special” being broadcast on the broadcasting station 10000 at 10:30 am on January 1, 2002. In this case, the device information storage means 103 stores the input source and broadcasting station of the program displayed on the television, and (TV, 10000, 2002.2.1.1/AM10:30) as the current time. The contents of the device information storage means 103 are shown in (Table 2).
[0025]
[Table 2]
Figure 0004175141
[0026]
The display program information acquisition unit 102 acquires the input source, the broadcasting station, and the current time from the device information storage unit 103 of (Table 2), and uses the acquired (TV, 10000, 2002.2.1.1/AM10:30). The program information name (broadcast date and time, broadcast station, program name, program content) of the program broadcast at 10:30 am on January 1, 2002 from the program database 101 of (Table 1) The program information corresponding to the program information name (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) is acquired and output to the display information acquisition means 110. The recognition dictionary 104 stores a recognition target character string that is a character string of a target word for speech recognition in association with a semantic character string that represents the meaning of the recognition target character string, and when the recognition target character string is program information, The program information name is stored in association with the meaning character string. In the above example, the recognition dictionary 104 sets a recognition target character string and a semantic character string as a set, and (this instruction word), (this instruction word), (this instruction word), (Matsushita) (News, Program name), (Special, Program name), (Matsushita Sports, Program name), (What is the content, Content display command), (From what time ?, Content display command), ... Instruction). (Table 3) shows the contents of the recognition dictionary 104.
[0027]
[Table 3]
Figure 0004175141
[0028]
The microphone 105 inputs a voice uttered by a speaker and outputs a voice signal. In the above example, it is assumed that the speaker utters “What is this?” And an audio signal “What is this?” Is input from the microphone 105. When a speech signal is input from the microphone 105, the speech recognition unit 106 converts the input speech signal into a recognition result character string and a semantic character string corresponding to the recognition result character string using the recognition dictionary 104, The recognition result character string and the meaning character string are output as the recognition result to the instruction character string detection means 108. In the above example, when the voice signal “What is this?” Is input from the microphone 105, the voice recognition means 106 uses the recognition dictionary 104 in Table 3 to output the voice signal “What is this?” The recognition result character string “What is this / contents?” And the semantic character string “instruction word / contents display command” are converted into a recognition result character string “What is this / contents?” And the semantic character string “instruction word / contents display” "Command" is output to the designated character string detection means 108 as a recognition result. The instruction character string storage unit 107 stores a character string including an instruction pronoun or a conjunction as an instruction character string. In the above example, an example of the instruction character string storage unit 107 is shown in (Table 4).
[0029]
[Table 4]
Figure 0004175141
[0030]
As shown in (Table 4), (this, this, ..., this time) is stored as the instruction character string. When the recognition result is input from the voice recognition unit 106, the instruction character string detection unit 108 detects the instruction character string stored in the instruction character string storage unit 107 from the recognition result character string of the recognition result, and indicates the instruction character string. Is detected, the input recognition result and the detected instruction character string are output to the display information acquisition means 110. In the above example, when the recognition result character string “What is this / contents?” And the semantic character string “instruction word / content display command” which are recognition results are input from the voice recognition means 106, the recognition result character string “ "/ What is the content?", The instruction character string "Kono" stored in the instruction character string storage means 107 of (Table 4) is detected, the recognition result input from the voice recognition means 106 and the detected instruction character The column “this” is output to the display information acquisition unit 110. The display information storage unit 109 stores the program information of the program on the search result screen displayed on the display unit 112 in association with the program information name. In the above example, since the search result screen is not displayed on the display unit 112, it is assumed that no program information is stored in the display information storage unit 109. When the recognition result and the instruction character string are input from the instruction character string detection unit 108 and no program information is stored in the display information storage unit 109, the display information acquisition unit 110 receives the program input from the display program information acquisition unit 102. The information and the program information name are associated with each other and stored in the display information storage unit 109, and the program information, the program information name input from the display program information acquisition unit 102, and the recognition result input from the instruction character string detection unit 108 Is output to the display screen creating means 111. In the above example, the display information acquisition unit 110 recognizes the recognition result character string “What is this / contents?” As the recognition result from the instruction character string detection unit 108, the meaning character string “instruction word / content display command”, and the instruction character. When the column “Konono” is input, program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxx) inputted from the display program information acquisition means 102 Program information names (broadcast date and time, broadcast station, program name, program content) are associated with each other and stored in the display information storage means 109. Further, the input program information (2002.2.1 / AM10: 00 to AM11: 00, 10000, special, xxxxxx, program information name (broadcast date, broadcast station, program name, program content) and recognition result character string “ This / contents "And it outputs the meaning character string" instruction language / content display instruction "on the display screen creation means 111. Here, the contents of the display information storage means 109 updated by the display information acquisition means 110 are shown in (Table 5).
[0031]
[Table 5]
Figure 0004175141
[0032]
The display unit 112 displays input information. When the display information acquisition unit 110 receives the program information, the program information name, and the recognition result, the display screen creation unit 111 converts the input program information into display screen information according to the input recognition result, and displays the display information. Program information is displayed on the means 112. In the above example, the display screen creation unit 111 sends the program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) and the program information name from the display information acquisition unit 110. When a recognition result character string “What is this / contents?” And a semantic character string “indicator / content display command” are input as (reception date / time, broadcast station, program name, program content) and recognition result Since the column “instruction word / content display command” includes a content display command, the input program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxx) A screen for displaying the program contents is created and displayed on the display means 112. FIG. 2 shows an example of the display means 112 on which the program content is displayed.
[0033]
Further, in the above example, if the speaker utters “What time is the special?”, An audio signal “What time is the special?” Is input from the microphone 105, and this audio signal “What time is the special?” It is assumed that the data is output to the recognition unit 106. The voice recognition means 106 uses the recognition dictionary 104 in Table 3 to recognize the voice signal “special / from what time?” And the meaning character string “program” input from the microphone 105. "Name / time display command" is output to the designated character string detection means 108 as a recognition result. When the recognition result is input from the voice recognition unit 106, the instruction character string detection unit 108 detects the instruction character string stored in the instruction character string storage unit 107 from the recognition result character string of the recognition result, and indicates the instruction character string. Is not detected, the recognition result is output to the display information acquisition means 110 and the search keyword extraction means 113. In the above example, the instruction character string detection unit 108 uses the recognition result character string “special / from what time?” Input from the voice recognition unit 106 to the instruction stored in the instruction character string storage unit 107 of (Table 4). Since the character string is not detected, only the recognition result input from the voice recognition unit 106 is output to the display information acquisition unit 110 and the search keyword extraction unit 113.
[0034]
When the recognition result is input from the instruction character string detection unit 108, the search keyword extraction unit 113 extracts the program information name and the program information from the input recognition result, and the extracted program information name and the program information are used as the program search unit. To 114. In the above example, the search keyword extraction unit 113 receives the recognition result character string “special / from what time?” And the semantic character string “program name / time display command” as the recognition result from the instruction character string detection unit 108. The program information name “program name” and the program information “special” corresponding to the program information name “program name” are extracted with reference to the input semantic character string, and the program information name “program name” and the program information “ "Special" is output to the program search means 114. When the program information name and the program information are input from the search keyword extracting unit 113, the program search unit 114 searches the program database 101 for a program that matches the input program information, and the program information and program of the searched program are searched. The information name is output to the display information acquisition unit 110. In the above example, when the program information name “program name” and the program information “special” are input from the search keyword extraction unit 113, the program search unit 114 uses the program name “special” as a search condition (Table 1). The program database 101 is searched, and as a result, program information name (broadcast date and time, broadcast station, program name, program content) and program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xx Xxx) and output to the display information acquisition means 110.
[0035]
When only the recognition result is input from the instruction character string detection unit 108, the display information acquisition unit 110 stores the program information input from the program search unit 114 in association with the program information name in the display information storage unit 109, The program information input from the program search means 114, the program information name, and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111. In the above example, the display information acquisition unit 110 receives only the recognition result character string “special / from what time?” And the semantic character string “program name / time display command” as the recognition result from the instruction character string detection unit 108. And the program information name (broadcast date and time, broadcast station, program name, program content) and program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xx) input from the program search means 114 Xxx) are stored in the display information storage means 109 in association with each other, and the program information name (broadcast date and time, broadcast station, program name, program content) and program information (2002.1) input from the program search means 114 are stored. .1 / AM10: 0 to AM11: 00,10000, special, xxxxxx) and the recognition result character string “special / from what time?” Inputted from the instruction character string detection means 108 and a meaning character string And outputs the program name / time display instruction "on the display screen creation means 111. Table 5 shows the contents of the display information storage unit 109 updated by the display information acquisition unit 110.
[0036]
Further, in the above example, the display screen creation unit 111 receives the program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) from the display information acquisition unit 110 and the program information. When the name (broadcast date and time, broadcast station, program name, program content) and recognition result character string “special / from what time?” And the semantic character string “program name / time display command” are input, the meaning character Since a time display command is included in the column “program name / time display command”, from the input program information (2002.2.1 / AM10: 00 to AM 11:00, 10000, special, xxxxxx) A screen for displaying time information is created and displayed on the display means 112. FIG. 3 shows an example of the display means 112 on which time information is displayed.
[0037]
Furthermore, in the above example, it is assumed that the speaker utters “What is this?”, And the voice signal “What is this?” Is input from the microphone 105, and this voice signal “What is this?” It is assumed that the data is output to the recognition unit 106. The voice recognition means 106 uses the recognition dictionary 104 in Table 3 to recognize the voice signal “What is this?” Input from the microphone 105 and the recognition result character string “What is this / what?” And the meaning character string “ The instruction word / content display command "is output to the instruction character string detecting means 108 as a recognition result. The instruction character string detecting unit 108 determines the instruction character string “this” stored in the instruction character string storage unit 107 of (Table 4) from the recognition result character string “What is this?” Input from the voice recognition unit 106. ”Is detected, and the recognition result character string“ this / contents? ”That is the input recognition result, the meaning character string“ instruction word / content display command ”, and the detected instruction character string“ this ”are displayed. It outputs to the information acquisition means 110.
[0038]
When the recognition result and the instruction character string are input from the instruction character string detection unit 108 and the program information is stored in the display information storage unit 109, the display information acquisition unit 110 receives the program information name and the program from the display information storage unit 109. Information is read, and the read program information, the program information name, and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111. In the above example, the display information acquisition unit 110 recognizes the recognition result character string “What is this / contents?” As the recognition result from the instruction character string detection unit 108, the meaning character string “instruction word / content display command”, and the instruction character. Since the column “Konono” is input and the program information is stored in the display information storage unit 109 of (Table 5), the program information name (broadcast date, broadcast station, program name, program content) is displayed from the display information storage unit 109. ) And program information (2002.2.1 / AM10: 00 to AM 11:00, 10000, special, xxxxxxx), and the read program information name (broadcast date, broadcast station, program name, program) Contents), program information (2002.2.1 / AM10: 00 to AM 11:00, 10000, special, xxxxxxx) and the recognition result character string “this / What is the content? " And it outputs the character string "instruction language / content display instruction" on the display screen creation means 111.
[0039]
Further, in the above example, the display screen creation unit 111 receives the program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) from the display information acquisition unit 110 and the program information. When a name (broadcast date / time, broadcast station, program name, program content) and recognition result character string “What is this / contents?” And a semantic character string “indicator / content display command” are input Since the content display command is included in the character string “instruction word / content display command”, the input program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) A screen for displaying the contents of the program is created and displayed on the display means 112. Here, an example of the display means 112 on which the program content is displayed is shown in FIG.
[0040]
In the case where program information of a plurality of programs is displayed on the display unit 112 as a program search result, and the program information of the plurality of displayed programs is stored in the display information storage unit 109, display information acquisition unit A warning screen 110 indicates that the program search result cannot be displayed on the display unit 112 when the recognition result and the instruction character string are input from the instruction character string detection unit 108 and the program information of a plurality of programs is read from the display information storage unit 109. May be displayed on the display unit 112, or a warning sound indicating that the program search result cannot be displayed on the display unit 112 may be generated and reproduced from the speaker.
[0041]
According to this embodiment, the program information of the program displayed on the TV or the program search result program is acquired in advance, and the command voice input is recognized as a result of speech recognition. If detected, a program search result screen is created and displayed using the program information acquired in advance, so that the speaker speaks a command including a pronoun or a synonym, and operates the TV receiver. Program information can be searched and displayed.
[0042]
(Embodiment 2)
A program information display apparatus having a voice recognition function according to Embodiment 2 of the present invention will be described with reference to the drawings. In the first embodiment described above, the apparatus is described as a device in which a speaker speaks a command including a pronoun or a conjunction, and searches and displays program information of a displayed program or a search result program. However, in the program information display apparatus having the voice recognition function of the present embodiment, when program information of a plurality of programs is displayed on the display means, the speaker selects one program from the plurality of programs, and this selection is made. Program information different from the displayed program information of the selected program is displayed when a speaker speaks a command including a pronoun or a conjunction.
[0043]
FIG. 4 is a diagram showing a configuration of a program information display apparatus having a voice recognition function according to the second embodiment. Here, blocks having the same reference numerals as those in Embodiment 1 perform the same operations, and detailed descriptions thereof are omitted. The program information display apparatus having a voice recognition function according to the present embodiment includes a program database 101, a recognition dictionary 104, a microphone 105, a voice recognition means 106, an instruction character string storage means 107, an instruction character string detection means 108, and a display information storage means. 109, display screen creation means 111, display means 112, search keyword extraction means 113, program search means 114, input means 201, selected program information detection means 202, and display information acquisition means 203.
[0044]
The input unit 201 includes a mouse, a touch panel, a keyboard, a remote controller, and the like. In order to select one program from a plurality of programs when a speaker displays program information of a plurality of programs on the display unit 112. The position information on which the program to be selected is displayed on the screen of the display means 112 is input. When the position information is input from the input unit 201 and the display screen information is input from the display screen creation unit 111, the selected program information detection unit 202 extracts program information corresponding to the input position information from the display screen information. The program information and program information name of the program corresponding to the extracted program information are detected from the display information storage means 109, and the detected program information and program information name are output to the display information acquisition means 203. The display information acquisition means 203 receives the recognition result and the instruction character string from the instruction character string detection means 108, and inputs from the selected program information detection means 202 when the program information of a plurality of programs is stored in the display information storage means 109. The program information and the program information name are stored in the display information storage means 109 in association with each other, and the program information, program information name, and instruction character string detection means 108 inputted from the selected program information detection means 202 are inputted. The recognition result is output to the display screen creation unit 111. When the recognition result and the instruction character string are input from the instruction character string detection unit 108 and the program information of one program is stored in the display information storage unit 109, the program information name stored in the display information storage unit 109 is stored. And the program information name read from the display information storage unit 109, the program information, and the recognition result input from the instruction character string detection unit 108 are output to the display screen creation unit 111. When only the recognition result is input from the instruction character string detection unit 108, the program information input from the program search unit 114 and the program information name are stored in the display information storage unit 109 in association with each other. The input program information, the program information name, and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111.
[0045]
An operation example of the program information display apparatus having the voice recognition function according to this embodiment configured as described above will be described. In FIG. 4, a program database 101 stores program information related to a program such as a recorded program, a program being broadcast, a program name of a program scheduled to be broadcast, a program content, a broadcast station, a broadcast date and time, as a program information name for each program. Store in association. A specific example of the program database 101 is shown in (Table 6).
[0046]
[Table 6]
Figure 0004175141
[0047]
The recognition dictionary 104 stores a recognition target character string that is a character string of a target word for speech recognition in association with a semantic character string that represents the meaning of the recognition target character string, and when the recognition target character string is program information, The program information name is stored in association with the meaning character string. In the above example, the recognition dictionary 104 sets a recognition target character string and a semantic character string as a set, and (this instruction word), (this instruction word), (this instruction word), (Matsushita) (News, program name), (special, program name), (10 o'clock, broadcast date and time), (contents ?, content display command), (programs ?, program list display command), ... (I want to see.) (Channel selection instruction) is stored. The contents of the recognition dictionary 104 are shown in (Table 7).
[0048]
[Table 7]
Figure 0004175141
[0049]
The microphone 105 inputs a voice uttered by a speaker and outputs a voice signal. In the above example, it is assumed that the speaker uttered “What is the program at 10 o'clock” on January 1, 2002, and an audio signal “What is the program at 10 o'clock?” Is input from the microphone 105. When a speech signal is input from the microphone 105, the speech recognition unit 106 converts the input speech signal into a recognition result character string and a semantic character string corresponding to the recognition result character string using the recognition dictionary 104, The recognition result character string and the meaning character string are output as the recognition result to the instruction character string detection means 108. In the above example, when the voice signal “What is the program at 10 o'clock?” Is input from the microphone 105, the voice recognition means 106 determines the voice signal “What is the program at 10 o'clock?” The recognition result character string “10 o'clock / program?” And the meaning character string “broadcast date / time / program list display command” are converted into the recognition result character string “10 o'clock / program?” And the semantic character string “broadcast date / time”. / Program list display command "is output to the instruction character string detection means 108 as a recognition result. The instruction character string storage unit 107 stores a character string including an instruction pronoun or a conjunction as an instruction character string. In the above example, an example of the instruction character string storage unit 107 is shown in (Table 4). As shown in (Table 4), (this, this, ..., this time) is stored as the instruction character string.
[0050]
When the recognition result is input from the voice recognition unit 106, the instruction character string detection unit 108 detects the instruction character string stored in the instruction character string storage unit 107 from the recognition result character string of the recognition result, and indicates the instruction character string. Is not detected, the recognition result is output to the display information acquisition means 203 and the search keyword extraction means 113. In the above example, the instruction character string detection means 108 is stored in the instruction character string storage means 107 of (Table 4) from the recognition result character string “10 o'clock / program?” Input from the voice recognition means 106. Since the instruction character string is not detected, only the recognition result input from the voice recognition unit 106 is output to the display information acquisition unit 203 and the search keyword extraction unit 113. When the recognition result is input from the instruction character string detection unit 108, the search keyword extraction unit 113 extracts the program information name and the program information from the input recognition result, and searches the program information name and the program information for the extracted program information name. Output to the means 114. In the above example, the search keyword extraction unit 113 receives the recognition result character string “10 o'clock / program?” And the semantic character string “broadcast date / program list display command” as the recognition result from the instruction character string detection unit 108. Then, the program information name “broadcast date and time” and the program information name “10 o'clock” corresponding to the program information name “broadcast date and time” are extracted with reference to the input semantic character string, and the program information name “broadcast date and time” is extracted. The program information “10 o'clock” is output to the program search means 114.
[0051]
When the program information name and the program information are input from the search keyword extracting unit 113, the program search unit 114 searches the program database 101 for a program that matches the input program information, and the program information and program of the searched program are searched. The information name is output to the display information acquisition unit 203. In the above example, when the program information name “broadcast date” and the program information “10 o'clock” are input from the search keyword extraction unit 113, the program search unit 114 uses the program information “10 o'clock” as a search condition (Table 6). ) And the program information name (broadcast date and time, broadcast station, program name, program content) and program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, Xxxxxxx), (2002.2.1 / AM10: 00 to AM11: 00, 10001, Matsushita News, OOXXX) and output to the display information acquisition means 203. When only the recognition result is input from the instruction character string detection unit 108, the display information acquisition unit 203 stores the program information input from the program search unit 114 in association with the program information name in the display information storage unit 109, The program information input from the program search means 114, the program information name, and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111. In the above example, the display information acquisition unit 203 inputs only the recognition result character string “10 o'clock / program?” And the meaning character string “broadcast date / program list display command” as the recognition result from the instruction character string detection unit 108. Then, the program information name (broadcast date / time, broadcast station, program name, program content) and program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, Xxxxxxx), (2002.2.1 / AM10: 00 to AM11: 00, 10001, Matsushita News, OOXXX) and stored in the display information storage means 109, and the program Program information name (broadcast date and time, broadcast station, program name, program content) and program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx inputted from the search means 114 × , (2002.2.1 / AM10: 00 to AM11: 00, 10001, Matsushita News, XXXXXX) and the recognition result character string "10 o'clock / program?" ”And the meaning character string“ broadcast date / time / program list display command ”are output to the display screen creation unit 111. Table 8 shows the contents of the display information storage unit 109 updated by the display information acquisition unit 203.
[0052]
[Table 8]
Figure 0004175141
[0053]
The display unit 112 displays input information. When the program information, the program information name, and the recognition result are input from the display information acquisition unit 203, the display screen creation unit 111 converts the input program information into display screen information according to the input recognition result, and displays it. The screen information is output to the selected program information detection unit 202 and the display unit 112. In the above example, the display screen creation means 111 receives the program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx) from the display information acquisition means 203, (2002. 1.1 / AM 10: 00 to AM 11:00, 10001, Matsushita News, ○○○○○○○), program information name (broadcast date and time, broadcast station, program name, program content) and recognition result character string that is a recognition result When “10 o'clock / program?” And the meaning character string “broadcast date / time / program list display command” are input, the meaning character string “broadcast date / time / program list display command” includes the program list display command. Program information (2002.2.1 / AM10: 0 to AM11: 00,10000, Special, XXXXXX), (2002.2.1 / AM10: 0 to AM11: 00, 10001, Matsushita New , ○○○○○○) creates a display screen information for displaying a list of program from outputs display screen information created with the display unit 112 selects program information detection unit 202. Here, an example of the display means 112 on which the program list is displayed is shown in FIG.
[0054]
The input unit 201 receives position information on which a program to be selected is displayed on the screen of the display unit 112 in order for the speaker to select one program from a plurality of programs displayed on the display unit 112. In the above example, if the program name “Matsushita News” is clicked with the mouse to select the program name “Matsushita News” from the programs displayed on the display means 112 in FIG. The position information clicked with the mouse is output to the selected program information detecting means 202. When the position information is input from the input unit 201 and the display screen information is input from the display screen creation unit 111, the selected program information detection unit 202 extracts program information corresponding to the input position information from the display screen information. The program information and program information name of the program corresponding to the extracted program information are detected from the display information storage means 109, and the detected program information and program information name are output to the display information acquisition means 203. In the above example, when the position information is input from the input unit 201 and the display screen information is input from the display screen creation unit 111, the selected program information detection unit 202 receives program information (Matsushita) corresponding to the input position information. News, 10001) is extracted from the display screen information, and program information (2002.2.1 / AM10: 0 to AM11: 00, 10001, Matsushita News, ○) corresponding to the extracted program information (Matsushita News, 10001) XX) and the program information name (broadcast date / time, broadcast station, program name, program content) are detected from the display information storage means 109, and the program information (2002.2.1 / AM10: 00) of the detected program is detected. -AM 11:00, 10001, Matsushita News, OOXX) and program information name (broadcast date and time, broadcast station, program name, program content) in the display information acquisition means 203 Forces.
[0055]
Further, in the above example, it is assumed that the speaker utters “What is this?”, The voice signal “What is this?” Is input from the microphone 105, and the voice signal “What is this?” Assume that the data is output to the means 106. The voice recognition means 106 uses the recognition dictionary 104 in Table 7 to recognize the voice signal “What is this?” Input from the microphone 105 and the recognition result character string “What is this / what?” And the meaning character string “ The recognition result character string “What is this / contents?” And the semantic character string “instruction word / content display command” are converted into the instruction character string detection means 108 as a recognition result. Output. The instruction character string detecting unit 108 determines the instruction character string “this” stored in the instruction character string storage unit 107 of (Table 4) from the recognition result character string “What is this?” Input from the voice recognition unit 106. ”Is detected, and the recognition result character string“ this / contents? ”That is the input recognition result, the meaning character string“ instruction word / content display command ”, and the detected instruction character string“ this ”are displayed. It outputs to the information acquisition means 203.
[0056]
The display information acquisition means 203 receives the recognition result and the instruction character string from the instruction character string detection means 108, and inputs from the selected program information detection means 202 when the program information of a plurality of programs is stored in the display information storage means 109. The program information and the program information name are stored in the display information storage means 109 in association with each other, and the program information, program information name, and instruction character string detection means 108 inputted from the selected program information detection means 202 are inputted. The recognition result is output to the display screen creation unit 111. In the above example, the display information acquisition unit 203 recognizes the recognition result character string “What is this / contents?” As the recognition result from the instruction character string detection unit 108, the meaning character string “instruction word / content display command”, and the instruction character. The column “Konono” is input, and the program information (2002.2.1 / AM10: 0 to AM11: 00,10000, special, xxxxxxx), (2002. 1.1 / AM10: 00 to AM11: 00, 10001, Matsushita News, OOOOXX) are stored, so that program information (2002.2.1 / 1 /) input from the selected program information detecting means 202 is stored. AM 10:00 to AM 11:00, 10001, Matsushita News, ○○○○○○) and the program information name (broadcast date and time, broadcast station, program name, program content) are stored in the display information storage means 109 in association with each other. , In addition, program information (2002.2.1 / AM10: 00 to AM11: 00, 10001, Matsushita News, ○○○○○○) and program information name (broadcast date and time, broadcast) input from the selected program information detection means 202 Station, program name, program content) and the recognition result input from the instruction character string detection means 108 are output to the display screen creation means 111. Here, the contents of the display information storage means 109 updated by the display information acquisition means 203 are shown in (Table 9).
[0057]
[Table 9]
Figure 0004175141
[0058]
Further, in the above example, the display screen creation unit 111 receives the program information (2002.2.1 / AM10: 0 to AM11: 00, 10001, Matsushita News, OOXXX) from the display information acquisition unit 203. When a program information name (broadcast date / time, broadcast station, program name, program content) and a recognition result character string “what is this / contents?” And a semantic character string “indicator / content display command” are input. Since the content display command is included in the meaning character string “instruction word / content display command”, the input program information (2002.2.1 / AM10: 0 to AM11: 00, 10001, Matsushita News, ○○○○ The display screen information for displaying the program content is created from (○○), and the created display screen information is output to the selected program information detection means 202 and the display means 112. Here, an example of the display means 112 on which the program content is displayed is shown in FIG.
[0059]
When a plurality of program information, program information names, and recognition results are input from the display information acquisition unit 203, the display screen creation unit 111 displays the input program information in a list according to the recognition results, and displays the list. When one of the programs is converted into display screen information that is highlighted, and position information is input from the input means 201, display information that highlights the program information corresponding to the input position information is acquired. A plurality of pieces of program information, program information names, and recognition results inputted from the means 203 may be converted and output to the display means 112.
[0060]
Further, when program information of a plurality of programs is displayed on the display unit 112 and the selected program information is highlighted, the input unit 201 is configured by a device with a button and is selected. When a button is pressed by the speaker to change the program, information on the pressed button is output to the display screen creating unit 111, and the display screen creating unit 111 corresponds to the button information input from the input unit 201. Then, the display screen information in which the program information to be highlighted is changed is converted again from the plurality of program information, program information names and recognition results inputted from the display information acquisition means 203 and output to the display means 112 and the selected program information detection means 202. When the display screen information is input from the display screen creation unit 111, the selected program information detection unit 202 highlights the program information highlighted in the input display screen information. Is detected from the display information storage means 109, and the program information and the program information name detected from the display information storage means 109 are detected. You may make it output to the display information acquisition means 203. FIG.
[0061]
In the present invention, it is assumed that the program database 101 and the display information storage means 109 store the recorded program, the program being broadcast, the program name of the program scheduled to be broadcast, the program content, the broadcast station, and the broadcast date and time. Although described, the present invention is not limited to this example, and the program database 101 may further store the genre and performer name to which the program belongs as program information.
[0062]
According to the present embodiment, the program search result of a plurality of programs is displayed, the program information of the program selected by the speaker from the plurality of programs is acquired in advance, and the input command voice is recognized as a result of voice recognition. When a pronoun or synonym is detected in the recognition result, a program search result screen is created using the program information acquired in advance and displayed, so that the speaker can be selected from multiple programs displayed The program information of the selected program can be spoken and displayed by a command including a pronoun or a synonym.
[0063]
【The invention's effect】
As described above, according to the program information display device having the voice recognition function of the present invention, the speaker speaks a command including a pronoun or a synonym and displays program information of the program displayed on the display means. be able to.
[0064]
Further, according to the program information display device having the voice recognition function of the present invention, when a part of the program information related to one program is displayed on the display means, the speaker utters a command including a pronoun or a synonym, Other program information different from the displayed program information can be displayed.
[0065]
Further, according to the program information display device having the voice recognition function of the present invention, the program information of a plurality of programs is displayed on the display means, and the program information is displayed when a speaker utters a command including a directive pronoun or a conjunction. It is possible to show the speaker a display screen and a response voice that indicate that the user cannot do it.
[0066]
Further, according to the program information display apparatus having a voice recognition function of the present invention, when program information of a plurality of programs is displayed on the display means, the speaker selects one program from the displayed plurality of programs and gives an instruction. A command including pronouns and conjunctions can be uttered to display other program information different from the program information displayed for the selected program.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a program information display device having a voice recognition function according to Embodiment 1 of the present invention.
FIG. 2 is a diagram showing a display example representing the operation of the program information display device
FIG. 3 is a view showing another display example showing the operation of the program information display apparatus;
FIG. 4 is a diagram showing a configuration of a program information display device having a voice recognition function according to Embodiment 2 of the present invention.
FIG. 5 is a diagram showing a display example representing the operation of the program information display device
FIG. 6 is a view showing another display example showing the operation of the program information display device.
[Explanation of symbols]
101 program database
102 Display program information acquisition means
103 Device information storage means
104 recognition dictionary
105 microphone
106 Voice recognition means
107 Instruction character string storage means
108 Instruction character string detection means
109 Display information storage means
110, 203 Display information acquisition means
111 Display screen creation means
112 Display means
113 Search keyword extraction means
114 Program search means
201 Input means
202 Selected program information detection means

Claims (5)

音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または前記番組の番組情報画面を表示する表示手段と、表示している番組の入力元や放送局、現在時刻等の機器の状態を記憶する機器情報記憶手段と、前記機器情報記憶手段に記憶されている機器の状態を用いて、前記表示手段で視聴または再生している番組の番組情報を前記番組データベースから取得し記憶する表示番組情報取得手段と、前記番組や前記番組の番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、前記表示番組情報取得手段に記憶されている番組情報を読み出し前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置。A recognition dictionary that stores a speech recognition target word, a microphone that converts speech uttered by a speaker into a speech signal, and a recognition result character that is a character string of the speech recognition target word using the recognition dictionary Voice recognition means for converting into a string; program database for storing program information such as program name, program content, broadcast station name, broadcast date and time; and instruction character string storage means for storing a character string including a pronoun or a noun An instruction character string detection means for detecting a character string including a pronoun or noun stored in the instruction character string storage means from a recognition result character string obtained by the voice recognition means, and a program or a program of the program Display means for displaying an information screen, equipment information storage means for storing the status of the equipment such as the input source of the program being displayed, the broadcasting station, and the current time, and the device information storage means. Display program information acquisition means for acquiring and storing program information of the program being viewed or reproduced on the display means from the program database using the state of the device being displayed, and a display screen for displaying the program and program information of the program Display information that is converted into information and output to the display means; and a program information stored in the display program information acquisition means when a character string including a pronoun or a noun is detected by the instruction character string detection means A program information display device having a voice recognition function, comprising: display information acquisition means for reading out and outputting to the display screen creation means. 音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記表示情報記憶手段から番組情報を読み出す表示情報取得手段と、前記表示情報取得手段により読み出された番組情報を表示画面情報に変換し前記表示手段に出力する表示画面作成手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置。A recognition dictionary that stores a speech recognition target word, a microphone that converts speech uttered by a speaker into a speech signal, and a recognition result character that is a character string of the speech recognition target word using the recognition dictionary Voice recognition means for converting into a sequence; program database for storing program information such as program name, program content, broadcast station name, broadcast date and time; and instruction character string storage means for storing a character string including a pronoun or a noun An instruction character string detection unit for detecting a character string including a pronoun or noun stored in the instruction character string storage unit from a recognition result character string obtained by the voice recognition unit, and a program or program information screen. A display means for displaying, a display information storage means for storing program information displayed on the display means, and a sentence containing a pronoun or noun by the indicated character string detection means When no sequence is detected, search keyword extraction means for extracting a keyword indicating program information from the recognition result character string obtained by the speech recognition means, and all programs of the program corresponding to the keyword extracted by the search keyword extraction means Program search means for acquiring and storing information from the program database, and when no character string including a pronoun or a conjunction is detected by the instruction character string detection means, the program information stored in the program search means is read out Display information storage means for reading program information from the display information storage means when the instruction character string detection means detects a character string including a pronoun or a noun. Program information read by the display information acquisition means is converted into display screen information and output to the display means Program information display device having a voice recognition function, characterized in that a display screen creating means that. 番組検索手段により取得された番組情報は、複数の番組の番組情報である請求項2記載の音声認識機能を有する番組情報表示装置。3. The program information display apparatus having a voice recognition function according to claim 2, wherein the program information acquired by the program search means is program information of a plurality of programs. 表示情報取得手段は、指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されると、表示情報記憶手段から複数番組の情報を読み込んだ場合には、番組検索結果を表示できない旨の警告画面情報または、警告音声を生成して、表示手段に表示させることを特徴とする請求項3記載の音声認識機能を有する番組情報表示装置。The display information acquisition means indicates that when a character string including a pronoun or noun is detected by the instruction character string detection means, the program search result cannot be displayed when information on a plurality of programs is read from the display information storage means. 4. The program information display apparatus having a voice recognition function according to claim 3, wherein warning screen information or warning voice is generated and displayed on the display means. 音声認識の対象語を格納する認識辞書と、話者が発話した音声を音声信号に変換するマイクロホンと、前記認識辞書を用いて前記音声信号を音声認識の対象語の文字列である認識結果文字列に変換する音声認識手段と、番組の番組名、番組内容、放送局名、放送日時等の番組情報を格納する番組データベースと、指示代名詞または連体詞を含む文字列を記憶する指示文字列記憶手段と、前記音声認識手段により得られた認識結果文字列から前記指示文字列記憶手段に記憶されている指示代名詞または連体詞を含む文字列を検出する指示文字列検出手段と、番組または番組情報画面を表示する表示手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合、前記音声認識手段により得られた認識結果文字列から番組情報を示すキーワードを抽出する検索キーワード抽出手段と、前記検索キーワード抽出手段により抽出されたキーワードに対応する番組の全番組情報を前記番組データベースから取得し記憶する番組検索手段と、前記表示手段に表示されている番組情報を記憶する表示情報記憶手段と、番組情報が入力されると、入力された番組情報を表示画面情報に変換して記憶し、前記表示画面情報を前記表示手段に出力する表示画面作成手段と、前記表示手段に複数の番組情報が表示されている場合、話者が前記複数の番組情報から選択した番組情報の前記表示手段における表示位置を入力する入力手段と、前記表示画面作成手段に記憶されている表示画面情報を読み出し、前記入力手段から入力された位置情報に対応する番組情報を前記表示画面情報から特定し、特定した番組情報の番組に関する番組情報を前記表示情報記憶手段から取得し記憶する選択番組情報検出手段と、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出されない場合には、前記番組検索手段に記憶されている番組情報を読み出して前記表示情報記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力し、前記指示文字列検出手段により指示代名詞または連体詞を含む文字列が検出された場合には、前記選択番組情報検出手段から番組情報を読み出して前記表示記憶手段に記憶し、前記番組情報を前記表示画面作成手段に出力する表示情報取得手段とを備えたことを特徴とする音声認識機能を有する番組情報表示装置。A recognition dictionary that stores a speech recognition target word, a microphone that converts speech uttered by a speaker into a speech signal, and a recognition result character that is a character string of the speech recognition target word using the recognition dictionary Voice recognition means for converting into a sequence; program database for storing program information such as program name, program content, broadcast station name, broadcast date and time; and instruction character string storage means for storing a character string including a pronoun or a noun An instruction character string detection means for detecting a character string including a pronoun or noun stored in the instruction character string storage means from a recognition result character string obtained by the voice recognition means, and a program or program information screen. A recognition result character obtained by the speech recognition means when a character string including a demonstrative pronoun or a conjunction is not detected by the display means for displaying and the indication character string detection means; Search keyword extracting means for extracting keywords indicating program information from the program, program search means for acquiring and storing all program information of programs corresponding to the keywords extracted by the search keyword extracting means from the program database, and the display means Display information storage means for storing program information displayed on the screen, and when the program information is input, the input program information is converted into display screen information and stored, and the display screen information is output to the display means Display screen creating means, and when a plurality of program information is displayed on the display means, an input means for inputting a display position on the display means of the program information selected by the speaker from the plurality of program information; The display screen information stored in the display screen creating means is read, and the program information corresponding to the position information input from the input means is displayed in the table. Selected program information detecting means for acquiring program information related to the specified program information from the display information storage means and storing it from the screen information, and a character string including a pronoun or a synonym detected by the indicated character string detecting means If not, the program information stored in the program search means is read out and stored in the display information storage means, the program information is output to the display screen creation means, and the indication character string detection means causes the indication pronoun Alternatively, when a character string including a conjunction is detected, display information acquisition means for reading program information from the selected program information detection means, storing it in the display storage means, and outputting the program information to the display screen creation means And a program information display device having a voice recognition function.
JP2003048915A 2003-02-26 2003-02-26 Program information display device having voice recognition function Expired - Fee Related JP4175141B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003048915A JP4175141B2 (en) 2003-02-26 2003-02-26 Program information display device having voice recognition function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003048915A JP4175141B2 (en) 2003-02-26 2003-02-26 Program information display device having voice recognition function

Publications (2)

Publication Number Publication Date
JP2004260544A JP2004260544A (en) 2004-09-16
JP4175141B2 true JP4175141B2 (en) 2008-11-05

Family

ID=33114742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003048915A Expired - Fee Related JP4175141B2 (en) 2003-02-26 2003-02-26 Program information display device having voice recognition function

Country Status (1)

Country Link
JP (1) JP4175141B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007324866A (en) * 2006-05-31 2007-12-13 Funai Electric Co Ltd Electronic apparatus and television receiver
KR102009316B1 (en) * 2013-01-07 2019-08-09 삼성전자주식회사 Interactive server, display apparatus and controlling method thereof
JP6440513B2 (en) 2014-05-13 2018-12-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Information providing method and device control method using voice recognition function
KR102049833B1 (en) * 2019-08-05 2019-11-29 삼성전자주식회사 Interactive server, display apparatus and controlling method thereof
JP7241142B1 (en) * 2021-09-27 2023-03-16 Tvs Regza株式会社 Receiving device and tuning system

Also Published As

Publication number Publication date
JP2004260544A (en) 2004-09-16

Similar Documents

Publication Publication Date Title
JP4459267B2 (en) Dictionary data generation apparatus and electronic device
US8924853B2 (en) Apparatus, and associated method, for cognitively translating media to facilitate understanding
JP4127668B2 (en) Information processing apparatus, information processing method, and program
TWI233026B (en) Multi-lingual transcription system
US6321196B1 (en) Phonetic spelling for speech recognition
JP5178109B2 (en) Search device, method and program
KR100378898B1 (en) A pronunciation setting method, an articles of manufacture comprising a computer readable medium and, a graphical user interface system
US8712776B2 (en) Systems and methods for selective text to speech synthesis
CN102378050B (en) Broadcast system using text-to-speech conversion
US20100082344A1 (en) Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
JP2010072507A (en) Speech recognition search system and speech recognition search method
US9576581B2 (en) Metatagging of captions
KR20160111275A (en) Foreign language learning system and foreign language learning method
JPWO2005122016A1 (en) Input assist device, information retrieval device, input assist method, and program
JP2008083459A (en) Speech translation device, speech translation method, and speech translation program
JP2007171809A (en) Information processor and information processing method
KR101100191B1 (en) A multimedia player and the multimedia-data search way using the player
JP2009042968A (en) Information selection system, information selection method, and program for information selection
CN110781649A (en) Subtitle editing method and device, computer storage medium and electronic equipment
JP4157418B2 (en) Data browsing support device, data browsing method, and data browsing program
JP4175141B2 (en) Program information display device having voice recognition function
JP2007503747A (en) Real-time media dictionary
JP2007199315A (en) Content providing apparatus
JP2002189483A (en) Voice input-type musical composition search system
JP2007257134A (en) Speech search device, speech search method and speech search program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060227

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060314

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080729

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080811

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 5

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees