JP4019085B2 - 番組録画装置、番組録画方法および番組録画プログラム - Google Patents

番組録画装置、番組録画方法および番組録画プログラム Download PDF

Info

Publication number
JP4019085B2
JP4019085B2 JP2005092578A JP2005092578A JP4019085B2 JP 4019085 B2 JP4019085 B2 JP 4019085B2 JP 2005092578 A JP2005092578 A JP 2005092578A JP 2005092578 A JP2005092578 A JP 2005092578A JP 4019085 B2 JP4019085 B2 JP 4019085B2
Authority
JP
Japan
Prior art keywords
time
chapter
keyword
video
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005092578A
Other languages
English (en)
Other versions
JP2006279290A (ja
Inventor
哲矢 鯵坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Embedded Products Ltd
Original Assignee
NEC Embedded Products Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Embedded Products Ltd filed Critical NEC Embedded Products Ltd
Priority to JP2005092578A priority Critical patent/JP4019085B2/ja
Publication of JP2006279290A publication Critical patent/JP2006279290A/ja
Application granted granted Critical
Publication of JP4019085B2 publication Critical patent/JP4019085B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は組録画装置、番組録画方法および番組録画プログラムに関し、特に字幕放送を受信して、その字幕放送を記録する際にチャプタを付加して記録する組録画装置、番組録画方法および番組録画プログラムに関する。
DVDレコーダやHDDレコーダに代表されるような、放送受信装置が受信した所定の番組をデジタルデータとして録画することが可能な番組録画装置が普及してきている。
一般的に、従来の番組録画装置は録画する番組に関する情報(例えば、ユーザが入力する番組の名称や録画時刻等。以下、番組情報と呼ぶ。)を記録媒体に記録しておき、再生時において、その番組情報を参照して録画されている番組をユーザに認識させる機能を搭載している。さらに、その番組情報を用いて頭出し(ユーザが選択した番組をその冒頭から再生すること)ができるものが存在する。録画された番組の冒頭以外の部分から再生を行う場合には、ユーザが画面に表示されている映像を参照しながら、早送りや巻き戻しを実行する必要がある。
画面を参照することなく、ユーザが所望する箇所から映像を再生させる技術として、所定の文字列(以下、キーワードと呼ぶ)を入力し、その入力された文字列から、記録媒体に記録された番組の再生開始箇所を特定する技術が知られている(例えば、特許文献1参照。)。
特許文献1(特開2000−287156号公報)に記載の技術は、MPEG2エンコード部が、チューナから入力されるテレビジョン信号に含まれるAVデータをMPEG2方式を用いて圧縮符号化し、記録部に出力している。またVBIデータ抽出部は、テレビジョン信号のVBIに含まれる付加情報を抽出して記録部に出力している。記録部5、MPGファイルとVBIファイルを対応付けてハードディスク7記録する。検索再生部は、ユーザが入力する文字列をキーワードとして、VBIファイルの中身を検索し、合致する台詞等に対応するMPGファイルを読み出して、その台詞の位置からデコードしてモニタに出力している。
また、番組を放送する技術の進歩に伴って、放送用の映像/音声データに対応して字幕データを送信する、いわゆる字幕放送と呼ばれる番組も増えてきている。字幕放送を番組録画装置で録画する技術が知られている(例えば、特許文献2参照)。
特許文献2(特開2004−289381号公報)に記載の技術は、テレビジョン放送波から抽出される文字情報の内容をDVDビデオフォーマットで規定されるサブピクチャデータに変換している。そして、サブピクチャデータを、映像や音声のデータとあわせてDVDに記録している。
さらに、録画された字幕放送を任意の位置から再生する技術として、例えば、特許文献3(特開2004−080476号公報)に記載の技術が知られている。
特許文献3に記載の技術は、ユーザから番組の録画指令を受けたとき、デマルチプレクサから出力されるその番組を構成するパーシャルTSを内蔵ハードディスクドライブに書き込むと共に、字幕文字データとその提示時刻情報とを対応付けたテーブルを作成し、録画番組とリンクさせて記憶している。字幕文字による映像検索指令を受けたときには、文字入力画面をOSD表示し、文字入力を受け付ける。入力された文字に一致する或いは類似する字幕文字をテーブルから検索し、その字幕文字の提示時刻の映像を再生している。
このような番組録画装置で字幕放送を記憶媒体(例えば、DVDディスク)に記録する場合、所望の場面から映像を再生させるための章ごとの区切り符号(以下、チャプタと呼ぶ。)を付与することがある。
上記特許文献に記載の技術を適用して、チャプタを付加する箇所を特定する場合、番組中にそのキーワードが短時間で連続して出現すると、チャプタを付加する箇所も連続的に指定されてしまう。そのため、最適な再生開始箇所を特定することが困難になってしまう場合がある。さらに、キーワードが複数回出現する場合、チャプタを付加する箇所はキーワードが出現する度に指定されてしまう。付与することが可能なチャプタの個数に上限があると、番組途中でその上限に達してしまい、所望の再生開始箇所を特定することができなくなってしまうことがある。
字幕データからキーワードが出現する時刻を特定してチャプタを付与する場合において、そのキーワードが短時間で連続的に出現するときでも、再生開始箇所として適切な箇所を特定することができる技術が望まれている。さらに、付与することが可能なチャプタの個数に上限があるときに、その上限値に対応してチャプタを付与することができる技術が望まれている。
また、番組中の音声を放送局に備えられた字幕文字変換器を用いて、リアルタイムで字幕文字へ変換して映像に合わせて放送する字幕放送(以下、リアルタイム字幕放送と呼ぶ)も実現している。リアルタイム字幕放送は、音声が出力される時刻とその音声に対応する字幕が表示される時刻とに時間差が存在する。したがって、リアルタイム字幕放送の字幕データを用いてチャプタを付与すると、そのチャプタで特定された再生開始箇所から所望の音声が出力されない場合がある。
通常の字幕放送とリアルタイム字幕放送とを混在させて録画する場合でも、適切にチャプタを付与することができる技術が望まれている。
特開2000−287156号公報 特開2004−289381号公報 特開2004−080476号公報
本発明が解決しようとする課題は、字幕データからキーワードが出現する時刻を特定して書き込み用データにチャプタを付与する場合において、そのキーワードが字幕として出現する間隔に対応して、再生開始箇所として適切な箇所を特定することができる技術を提供することにある。
さらに、本発明が解決しようとする他の課題は、書き込み用データに付与することが可能なチャプタの個数に上限があるときに、その上限値に対応してチャプタを付与することができる技術を提供することにある。
さらに、本発明が解決しようとする他の課題は、通常の字幕放送とリアルタイム字幕放送とを混在させて録画する場合でも、適切にチャプタを付与することができる技術を提供することにある。
以下に、[発明を実施するための最良の形態]で使用される番号を用いて、課題を解決するための手段を説明する。これらの番号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]との対応関係を明らかにするために付加されたものである。ただし、それらの番号を、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
上記課題を解決するために、以下に述べる番組録画装置を構成する。その番組録画装置は、字幕放送を受信する受信装置(2)から供給される字幕データ付テレビジョン信号(30)に応答して、前記字幕データ付テレビジョン信号(30)から字幕データ(31)と映像音声データ(32)とを抽出するデコーダ装置(4)と、前記字幕データ(31)と前記映像音声データ(32)とに基づいてチャプタ(頭出し用章区切り)付書き込み用画像(39)を生成する書き込み用データ生成装置(1)とを具備して構成する。ここで、前記映像音声データ(32)は、前記字幕放送の映像と音声とを含むものである。
そして、前記書き込み用データ生成装置(1)は、予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブル(33)を生成する字幕データ(31)解析部(12)と、前記初期チャプタ情報テーブル(33)に基づいて前記チャプタ候補時刻を補正して、チャプタ情報テーブル(35)を生成するチャプタ情報テーブル補正部(13)と、前記チャプタ付映像音声記録媒体(39)を生成する書き込み用画像生成部(14)とを有して構成する。
前記字幕データ(31)解析部(12)は、前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止する。
さらに、前記チャプタ情報テーブル補正部(13)は、前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブル(35)を生成する。
そして、前記書き込み用画像生成部(14)は、前記チャプタ情報テーブル(35)に示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データ(34)に前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体(39)を生成する。
上述したような番組録画装置を構成することで、字幕データ(31)を用いてチャプタを生成することが可能になり、そのチャプタを使用して番組の頭出しを行うときに、出力される音声データとのずれを抑制することが可能になる。
また、その番組録画装置において、前記字幕データ(31)解析部(12)は、前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブル(33)を構成する。このとき、前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するときには、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定する。さらに、前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成する。そのうえで、前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブル(33)に追加する。
また、その番組録画装置において、前記チャプタ情報補正部は音声認識部を含んで構成されることが好ましい。そして、前記音声認識部は、前記書き込み用映像音声データ(34)に含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定する。また、チャプタ情報補正部は、前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する。
その番組録画装置において、前記音声認識部は、前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行するように機能するものであることが好ましい。そして、前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定する。また、チャプタ情報補正部は、前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないときには、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する。
その番組録画装置において、前記音声認識部は、予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行するような機能を備えて構成されるものであってもよい。その際、前記チャプタ情報テーブル補正部(13)は、その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する。
また、その番組録画装置において、さらに、前記映像音声データ(32)を処理して前記書き込み用映像音声データ(34)を生成する画像処理部を含む構成であることが好ましい。ここで、前記画像処理部は、前記映像音声データ(32)に対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データ(32)とを対応付けて前記書き込み用映像音声データ(34)を生成する。そして、前記チャプタ情報テーブル補正部(13)は、前記書き込み用映像音声データ(34)に含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する。
また、以下の方法で番組録画を実行することで上記課題を解決することが可能になる。その方法は、下記行為の連鎖であり、その中で述べる映像音声データ(32)は字幕放送の映像データと音声データとを含むものであるとする。
上記課題を解決するために、
[a]字幕データ付テレビジョン信号(30)に応答して、前記字幕データ付テレビジョン信号(30)から字幕データ(31)と映像音声データ(32)とを抽出するステップと、
[b]予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブル(33)を生成するステップと、
[c]前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止するステップと、
[d]前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブル(35)を生成するステップと、
[e]前記字幕データ(31)と前記映像音声データ(32)と前記チャプタ情報テーブル(35)に示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データ(34)に前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体(39)を生成するステップ
を具備する番組録画方法を実行する。
その番組録画方法において、前記[b]ステップは、下記複数のステップを含むものであることが好ましい。その複数のステップは、
前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブル(33)を構成するステップと、
前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するとき、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定するステップと
前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成するステップと、
前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブル(33)に追加するステップである。
その番組録画装置において、前記[d]ステップは、記複数のステップを含むものであることが好ましい。その複数のステップは、
前記書き込み用映像音声データ(34)に含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定するステップと、
前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップである。
その番組録画方法において、前記[d]ステップは、さらに下記複数のステップを具備するものでああってもよい。ここで、その複数のステップは、
前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行するステップと、
前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定するステップと、
前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないとき、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップである。
また、その番組録画方法において、前記[d]ステップは、さらに下記複数のステップを具備するものでああってもよい。ここで、その複数のステップは、
予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行するステップと、
その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正するステップである。
その番組録画方法において、上述した[a]〜[e]ステップに加えてさらに、下記ステップを実行する。
上記課題を解決するために、
[f]前記映像音声データ(32)に対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データ(32)とを対応付けて前記書き込み用映像音声データ(34)を生成するステップと、
[g]前記書き込み用映像音声データ(34)に含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正するステップ
を具備する番組録画方法を実行する。
また、以下に示すコンピュータプログラムを組むことで上記課題を解決すること可能である。そのプログラムはコンピュータを字幕放送を受信する受信手段から供給される字幕データ付テレビジョン信号(30)に応答して、前記字幕データ付テレビジョン信号(30)から字幕データ(31)と映像音声データ(32)とを抽出するデコーダ手段と、前記字幕データ(31)と前記映像音声データ(32)とに基づいてチャプタ付映像音声記録媒体(39)を生成する書き込み用映像音声データ生成手段として機能させるプログラムである。さらに詳細には、そのプログラムは、前記書き込み用映像音声データ生成手段に、
[a]前記デコーダ手段から供給される前記字幕データ(31)と前記映像音声データ(32)とを受け取るステップと、前記映像音声データ(32)は前記字幕放送の映像データと音声データとを含み、
[b]予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブル(33)を生成するステップと、
[c]前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止するステップと、
[d]前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブル(35)を生成するステップと、
[e]前記字幕データ(31)と前記映像音声データ(32)と前記チャプタ情報テーブル(35)に示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データ(34)に前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体に書き込むためのデータ(39)を生成するステップ
を具備する方法を実行させる番組録画プログラムである。
その番組録画プログラムにおいて、前記[b]ステップは、
前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブル(33)を構成するステップと、
前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するとき、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定するステップと
前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成するステップと、
前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブル(33)に追加するステップ
を具備するものであってもよい。
また、その番組録画プログラムにおいて、前記[d]ステップは、
前記書き込み用映像音声データ(34)に含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定するステップと、
前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
を具備するものであってもよい。
また、その番組録画プログラムにおいて、前記[d]ステップは、さらに、
前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行するステップと、
前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定するステップと、
前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないとき、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
を具備するものであってもよい。
その番組録画プログラムにおいて、前記[d]ステップは、さらに、
予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行するステップと、
その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正するステップ
を具備するものであってもよい。
その番組録画プログラムにおいて、前記コンピュータを、さらに、前記映像音声データ(32)を処理して前記書き込み用映像音声データ(34)を生成する画像処理手段として機能させるプログラムであることが好ましい。そして、そのプログラムは前記書き込み用映像音声データ生成手段に、さらに、
[f]前記映像音声データ(32)に対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データ(32)とを対応付けて前記書き込み用映像音声データ(34)を生成するステップと、
[g]前記書き込み用映像音声データ(34)に含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正するステップ
を具備する方法を実行させる番組録画プログラムであることが好ましい。
本発明によると、字幕データからキーワードが出現する時刻を特定してチャプタを付与する場合において、そのキーワードが短時間で連続的に出現するときでも、再生開始箇所として適切な箇所を特定することができる。
さらに、本発明によると、付与することが可能なチャプタの個数に上限があるときに、その上限値に対応してチャプタを付与することができる。
さらに、本発明によると、通常の字幕放送とリアルタイム字幕放送とを混在させて録画する場合でも、適切にチャプタを付与することができる。
以下に、図面を参照して本発明を実施するための形態について説明を行う。以下の説明において、本実施の形態における番組録画システムが、受信した字幕放送をDVDディスクに記録するシステムである場合を例示して説明を行う。
図1は、本発明の実施の形態に構成を例示するブロック図である。図1を参照すると、本実施の形態のデジタル録画システムは、DVDデータ生成装置1と、放送受信装置2と、アンテナ3と、字幕放送デコーダ4と、入力装置5と、表示装置6と、DVDデータ書き込み装置7とを含んで構成されている。DVDデータ生成装置1は、本実施の形態の番組録画システムにおける記録用データを生成する情報処理装置である。以下の実施の形態において、DVDデータ生成装置1がパーソナルコンピュータである場合を例示し、通常パーソナルコンピュータに備えられている情報処理機能を用いて本発明を実現する場合に対応して説明を行う。また、以下の実施の形態において、受信した番組を記録するための記録媒体として、DVDディスクを用いる場合を例示して説明を行う。
図1に示されているように、DVDデータ生成装置1は、送受信部8と、演算処理部9と、主記憶部10と、複数の情報処理部(11〜14)と、大容量記憶装置15とを含んで構成されている。本実施の形態において、DVDデータ生成部14は、複数の情報処理機能ブロック(17〜20)で構成されている。また、大容量記憶装置15は、複数の情報格納部(21〜26)を含んで構成されている。図1に示されているように、DVDデータ生成装置1に備えられている各機能ブロック(8〜15)は、バス16を介して互いに接続されている。なお、DVDデータ生成装置1を構成する各機能ブロックの詳細は後述するものとする。
放送受信装置2は、字幕放送の受信を行い、受信した放送を所定の表示装置に表示させる機能を有する装置である。図1を参照すると、放送受信装置2は、アンテナ3を介して字幕放送を受信する場合の構成が例示されている。放送受信装置2は、受信した字幕放送52をMPEG2エンコード部11に供給する。MPEG2エンコード部11はその字幕放送から映像音声データを特定してMPEG2エンコードを行う。
字幕放送デコーダ4は、放送受信装置2が受信した字幕放送から、字幕データを抽出する装置である。
入力装置5は、キーボードやマウスなど、本体装置にデータを入力することが可能な機能を備える装置である。表示装置6は、CRTディスプレイや液晶表示装置など、画面に情報を表示する表示装置である。DVDデータ書き込み装置7は、DVDデータ生成装置1から供給される書き込み用DVDデータをDVDディスクに書き込む可能DVDドライブである。
以下に、DVDデータ生成装置1を構成する各ブロックについて説明を行う。DVDデータ生成装置1の送受信部8は、DVDデータ生成装置1の外部から供給されるデータを、DVDデータ生成装置1の内部で情報処理可能な形式に変換する通信インターフェースである。本実施の形態における送受信部8は、字幕放送デコーダ4から出力される字幕放送に関連するデータを受信し、そのデータを形式変換してバス16を介して所定の機能ブロックに供給している。また、本実施の形態の送受信部8が、入力装置5および表示装置6に接続され、それぞれの装置と送受信可能な構成であってもよい。
演算処理部9は、DVDデータ生成装置1に備えられた各種装置の制御やデータの処理を行うプロセッシングユニットである。本実施の形態において、演算処理部9は、DVDデータ生成装置1に備えられているCPU(Central Processing Unit:中央演算処理装置)である場合に対応して説明を行う。
主記憶部10は、電気的にデータを記憶する記憶媒体である。主記憶部10は、演算処理部9がソフトウェアを実行する場合に、メインメモリとして用いられる。本実施の形態において、主記憶部10
がDVDデータ生成装置1に備えられたRAM(Random Access Memory)であることを前提に説明をおこなう。なお、本実施の形態における主記憶部10は、特定の半導体記憶装置に制限されるものではない。
MPEG2エンコード部11は、法送受信装置2から供給される字幕放送(映像/音声データ)に応答し、MPEG2規格に対応してMPEG2データ生成する圧縮画像生成機能ブロックである。
字幕データ解析部12は、字幕放送デコーダ4から供給される字幕データに応答して、その字幕データを解析する情報処理機能ブロックであり、受信する字幕データを随時解析し、予め設定されるキーワードと一致する字幕が表示される時刻を特定する。なお字幕データ解析部12の動作に関する詳細は、後述する。
チャプタ情報テーブル補正部13は、字幕データに基づいて、書き込み用DVDデータにチャプタ(章)をつける場合に、最適なチャプタを生成するための補正を行う情報処理機能ブロックである。
DVDデータ生成部14は、MPEG2エンコード部11、字幕データ解析部12およびチャプタ情報テーブル補正部13から供給される各種データに基づいて、書き込み用DVDデータを生成する情報処理機能ブロックである。上述したように、DVDデータ生成部14は、サムネイル画像作成部17と、ナビゲーションデータ作成部18と、メニュー画面作成部19と、書き込みデータ作成部20とを含んで構成されている。
サムネイル画像作成部17は、DVDディスクに格納するサムネイル画像を生成する情報処理機能ブロックである。ナビゲーションデータ作成部18は、DVDディスクにMPEG2データを書き込むときのナビゲーションデータを生成する情報処理機能ブロックである。メニュー画面作成部19は、DVDディスクの作成に対応して、そのDVDディスクに格納するメニュー画面を生成する情報処理機能ブロックである。書き込みデータ作成部20は、MPEG2データ34をDVDディスクに書き込むための書き込み用データを生成する情報処理機能ブロックである。
また、大容量記憶装置15は、DVDデータ生成装置1に備えられた情報記憶装置である。本実施の形態における大容量記憶装置15は、DVDデータ生成装置1への電源の供給が遮断された場合であっても、情報の保持を継続することが可能な記憶装置であることが好ましい。したがって、以下の実施の形態において、大容量記憶装置15がハードディスクドライブである場合に対応して説明を行う。
上述したように、大容量記憶装置15は、キーワードリスト格納部21と、最大チャプタ情報格納部22と、MPEG2データ格納部23と、DVDデータ格納部24と、チャプタ情報テーブル格納部25と、補正用データ格納部26とを含んで構成されている。
キーワードリスト格納部21は、チャプタを生成するときに用いられるキーワードを格納する情報格納部である。キーワードリスト格納部21は、少なくとも一つのキーワードを保持している。以下の実施の形態では、キーワードリスト格納部21は複数のキーワードを保持し、その複数のキーワードは、各情報処理部から読み出し可能な状態であるものとする。キーワードリストは、ユーザによってキーワードが手入力されるものをリストとして保持する場合や、EPG(電子番組表)情報から出演者名などを自動的に抽出することで生成される
最大チャプタ情報格納部22は、本実施の形態において、作成されるDVDディスクに付与することが可能なチャプタの最大数を格納する情報格納部である。最大チャプタ情報格納部22には、DVD規格で定められる最大チャプタ数と、ユーザが独自に設定する最大チャプタ数とが格納されている。付与するチャプタの上限を特定する時には、字幕データ解析部12は最大チャプタ情報格納部22を参照して、その最大チャプタ数を特定する。
MPEG2データ格納部23は、MPEG2エンコード部11から出力されるMPEG2データを格納する情報格納部である。DVDデータ格納部24は、DVDデータ生成部14から出力される書き込み用データを格納する情報格納部である。チャプタ情報テーブル格納部25は、字幕データ解析部12が生成する初期チャプタ情報テーブル33およびチャプタ情報テーブル補正部13が生成するチャプタ情報テーブル35を格納する情報格納である。補正用データ格納部26は、チャプタ情報テーブル補正部13が初期チャプタ情報テーブル33の補正を実行するときに用いる補正用のデータを格納する情報格納部である。
以下に、本実施の形態における詳細な構成を説明する。図2は、本実施の形態の番組録画システムにおける構成とデータの流れとを例示するブロック図である。図2に示されているように、字幕放送デコーダ4は、放送受信装置2と、MPEG2エンコード部11と、字幕データ解析部12とに接続されている。字幕データ解析部12はさらにチャプタ情報テーブル補正部13に接続されている。また、MPEG2エンコード部11は、サムネイル画像作成部17とナビゲーションデータ作成部18と書き込みデータ作成部20とに接続されている。また、チャプタ情報テーブル補正部13はさらに、サムネイル画像作成部17と、ナビゲーションデータ作成部18とに接続されている。サムネイル画像作成部17とナビゲーションデータ作成部18とは、さらにメニュー画面作成部19に接続されている。また、ナビゲーションデータ作成部18は、書き込みデータ作成部20に接続されている。書き込みデータ作成部20は、前述のMPEG2エンコード部11と、そのサムネイル画像作成部17と、メニュー画面作成部19とに接続されている。
図2を参照すると、本実施の形態の放送受信装置2は、放送の受信に対応して受信放送データ30を出力する。放送受信装置2は、その受信放送データ30に基づいて、映像/音声データ32をMPEG2エンコード部11に出力し、字幕データ31を字幕データ解析部12に出力する。MPEG2エンコード部11は、字幕放送デコーダ4から供給される映像/音声データ32に基づいてMPEG2データ34を出力する。
字幕データ解析部12は、字幕放送デコーダ4から供給される字幕データ31に基づいて初期チャプタ情報テーブル33を出力する。初期チャプタ情報テーブル33とMPEG2データ34はチャプタ情報テーブル補正部13に供給される。チャプタ情報テーブル補正部13は、各々のデータに基づいてチャプタ情報テーブル35を出力し、サムネイル画像作成部17とナビゲーションデータ作成部18とに供給する。
サムネイル画像作成部17は、MPEG2エンコード部11から供給されるMPEG2データ34とチャプタ情報テーブル補正部13から供給されるチャプタ情報テーブル35に基づいてサムネイル画像データ40をメニュー画面作成部19に出力する。ナビゲーションデータ作成部18は、MPEG2エンコード部11から供給されるMPEG2データ34とチャプタ情報テーブル補正部13から供給されるチャプタ情報テーブル35とに基づいてナビゲーションデータ37をメニュー画面作成部19と書き込みデータ作成部20とに出力する。メニュー画面作成部19は、ナビゲーションデータ37とサムネイル画像データ40とに基づいて、メニュー画面データ38を書き込みデータ作成部20に出力する。書き込みデータ作成部20は、MPEG2データ34と、ナビゲーションデータ37とメニュー画面データ38とに基づいて、チャプタ付書き込み用映像音声データ39を生成する。
以下に、図面を参照して、字幕データ解析12の動作について説明を行う。図3は、本実施の形態における字幕データ解析部12の動作を例示するフローチャートである。本実施の形態において、図3に示されている動作は、DVDディスクに書き込むために番組録画が行われることで開始するものとする。図3のステップS101において、字幕データ解析部12は、字幕放送デコーダ4から出力される字幕データ31を受け取る。字幕データ解析部12は、受け取った字幕データ31に応答して、初期チャプタ情報テーブル33の生成を開始する。
ステップS102において、字幕データ解析部12は、初期チャプタ情報テーブルの生成開始に応答して大容量記憶装置15のキーワードリスト格納部21を参照する。字幕データ解析部12は、その参照によって得られたキーワードリストの読み込みを行う。なお、予めキーワードリスト格納部21に格納されるキーワードリストは、ユーザのキーボード入力や、EPG情報に基づいて選択された文字列をキーワードとして設定するなどの方法によって生成される。字幕データ解析部12は、受信した字幕データからキーワードに対応する字幕が出現する時刻を特定し、そのキーワードと出現時刻とを関連付けて一時的に保持する。
ステップS103において、字幕データ解析部12は、時間経過に対応して字幕データを解析する。字幕データ解析部12は、その解析に基づいて、予め設定されたキーワードが字幕データに出現すると、そのキーワードと出現時刻とを関連付けて初期チャプタ情報テーブルを生成する。字幕データ解析部12は、初期チャプタ情報テーブルの生成過程で、以前に出現したキーワードが再度出現しているかどうかの判断を行う。その判断の結果、キーワードが既出であった場合、処理はステップS104に進む。以前に出現したキーワードが出現していない場合、処理はステップS110に進む。
ステップS104において、字幕データ解析部12は、既出のキーワードの出現時刻を特定する。字幕データ解析部12は、特定した時刻に基づいて、前回そのキーワードが字幕として出現した時刻と今回出現した時刻との時間間隔(時間差)を求める。字幕データ解析部12は、その求めた時間間隔が所定の時間(以下、チャプタ未作成時間T1と呼ぶ)を超えているかどうかの判断を行い、超えている場合は、処理はステップS105に進む。その求めた時間差がチャプタ未作成時間T1を超えていない場合は、そのキーワードが出現した時刻をチャプタとして採用しないまま、処理はステップS110に進む。例えば、チャプタ未作成時間T1として、5秒間という時間が設定されているものとする。予め設定されたキーワードが、”00:10:00”に字幕表示されたとして、その出現時刻から5秒以内(00:10:00〜00:10:05までの間)に再度字幕として表示されたとしても、字幕データ解析部12は、その時刻をチャプタ候補時刻として特定しない。
ステップS105において、字幕データ解析部12は、キーワードが出現した時刻をチャプタ候補時刻とし、そのチャプタ候補時刻と前回キーワードが出現した時刻との時間差を時間間隔情報とし、チャプタ候補時刻と時間間隔情報とを新たなチャプタ番号に関連付けて初期チャプタ情報テーブルを更新する。更新が完了すると、処理はステップS106に進む。
ステップS106において、字幕データ解析部12は、初期チャプタ情報テーブルが更新されたことに応答して、最大チャプタ情報格納部22を参照し、最大チャプタ数情報を読み込む。
ステップS107において、字幕データ解析部12は、その現時点における初期チャプタ情報テーブルに保持されている総チャプタ数を特定する。字幕データ解析部12は、その総チャプタ数と読み込んだ最大チャプタ数との比較を行う。その比較の結果、総チャプタ数が最大チャプタ数を超えていない場合、字幕データ解析部12は、初期チャプタ情報テーブルに新たなチャプタ情報を追加する(ステップS108)。その比較の結果、総チャプタ数が最大チャプタ数を超えている場合には、字幕データ解析部12は、同一キーワード出現間隔が、一番短いチャプタを削除して、初期チャプタ情報テーブルを更新する(ステップS109)。
ステップS110において、字幕データ解析部12は、字幕データの解析が全て完了したかどうかの判断を行う。その判断の結果、解析が完了していない場合には、処理はステップS103戻る。解析が完了した場合、処理はステップS111に進む。ステップS111において、字幕データ解析部12は、生成してきた初期チャプタ情報テーブルを出力する。
これによって、
以下に、初期チャプタ情報テーブルの具体例を示して、字幕データ解析部12の動作および初期チャプタ情報テーブルの構成に関して説明を行う。以下の実施の形態の説明においては、設定されている最大チャプタ数が”8”であるものする。図4は、初期チャプタ情報テーブル33の構成を例示するテーブルである。図4を参照すると、初期チャプタ情報テーブル33は、チャプタ番号41と、キーワード42と、チャプタ候補時刻43と、同一キーワード間隔44とが関連付けられて構成されている。図4に示されている初期チャプタ情報テーブル33は、1番目から8番目までのチャプタ番号41がすでに使用されている場合を例示している。
チャプタ番号41は、チャプタ候補時刻の特定が行われるごとに付与される番号である。キーワード42は、字幕データ解析部12がキーワードリストに基づいて特定した文字列である。チャプタ候補時刻43は、そのキーワード42が字幕データに基づいて字幕表示される時刻である。同一キーワード間隔44は、以前キーワード字幕表示された時刻とそのキーワードが再度字幕表示される時刻との時間差である。
図5は、字幕データを解析した結果、新たにキーワードが出現したときの更新用データ45の構成を例示するテーブルである。図5を参照すると、字幕データの解析開始時刻から27分45秒の時点で”プロ野球”というキーワードが出現したことを示している。このとき字幕データ解析部12は、初期チャプタ情報テーブル33を参照して、前回”プロ野球”というキーワードが出現した時刻(00:12:20)と、今回の出現時刻(00:27:45)とから、同一キーワード間隔44を算出する。
このとき、初期チャプタ情報テーブル33の最大チャプタ数と同数のチャプタ情報を保持しているので、字幕データ解析部12は、図3のフローチャートにおけるステップS109の処理を実行する。字幕データ解析部12は、初期チャプタ情報テーブル33を参照して、同一キーワードの出現間隔が、一番短いチャプタを特定する。図4を参照すると、このときのチャプタ番号が”3”の”小泉首相”というキーワードは、前回出現した時刻から15秒後に出現していることが示されている。字幕データ解析部12は、チャプタ番号3に関連付けられているチャプタ情報を削除し、更新用データ45に示されている情報を新たなチャプタ情報として追加するとともに、初期チャプタ情報テーブル33を更新する。
図6は、更新された初期チャプタ情報テーブル33aの構成を例示するテーブルである。図6を参照すると、更新されたチャプタ情報テーブル33aは、更新前のチャプタ情報テーブル40のチャプタ番号3に関連付けられていた情報が削除されている。また、その策上に伴って各チャプタ情報が繰り上げられている。さらに、図6に示されているように、その削除によって、チャプタ番号2の”小泉首相”というキーワードの次に”小泉首相”というキーワードが出現する時刻が、15分55秒となる。そのため、字幕データ解析部12は初期チャプタ情報テーブル33aチャプタ番号5の同一キーワード間隔44を更新する。
これによって、そのキーワードが字幕として出現する間隔に対応して、再生開始箇所として適切な箇所を特定することが可能となる。
図7は、チャプタ情報テーブル補正部13がチャプタを付与する時刻を補正する動作を例示するフローチャートである。その補正は字幕データ解析部12から供給される初期チャプタ情報テーブル33に基づいて実行される。図7のステップS201において、チャプタ情報テーブル補正部13は、字幕データ解析部12から供給される初期チャプタ情報テーブルを読み込む。ステップS202において、チャプタ情報テーブル補正部13は、MPEG2エンコード部11から出力されるMPEG2データ34を読み込む。
ステップS203において、チャプタ情報テーブル補正部13の音声認識部13−1は、初期チャプタ情報テーブル33(または、初期チャプタ情報テーブル33a)に示されているチャプタ候補時刻43に基づいて、音声認識を開始する時刻(以下、音声認識開始時刻と呼ぶ。)を特定する。音声認識開始時刻は、チャプタ候補時刻から所定の時間(以下、認識時間T2と呼ぶ)だけ早い時刻が設定される。音声認識部13−1は、音声認識開始時刻から音声認識を開始し、一定の時間間隔(音声認識実行時間46)が経過するまでにキーワードに対応する音声の認識を実行する。
リアルタイム字幕放送の場合には、音声が出力されてからその音声に対応する字幕が表示されるまで、5〜10秒間程度のタイムラグが発生してしまうことがある。そこで、認識時間T2として、例えば10秒間を設定しておくと、チャプタ候補時刻から音声認識を実行するよりも、キーワードに対応する音声を認識することができる可能性(音声認識率)が高くなる。また、音声認識を終了する時刻を、チャプタ候補時刻から所定の時間だけ遅らせることで、より音声認識率を高めることが可能となる。
ステップS204において、音声認識部13−1は、キーワードに対応する音声データを認識することができたかどうかの判断を実行する。その判断の結果、キーワードに対応する音声データの認識ができた場合、処理はステップS205に進む。キーワードに対応する音声データの認識ができなかった場合、処理はステップS206に進む。
ステップS205において、チャプタ情報テーブル補正部13は、音声認識部13−1による音声認識に基づいて、キーワードに対応する音声データが出現する時刻(キーワード出現時刻47)を特定する。ステップS207において、チャプタ情報テーブル補正部13は、キーワード出現時刻47と補正時間T3とに対応してチャプタ時刻を補正する。
ステップS206において、チャプタ情報テーブル補正部13は音声認識部13−1による音声認識ができなかった場合、ステップS203で設定される音声認識開始時刻に対応してチャプタ時刻を補正する。ステップS208において、チャプタ情報テーブル補正部13は補正が完了したときに、チャプタ情報テーブルを更新する。
ここで、上述のフローチャートの動作を補正用チャプタ情報テーブルの具体例を示して、チャプタ情報テーブル補正部13の動作およびチャプタ情報テーブルの構成に関して説明を行う。図8は、音声認識実行時間46を含む補正用チャプタ情報テーブル50の構成を例示するテーブルである。補正用チャプタ情報テーブル50は初期チャプタ情報テーブル33に基づいて生成される。以下の説明において第1補正時間T2が10秒であり、補正時間T3が1秒である場合を例示する。
図8を参照すると、補正用チャプタ情報テーブル50は、キーワード42とチャプタ候補時刻43とに関連付けられた音声認識実行時間46とで構成されている。図8に示されているように。補正用チャプタ情報テーブル50は、各チャプタ候補時刻43より第1補正時間T2(10秒間)早い時刻を音声認識開始時刻として特定している。また、各チャプタ候補時刻43より5秒遅い時刻を音声認識終了時刻として特定している。音声認識部13−1は、補正用チャプタ情報テーブル50の音声認識実行時間46に示されている時間の音声認識を実行し、キーワードに対応する音声データが出現する時刻を特定する。
図9は、音声認識部13−1による音声認識の結果(キーワード出現時刻47)と認識対象のキーワードとを関連付けて保持する補正用チャプタ情報テーブル51の構成を例示するテーブルである。図9を参照すると、チャプタ情報テーブル補正部13は、音声認識部13−1による音声認識の結果をキーワード出現時刻47として各キーワード42に関連付けて保持している。
図10は、キーワード出現時刻47から第2補正時刻T3を加減して得られたチャプタ設定時刻48と、そのチャプタの特定に用いられるキーワードとを関連付けて保持しているチャプタ情報テーブル35の構成を例示するテーブルである。図10を参照すると、チャプタ情報テーブル35は、音声認識部13−1が実行した音声認識によって得られたキーワード出現時刻47をさらに補正したチャプタ設定時刻48と、キーワード42とを関連付けて保持している。
上述してきたように、チャプタ情報テーブル補正部13は、字幕データに基づいて特定されるチャプタ候補時刻と、MPEG2データの音声が出力される時刻との時間差に対応して補正している。補正することによって得られたチャプタ設定時刻に対応してチャプタを付与させているため、任意のチャプタから記録画像を再生させたときに、音声が途中から再生されてしまうような不具合を低減させることが可能になる。
図11は、チャプタ情報テーブル補正部13が実行する補正における、他の実施の形態の動作を例示するフローチャートである。図11に示されているステップS201とステップS202は、図7で説明した動作と同様であるので、詳細な説明は省略する。
図11のステップS301において、チャプタ情報テーブル補正部13は、MPEG2エンコード部11から供給されるMPEG2データ34に基づいて、そのMPEG2データ34が生放送番組を録画した字幕データ31から生成されたかどうかの判断を実行する。その判断の結果、MPEG2データ34が、生放送番組を録画した字幕データ31に基づいて生成されている場合、処理はステップS302に進み、録画番組に対応して生成されたMPEG2データ34の場合、処理はステップS303に進む。ここで、チャプタ情報テーブル補正部13は、MPEG2データ34の受信に応答して、EPG情報から番組のジャンルを取得し、そのジャンルに基づいて上記の判断を実行する。例えば、そのジャンルがニュースやスポーツの場合、処理はステップS302に進むこととなる。
ステップS302において、チャプタ情報テーブル補正部13は、リアルタイム字幕放送に対応した補正を実行する。また、ステップS303において、チャプタ情報テーブル補正部13は、録画放送用の補正を実行する。
具体的には、例えばチャプタ情報テーブル補正部13は、リアルタイム字幕放送に対応した補正を実行する場合、上述した認識時間T2に対応して、チャプタ設定時刻を特定し、録画放送用の補正を実行する場合には、補正時間T3に対応してチャプタ設定時刻を特定する。
これによって、番組のジャンルに対応してチャプタを設定する時刻を特定することが可能になる。
なお、上述してきた実施の形態において、各装置の構成は本発明における構成を限定するものではない。例えば、記録媒体はDVDディスクに限定されるものではなく、受信した字幕放送をHDDレコーダを使用してハードディスクに記録させる構成であってもよい。同様に、上述の実施の形態において、DVDデータ生成装置1がパーソナルコンピュータである場合を例示して説明を行ってきたが、これは、本発明のDVDデータ生成装置1の構成を限定するものではない。例えば、DVDデータ生成装置1として専用の装置を構成して本発明を実現することも可能である。
また、上述の実施の形態において、各情報処理部がコンピュータプログラム(ソフトウェア)である場合を前提に説明を行ってきたが、例えば、任意のプログラムに対応する電子回路(ハードウェア)を構成し、その電子回路を動作させることで、本実施の形態の動作を実現させることが可能である。
なお、上述の実施の形態において、その動作に矛盾が生じない範囲において、組み合わせて実行することも可能である。
図1は、本発明の実施の形態の構成を例示するブロック図である。 図2は、本発明の実施の形態の構成とデータの流れとを例示するブロック図である。 図3は、本発明の実施の形態におけるデータ解析部の動作を例示するフローチャートである。 図4は、初期チャプタ情報テーブルの構成を例示するテーブルである。 図5は、新たなキーワードを例示するテーブルである。 図6は、新たなキーワードに対応して生成されるチャプタ情報テーブルの構成を例示するテーブルである。 図7は、本発明の実施の形態におけるチャプタ情報テーブル補正部の動作を例示するフローチャートである。 図8は、補正用チャプタ情報テーブルの構成を例示するテーブルである。 図9は、補正用チャプタ情報テーブルの構成を例示するテーブルである。 図10は、チャプタ情報テーブルの構成を例示するテーブルである。 図11は、チャプタ情報テーブル補正部の他の動作を例示するフローチャートである。
符号の説明
1…DVDデータ生成装置
2…放送受信装置
3…アンテナ
4…字幕放送デコーダ
5…入力装置
6…表示装置
7…DVDデータ書き込み装置
8…送受信部
9…演算処理部
10…主記憶部
11…MPEG2エンコード部
12…字幕データ解析部
13…チャプタ情報テーブル補正部
14…DVDデータ生成部
15…大容量記憶装置
16…バス
17…サムネイル画像作成部
18…ナビゲーションデータ作成部
19…メニュー画面作成部
20…書き込みデータ作成部
21…キーワードリスト格納部
22…最大チャプタ情報格納部
23…MPEG2データ格納部
24…DVDデータ格納部
25…チャプタ情報テーブル格納部
26…補正用データ格納部
30…受信放送データ
31…字幕データ
32…映像/音声データ
33、33a…初期チャプタ情報テーブル
34…MPEG2データ
35…チャプタ情報テーブル
37…ナビゲーションデータ
38…メニュー画面データ
39…チャプタ付映像音声記録媒体
40…サムネイル画像データ
41…チャプタ番号
42…キーワード
43…チャプタ候補時刻
44…同一キーワード間隔
45…更新用データ
46…音声認識実行時間
47…キーワード出現時刻
48…チャプタ設定時刻
50、51、補正用チャプタ情報テーブル
52…字幕放送
T1…チャプタ未作成時間
T2…認識時間
T3…補正時間

Claims (15)

  1. 字幕放送を受信する受信装置から供給される字幕データ付テレビジョン信号に応答して、前記字幕データ付テレビジョン信号から字幕データと映像音声データとを抽出するデコーダ装置と、前記映像音声データは、前記字幕放送の映像と音声とを含み、
    前記字幕データと前記映像音声データとに基づいてチャプタ付映像音声記録媒体を生成する書き込み用データ生成装置と
    を具備し、
    前記書き込み用データ生成装置は、
    予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブルを生成する字幕データ解析部と、
    前記初期チャプタ情報テーブルに基づいて前記チャプタ候補時刻を補正して、チャプタ情報テーブルを生成するチャプタ情報テーブル補正部と、
    前記チャプタ付映像音声記録媒体を生成する書き込み用画像生成部と
    を有し、
    前記字幕データ解析部は、
    前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止し、
    前記チャプタ情報テーブル補正部は、音声認識部を含み、
    前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブルを生成し、
    前記音声認識部は、
    前記書き込み用映像音声データに含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定し、
    前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定し、
    前記書き込み用画像生成部は、
    前記チャプタ情報テーブルに示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データに前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体を生成する
    番組録画装置。
  2. 請求項1に記載の番組録画装置において、
    前記字幕データ解析部は、
    前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブルを構成し、
    前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するとき、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定し、
    前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成し、
    前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブルに追加する
    番組録画装置。
  3. 請求項に記載の番組録画装置において、
    前記音声認識部は、
    前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行し、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定し、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないとき、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する
    番組録画装置。
  4. 請求項に記載の番組録画装置において、
    前記音声認識部は、予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行し、
    前記チャプタ情報テーブル補正部は、
    その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する
    番組録画装置。
  5. 請求項1からの何れか一項に記載の番組録画装置において、
    さらに、前記映像音声データを処理して前記書き込み用映像音声データを生成する画像処理部を含み、
    前記画像処理部は、前記映像音声データに対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データとを対応付けて前記書き込み用映像音声データを生成し、
    前記チャプタ情報テーブル補正部は、
    前記書き込み用映像音声データに含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正して前記チャプタ設定時刻を特定する
    番組録画装置。
  6. (a)字幕データ付テレビジョン信号に応答して、前記字幕データ付テレビジョン信号から字幕データと映像音声データとを抽出するステップと、前記映像音声データは前記字幕放送の映像データと音声データとを含み、
    (b)予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブルを生成するステップと、
    (c)前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止するステップと、
    (d)前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブルを生成するステップと、
    (e)前記字幕データと前記映像音声データと前記チャプタ情報テーブルに示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データに前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体を生成するステップ
    を具備し、
    前記(d)ステップは、
    前記書き込み用映像音声データに含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定するステップと、
    前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する
    番組録画方法。
  7. 請求項に記載の番組録画方法において、
    前記(b)ステップは、
    前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブルを構成するステップと、
    前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するとき、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定するステップと
    前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成するステップと、
    前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブルに追加するステップ
    を具備する番組録画方法。
  8. 請求項に記載の番組録画方法において、
    前記(d)ステップは、さらに、
    前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行するステップと、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定するステップと、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないとき、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する番組録画方法。
  9. 請求項に記載の番組録画方法において、
    前記(d)ステップは、さらに、
    予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行するステップと、
    その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正するステップ
    を具備する番組録画方法。
  10. 請求項からの何れか一項に記載の番組録画方法において、
    さらに、
    (f)前記映像音声データに対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データとを対応付けて前記書き込み用映像音声データを生成するステップと、
    (g)前記書き込み用映像音声データに含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する番組録画方法。
  11. コンピュータを
    字幕放送を受信する受信手段から供給される字幕データ付テレビジョン信号に応答して、前記字幕データ付テレビジョン信号から字幕データと映像音声データとを抽出するデコーダ手段と、
    前記字幕データと前記映像音声データとに基づいてチャプタ付映像音声記録媒体を生成する書き込み用映像音声データ生成手段
    として機能させるプログラムであって、
    前記書き込み用映像音声データ生成手段に、
    (a)前記デコーダ手段から供給される前記字幕データと前記映像音声データとを受け取るステップと、前記映像音声データは前記字幕放送の映像データと音声データとを含み、
    (b)予め設定されたキーワードが字幕として表示される時刻をチャプタ候補時刻として特定し、前記キーワードと前記チャプタ候補時刻とを対応付けて初期チャプタ情報テーブルを生成するステップと、
    (c)前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えずに再度字幕として出現するとき、前記キーワードが新たに出現する時刻をチャプタ候補時刻として特定することを禁止するステップと、
    (d)前記チャプタ候補時刻と前記キーワードに対応する音声が出力される時刻との時間差に基づいてチャプタ設定時刻を特定し、前記チャプタ設定時刻と前記キーワードとを関連付けて前記チャプタ情報テーブルを生成するステップと、
    (e)前記字幕データと前記映像音声データと前記チャプタ情報テーブルに示される前記チャプタ設定時刻に基づいて、書き込み用映像音声データに前記チャプタ情報を付与して前記チャプタ付映像音声記録媒体を生成するステップ
    を具備する方法を実行するための手順を示し、
    前記(d)ステップは、
    前記書き込み用映像音声データに含まれる音声データの音声認識を実行して前記キーワードが音声として出力される時刻をキーワード音声出力時刻として特定するステップと、
    前記キーワード音声出力時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する
    番組録画プログラム。
  12. 請求項11に記載の番組録画プログラムにおいて、
    前記(b)ステップは、
    前記キーワードと前記チャプタ候補時刻とを関連付けたレコードを生成して前記初期チャプタ情報テーブルを構成するステップと、
    前記チャプタ候補時刻に対応付けられた前記キーワードが、所定の時間を越えて再度字幕として出現するとき、前記キーワードが新たに出現する時刻を新たなチャプタ候補時刻として特定するステップと
    前記チャプタ候補時刻と前記新たなチャプタ候補時刻との時間差であるキーワード出現間隔と前記新たなチャプタ候補時刻と前記キーワードとを関連付けて新たなレコードを生成するステップと、
    前記レコードの総数が所定の数を超えるとき、前記出現間隔が短いレコードを削除して、新たなレコードを前記初期チャプタ情報テーブルに追加するステップ
    を具備する
    番組録画プログラム。
  13. 請求項12に記載の番組録画プログラムにおいて、
    前記(d)ステップは、さらに、
    前記チャプタ候補時刻を基準時刻として所定の時間範囲で音声認識を実行するステップと、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されるとき、その認識された時刻を前記キーワード音声出力時刻として特定するステップと、
    前記時間範囲で実行された音声認識により、前記キーワードに対応する音声が認識されないとき、前記キーワードの音声認識を開始する時刻と前記チャプタ候補時刻との時間差に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する
    番組録画プログラム。
  14. 請求項13に記載の番組録画プログラムにおいて、
    前記(d)ステップは、さらに、
    予め定められた認識時間に基づいて音声認識を開始する音声認識開始時刻を特定し、特定された前記音声認識開始時刻から所定の時間範囲で音声認識を実行するステップと、
    その音声認識によって得られた前記キーワード音声出力時刻を、予め定められた補正時間に基づいて前記チャプタ候補時刻を補正するステップ
    を具備する
    番組録画プログラム。
  15. 請求項11から14の何れか一項に記載の番組録画プログラムにおいて、
    前記コンピュータを、さらに、
    前記映像音声データを処理して前記書き込み用映像音声データを生成する画像処理手段として機能させ、
    前記書き込み用映像音声データ生成手段に、さらに、
    (f)前記映像音声データに対応する字幕放送が生放送番組であるか録画放送番組であるかを示す番組種別情報を生成し、前記番組種別情報と前記映像音声データとを対応付けて前記書き込み用映像音声データを生成するステップと、
    (g)前記書き込み用映像音声データに含まれる前記番組種別情報に基づいて、前記チャプタ候補時刻を補正するステップ
    を具備する方法を実行させる
    番組録画プログラム。
JP2005092578A 2005-03-28 2005-03-28 番組録画装置、番組録画方法および番組録画プログラム Expired - Fee Related JP4019085B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005092578A JP4019085B2 (ja) 2005-03-28 2005-03-28 番組録画装置、番組録画方法および番組録画プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005092578A JP4019085B2 (ja) 2005-03-28 2005-03-28 番組録画装置、番組録画方法および番組録画プログラム

Publications (2)

Publication Number Publication Date
JP2006279290A JP2006279290A (ja) 2006-10-12
JP4019085B2 true JP4019085B2 (ja) 2007-12-05

Family

ID=37213606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005092578A Expired - Fee Related JP4019085B2 (ja) 2005-03-28 2005-03-28 番組録画装置、番組録画方法および番組録画プログラム

Country Status (1)

Country Link
JP (1) JP4019085B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008172421A (ja) * 2007-01-10 2008-07-24 Sony Corp 記録装置および方法、再生装置および方法、並びにプログラム
JP2008219343A (ja) * 2007-03-02 2008-09-18 Sony Corp 情報処理装置および方法、並びにプログラム
JP4403432B2 (ja) 2007-07-19 2010-01-27 ソニー株式会社 録画再生装置及び録画再生方法
JP4929128B2 (ja) * 2007-11-07 2012-05-09 株式会社日立製作所 録画再生装置
JP5649769B2 (ja) * 2007-12-27 2015-01-07 京セラ株式会社 放送受信装置
JP2010109852A (ja) * 2008-10-31 2010-05-13 Hitachi Ltd 映像インデクシング方法、映像録画再生装置、及び映像再生装置
JP2014030180A (ja) * 2012-06-27 2014-02-13 Sharp Corp 録画装置、テレビジョン受信機及び録画方法
JP6223678B2 (ja) * 2012-12-21 2017-11-01 株式会社東芝 電子機器及び再生制御方法
JP6301616B2 (ja) * 2013-09-06 2018-03-28 株式会社東芝 電子機器、電子機器の制御方法、及びシーン制御プログラム
JP6601944B2 (ja) * 2015-06-09 2019-11-06 日本放送協会 コンテンツ生成装置およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4465827B2 (ja) * 2000-07-13 2010-05-26 ソニー株式会社 映像信号記録再生装置および方法、並びに記録媒体
JP2002199348A (ja) * 2000-12-27 2002-07-12 Matsushita Electric Ind Co Ltd 情報受信記録再生装置
JP2004080476A (ja) * 2002-08-20 2004-03-11 Sanyo Electric Co Ltd ディジタル映像再生装置
JP2004207821A (ja) * 2002-12-24 2004-07-22 Nippon Hoso Kyokai <Nhk> 字幕放送受信装置、字幕放送受信方法及び字幕放送受信プログラム

Also Published As

Publication number Publication date
JP2006279290A (ja) 2006-10-12

Similar Documents

Publication Publication Date Title
JP4019085B2 (ja) 番組録画装置、番組録画方法および番組録画プログラム
US6822661B2 (en) Information-display control apparatus and method
KR101111537B1 (ko) 컨텐츠 시청 지원 장치 및 컨텐츠 시청 지원 방법
JP5433143B2 (ja) デジタル放送メディア記録装置及び記録方法
JP4734992B2 (ja) 番組記録装置、および番組記録方法
JPWO2006033329A1 (ja) 映像表示装置、映像表示方法および映像表示プログラム
JP2002044586A (ja) 画像記録再生装置および方法
JP2009004872A (ja) ワンセグ放送受信装置、ワンセグ放送受信方法、およびワンセグ放送受信プログラムを記録した媒体
JP2008193585A (ja) 放送番組記録再生装置および放送番組記録再生方法
JP2004357293A (ja) 識別子で関連付けられたドキュメントの選択のためのナビゲーション処理及びその処理を実施する装置
JP2007267259A (ja) 画像処理装置およびファイル再生方法
JP6266271B2 (ja) 電子機器、電子機器の制御方法及びコンピュータプログラム
US20070043776A1 (en) Controller to be connected to IEEE 1394 serial bus
JP2010093865A (ja) 電子機器および表示制御方法
KR101233167B1 (ko) 녹화물 표시 장치 및 방법
US8295676B2 (en) Video reproducing apparatus
JP6575820B2 (ja) 録画再生装置
JP2001094912A (ja) 録画再生処理方法、装置及び録画再生処理システム
KR100546874B1 (ko) 데이터 복구가 가능한 영상 처리 장치 및 그의 복구 방법
JP2008035218A (ja) 記録再生装置および自動録画方法
JP6575819B2 (ja) 録画再生装置
WO2020208695A1 (ja) 映像記録再生装置および映像記録再生方法
JP4456993B2 (ja) データ処理装置、その方法、そのプログラム、および、記録媒体
JP4592491B2 (ja) 映像記録装置
JP2006013787A (ja) コンテンツ記録装置、方法、プログラム、及び記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070921

R150 Certificate of patent or registration of utility model

Ref document number: 4019085

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees