JP5423425B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP5423425B2
JP5423425B2 JP2010013571A JP2010013571A JP5423425B2 JP 5423425 B2 JP5423425 B2 JP 5423425B2 JP 2010013571 A JP2010013571 A JP 2010013571A JP 2010013571 A JP2010013571 A JP 2010013571A JP 5423425 B2 JP5423425 B2 JP 5423425B2
Authority
JP
Japan
Prior art keywords
subtitle
display
caption
character string
display position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010013571A
Other languages
English (en)
Other versions
JP2011151750A (ja
Inventor
純 大橋
健太郎 永濱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Mobile Communications Ltd
Original Assignee
Fujitsu Mobile Communications Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Mobile Communications Ltd filed Critical Fujitsu Mobile Communications Ltd
Priority to JP2010013571A priority Critical patent/JP5423425B2/ja
Priority to US12/873,661 priority patent/US20110181773A1/en
Publication of JP2011151750A publication Critical patent/JP2011151750A/ja
Application granted granted Critical
Publication of JP5423425B2 publication Critical patent/JP5423425B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

この発明は、例えばデジタル放送など、映像に字幕を重ねて表示する画像処理を行う画像処理装置に関する。
周知のように、従来は、映像を表示するモニタの解像度と、受信した映像の解像度が異なる場合に、モニタの解像度に応じた位置を先頭に字幕文を表示させるようにしている(例えば、特許文献1参照)。
ところで近時、デジタル放送には画面サイズの大きい設置型の固定受信機向けの字幕形式や画面サイズの小さい携帯電話機等の移動受信機向けの字幕形式がある。これらの形式は解像度が異なるばかりではなく、レイアウトの自由度や装飾機能に隔たりがある。
一方、固定機向けのデジタル放送をトランスコードし移動機で視聴するという視聴形態が一般化している。これはPCやテレビ、レコーダで音声・映像・字幕の各メディアの形式を対応した携帯機向けの形式に変換することで実現する。
字幕に関しては、上述した通り解像度ばかりではなく、レイアウトや装飾機能に隔たりがあるため、公知の技術を用いたとしても適切に変換することができなかった。
また字幕の形式を変換するのではなく映像に合成する方法があるが、字幕の表示・非表示がフォーマット変換時にしか設定できないため、端末で再生中には字幕表示設定を変更できないという課題があった。
特開2001−346118号公報
従来では、映像上の任意の位置を指定して文字色・背景色の異なる複数の字幕文を表示することが可能な字幕形式を、単数のみに対応している字幕形式に変換する際に、元の字幕形式とは異なるレイアウトで表示されてしまい、閲覧性低下したりコンテンツ保持者が意図する表示方法と違う形でユーザに提示してしまうという問題があった。
この発明は上記の問題を解決すべくなされたもので、映像上の任意の位置を指定して文字色・背景色の異なる字幕文を単数のみ表示することが可能な字幕形式のデジタル放送を受信する受信機において、複数の字幕文を表示することが可能なディジタル放送の字幕表示を可能とする画像処理装置を提供することを目的とする。
上記の目的を達成するために、この発明は、表示位置を指定し複数の字幕表示を行うことが可能な第1字幕形式を採用する放送信号を受信する受信手段と、この受信手段が受信した放送信号に含まれる字幕情報に基づいて、字幕の表示位置を検出する表示位置検出手段と、字幕情報に基づいて、字幕の文字列を検出する文字列検出手段と、複数の字幕表示を行うことができない第2字幕形式の字幕情報を生成するものであって、表示位置検出手段が検出した表示位置に文字列検出手段が検出した文字列を表示するために、字幕の表示領域の始点から字幕として空白文字を配置するとともに、これに続いて文字列検出手段が検出した文字列を配置して第2字幕形式の字幕情報を生成する字幕生成手段とを具備して構成するようにした。
以上述べたように、この発明では、第1字幕形式を採用する放送信号から得た字幕情報に基づいて、字幕の表示位置を字幕の文字列を検出し、字幕の表示領域の始点から字幕として空白文字を配置するとともに、これに続いて上記文字列を配置して第2字幕形式の字幕情報を生成するようにしている。
したがって、この発明によれば、字幕のレイアウトや装飾を維持しつつ第1字幕形式の字幕情報を第2字幕形式の字幕情報に変換できるので、映像上の任意の位置を指定して文字色・背景色の異なる字幕文を単数のみ表示することが可能な字幕形式のデジタル放送を受信する受信機において、映像上の任意の位置を指定して文字色・背景色の異なる字幕文を複数表示することが可能な画像処理装置を提供できる。
この発明に係わる画像処理装置を備えた放送受信装置の一実施形態の構成を示す回路ブロック図。 ISDB-T SUBによる字幕を表示する領域の管理を説明するための図。 ISDB-T SUBによる字幕を説明するための図。 3GPP Timed Textによる字幕を説明するための図。 図1に示した放送受信装置によって生成されるTimed Textを説明するための図。 図1に示した放送受信装置の第1の実施形態に係わる字幕トランスコーダの構成を示す図。 図6に示した字幕トランスコーダの動作を説明するためのフローチャート。 図6に示した字幕トランスコーダの動作を説明するための図。 図6に示した字幕トランスコーダの動作を説明するための図。 DVB SUBによる字幕を説明するための図。 図1に示した放送受信装置の第2の実施形態に係わる字幕トランスコーダの構成を示す図。 図11に示した字幕トランスコーダの動作を説明するためのフローチャート。 DTVCCによる字幕を説明するための図。 図1に示した放送受信装置の第3の実施形態に係わる字幕トランスコーダの構成を示す図。 図14に示した字幕トランスコーダの動作を説明するためのフローチャート。 図15に示した放送受信装置によって生成されるTimed Textを説明するための図。 図1に示した放送受信装置の変形例によって生成されるTimed Textを説明するための図。 図1に示した放送受信装置の変形例の構成を示す回路ブロック図。
以下、図面を参照して、この発明の実施形態について説明する。
なお、ここでは、デジタル放送の規格、および映像上の任意の位置を指定して文字色・背景色の異なる字幕文を複数表示することが可能な字幕形式として、例えば以下の3つのデジタル放送を想定している。
1.国内および南米のデジタルテレビ放送規格であるISDB-T Integrated Services Digital Broadcasting - Terrestrial)に、ARIB TR-B14 A Profileで規定される字幕形式(以下、ISDB-T SUBと表記する)を適用したデジタル放送。
2.欧州を中心に採用されているデジタルテレビ放送規格であるDVB(Digital Broadcasting)に、ETSI EN 300 743で規定される字幕形式(以下、DVB SUBと表記する)を適用したデジタル放送。
3.北米を中心に採用されているデジタルテレビ放送規格であるATSC(Advanced Television Systems Committee)で使用され、CEA 708で規定される字幕形式(以下、DTVCCと表記する)を適用したデジタル放送。
また、映像上の所定の位置に字幕を表示する字幕形式としては、3GPP(3rd Generation Partnership Project)が規格化し、3GPP TS 26.234で規定される3GPP Timed Text(以下、Timed Textと表記する)を想定する。
すなわち、この発明に係わる画像処理装置では、3つのデジタル放送のうち、いずれかを受信し、そして、Timed Textにより字幕を表示する。
図1は、この発明の実施形態に係わる画像処理装置を備えた放送受信装置の構成を示すものである。この放送受信装置は、チューナ11と、ハードディスクドライブ(HDD)12と、メモリカード13を接続するためのカードインタフェース(I/F)14と、読出処理部15と、分離処理部20と、音声トランスコーダ30と、映像トランスコーダ40と、字幕トランスコーダ50と、多重処理部60と、記録処理部70と、入力部80と、制御部100とを備えている。
チューナ11は、例えば衛星デジタル放送や地上デジタル放送、インターネットを通じて配信されるデジタル放送などを受信するためのチューナであって、受信した信号を復調して、音声、映像、字幕などの複数のメディアデータを含むマルチメディアデータを得る。
ハードディスクドライブ(HDD)12は、上記マルチメディアデータを保存するものである。すなわち、ハードディスクドライブ12は、チューナ11などによって得たマルチメディアデータをリアルタイム再生せず、ユーザが好きなときに視聴するためにマルチメディアデータを保存するのに用いる記憶媒体である。
メモリカード13も同様に、上記マルチメディアデータを保存するものであって、NAND型フラッシュメモリなどを用いた記憶媒体である。
カードインタフェース(I/F)14は、メモリカード13が電気的および物理的に接続され、読出処理部15によって制御されることにより、メモリカード13に記録されたデータを読み出したり、あるいはデータをメモリカード13に記録するためのインタフェースである。
読出処理部15は、ハードディスクドライブ12を制御して、これに記録されたマルチメディアデータを読み出したり、カードインタフェース14を制御して、メモリカード13に記録されたマルチメディアデータを読み出して、分離処理部20に出力する。
なお、図1には図示しないが、チューナ11によって得られたマルチメディアデータを、ハードディスクドライブ12に記録(録画)したりと、カードインタフェース14を通じてメモリカード13に記録(録画)する録画処理部を備える。
分離処理部20は、チューナ11によって得られたマルチメディアデータや、読出処理部15によって読み出されたマルチメディアデータが入力され、このマルチメディアデータを、音声データ、映像データ、字幕データに分離する処理を行うもので、各データはそれぞれ対応する音声トランスコーダ30、映像トランスコーダ40および字幕トランスコーダ50に出力される。
音声トランスコーダ30は、後述する制御部100から与えられる変換パラメータにしたがって、分離処理部20から与えられる音声データをトランスコードし、当該放送受信装置で再生可能な音声データに変換する。
映像トランスコーダ40は、制御部100から与えられる変換パラメータにしたがって、分離処理部20から与えられる映像データをトランスコードし、当該放送受信装置で再生可能な映像データに変換する。
字幕トランスコーダ50は、制御部100から与えられる変換パラメータにしたがって、分離処理部20から与えられる字幕データに変換処理を施して、Timed Text方式の字幕データを得る。
多重処理部60は、音声トランスコーダ30から出力される音声データ、映像トランスコーダ40から出力される映像データおよび字幕トランスコーダ50から出力される字幕データを1つのマルチメディアデータに多重化する。このようにして主にサイズの小さなモニタを備える携帯電話機などの受信機に向けたデータが得られる。
記録処理部70は、多重処理部60によって得られたマルチメディアデータを記録するものであって、ハードディスクドライブ12やメモリカード13に記録する。
なお、このようにして得たマルチメディアデータは、図示しないデコーダによって音声信号、映像信号、字幕信号に復号され、スピーカ(図示しない)から拡声出力されると共に、映像がモニタ(図示しない)上に表示されてもよく、字幕信号に基づく字幕は、映像信号に基づく映像上に重ねて表示される。
入力部80は、ユーザからの要求を受け付けるためのインタフェースであって、例えば、音声の品質の度合い、映像の品質の度合い、出力解像度、字幕の表示方法などの情報が任意に入力される。
制御部100は、当該放送受信装置の各部を統括して制御するものであって、入力部80を通じて入力された情報に基づいて、上記変換パラメータを生成し、音声に関わるパラメータについては、音声トランスコーダ30に出力し、映像に関わるパラメータについては、映像トランスコーダ40に出力し、そして字幕に関わるパラメータについては、字幕トランスコーダ50に出力する。
次に、この発明に係わる字幕トランスコーダ50の詳細な構成について説明する。なお、前述したようにデジタルテレビ放送規格によって採用する字幕形式が異なり、それに応じて字幕トランスコーダ50の処理も異なるため、字幕形式毎に説明する。第1の実施形態では、字幕データがISDB-T SUBの場合について説明し、第2の実施形態では、DVB SUBの場合について説明し、そして第3の実施形態では、DTVCCの場合について説明する。
(第1の実施形態:字幕データがISDB-T SUBの場合)
字幕データISDB-T SUBは、PES(Packet Elementary Stream)パケット形式であり、映像データ、音声データとともにMPEG-2 TS形式で上記マルチメディアデータとして多重され、PESヘッダに存在するPTS(Presentation Time Stamp)によって映像・音声と同期して再生されるものである。またISDB-T SUBには、字幕文の情報である字幕文データと、制御情報が格納された字幕管理データを含んでいる。
ISDB-T SUBを採用する地上デジタル放送では、図2に示すように、映像と字幕をプレーンPと呼ばれる論理的な領域で管理する。そして、通常の地上ディジタル放送受信装置では、再生時に字幕を映像にオーバーレイして表示する。なお、当該放送受信装置では、ISDB-T SUBをTimed Textに変換して表示を行う。これについては後に詳述する。
通常の地上ディジタル放送受信装置について、さらに具体的に説明する。通常の地上ディジタル放送受信装置では、字幕プレーンPの原点座標を起点とする任意の場所が、字幕データ中の制御符号SDPで指定されるとともに、サイズがSDFで指定される。また背景色がCOLで指定される。このようにして、表示領域Eが字幕データ中の制御符号(SDP、SDF、COL)によって設定される。そして、例えば図3に示すように、字幕文S1〜S3を、表示領域Eにおいて、文字単位で、対応した制御符号により指定された場所・文字サイズ・文字間隔・文字色・背景色で表示する。
一方、Timed Textでは、図4に示すように、ディスプレイの表示領域Dのうち、論理的な領域Text Track中の任意の場所に、背景色を指定可能な表示領域Text Boxを設定することが可能であって、Text Box中に文字単位で文字色を指定した字幕文を表示することができる。しかし、Timed Textでは、ISDB-T SUBのように文字単位で表示位置を指定する機能や背景色を指定する機能がないため、ISDB-T SUBを単純にTimed Textに変換することはできない。
そこで、発明に係わる放送受信装置では、図1の字幕トランスコーダ50によってISDB-T SUBをTimed Textに変換する。すなわち、字幕トランスコーダ50は、図5に示すように、例えば図3に例示した各字幕文S1〜S3を包含する矩形領域に対応するText Boxを生成し、その背景色を透明に設定する。そしてText Box上に、画面左上から空白文字や改行を設定して、ISDB-T SUBで指定された表示位置に各字幕文S1〜S3を設定する。そして、Timed Textで使用可能な装飾機能であるハイライト機能を使用し、それぞれの文字をISDB-T SUBの背景色で指定された色でハイライト表示する。この方法により、ISDB-T SUBで表示した場合と酷似した表示を行う。
図6に、字幕トランスコーダ50の構成を示す。すなわち、字幕トランスコーダ50は、入力PESバッファ51と、パラメータ設定部52と、字幕解析処理部53と、スケール処理部54と、データ変換処理部55と、出力バッファ56とを備える。このような構成により、図7に示す処理を繰り返し実行する。
入力PESバッファ51は、分離処理部20から与えられる字幕データを一時的に蓄え、後段の処理の進捗に応じて、字幕解析処理部53により、処理対象となる字幕データのPESパケットが読み出される。
パラメータ設定部52は、制御部100から与えられる変換パラメータに基づいて、ISDB-T SUBをTimed Textに変換する際の出力解像度をスケール処理部54に通知する。
字幕解析処理部53は、ステップ7aにおいて、字幕文データおよび字幕管理データを解析する。字幕文データ中の文字コードおよび制御コードを解析し、横方向(縦書きの場合は縦方向)に連続し背景色が同じである文字列を1つの字幕グループとして検出する。また、この検出した各字幕グループに含まれる文字・文字サイズ・文字色・背景色・各種装飾情報を検出するとともに、そして各字幕グループの開始座標および終了座標を検出する。また字幕管理データについても解析を行い、制御コードから表示書式等を変更する。図3の例では、字幕グループは、S1〜S3に相当する。
スケール処理部54は、ステップ7bにおいて、ISDB-T SUBの字幕プレーンPの解像度(入力解像度。例えば、960x540あるいは720x480など)、パラメータ設定部52から通知された出力解像度(Text Trackのサイズ)に基づいて、字幕解析処理部53が解析した文字サイズおよび各グループの開始・終了座標などのスケールを変換するスケール変換処理を実施する。
例えば、入力解像度が960x540、出力解像度が320x180の場合は、文字サイズおよび各座標を1/3に変換する。また小さなモニタ上での字幕の読みやすさを考慮して、縮小するのではなく、より大きなサイズに変換してもよい。
例えば、横書きで、縦方向より横方向の表示サイズが大きくならないようにすることを優先する場合には、図8(a)に示すように、各行の折り返し位置と改行位置を調整して、グループのサイズを変更してもよい。さらには、複数の行を連結して、改行位置から折り返し位置までの空きをなくすようにしてもよい。なお、横書きで、横方向より縦方向の表示サイズが大きくならないようにすることを優先する場合には、図8(b)に示すように、各行の折り返し位置や改行位置は変更することなく、文字サイズを拡大する。
なお、ここでスケール変換した字幕文の文字列長が終了座標を超えて、表示領域Eからはみ出してしまう場合、追加的に、改行やフォントを変更する処理や、文字サイズをより小さくする処理を実施して、各字幕グループが表示領域E内の所望の位置に表示できるように調整する処理を実施する。
データ変換処理部55は、ステップ7cにおいて、まず、各字幕グループ内の字幕文の文字コードを8単位符号からUnicodeのUTF-8(もしくはUTF-16)に変換する処理を行う。そして、データ変換処理部55は、すべての字幕グループ(図3の例では、字幕グループは、S1〜S3)を包含するサイズのText Boxを設定する。なお、Text Boxのサイズは、Text Trackと同じサイズとしてもよい。
さらに、データ変換処理部55は、各字幕グループを上記Text Box内に配置する処理を行う。すなわち、データ変換処理部55は、字幕解析処理部53によって検出され、スケール処理部54によってスケール変換された各字幕グループの開始座標を参照し、その開始座標が、対応する字幕グループの開始位置となるように、各字幕グループの字幕文に加えて、空白文字や改行コードを設定して、映像と字幕の位置関係が相対的にISDB-T SUBの位置関係と一致するように調整して、1つのText Sampleを生成する。図3の例では、各字幕グループの位置関係が図5に示すような配置になるように、図10に示すようなText Boxをデータとして持つText Sampleを生成する。なお、図10では、空白文字や改行コードの設定により、字幕文とその位置調整を示したもので、背景色の設定については省略して示している。
また、データ変換処理部55は、上記Text Sampleに対して装飾処理を行う。字幕解析処理部53によって検出されたISDB-T SUB中の装飾情報(文字色、スクロールやブリンク)に基づく装飾をText Sample中の対応する文字に対して行うために、Text Style BoxやText Scroll Delay Box等を上記Text Sampleに対して適用して実現する。そしてまた、各字幕グループの背景色については、データ変換処理部55は、Text Hilight Box、Text Hilight Color Boxを用いたハイライト処理を上記Text Sampleに対して適用して実現する。
なお、上記Text Sampleの出力タイミングの情報については、データ変換処理部55は、PESパケットのPTSを基準に生成する。また、初回のデータ変換処理の場合は、Text TrackのヘッダであるTrack Header Box、およびSampleのデフォルトパラメータを設定したText Sample Entryを、上記Text Sampleに合わせて生成する。
出力バッファ56は、ステップ7dにおいて、データ変換処理部55のデータ変換処理によって生成されText Sampleと、その出力タイミング情報、さらに、初回のデータの場合は、Text Sample Entry、Track Header Boxを対応づけて、一時的に記憶し、後段の多重処理部60の処理の進捗(あるいは、音声トランスコーダ30および映像トランスコーダ40の進捗)に合わせて出力する。
以上のように、上記構成の画像処理装置では、ISDB-T SUBをTimed Textに変換する際に、横方向(縦書きの場合は縦方向)に連続し背景色が同じである文字列を1つの字幕グループとして検出するとともに、各グループの開始座標を検出し、Text Box内に空白文字や改行コードを設定することで位置調整して、複数の字幕グループを含む1つのText Sampleを生成するようにしている。
したがって、上記構成の画像処理装置によれば、ISDB-T SUBを相対的な表示位置をほとんど変えずにTimed Textに変換することができるので、Timed Text方式のデジタル放送を再生する受信機において、ISDB-T SUBと同様に動的に字幕の表示位置を変化させることができる。
(第2の実施形態:字幕データがDVB SUBの場合)
字幕データDVB SUBは、PES(Packet Elementary Stream)パケット形式であり、映像データ、音声データとともにMPEG-2 TS形式で上記マルチメディアデータとして多重され、PESヘッダに存在するPTS(Presentation Time Stamp)によって映像・音声と同期して再生されるものである。
DVB SUBは、PESパケット中にディスプレイのサイズの情報を有し、図10に示すようなwindowを、画面中の任意の位置および任意のサイズで設定し、上記window上にpageと呼ばれる表示単位で字幕を表示する。また字幕を表示する領域(図10では、R1〜R3)は、regionと呼ばれ、window上の任意の位置に、任意のサイズで複数設定できる。
ディスプレイの情報やpageやregionを設定するためのデータは、PESパケットのペイロードにsubtitle segmentとして格納されており、subtitle segmentのsegment_typeパラメータで識別できる。ディスプレイ情報は、display definition segmentに格納され、page情報は、page composition segmentに格納され、region情報は、region composition segmentに格納され、字幕文データは、object data segmentに格納される。DVB SUBは、字幕文データとして、テキスト形式とビットマップ形式を使用することができ、region composition segmentのobject_idパラメータで、形式を識別できる。字幕文データがテキスト形式の場合は、object data segmentには、文字コードが格納され、文字色、背景色は、region composition segmentで指定される。また字幕文データがビットマップ形式の場合は、各ピクセルの色情報が指定される。
一方、Timed Textでは、図4に示したように、ディスプレイの表示領域Dのうち、論理的な領域Text Track中の任意の場所に、背景色を指定可能な表示領域Text Boxを設定することが可能であって、Text Box中に文字単位で文字色を指定した字幕文を表示することができる。しかし、Timed Textでは、DVB SUBのように文字単位で表示位置を指定する機能や背景色を指定する機能、そしてビットマップ形式のデータを字幕として表示させる機能がないため、DVB SUBを単純にTimed Textに変換することはできない。
そこで、発明に係わる放送受信装置では、図1の字幕トランスコーダ50によってDVB SUBをTimed Textに変換する。すなわち、字幕トランスコーダ50は、図5に示すように、例えば図10に例示した各region R1〜R3を包含する矩形領域に対応するText Boxを生成し、その背景色を透明に設定する。そしてText Box上に、画面左上から空白文字や改行を設定して、DVB SUBで指定された表示位置に各字幕表示領域R1〜R3を設定する。そして、Timed Textで使用可能な装飾機能であるハイライト機能を使用し、それぞれの文字をDVB SUBの背景色で指定された色でハイライト表示する。この方法により、DVB SUBで表示した場合と酷似した表示を行う。なお、ビットマップ形式のデータによる字幕については、その表示を文字認識して、テキスト形式のデータに変換する。
図11に、字幕トランスコーダ50の構成を示す。すなわち、字幕トランスコーダ50は、入力PESバッファ51と、パラメータ設定部52と、字幕解析処理部53と、スケール処理部54と、データ変換処理部55と、出力バッファ56と、字幕データ判定部57と、文字認識処理部58とを備える。このような構成により、図12に示す処理を繰り返し実行する。
入力PESバッファ51は、分離処理部20から与えられる字幕データを一時的に蓄え、後段の処理の進捗に応じて、字幕解析処理部53により、処理対象となる字幕データのPESパケットが読み出される。
パラメータ設定部52は、制御部100から与えられる変換パラメータに基づいて出力解像度をスケール処理部54に通知する。
ステップ12a〜12fは、ループ処理である。字幕解析処理部53、字幕データ判定部57および文字認識処理部58によるステップ12b〜12eの処理が、各regionについて実施され、字幕分データの形式の判定、文字認識処理および字幕解析処理が行われる。図10の例では、R1〜R3について、それぞれ実行される。
ステップ12bでは字幕データ判定部57が、処理対象のregionについて、region composition segmentのobject_idパラメータを参照し、ステップ12cに移行する。
ステップ12cでは字幕データ判定部57が、region composition segmentのobject_idパラメータに基づいて、処理対象のregionがビットマップ形式の字幕分データであるか否かを判定する。ここで、ビットマップ形式の字幕分データである場合には、処理対象のregionのデータを文字認識処理部58に出力して、ステップ12dに移行し、一方、ビットマップ形式の字幕分データではない場合は、処理対象のregionのデータを字幕解析処理部53に出力して、ステップ12eに移行する。
ステップ12dでは文字認識処理部58が、字幕データ判定部57を通じて入力される処理対象のregionのobject data segmentから取得したビットマップデータに対して文字認識処理を実施して、このビットマップデータで表現される字幕文の文字列、文字のサイズ、文字色、背景色をそれぞれ検出し、これらの情報から字幕文データおよび字幕管理データを生成する。
すなわち、文字認識処理部58は、ビットマップデータで表現される字幕文を字幕文データおよび字幕管理データに変換する。このようにして生成した字幕文データおよび字幕管理データは、字幕解析処理部53に出力され、ステップ12eに移行する。なお、ここで文字認識処理部58は、上記文字認識処理において、文字の形状から対応するフォントを検出し、そのフォントの種別を示すフォント情報を生成して、字幕解析処理部53に出力するようにしてもよい。
ステップ12eでは字幕解析処理部53が、字幕データ判定部57あるいは文字認識処理部58から与えられる、処理対象のregionの字幕文データおよび字幕管理データを解析する。字幕文データ中の文字コードおよび制御コードを解析し、region内の文字列を1つの字幕グループとして検出する。また、この検出した各字幕グループに含まれる文字・文字サイズ・文字色・背景色・各種装飾情報を検出するとともに、そして各字幕グループの開始・終了座標を検出する。また字幕管理データについても解析を行い、制御コードから表示書式等を変更する。
ステップ12gは、すべてのregionについてステップ12b〜12eの処理が完了すると実行される。ステップ12gでは、スケール処理部54が、display definition segmentより取得したDVB SUBのディスプレイの解像度、パラメータ設定部52から通知された出力解像度(Text Trackのサイズ)に基づいて、字幕解析処理部53が解析した文字サイズおよび各グループの開始・終了座標などのスケールを変換するスケール変換処理を実施する。
例えば、入力解像度が1920x1080、出力解像度が320x180の場合は、文字サイズおよび各座標を1/6に変換する。また小さなモニタ上での字幕の読みやすさを考慮して、縮小するのではなく、より大きなサイズに変換してもよい。その際、横方向あるいは縦方向の表示サイズを優先するために、改行位置を調整し、各グループのサイズを変更してもよいし、後述する第2の実施形態の様式で表示するような処理を実施してもよい。
なお、ここでスケール変換した字幕文の文字列長が終了座標を超えて、windowからはみ出してしまう場合、追加的に、改行やフォントを変更する処理や、文字サイズをより小さくする処理を実施して、各字幕グループがwindow内の所望の位置に表示できるように調整する処理を実施する。
ステップ12hでは、データ変換処理部55が、まず、各字幕グループ内の字幕文の文字コードを8単位符号からUnicodeのUTF-8(もしくはUTF-16)に変換する処理を行う。そして、データ変換処理部55は、すべての字幕グループ(図10の例では、字幕グループは、R1〜R3に対応するもの)を包含するサイズのText Boxを設定する。なお、Text Boxのサイズは、Text Trackと同じサイズとしてもよい。
さらに、データ変換処理部55は、各字幕グループを上記Text Box内に配置する処理を行う。すなわち、データ変換処理部55は、字幕解析処理部53によって検出され、スケール処理部54によってスケール変換された各字幕グループの開始座標を参照し、その開始座標が、対応する字幕グループの開始位置となるように、各字幕グループの字幕文に加えて、空白文字や改行コードを設定して、映像と字幕の位置関係が相対的にDVB SUBの位置関係と一致するように調整して、1つのText Sampleを生成する。図10の例では、各字幕グループの位置関係が図5に示すような配置になるように、Text Sampleを生成する。
また、データ変換処理部55は、上記Text Sampleに対して装飾処理を行う。字幕解析処理部53によって検出されたDVB SUB中の装飾情報(文字色、スクロールやブリンク)に基づく装飾をText Sample中の対応する文字に対して行うために、Text Style BoxやText Scroll Delay Box等を上記Text Sampleに対して適用して実現する。なお、DVB SUB中での色指定は、YCbCr形式であるため、Timed Textで採用するRGB形式に変換する処理を行う。
そしてまた、各字幕グループの背景色については、データ変換処理部55は、Text Hilight Box、Text Hilight Color Boxを用いたハイライト処理を上記Text Sampleに対して適用して実現する。また文字認識処理部58の文字認識処理により、フォント情報を生成している場合、サンプル情報を記述するText Sample Entryを生成し、FontTableBoxで該当するフォントを指定する。
なお、上記Text Sampleの出力タイミングの情報については、データ変換処理部55は、PESパケットのPTSを基準に生成する。また、初回のデータ変換処理の場合は、Text TrackのヘッダであるTrack Header Box、およびSampleのデフォルトパラメータを設定したText Sample Entryを、上記Text Sampleに合わせて生成する。
ステップ12iでは、出力バッファ56が、データ変換処理部55のデータ変換処理によって生成されText Sampleと、その出力タイミング情報、さらに、初回のデータの場合は、Text Sample Entry、Track Header Boxを対応づけて、一時的に記憶し、後段の多重処理部60の処理の進捗(あるいは、音声トランスコーダ30および映像トランスコーダ40の進捗)に合わせて出力する。
以上のように、上記構成の画像処理装置では、DVB SUBをTimed Textに変換する際に、regionの文字列(ビットマップ形式の場合は、文字認識処理により文字列に変換する)を1つの字幕グループとして検出するとともに、各グループの開始座標を検出し、Text Box内に空白文字や改行コードを設定することで位置調整して、複数の字幕グループを含む1つのText Sampleを生成するようにしている。
したがって、上記構成の画像処理装置によれば、DVB SUBを相対的な表示位置をほとんど変えずにTimed Textに変換することができるので、Timed Text方式のデジタル放送を再生する受信機において、DVB SUBと同様に動的に字幕の表示位置を変化させることができる。また、ビットマップ形式の字幕データであっても、変換できる。
(第3の実施形態:字幕データがDTVCCの場合)
字幕データDTVCCは、Caption Channelパケット形式であり、コンテンツ映像のMPEG-2 Videoデータのuser_data領域に格納され、このVideoデータと同期して再生される。
DTVCCは、図13に示すように、縦横それぞれにマージン(20%が推奨値)を残してビデオの表示領域V上にsafe title areaを設け、これをgridと呼ばれる領域に分割する。このgridの数は、映像のアスペクト比が16:9の場合は縦210個x横75個とし、4:3の場合は縦160個x横75個とする。
このようなgridに分割されたsafe title areaにおいて、任意のgridを組み合わせることでサイズを可変し、背景色を設定して、字幕表示領域であるwindowを表示する。このようにして設定されるwindowは、最大8つ表示できる。またwindowに優先順位を設定することができ、window同士が重なった場合、優先順位の高いものが前面に表示される。図13の例では、window2の優先順位がwndow1の優先順位よりも高く設定されている様子を示している。
windowは、字幕データ中の制御コードSWAにより、スクロールさせたり、表示効果や背景色等を設定したり、複数のwindowを揃えたりする設定を施すことができる。またwindow内で表示する字幕文は、字幕文データ中のSPA制御コードにより文字単位でサイズやフォント、アンダーライン等の修飾を設定でき、また字幕分データ中のSPC制御コードにより文字色や背景色等を設定できる。
一方、Timed Textでは、図4に示したように、ディスプレイの表示領域Dのうち、論理的な領域Text Track中の任意の場所に、背景色を指定可能な表示領域Text Boxを設定することが可能であって、Text Box中に文字単位で文字色を指定した字幕文を表示することができる。しかし、Timed Textでは、DTVCCのようにwindow単位で表示位置を指定する機能や背景色を指定する機能、そしてwindowに優先順位を設定して重ね合わせ表示させる機能がないため、DTVCCを単純にTimed Textに変換することはできない。
そこで、発明に係わる放送受信装置では、図1の字幕トランスコーダ50によってDTVCCをTimed Textに変換する。すなわち、字幕トランスコーダ50は、図5に示すように、例えば図13に例示した各window1〜window3を包含する矩形領域に対応するText Boxを生成し、その背景色を透明に設定する。そしてText Box上に、画面左上から空白文字や改行を設定して、DTVCCで指定された表示位置に各字幕表示領域R1〜R3を設定する。そして、Timed Textで使用可能な装飾機能であるハイライト機能を使用し、それぞれの文字をDTVCCの背景色で指定された色でハイライト表示する。この方法により、DTVCCで表示した場合と酷似した表示を行う。
図14に、字幕トランスコーダ50の構成を示す。すなわち、字幕トランスコーダ50は、入力パケットバッファ51と、パラメータ設定部52と、字幕解析処理部53と、スケール処理部54と、データ変換処理部55と、出力バッファ56とを備える。このような構成により、図15に示す処理を繰り返し実行する。
入力パケットバッファ51は、分離処理部20から与えられる字幕データを一時的に蓄え、後段の処理の進捗に応じて、字幕解析処理部53により、処理対象となる字幕データのパケットが読み出される。
パラメータ設定部52は、制御部100から与えられる変換パラメータに基づいて、DTVCCをTimed Textに変換する際の出力解像度をスケール処理部54に通知する。
字幕解析処理部53は、ステップ15aにおいて、DTVCCを解析し、window内の文字列を1つの字幕グループとして検出する。そして、字幕解析処理部53は、この検出した各字幕グループに含まれる文字・文字サイズ・文字色・背景色・各種装飾情報を検出するとともに、そして各字幕グループの開始座標および終了座標をDTVCCから検出する。
なお、開始座標および終了座標は、windowを構成するgridの位置を示す情報に基づいて、ビデオ表示領域Vの左上を原点とするピクセル値で示される座標系の位置情報に変換する。また文字サイズは、SPAで指定されたSTANDARD,LARGE,SMALLという3段階の設定値をピクセル値に変換する。フォントが指定されている場合は、対応するフォント選択し、フォント情報を生成してもよい。
スケール処理部54は、ステップ15bにおいて、ビデオ表示領域V、パラメータ設定部52から通知された出力解像度(Text Trackのサイズ)に基づいて、字幕解析処理部53が解析した文字サイズおよび各グループの開始・終了座標などのスケールを変換するスケール変換処理を実施する。
例えば、入力解像度が1920x1080、出力解像度が320x180の場合は、文字サイズおよび各座標を1/6に変換する。また小さなモニタ上での字幕の読みやすさを考慮して、縮小するのではなく、より大きなサイズに変換してもよい。その際、横方向あるいは縦方向の表示サイズを優先するために、改行位置を調整し、各グループのサイズを変更してもよいし、後述する第2の実施形態の様式で表示するような処理を実施してもよい。
またスケール処理部54は、window同士が重なっている場合は、文字サイズの変更やwindowの表示位置を変更し、重なりを解消する処理を行う。
なお、ここでスケール変換した字幕文の文字列長が終了座標を超えて、表示領域Eからはみ出してしまう場合、追加的に、改行やフォントを変更する処理や、文字サイズをより小さくする処理を実施して、各字幕グループが表示領域E内の所望の位置に表示できるように調整する処理を実施する。
データ変換処理部55は、ステップ15cにおいて、まず、各字幕グループ内の字幕文の文字コードを8単位符号からUnicodeのUTF-8(もしくはUTF-16)に変換する処理を行う。そして、データ変換処理部55は、すべての字幕グループ(図13の例では、字幕グループは、window1〜window3)を包含するサイズのText Boxを設定する。なお、Text Boxのサイズは、Text Trackと同じサイズとしてもよい。
さらに、データ変換処理部55は、各字幕グループを上記Text Box内に配置する処理を行う。すなわち、データ変換処理部55は、字幕解析処理部53によって検出され、スケール処理部54によってスケール変換された各字幕グループの開始座標を参照し、その開始座標が、対応する字幕グループの開始位置となるように、各字幕グループの字幕文に加えて、空白文字や改行コードを設定して、映像と字幕の位置関係が相対的にDTVCCの位置関係と一致するように調整して、1つのText Sampleを生成する。図13の例では、各字幕グループの位置関係が図16に示すような配置になるように、Text Sampleを生成する。
また、データ変換処理部55は、上記Text Sampleに対して装飾処理を行う。字幕解析処理部53によって検出されたDTVCC中の装飾情報(文字色、スクロールやブリンク)に基づく装飾をText Sample中の対応する文字に対して行うために、Text Style BoxやText Scroll Delay Box等を上記Text Sampleに対して適用して実現する。なお、DTVCCの色指定は、RGB各2bitの全64色であるが、Timed TextではRGB各8bitであるため、これを考慮して、2bitのRGB値を8bitのRGB値に変換する処理を行う。
そしてまた、各字幕グループの背景色については、データ変換処理部55は、Text Hilight Box、Text Hilight Color Boxを用いたハイライト処理を上記Text Sampleに対して適用して実現する。またスクロール処理が指定されている場合は、Text Sample Entryにスクロールの開始・停止タイミングを設定するとともに、Text Scroll Delay Boxによりスクロールの遅延を設定する。フォント情報を生成している場合は、サンプル情報を記述するText Sample Entryを生成し、Font Table Boxで該当するフォントを指定する。
なお、上記Text Sampleの出力タイミングの情報については、データ変換処理部55は、VideoのPTSを基準に生成する。また、初回のデータ変換処理の場合は、Text TrackのヘッダであるTrack Header Box、およびSampleのデフォルトパラメータを設定したText Sample Entryを、上記Text Sampleに合わせて生成する。
出力バッファ56は、ステップ15dにおいて、データ変換処理部55のデータ変換処理によって生成されText Sampleと、その出力タイミング情報、さらに、初回のデータの場合は、Text Sample Entry、Track Header Boxを対応づけて、一時的に記憶し、後段の多重処理部60の処理の進捗(あるいは、音声トランスコーダ30および映像トランスコーダ40の進捗)に合わせて出力する。
以上のように、上記構成の画像処理装置では、DTVCCをTimed Textに変換する際に、windowの文字列を1つの字幕グループとして検出するとともに、各グループの開始座標を検出し、Text Box内に空白文字や改行コードを設定することで位置調整して、複数の字幕グループを含む1つのText Sampleを生成するようにしている。
したがって、上記構成の画像処理装置によれば、DTVCCを相対的な表示位置をほとんど変えずにTimed Textに変換することができるので、Timed Text方式のデジタル放送を再生する受信機において、DTVCCと同様に動的に字幕の表示位置を変化させることができる。
なお、この発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
その一例として例えば、上記第1および第2の実施の形態では、それぞれデータ変換処理部55によって、図5に示すようなTimed Textに変換し、上記第3の実施の形態では、データ変換処理部55によって、図17に示すようなTimed Textに変換した。すなわち、元の字幕分データ(ISDB-T SUB、DVB SUBあるいはDTVCC)と同じ位置に同じ字幕を表示するようにした。
これに代わって例えば、図17に例示するように、データ変換処理部55は、元の字幕分データに対応する位置には、インデックス番号(図17の例では「1」と「2」)だけを表示するようにText Sampleを生成するとともに、Text Boxの外周部(図17に例では下部)に、インデックス番号と字幕文を対応づけて表示するようにText Sampleを生成するようにしてもよい。
また上記実施形態では、図1に示したように、デジタル放送をトランスコードしたのち、ハードディスクドライブ12やメモリカード13に記録するようにしたが、これに代わって例えば、図18に示すように、トランスコードしたマルチメディアデータをデコードして、再生するようにしてもよい。その場合、入力部80からの字幕の表示・非表示を指定するユーザ入力により字幕再生のオンオフを随時切り換えることも可能である。その場合、字幕トランスコーダ50の処理を停止することやデコーダ90による字幕のデコードの停止、再生処理部91による字幕のオーバーレイの停止により実現する。
図18に示す放送受信装置では、デコーダ90が、音声トランスコーダ30から出力される音声データ、映像トランスコーダ40から出力される映像データおよび字幕トランスコーダ50から出力される字幕データをそれぞれデコードして、音声信号、映像信号、字幕信号を得る。そして、再生処理部91が、映像信号と字幕信号に基づいて、映像に字幕を載せた映像をディスプレイ92に表示させる。このように、トランスコードしたマルチメディアデータを再記録しない放送受信装置に適用することも可能である。
また上記実施の形態では、Text Box上に空白文字と改行の組み合わせにより、字幕文の表示位置を調整するようにしたが、空白文字だけで上記表示位置を調整するようにしてもよい。
そしてまた、上記実施の形態では、各形式(ISDB-T SUB、DVB SUBあるいはDTVCC)の字幕データを包含する矩形領域に対応するText Boxを生成するようにしたが、表示領域全体を包含する領域に対応するText Boxを生成するようにしてもよい。
さらにまた各形式(ISDB-T SUB、DVB SUBあるいはDTVCC)の字幕データから字幕文を検出するようにしたが、字幕が重ねられた映像に対して文字認識処理を施して字幕文とその表示位置を検出し、この検出結果に基づいてTimed Text方式の字幕データを生成するようにしてもよい。なお、文字が存在しない位置については、無色の空白文字を設定する。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
11…チューナ、12…ハードディスクドライブ(HDD)、13…メモリカード、14…カードインタフェース(I/F)、15…読出処理部、20…分離処理部、30…音声トランスコーダ、40…映像トランスコーダ、50…字幕トランスコーダ、51…入力PESバッファ、52…パラメータ設定部、53…字幕解析処理部、54…スケール処理部、55…データ変換処理部、56…出力バッファ、57…字幕データ判定部、58…文字認識処理部、60…多重処理部、70…記録処理部、80…入力部、90…デコーダ、91…再生処理部、92…ディスプレイ、100…制御部。。

Claims (8)

  1. 表示位置を指定し複数の字幕表示を行うことが可能な第1字幕形式を採用する放送信号を受信する受信手段と、
    この受信手段が受信した放送信号に含まれる字幕情報に基づいて、字幕の表示位置を検出する表示位置検出手段と、
    前記字幕情報に基づいて、字幕の文字列を検出する文字列検出手段と、
    複数の字幕表示を行うことができない第2字幕形式の字幕情報を生成するものであって、前記表示位置検出手段が検出した前記表示位置と対応する位置に前記文字列検出手段が検出した文字列を表示するために、前記表示位置を含む領域に前記第2字幕形式の表示領域を設定し前記表示領域の始点から字幕として空白文字を配置するとともに、これに続いて前記文字列検出手段が検出した文字列を前記対応する位置に配置して前記第2字幕形式の字幕情報を生成する字幕生成手段と
    を具備したことを特徴とする画像処理装置。
  2. 前記文字列検出手段は、前記字幕情報に含まれる画像データから文字を認識することで、字幕に文字列を検出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記字幕生成手段は、前記表示位置検出手段が検出した前記表示位置をすべて包含する領域を検出して前記第2字幕形式の前記表示領域を設定することを特徴とする請求項1に記載の画像処理装置。
  4. 前記文字列検出手段は、縦方向もしくは横方向に連なる字幕の文字列を1つのグループとして検出し、
    前記表示位置検出手段は、前記グループの表示位置を検出することを特徴とする請求項3に記載の画像処理装置。
  5. 表示位置を指定し複数の字幕表示を行うことが可能な第1字幕形式を採用する放送信号を受信する受信手段と、
    この受信手段が受信した放送信号に含まれる字幕情報に基づいて、字幕の表示位置を検出する表示位置検出手段と、
    前記字幕情報に基づいて、字幕の文字列を検出する文字列検出手段と、
    複数の字幕表示を行うことができない第2字幕形式の字幕情報を生成するものであって、前記表示位置検出手段が検出した表示位置と対応する位置に前記文字列を示すインデックスを表示するために、前記表示位置を含む領域に前記第2字幕形式の表示領域を設定し、前記表示領域の始点から字幕として空白文字を配置し前記対応する位置に前記インデックスを配置するとともに、前記インデックスに対応する前記文字列を前記表示領域の端部に表示するために、さらに空白文字を配列して前記インデックスに対応する前記文字列を前記表示領域の前記端部に配置して前記第2字幕形式の字幕情報を生成する字幕生成手段と
    を具備したことを特徴とする画像処理装置。
  6. 前記文字列検出手段は、前記字幕情報に含まれる画像データから文字を認識することで、字幕に文字列を検出することを特徴とする請求項5に記載の画像処理装置。
  7. 前記字幕生成手段は、前記表示位置検出手段が検出した前記表示位置をすべて包含する領域を検出して前記第2字幕形式の前記表示領域を設定することを特徴とする請求項5に記載の画像処理装置。
  8. 前記文字列検出手段は、縦方向もしくは横方向に連なる字幕の文字列を1つのグループとして検出し、
    前記表示位置検出手段は、前記グループの表示位置を検出することを特徴とする請求項7に記載の画像処理装置。
JP2010013571A 2010-01-25 2010-01-25 画像処理装置 Expired - Fee Related JP5423425B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010013571A JP5423425B2 (ja) 2010-01-25 2010-01-25 画像処理装置
US12/873,661 US20110181773A1 (en) 2010-01-25 2010-09-01 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010013571A JP5423425B2 (ja) 2010-01-25 2010-01-25 画像処理装置

Publications (2)

Publication Number Publication Date
JP2011151750A JP2011151750A (ja) 2011-08-04
JP5423425B2 true JP5423425B2 (ja) 2014-02-19

Family

ID=44308704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010013571A Expired - Fee Related JP5423425B2 (ja) 2010-01-25 2010-01-25 画像処理装置

Country Status (2)

Country Link
US (1) US20110181773A1 (ja)
JP (1) JP5423425B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2827586B1 (en) * 2012-03-14 2019-05-08 Panasonic Corporation Receiver apparatus, broadcast/communication-cooperation system, and broadcast/communication-cooperation method
US20140002460A1 (en) * 2012-06-27 2014-01-02 Viacom International, Inc. Multi-Resolution Graphics
US9628865B2 (en) * 2012-09-10 2017-04-18 Apple Inc. Enhanced closed caption feature
WO2015126117A1 (ko) * 2014-02-23 2015-08-27 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
JP6366070B2 (ja) * 2014-07-10 2018-08-01 日本放送協会 テキストコンテンツ生成装置、送信装置、受信装置、およびプログラム。
CN104244107B (zh) * 2014-08-26 2017-08-08 中译语通科技(北京)有限公司 一种基于字幕检测与识别的视频字幕还原方法
WO2017002602A1 (ja) * 2015-06-30 2017-01-05 ソニー株式会社 受信装置、受信方法、送信装置および送信方法
AU2016289048B2 (en) * 2015-07-09 2020-12-24 Sony Corporation Reception device, reception method, transmission device, and transmission method
CN105100869B (zh) * 2015-07-13 2018-09-04 腾讯科技(深圳)有限公司 弹幕显示方法及装置
EP3429217B1 (en) * 2016-03-10 2021-09-01 Sony Group Corporation Information processing device, information processing method, and program
JP7214596B2 (ja) * 2019-09-03 2023-01-30 株式会社東芝 コンテンツ送信装置、送信方法

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6320621B1 (en) * 1999-03-27 2001-11-20 Sharp Laboratories Of America, Inc. Method of selecting a digital closed captioning service
US6587153B1 (en) * 1999-10-08 2003-07-01 Matsushita Electric Industrial Co., Ltd. Display apparatus
KR100631499B1 (ko) * 2000-01-24 2006-10-09 엘지전자 주식회사 디지털 티브이의 캡션 표시 방법
US7202912B2 (en) * 2000-05-12 2007-04-10 Thomson Licensing Method and system for using single OSD pixmap across multiple video raster sizes by chaining OSD headers
US6661466B1 (en) * 2000-09-18 2003-12-09 Sony Corporation System and method for setting default audio and subtitling language preferences for a video tuner
JP2003037792A (ja) * 2001-07-25 2003-02-07 Toshiba Corp データ再生装置及びデータ再生方法
US6952236B2 (en) * 2001-08-20 2005-10-04 Ati Technologies, Inc. System and method for conversion of text embedded in a video stream
JP2004080676A (ja) * 2002-08-22 2004-03-11 Funai Electric Co Ltd ディジタル放送/アナログ放送受信装置
KR20040078765A (ko) * 2003-03-05 2004-09-13 삼성전자주식회사 폐쇄캡션 데이터의 형식을 자동으로 검출하여 캡션데이터를 표시하는 방법 및 장치
JP4430882B2 (ja) * 2003-03-19 2010-03-10 富士通株式会社 複合メディアコンテンツの変換装置及び変換方法並びに複合メディアコンテンツ変換プログラム
KR100526345B1 (ko) * 2003-06-12 2005-11-08 엘지전자 주식회사 클로즈드 캡션의 옵션 운용방법
US7391470B2 (en) * 2003-07-15 2008-06-24 Samsung Electronics Co., Ltd. Apparatus and method for providing caption information
KR100565614B1 (ko) * 2003-09-17 2006-03-29 엘지전자 주식회사 캡션 송수신 방법
JP4552426B2 (ja) * 2003-11-28 2010-09-29 カシオ計算機株式会社 表示制御装置および表示制御処理のプログラム
CN1890967B (zh) * 2003-12-08 2010-11-17 汤姆逊许可公司 电视接收器中的数字/模拟隐藏式字幕显示***
KR20050078907A (ko) * 2004-02-03 2005-08-08 엘지전자 주식회사 고밀도 광디스크의 서브타이틀 재생방법과 기록재생장치
US7529467B2 (en) * 2004-02-28 2009-05-05 Samsung Electronics Co., Ltd. Storage medium recording text-based subtitle stream, reproducing apparatus and reproducing method for reproducing text-based subtitle stream recorded on the storage medium
JP4449622B2 (ja) * 2004-07-23 2010-04-14 船井電機株式会社 テレビジョン放送受信装置
JP2006295675A (ja) * 2005-04-13 2006-10-26 Funai Electric Co Ltd ディジタルテレビジョン放送信号受信装置
KR20070047665A (ko) * 2005-11-02 2007-05-07 삼성전자주식회사 방송수신장치, 방송송신장치, 방송 시스템 및 그 제어방법
JP4768412B2 (ja) * 2005-11-15 2011-09-07 株式会社東芝 デジタル放送用携帯字幕仕様変換装置とその変換方法
JP4768411B2 (ja) * 2005-11-15 2011-09-07 株式会社東芝 デジタル放送用携帯字幕仕様変換装置とその変換方法
TWI372562B (en) * 2006-09-15 2012-09-11 Himax Tech Ltd Method of displaying characters and display device thereof
US8345159B2 (en) * 2007-04-16 2013-01-01 Caption Colorado L.L.C. Captioning evaluation system
CN101803369B (zh) * 2007-11-12 2013-05-22 三菱电机株式会社 数字广播接收机
US8296796B2 (en) * 2007-12-11 2012-10-23 Lg Electronics Inc. Digital broadcasting receiver and a data processing method
JP5110521B2 (ja) * 2008-01-11 2012-12-26 Necカシオモバイルコミュニケーションズ株式会社 字幕付映像再生装置及びプログラム
JP2009177502A (ja) * 2008-01-24 2009-08-06 Nec Corp 携帯端末装置
JP2009188462A (ja) * 2008-02-01 2009-08-20 Toshiba Corp 字幕表示システム及び字幕表示方法
US20110285726A1 (en) * 2009-02-18 2011-11-24 William Gibbens Redmann Method and apparatus for preparing subtitles for display
US8422563B2 (en) * 2009-11-24 2013-04-16 General Instrument Corporation System for generating closed captioning compatible with legacy and newer set-top boxes
TW201233169A (en) * 2011-01-25 2012-08-01 Hon Hai Prec Ind Co Ltd Apparatus and method for searching subtitle of television program

Also Published As

Publication number Publication date
US20110181773A1 (en) 2011-07-28
JP2011151750A (ja) 2011-08-04

Similar Documents

Publication Publication Date Title
JP5423425B2 (ja) 画像処理装置
KR100897170B1 (ko) 알파 블렌딩 시스템 및 그 방법
US7050109B2 (en) Methods and apparatus for the provision of user selected advanced close captions
JP4871635B2 (ja) デジタル放送受信装置及びその制御方法
KR100816136B1 (ko) 비디오 신호에서 인코딩된 텍스트의 번역을 위한 장치 및 방법
US20060204092A1 (en) Reproduction device and program
EP1939882B1 (en) Information storage medium containing subtitles and processing apparatus therefor
US9013631B2 (en) Method and apparatus for processing and displaying multiple captions superimposed on video images
JP2006025422A (ja) オーディオビデオデータストリームの字幕を通じてナビゲートするための方法および装置
JP2009164655A (ja) 字幕情報送出装置、字幕情報処理装置およびこれら装置の連携方法
JP2003018491A (ja) 字幕表示装置および方法
JP2000041226A (ja) 番組情報受信装置と番組情報表示方法及び番組情報送信装置並びに番組情報送信方法
JP2006211488A (ja) 映像再生装置
JP2009005268A (ja) 送信装置、受信装置及び再生装置
JP2007243841A (ja) 映像出力装置
MXPA04011267A (es) Sistema de subtitulos en sistema de graficos con base de windows.
US20050259977A1 (en) Multiplex DVD player
WO2014207874A1 (ja) 電子機器、出力方法およびプログラム
KR100728929B1 (ko) 디지털 캡션을 이용한 개인적인 데이터 삽입 장치 및 그방법
JP5231758B2 (ja) データ放送表示装置、データ放送表示方法およびデータ放送表示プログラム
KR102558213B1 (ko) 재생 장치, 재생 방법, 프로그램, 및 기록 매체
JP2008148175A (ja) 字幕情報処理装置、文字列情報出力装置、および文字列情報出力方法
JP2011061670A (ja) 要約コンテンツを表示する表示装置、方法及びプログラム
JP2006180091A (ja) コンテンツ合成装置及び方法
KR20060130800A (ko) 방송 스트림의 캡션 데이터를 이용한 학습자료 제작 방법및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131111

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees