JP5248364B2 - Subtitle conversion apparatus and subtitle conversion method - Google Patents

Subtitle conversion apparatus and subtitle conversion method Download PDF

Info

Publication number
JP5248364B2
JP5248364B2 JP2009035193A JP2009035193A JP5248364B2 JP 5248364 B2 JP5248364 B2 JP 5248364B2 JP 2009035193 A JP2009035193 A JP 2009035193A JP 2009035193 A JP2009035193 A JP 2009035193A JP 5248364 B2 JP5248364 B2 JP 5248364B2
Authority
JP
Japan
Prior art keywords
subtitle
caption
sentence
character
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009035193A
Other languages
Japanese (ja)
Other versions
JP2010193150A (en
Inventor
純 大橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009035193A priority Critical patent/JP5248364B2/en
Publication of JP2010193150A publication Critical patent/JP2010193150A/en
Application granted granted Critical
Publication of JP5248364B2 publication Critical patent/JP5248364B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、表示許容文字数が多い字幕文から表示許容文字数が少ない字幕文へ変換する字幕変換装置および字幕変換方法に関する。   The present invention relates to a caption conversion device and a caption conversion method for converting a caption sentence with a large number of display allowable characters into a caption sentence with a small number of display allowable characters.

近年、地上デジタル放送におけるフルセグメント(以下フルセグと称する)放送などにより提供される情報量が多いコンテンツのデータを、ワンセグメント(以下ワンセグ(登録商標)と称する)放送により提供される情報量があまり多くないコンテンツのデータにダウンコンバートして、携帯情報端末や携帯型記憶装置を用いてコンテンツデータの再生を行うことが可能になってきている。そして、そのようなダウンコンバートの処理は、映像音声データだけでなく字幕データに対しても施される必要がある。   In recent years, the amount of information provided by one-segment (hereinafter referred to as one-segment (registered trademark)) broadcasting is much less than the amount of information provided by full-segment (hereinafter referred to as full-segment) broadcasting in terrestrial digital broadcasting. It has become possible to down-convert content data to content data and reproduce the content data using a portable information terminal or a portable storage device. Such down-conversion processing needs to be performed not only on video / audio data but also on caption data.

例えば、字幕文を映像データとして扱ってダウンコンバートする手法が採用される場合がある。
また例えば、特許文献1によれば、地上デジタル放送におけるフルセグ放送で画面内の任意の位置に表示される複数の字幕を結合や分割などをして並べ替えて再構築し、所定領域に表示する手法が公開されている。
For example, there is a case in which a subtitle sentence is treated as video data and down-converted.
Further, for example, according to Patent Document 1, a plurality of subtitles displayed at arbitrary positions in a screen in full seg broadcasting in terrestrial digital broadcasting are rearranged by combining, dividing, and the like, and displayed in a predetermined area. The method is public.

特開2007−142568号公報(図2 段落0018−0019)JP 2007-142568 A (FIG. 2, paragraphs 0018-0019)

ところが従来の手法では、字幕文を映像データとして扱うので、情報量が多い(文字数が多い)字幕文をダウンコンバートした場合の字幕文は文字が小さく文字視認性が低くなっていた。また特許文献1のように、文字視認性が低くならないように字幕文を字幕データとして扱って、その表示位置の仕様を変換する字幕文変換を行うデータ送出装置に関する手法でも、情報再生装置において情報量が多い(文字数が多い)字幕文であった場合には、当該字幕文の文字視認性を保ちながら、当該字幕文の意味を損なわない字幕文に変換することはできなかった。   However, in the conventional method, since the subtitle sentence is handled as video data, the subtitle sentence when the subtitle sentence having a large amount of information (the number of characters) is down-converted has small characters and has low character visibility. Also, as in Patent Document 1, a method related to a data transmission device that handles caption text as caption data and converts the specification of the display position so that the character visibility does not become low can be used in the information reproducing apparatus. When a subtitle sentence has a large amount (a large number of characters), it cannot be converted into a subtitle sentence that does not impair the meaning of the subtitle sentence while maintaining the character visibility of the subtitle sentence.

そこで、本発明は上述した課題を解決するために、情報量が多い(文字数が多い)字幕文であった場合でも、当該字幕文の文字視認性を保ちながら、当該字幕文の意味を損なわない字幕文に変換することができる字幕変換装置および字幕変換方法を提供することを目的とする。   Therefore, in order to solve the above-described problem, the present invention does not impair the meaning of the caption text while maintaining the character visibility of the caption text even when the caption text has a large amount of information (the number of characters is large). It is an object of the present invention to provide a caption conversion device and a caption conversion method that can convert a caption sentence.

本発明は上述した課題を解決するため、所定の文字サイズ情報で定義された字幕文をコンテンツデータから抽出する字幕文抽出手段と、前記字幕文抽出手段が抽出した字幕文の文字サイズ情報を前記字幕文の文字が小さくなるように変換する文字サイズ変換手段と、前記文字サイズ変換手段が文字サイズ情報を変換した字幕文から特定の文字を削除する文字削除手段と、を具備することを特徴とするものである。   In order to solve the above-described problem, the present invention extracts caption text extraction means for extracting caption text defined by predetermined character size information from content data, and character size information of the caption text extracted by the caption text extraction means. Character size conversion means for converting the subtitle sentence so that the characters are reduced, and character deletion means for deleting a specific character from the subtitle sentence in which the character size conversion means has converted the character size information. To do.

また本発明は上述した課題を解決するため、所定の文字サイズ情報で定義された字幕文をコンテンツデータから抽出し、前記字幕文の文字サイズ情報を前記字幕文の文字が小さくなるように変換し、前記文字サイズ情報を変換された字幕文から特定の文字を削除する、ことを特徴とするものである。   In order to solve the above-described problem, the present invention extracts subtitle sentences defined by predetermined character size information from content data, and converts the character size information of the subtitle sentences so that the characters of the subtitle sentences become smaller. A specific character is deleted from the caption text converted from the character size information.

本発明によれば、情報量が多い(文字数が多い)字幕文であった場合でも、当該字幕文の文字視認性を保ちながら、当該字幕文の意味を損なわない字幕文に変換することができる。   According to the present invention, even when a caption sentence has a large amount of information (a large number of characters), it can be converted into a caption sentence that does not impair the meaning of the caption sentence while maintaining the character visibility of the caption sentence. .

本発明の実施形態に係る字幕変換装置であるコンピュータ装置の構成を示すブロック図。The block diagram which shows the structure of the computer apparatus which is a caption conversion apparatus concerning embodiment of this invention. 情報量の多い字幕文を制約された文字数の字幕文に変換するプログラムの構造を示す図。The figure which shows the structure of the program which converts the subtitle sentence with much information amount into the subtitle sentence of the character number with restrictions. フルセグ放送波の字幕データとワンセグ放送波の字幕データとの仕様を比較した表。A table comparing the specifications of full-segment broadcasting wave caption data and one-segment broadcasting wave caption data. 図2で説明した字幕文変換処理部によって実行される、フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の一実施形態を示すフローチャート。The flowchart which shows one Embodiment of the subtitle sentence conversion process performed by the subtitle sentence conversion process part demonstrated in FIG. 2 from the subtitle data of a full segment broadcast wave to the subtitle data of a one segment broadcast wave. 図2で説明した字幕文変換処理部によって実行される、フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の第2の実施形態を示すフローチャート。The flowchart which shows 2nd Embodiment of the subtitle sentence conversion process performed by the subtitle sentence conversion process part demonstrated in FIG. 2 from the subtitle data of a full segment broadcast wave to the subtitle data of a one segment broadcast wave. 図2で説明した字幕文結合処理部によって実行される、字幕文変換処理を施した複数の字幕文を結合する字幕文結合処理の一実施形態を示すフローチャート。The flowchart which shows one Embodiment of the subtitle sentence combining process combined with the some subtitle sentence which performed the subtitle sentence conversion process performed by the subtitle sentence combining process part demonstrated in FIG.

以下、本発明における実施形態について図面を用いて説明する。
図1は、本発明の実施形態に係る字幕変換装置であるコンピュータ装置の構成を示すブロック図である。なお本実施形態では字幕変換装置をコンピュータ装置に適用した例を示すが、本実施形態と同様の構成を備えたHDDレコーダ、DVDレコーダ、テレビジョン受像機、携帯移動端末などであってもよい。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of a computer device which is a caption conversion device according to an embodiment of the present invention. In this embodiment, an example in which the caption conversion device is applied to a computer device is shown. However, an HDD recorder, a DVD recorder, a television receiver, a portable mobile terminal, or the like having the same configuration as in this embodiment may be used.

コンピュータ装置10は、CPU20、ノースブリッジ30、主メモリ31、グラフィックスコントローラ32、表示器33、サウスブリッジ40、BIOS−ROM41、ハードディスクドライブ(Hard Disk Drive;以下HDDと称する)42、光ディスクドライブ(Optical Disk Drive;以下ODDと称する)43、コントローラ部44、USB_IF部47、通信部46、チューナ部45、およびキーボード/マウス48などで構成されている。   The computer device 10 includes a CPU 20, a north bridge 30, a main memory 31, a graphics controller 32, a display 33, a south bridge 40, a BIOS-ROM 41, a hard disk drive (hereinafter referred to as HDD) 42, an optical disk drive (Optical). Disk Drive (hereinafter referred to as ODD) 43, controller unit 44, USB_IF unit 47, communication unit 46, tuner unit 45, keyboard / mouse 48, and the like.

CPU20はコンピュータ装置10の動作を制御するプロセッサであり、HDD42から主メモリ31にロードされるオペレーティングシステム(Operating System;以下OSと称する)および各種アプリケーションプログラムを実行する。またCPU20は、BIOS−ROM41に格納されたBIOS(Basic Input Output System;以下BIOSと称する)プログラムも実行する。   The CPU 20 is a processor that controls the operation of the computer apparatus 10 and executes an operating system (hereinafter referred to as OS) and various application programs loaded from the HDD 42 to the main memory 31. The CPU 20 also executes a BIOS (Basic Input Output System; hereinafter referred to as BIOS) program stored in the BIOS-ROM 41.

ノースブリッジ30は、CPU20とFSB(Front Side Bus;以下FSBと称する)などのバスを介して接続し、さらにサウスブリッジ40と接続するブリッジデバイスである。またノースブリッジ30は、AGP(Accelerated Graphics Port;以下AGPと称する)バスなどを介してグラフィクスコントローラ32との通信を実行する機能も有している。またノースブリッジ30は、主メモリ31とも接続される。   The north bridge 30 is a bridge device that is connected to the CPU 20 via a bus such as an FSB (Front Side Bus; hereinafter referred to as FSB) and further connected to the south bridge 40. The north bridge 30 also has a function of executing communication with the graphics controller 32 via an AGP (Accelerated Graphics Port; hereinafter referred to as AGP) bus. The north bridge 30 is also connected to the main memory 31.

グラフィクスコントローラ32は、コンピュータ装置10が備える表示器33を制御する表示コントローラである。
表示器33は、例えばLCD(Liquid Crystal Display;以下LCDと称する)などのディスプレイである。本実施形態では、地上デジタル放送により提供される字幕文を表示する。なお表示器33はコンピュータ装置10の外部に備えられる形態であってもよい。
The graphics controller 32 is a display controller that controls the display device 33 provided in the computer apparatus 10.
The display device 33 is a display such as an LCD (Liquid Crystal Display; hereinafter referred to as LCD). In the present embodiment, a caption sentence provided by terrestrial digital broadcasting is displayed. The display device 33 may be provided outside the computer apparatus 10.

サウスブリッジ40は各種I/Oデバイスを制御するブリッジデバイスである。サウスブリッジ40には、PCI Expressのような通信バスを介してチューナ部45が接続される。またサウスブリッジ40には、各種バスを介してBIOS−ROM41やHDD42、ODD43、コントローラ部44、USB_IF部47、通信部46と接続される。   The south bridge 40 is a bridge device that controls various I / O devices. A tuner unit 45 is connected to the south bridge 40 via a communication bus such as PCI Express. The south bridge 40 is connected to the BIOS-ROM 41, the HDD 42, the ODD 43, the controller unit 44, the USB_IF unit 47, and the communication unit 46 via various buses.

BIOS−ROM41は、BIOSプログラムを格納する。
HDD42は、主メモリ31にロードするOSや各種アプリケーションプログラムなどを格納する。またCPU20が各種プログラムを実行する際のワークメモリとして使用される。本実施形態では、字幕データの変換処理を行うプログラムのワークメモリとして使用される。
The BIOS-ROM 41 stores a BIOS program.
The HDD 42 stores an OS to be loaded into the main memory 31 and various application programs. Further, it is used as a work memory when the CPU 20 executes various programs. In the present embodiment, it is used as a work memory of a program that performs conversion processing of caption data.

ODD43は、装着された光ディスクからのデータを読み取る。また、記録可能な光ディスクへのデータ記録を行う。本実施形態では、BD(Blu-ray Disc;以下BDと称する)やDVDなどから字幕が含まれるデータを読み取る。   The ODD 43 reads data from the mounted optical disk. Also, data is recorded on a recordable optical disc. In this embodiment, data including subtitles is read from a BD (Blu-ray Disc; hereinafter referred to as BD), a DVD, or the like.

コントローラ部44は、キーボード/マウス48を制御するためのキーボードコントローラなどが集積された1チップマイクロコンピュータである。
チューナ部45は、アンテナATによって受信されたデジタル放送波に対して、特定チャンネルの選局や復調復号処理を施して、映像音声データの他に字幕データが含まれるデータをサウスブリッジ40を介してHDD42に出力する。本実施形態では、地上デジタル放送波のデータ(特に字幕データが含まれるフルセグ放送波のデータ)に対して選局や復調復号処理を施して出力する。
The controller unit 44 is a one-chip microcomputer in which a keyboard controller and the like for controlling the keyboard / mouse 48 are integrated.
The tuner unit 45 performs channel selection and demodulation / decoding processing of a specific channel on the digital broadcast wave received by the antenna AT, and transmits data including subtitle data in addition to the video / audio data via the south bridge 40. The data is output to the HDD 42. In the present embodiment, digital terrestrial broadcast wave data (particularly full-segment broadcast wave data including caption data) is subjected to channel selection and demodulation / decoding processing and output.

通信部46は、インターネットに接続された情報提供サイトや家庭内ネットワークなどに接続された外部装置と、LANなどを介してデータのやりとりを行う。本実施形態では、インターネットや家庭内ネットワークなどから提供されるフルセグ放送波の字幕データが含まれるデータを取得し、ネットワークに接続された記録装置にワンセグ放送波の字幕データが含まれるデータを出力する。
USB_IF部47は、USB規格に基づいて接続されたUSBデバイスUDと通信してデータのやりとりを行う。本実施形態では、記録媒体であるUSBデバイスUDが接続されたときに、ワンセグ放送波の仕様に基づいて変換された字幕文が含まれるデータを出力する。
The communication unit 46 exchanges data with an external device connected to an information providing site connected to the Internet or a home network via a LAN or the like. In this embodiment, data including subtitle data of full-segment broadcasting waves provided from the Internet or a home network is acquired, and data including subtitle data of one-segment broadcasting waves is output to a recording device connected to the network. .
The USB_IF unit 47 communicates with a USB device UD connected based on the USB standard to exchange data. In this embodiment, when a USB device UD that is a recording medium is connected, data including a caption sentence converted based on the specifications of the one-segment broadcasting wave is output.

次に図1で説明したCPU20によって実行される、情報量の多い字幕文を制約された文字数の字幕文に変換するプログラムの構造を、図2を用いて説明する。
図2は、情報量の多い字幕文であるフルセグ放送波の字幕文を、制約された文字数の字幕文であるワンセグ放送波の字幕文に変換するプログラムの構造を示す図である。
Next, the structure of the program executed by the CPU 20 described with reference to FIG. 1 for converting a caption text with a large amount of information into a caption text with a restricted number of characters will be described with reference to FIG.
FIG. 2 is a diagram illustrating a structure of a program for converting a full-segment broadcast wave subtitle sentence, which is a subtitle sentence having a large amount of information, into a one-segment broadcast wave subtitle sentence, which is a subtitle sentence having a restricted number of characters.

字幕変換プログラム200は、管理データ変換処理部211、DRCS(Dynamically Re-definable Character Set;以下DRCSと称する)変換処理部212、字幕文変換処理部213、字幕文結合処理部214、などで構成されている。なおDRCSとは、所定の文字コードに含まれていない難しい人名漢字や特殊な記号、絵文字などを外字として扱うために画像パターン化してコード化した文字データであって、字幕文データとして使用可能な文字データのことである。また字幕変換プログラム200は、HDD42が備える入力バッファ202からフルセグ放送波の字幕データを取得してワンセグ放送波の字幕データへの変換処理を施して、HDD42が備える出力バッファ221にワンセグ放送波の変換処理を施した字幕データを出力する。すなわち本実施形態では、情報量の多い字幕文としてフルセグ放送波の字幕文を例にして、また制約された文字数の字幕文としてワンセグ放送波の字幕文を例にして説明する。   The subtitle conversion program 200 includes a management data conversion processing unit 211, a DRCS (Dynamically Re-definable Character Set; hereinafter referred to as DRCS) conversion processing unit 212, a subtitle sentence conversion processing unit 213, a subtitle sentence combination processing unit 214, and the like. ing. Note that DRCS is character data that is encoded by patterning images so that difficult personal kanji, special symbols, pictograms, etc. that are not included in a predetermined character code are handled as external characters, and can be used as caption text data. It is character data. The subtitle conversion program 200 obtains full-seg broadcast wave subtitle data from the input buffer 202 provided in the HDD 42, performs conversion processing to subtitle data of one-seg broadcast wave, and converts the one-seg broadcast wave into the output buffer 221 provided in the HDD 42. The processed caption data is output. That is, in the present embodiment, a full-segment broadcast wave subtitle sentence is taken as an example of a caption sentence with a large amount of information, and a one-segment broadcast wave subtitle sentence is taken as an example as a subtitle sentence with a limited number of characters.

なおフルセグ放送波およびワンセグ放送波の字幕データは、当該字幕データに含まれる字幕文の基本となる文字サイズや文字色などを示す字幕管理データと、字幕文をコード化した字幕文データを含んでいる。DRCSは、フルセグ放送波の字幕データでは字幕管理データまたは字幕文データに含まれるが、ワンセグ放送波の字幕データでは字幕文データにのみ含まれるものである。   Note that the caption data of the full-segment broadcasting wave and the one-segment broadcasting wave includes caption management data indicating the basic character size and character color of the caption text included in the caption data, and caption text data in which the caption text is encoded. Yes. The DRCS is included in the caption management data or caption text data in the full-segment broadcast wave caption data, but is included only in the caption text data in the one-segment broadcast wave caption data.

字幕データ抽出部201は、チューナ部45や通信部46、ODD43などから取得されてHDD42に保存されたフルセグ放送波のデータから、字幕データをPES(Packetized Elementary Stream;以下PESと称する)パケットと呼ばれるデータ単位で抽出して入力バッファ202に出力すると共に、字幕変換プログラム200に対して字幕データを格納した情報を通知する。なお特に字幕データのPESパケットを字幕PESパケットと称する。また、字幕PESパケットに含まれるPESヘッダにおいて定義され、当該字幕PESパケットの字幕文の表示時間情報であるPTS(Presentation Time Stamp;以下PTSと称する)を取得する。   The caption data extraction unit 201 is referred to as a PES (Packetized Elementary Stream; hereinafter referred to as PES) packet from the full-segment broadcast wave data acquired from the tuner unit 45, the communication unit 46, the ODD 43, etc. and stored in the HDD 42. The data is extracted in units of data and output to the input buffer 202, and the subtitle data is stored in the subtitle conversion program 200. In particular, a PES packet of caption data is referred to as a caption PES packet. Also, a PTS (Presentation Time Stamp; hereinafter referred to as PTS), which is defined in the PES header included in the caption PES packet and is display time information of the caption text of the caption PES packet, is acquired.

入力バッファ202は、字幕データ抽出部201から出力されるフルセグ放送波の字幕データを取得して、PESパケット単位で管理して格納する。
管理データ変換処理部211は、入力バッファ202から取得したフルセグ放送波の字幕データから字幕管理データを抽出して、ワンセグ放送波の字幕管理データに変換する処理を施して出力バッファ221に出力する。
The input buffer 202 acquires subtitle data of a full segment broadcast wave output from the subtitle data extraction unit 201, manages and stores it in units of PES packets.
The management data conversion processing unit 211 extracts subtitle management data from full-segment broadcast wave caption data acquired from the input buffer 202, performs conversion into one-segment broadcast wave caption management data, and outputs the result to the output buffer 221.

DRCS変換処理部212は、管理データ変換処理部211や字幕文変換処理部213から検出されたフルセグ放送波のDRCSを、ワンセグ放送波のDRCSに変換する処理を施して、字幕文変換処理部213に出力する。   The DRCS conversion processing unit 212 performs processing for converting the full segment broadcasting wave DRCS detected from the management data conversion processing unit 211 and the caption text conversion processing unit 213 into the DRCS of the one segment broadcasting wave, and the caption sentence conversion processing unit 213. Output to.

字幕文変換処理部213は、入力バッファ202から取得したフルセグ放送波の字幕データから字幕文データを抽出して、ワンセグ放送波の字幕データに変換する処理を施して出力バッファ221に出力する。また、DRCS変換処理部212から入力されたワンセグ放送波のDRCSを字幕文データに重畳して出力バッファ221に出力する。   The caption text conversion processing unit 213 extracts the caption text data from the full-segment broadcast wave caption data acquired from the input buffer 202, performs the process of converting the caption data into one-segment broadcast wave caption data, and outputs the result to the output buffer 221. Also, the DRCS of the one-segment broadcasting wave input from the DRCS conversion processing unit 212 is superimposed on the caption text data and output to the output buffer 221.

字幕文結合処理部214は、字幕データ抽出部201から通知される字幕データを格納した情報の通知時間の間隔を監視し、通知された時間間隔に応じて、字幕文変換処理部213によって変換されたワンセグ放送波の字幕データを結合する処理を施す。   The subtitle sentence combination processing unit 214 monitors the notification time interval of the information storing the subtitle data notified from the subtitle data extraction unit 201 and is converted by the subtitle sentence conversion processing unit 213 according to the notified time interval. The processing to combine the subtitle data of the one-segment broadcasting wave is performed.

出力バッファ221は、管理データ変換処理部211から出力されるワンセグ放送波の字幕管理データや、字幕文変換処理部213から出力されるワンセグ放送波の字幕データを取得して、PESパケット単位で管理して格納する。そして要求されたワンセグ放送波の字幕データを字幕データ出力部222へPESパケット単位で出力する。   The output buffer 221 acquires the one-segment broadcasting wave caption management data output from the management data conversion processing unit 211 and the one-seg broadcasting wave caption data output from the caption sentence conversion processing unit 213, and manages them in units of PES packets. And store. Then, the requested caption data of the one-segment broadcasting wave is output to the caption data output unit 222 in units of PES packets.

字幕データ出力部222は、所定時間間隔で出力バッファ221に対して格納するワンセグ放送波の字幕データをPESパケット単位で出力するように要求する。そして出力バッファ221から入力されたワンセグ放送波の字幕データに対して所定の処理を施してOSD生成部223へ出力する。   The caption data output unit 222 requests the output buffer 221 to output the one-segment broadcast wave caption data to be stored in units of PES packets at predetermined time intervals. Then, the one-segment broadcast wave caption data input from the output buffer 221 is subjected to predetermined processing and output to the OSD generation unit 223.

OSD生成部223は、字幕データ出力部222から入力された字幕データの字幕文をテキスト形式のグラフィックデータに変換してグラフィクスコントローラ32に出力する。   The OSD generation unit 223 converts the caption text of the caption data input from the caption data output unit 222 into graphic data in text format, and outputs the text data to the graphics controller 32.

すなわち、図2で示すプログラムによって、フルセグ放送波の字幕データの仕様からワンセグ放送波の字幕データの仕様へと変換する処理が行われる。
次に、フルセグ放送波の字幕データとワンセグ放送波の字幕データとの仕様の違いを、図3を用いて説明する。
図3は、フルセグ放送波の字幕データとワンセグ放送波の字幕データとの仕様を比較した表である。
(1.規格書)
フルセグ放送波では、社団法人電波産業会発行の「地上デジタルテレビジョン放送運用規定」ARIB TR−B14 3.8版におけるAプロファイルが適用される。
That is, the program shown in FIG. 2 performs a process of converting from full-segment broadcast wave caption data specifications to one-segment broadcast wave caption data specifications.
Next, differences in specifications between full-segment broadcast wave caption data and one-segment broadcast wave caption data will be described with reference to FIG.
FIG. 3 is a table comparing the specifications of full-segment broadcast wave caption data and one-segment broadcast wave caption data.
(1. Standard document)
In the full-segment broadcasting wave, the A profile in ARIB TR-B14 3.8 edition “Guidelines for Digital Terrestrial Television Broadcasting Operation” issued by the Radio Industries Association is applied.

一方、ワンセグ放送波では、社団法人電波産業会発行の「地上デジタルテレビジョン放送運用規定」ARIB TR−B14 3.8版におけるCプロファイルが適用される。   On the other hand, in the 1Seg broadcasting wave, the C profile in the ARIB TR-B14 3.8 edition “Operational Rules for Digital Terrestrial Television Broadcasting” issued by the Japan Radio Industry Association is applied.

なおこれ以降の項目の説明は、上記2つのプロファイルで規定されている仕様の抜粋である。
(2.表示形式)
フルセグ放送波では、HD解像度(1920x1080)の動画プレーンに対する字幕プレーンは解像度(960x540)で規定されていて、SD解像度(720x480)の動画プレーンに対する字幕プレーンは解像度(720x480)で規定されている。すなわち字幕プレーンとして規定されている表示領域は動画プレーンの表示領域と同一であって分解能の規定が異なるものであり、字幕プレーン(動画プレーン)内の矩形領域内であれば字幕文を任意の位置に表示してもよい。
The following explanation of the items is an excerpt of the specifications defined in the above two profiles.
(2. Display format)
In the full-segment broadcasting wave, the caption plane for the HD resolution (1920 × 1080) moving image plane is defined by the resolution (960 × 540), and the caption plane for the SD resolution (720 × 480) moving image plane is defined by the resolution (720 × 480). In other words, the display area specified as the caption plane is the same as the display area of the moving picture plane, and the definition of resolution is different, and the caption text can be placed at any position within the rectangular area in the caption plane (moving picture plane). May be displayed.

一方、ワンセグ放送波では、字幕プレーンは、縦画面字幕表示領域では12文字x4行の矩形領域と規定されていて、横画面字幕表示領域では16文字x3行の矩形領域と規定されている。すなわち画面方向に因って文字数と行数の規定が異なるものである。   On the other hand, in the one-segment broadcasting wave, the subtitle plane is defined as a rectangular area of 12 characters x 4 lines in the vertical screen subtitle display area, and is defined as a rectangular area of 16 characters x 3 lines in the horizontal screen subtitle display area. That is, the number of characters and the number of lines differ depending on the screen direction.

(3.文字サイズ)
フルセグ放送波では、ドット数による指定と、型による指定、さらにそれぞれの型に対しての幅拡大による指定などにより多くの文字サイズが設定可能である。例えば、36x36ドット(ドット数による指定)で、標準型(型による指定)で、縦横倍(それぞれの型に対しての幅拡大による指定)という文字サイズの指定が可能である。
(3. Font size)
In full-segment broadcasting waves, a large number of character sizes can be set by specifying the number of dots, specifying the type, and specifying the type by expanding the width of each type. For example, it is possible to specify a character size of 36 × 36 dots (designation by the number of dots), standard type (designation by type), and vertical and horizontal double (designation by expanding the width for each type).

一方、ワンセグ放送波では、ドット数による指定はできず、型による指定のみであり、さらには標準と中型の2つの型のみが許可されていて、そのうち中型では特定の文字種類(一部の記号(2区94点を除いた記号)、英数、平仮名、カタカナ、スペースなど)のみで指定が可能となっている。なお、中型は標準に対して横方法の大きさが半分になった型である。   On the other hand, one-segment broadcasting waves cannot be specified by the number of dots, only by type, and only two types, standard and medium, are allowed. (Symbols excluding 94 points in 2 wards), alphanumeric characters, hiragana, katakana, space, etc.) can be specified only. The medium size is a size in which the size of the horizontal method is halved with respect to the standard.

(4.一字幕文の最大表示文字数)
フルセグ放送波の字幕文では一字幕文の最大表示文字数は、HD解像度の動画プレーンにおいて、文字サイズが16x16ドットで小型の場合には約8040文字である。
(4. Maximum number of characters that can be displayed in one subtitle sentence)
In the subtitle sentence of the full segment broadcast wave, the maximum number of display characters of one subtitle sentence is about 8040 characters when the character size is 16 × 16 dots and small in the HD resolution video plane.

一方、ワンセグ放送波の字幕文では一字幕文の最大表示文字数は、文字サイズが標準の場合には48文字である。つまり、この規定は標準の文字サイズの文字に対して1文字として換算するため、字幕文が全て標準の文字である場合は48文字が許可され、中型の文字サイズの文字に対しては0.5文字として換算するため、字幕文が全て中型の文字である場合は96文字が許可されるものである。すなわち、標準に対して横方法の大きさが半分になった型である中型の文字サイズの字幕文であれば、標準の字幕文の倍の文字数が表示可能となる。   On the other hand, in a one-segment broadcasting wave subtitle sentence, the maximum number of characters displayed in one subtitle sentence is 48 characters when the character size is standard. In other words, since this rule converts a standard character size character as one character, 48 characters are permitted if the subtitle text is all standard characters, and 0. In order to convert as 5 characters, 96 characters are permitted when all the subtitle sentences are medium-sized characters. That is, if the caption text has a medium character size, which is half the size of the horizontal method relative to the standard, the number of characters double that of the standard caption text can be displayed.

(5.一字幕PESパケットの最小送出間隔)
フルセグ放送波では、字幕データのPESパケットは100msec以上の間隔で送出される。
一方、ワンセグ放送波では、字幕データのPESパケットは1000msec以上の間隔で送出される。
すなわち、字幕データ抽出部201は、フルセグ放送波の字幕データを最小100msec間隔で抽出して、字幕データ出力部222は、ワンセグ放送波の字幕データを最小1000msec間隔で出力する。
(5. Minimum transmission interval of one subtitle PES packet)
In the full segment broadcasting wave, the PES packet of the caption data is transmitted at an interval of 100 msec or more.
On the other hand, in the one-segment broadcasting wave, PES packets of caption data are transmitted at intervals of 1000 msec or more.
That is, subtitle data extraction section 201 extracts subtitle data of full segment broadcast waves at a minimum interval of 100 msec, and subtitle data output section 222 outputs subtitle data of one segment broadcast waves at a minimum interval of 1000 msec.

[字幕文変換処理の実施例1]
次に図3で説明したフルセグ放送波の字幕データとワンセグ放送波の字幕データとの仕様の違いを踏まえた、フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の一実施形態を、図4を用いて説明する。
[Example 1 of subtitle sentence conversion processing]
Next, subtitle sentence conversion processing for converting full-segment broadcast wave caption data into one-segment broadcast wave caption data based on the difference in specifications between full-segment broadcast wave caption data and one-segment broadcast wave caption data described in FIG. One embodiment will be described with reference to FIG.

図4は、図2で説明した字幕文変換処理部213によって実行される、フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の一実施形態を示すフローチャートである。   FIG. 4 is a flowchart showing an embodiment of caption text conversion processing for converting subtitle data of full-segment broadcasting waves to caption data of one-segment broadcasting waves, which is executed by the caption text conversion processing unit 213 described in FIG. .

字幕文変換処理部213は、入力バッファ202に格納されたフルセグ放送波の字幕データを1PESパケット取得して、この取得した字幕データから字幕文データを抽出する。そして抽出した字幕文データに対して文字コード変換処理を施す(S401)。   The caption sentence conversion processing unit 213 obtains 1 PES packet of caption data of the full segment broadcast wave stored in the input buffer 202, and extracts caption sentence data from the obtained caption data. Then, a character code conversion process is performed on the extracted caption text data (S401).

この文字コード変換処理では、字幕文変換処理部213がフルセグ放送波の字幕文データで使用される1バイト符号である英数や平仮名・片仮名などの文字種類を2バイト漢字系符号の文字種類に変換し、またフルセグ放送波で許可されている2バイトDRCSをワンセグ放送波で許可されている1バイトDRCSに変換する。なお2バイトDRCSは、字幕文変換処理部213や管理データ変換処理部211が検出してDRCS変換処理部212へ出力し、DRCS変換処理部212が1バイトDRCSに変換して字幕文変換処理部213へ出力する。すなわち文字コード変換処理は、ワンセグ放送波で許可されていない文字種類およびDRCSをワンセグ放送波で許可されている文字種類またはDRCSに変換する処理である。   In this character code conversion process, the subtitle sentence conversion processing unit 213 converts the character types such as alphanumeric characters, hiragana and katakana, which are 1-byte codes used in full-segment broadcasting wave subtitle text data, to the character types of 2-byte kanji code. Further, the 2-byte DRCS permitted for the full-segment broadcasting wave is converted into the 1-byte DRCS permitted for the one-segment broadcasting wave. The 2-byte DRCS is detected by the caption text conversion processing unit 213 and the management data conversion processing unit 211 and is output to the DRCS conversion processing unit 212. The DRCS conversion processing unit 212 converts the 1-byte DRCS into a 1-byte DRCS. To 213. In other words, the character code conversion process is a process of converting a character type and DRCS that are not permitted in the one-segment broadcasting wave into a character type or DRCS that is permitted in the one-segment broadcasting wave.

そして、文字コード変換処理を施された字幕文データに対してルビ削除処理を施す(S402)。この処理ではルビの削除を行う。なお下記2つの条件を両方とも満たす文字をルビであると判定して削除する。   Then, a ruby deletion process is performed on the caption text data that has been subjected to the character code conversion process (S402). In this process, ruby is deleted. A character that satisfies both of the following two conditions is determined to be ruby and is deleted.

(条件1)文字サイズが小型以下の文字が2つ以上連続する文字列。
(条件2)隣接する文字の文字サイズが小型よりも大きい文字サイズではない文字列。
さらに、ルビ削除処理を施された字幕文データに対して表示形式変換処理を施す(S403)。図3に示すようにフルセグ放送波の字幕文データを表示できる字幕プレーンのサイズは動画プレーンのサイズに応じて決まり、字幕文は字幕プレーン内の任意の矩形領域に表示することができる。なお、字幕文の表示開始位置はその座標を指定する制御符号により指定される。また、指定された座標に表示される字幕文の文字サイズや文字間隔、文字色、記述方向(縦書き・縦書き)などの表示形式に関しても、それらを指定する制御符号により指定される。
(Condition 1) A character string in which two or more characters having a character size smaller than or equal to each other continue.
(Condition 2) A character string in which the character size of the adjacent character is not larger than the small character size.
Further, the display format conversion process is performed on the caption text data that has been subjected to the ruby deletion process (S403). As shown in FIG. 3, the size of the caption plane that can display the caption text data of the full-segment broadcasting wave is determined according to the size of the moving picture plane, and the caption text can be displayed in an arbitrary rectangular area in the caption plane. Note that the display start position of the caption text is specified by a control code that specifies the coordinates. Also, the display format such as the character size, character spacing, character color, and description direction (vertical writing / vertical writing) of the caption text displayed at the specified coordinates is also specified by a control code for specifying them.

一方、ワンセグ放送波の字幕文を表示できる領域設定では字幕プレーンの概念は定義されておらず、図3に示すように所定の位置に所定の文字数と行数により表示することが規定されているので、字幕文の記述方向に応じて、字幕文の表示開始位置指定を所定位置にするための制御符号に変換して、さらに所定の文字数と行数にするための制御符号に変換する処理を行う。また文字色はフルセグ放送波の字幕文では128色が許可されているが、ワンセグ放送波の字幕文では8色しか許可されていないため、128色から8色へとRGB色空間で最も近い色に置き換えて、この置き換えた色で文字の色に変換する処理を行う。そしてこれ以外に、文字の装飾などを指定する制御符号は削除する。   On the other hand, the concept of the subtitle plane is not defined in the area setting that can display the subtitle text of the one-segment broadcasting wave, and it is stipulated that a predetermined number of characters and lines are displayed at a predetermined position as shown in FIG. Therefore, according to the description direction of the subtitle sentence, the process of converting the display start position designation of the subtitle sentence into a control code for setting it to a predetermined position, and further converting it into a control code for setting the predetermined number of characters and lines. Do. In addition, although 128 colors are permitted in the full-segment broadcasting wave caption text, only eight colors are permitted in the one-segment broadcasting wave caption text, so the closest color in the RGB color space from 128 colors to 8 colors. And the process of converting to the character color with the replaced color is performed. In addition to this, control codes for designating character decorations are deleted.

またさらに、ワンセグ放送波の字幕文の文字サイズは、図3に示すように標準サイズと中型サイズしか許可されていないので、フルセグ放送波の字幕文の文字サイズが標準サイズ以上の大きさの文字は標準サイズにして、フルセグ放送波の字幕文の文字サイズが標準サイズよりも小さい大きさの文字は中型サイズにするように制御符号を変換する処理を行う。   Furthermore, only the standard size and medium size are allowed as the subtitle text size of the one-segment broadcasting wave as shown in FIG. 3, so that the text size of the subtitle text of the full-segment broadcasting wave is larger than the standard size. Is converted to a standard size, and the control code is converted so that the character size of the subtitle sentence of the full-segment broadcasting wave is smaller than the standard size is set to the medium size.

すなわち、表示形式変換処理は、ワンセグ放送波で許可されていない表示形式をワンセグ放送波で許可されている表示形式に変換すると共に不要な表示形式の設定は削除して、さらに文字サイズを所定の基準に基づいて変換する処理である。   In other words, the display format conversion process converts a display format not permitted by the 1Seg broadcast wave to a display format permitted by the 1Seg broadcast wave, deletes unnecessary display format settings, and further sets the character size to a predetermined size. This is a process of converting based on the reference.

そして表示形式変換処理を施された字幕文データに対して文字数を判定する処理を施す(S404)。表示形式変換処理を施された字幕文データの字幕文が、その字幕文で使用される文字数が標準の文字サイズで換算して48文字以下の場合(S404のN)は、字幕文変換処理を終了するが、標準の文字サイズで換算して48文字よりも多い場合(S404のY)は、文字種類に対して優先順位を付してそれぞれの文字の文字サイズを変換する文字サイズ調整処理に移行する(S405)。   Then, processing for determining the number of characters is performed on the caption text data that has been subjected to the display format conversion processing (S404). When the subtitle sentence of the subtitle sentence data that has been subjected to the display format conversion processing is 48 characters or less in terms of the standard character size (N in S404), the subtitle sentence conversion process is performed. If the standard character size is greater than 48 characters (Y in S404), character size adjustment processing is performed for converting the character size of each character by giving priority to the character type. Transition is made (S405).

文字サイズ調整処理は、文字種類に対して優先順位を付して、字幕文中の標準の文字サイズを中型の文字サイズに変換する処理である。まず標準の文字サイズで換算して48文字よりも多い字幕文中の標準サイズの文字のうち“英数”の文字種類の文字を中型サイズに変換する。そして“英数”の文字種類の文字の変換が終了した時点で再び、標準の文字サイズで換算して48文字よりも多いかを確認し、まだ多いようであれば、次いで、“平仮名”、“カタカナ”、“一部の記号(2区94点を除いた記号)”、“スペース”の順序で順次、標準サイズの文字を中型サイズに変換する。   The character size adjustment process is a process for assigning priorities to character types and converting a standard character size in a subtitle sentence to a medium character size. First, a character of “alphanumeric” character type is converted to a medium size among characters of a standard size in a subtitle sentence having more than 48 characters in terms of a standard character size. When the conversion of “alphanumeric” character types is completed, the standard character size is converted again to check whether it is more than 48 characters. If there are still more, then “Hiragana”, Standard size characters are converted to medium size sequentially in the order of “katakana”, “partial symbols (symbols excluding 94 points in 2 sections)” and “space”.

そして全ての文字種類の文字に対して文字サイズの変換が終了した時点で、文字サイズ調整処理を施された字幕文データに対して、改めて文字数を判定する処理を施す(S406)。そして文字サイズ調整処理を施された字幕文データの字幕文が、その字幕文で使用される文字数が標準の文字サイズで換算して48文字以下の場合(S406のN)は、字幕文変換処理を終了するが、標準の文字サイズで換算して48文字よりも多い場合(S406のY)は、制限文字数を超過した文字数分の不要文字を削除する不要文字削除処理に移行する(S407)。そして不要文字削除処理は、スペース、句読点を削除する。   When the character size conversion is completed for all the character types, the subtitle sentence data that has been subjected to the character size adjustment process is subjected to a process of determining the number of characters again (S406). If the subtitle sentence of the subtitle sentence data that has undergone the character size adjustment processing is 48 characters or less in terms of the standard character size (N in S406), the subtitle sentence conversion process is performed. However, when the standard character size is converted to more than 48 characters (Y in S406), the process proceeds to an unnecessary character deletion process for deleting unnecessary characters for the number of characters exceeding the limit number of characters (S407). In the unnecessary character deletion process, spaces and punctuation marks are deleted.

[字幕文変換処理の実施例2]
次に、図フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の第2の実施形態を、図5を用いて説明する。
図5は、図2で説明した字幕文変換処理部213によって実行される、フルセグ放送波の字幕データからワンセグ放送波の字幕データへと変換する字幕文変換処理の第2の実施形態を示すフローチャートである。
[Example 2 of subtitle sentence conversion processing]
Next, a second embodiment of subtitle sentence conversion processing for converting subtitle data of the full-segment broadcasting wave into subtitle data of the one-segment broadcasting wave will be described with reference to FIG.
FIG. 5 is a flowchart illustrating a second embodiment of subtitle sentence conversion processing performed by the subtitle sentence conversion processing unit 213 described with reference to FIG. 2 to convert full-segment broadcast wave caption data into one-segment broadcast wave caption data. It is.

本実施形態は、図4で示したフローチャートとほとんど同じ処理を行うが、図4における不要文字削除処理(S407)は行わず、その処理の代わりに字幕文を分割して、分割したそれぞれの字幕文の表示タイミングをずらす字幕文分割処理を行う。すなわち、入力バッファ202から取得した1PESパケット単位の字幕データに対して、文字コード変換処理(S501)とルビ変換処理(S502)、表示形式変換処理(S503)、文字数を判定する処理(S504)を施して、標準の文字サイズで換算して48文字よりも多い場合(S504のY)は文字サイズ調整処理(S505)を施すまでの一連の処理が図4で示したフローチャートと同じである。   This embodiment performs almost the same process as the flowchart shown in FIG. 4, but does not perform the unnecessary character deletion process (S407) in FIG. 4, and instead of this process, the subtitle sentence is divided and each subtitle is divided. Perform subtitle sentence division processing to shift the sentence display timing. That is, character code conversion processing (S501), ruby conversion processing (S502), display format conversion processing (S503), and processing for determining the number of characters (S504) are performed on subtitle data in units of 1 PES packets acquired from the input buffer 202. When the standard character size is larger than 48 characters (Y in S504), a series of processing until the character size adjustment processing (S505) is performed is the same as the flowchart shown in FIG.

そして、文字サイズ調整処理を施された字幕文データに対して、改めて文字数を判定する処理を施し(S506)、文字サイズ調整処理を施された字幕文データの字幕文が、その字幕文で使用される文字数が標準の文字サイズで換算して48文字よりも多い場合(S506のY)は、字幕文分割処理に移行する(S507)。   Then, a process for determining the number of characters is performed again on the caption text data that has been subjected to the character size adjustment process (S506), and the caption sentence of the caption sentence data that has been subjected to the character size adjustment process is used in the caption sentence. When the number of characters to be converted is larger than 48 characters in terms of the standard character size (Y in S506), the process proceeds to subtitle sentence division processing (S507).

すなわち字幕文分割処理は、任意に指定された指定時間の間、処理の実行を待つための制御符号であるTIME制御文および、表示している字幕を消去するための制御符号であるCS制御文を用いて、1字幕PESパケットの中で複数画面分の字幕文が存在するように字幕文を分割する処理である。   That is, the subtitle sentence division process is a TIME control sentence that is a control code for waiting for execution of a process for an arbitrarily designated time, and a CS control sentence that is a control code for erasing a displayed subtitle. Is used to divide a caption sentence so that caption sentences for a plurality of screens exist in one caption PES packet.

図3に示すようにワンセグ放送波の字幕文を表示するときに許可されている文字数は、文字サイズ“標準”換算で48文字である。つまり48文字を超える字幕文は一回の表示で全ての文字を表示することができない。そこで、字幕文の先頭から数えて48文字目の字幕文データの直後にCS制御文を追加すると、先頭の48文字までの字幕文を表示した後に画面に表示されている字幕文を消去して49文字目以降の字幕文を表示することができる。また、任意の時間情報と共にTIME制御文をCS制御文の直前に追加すると、指定した時間が経過するのを待ってから、CS制御文が実行されるので、つまり、先頭から48文字目までの字幕文が表示された後に、指定時間が経過してから表示されている字幕文が消去されて49文字目以降の字幕文が表示される。   As shown in FIG. 3, the number of characters permitted when displaying a one-segment broadcasting wave subtitle sentence is 48 characters in terms of character size “standard”. That is, a subtitle sentence exceeding 48 characters cannot be displayed in a single display. Therefore, if a CS control sentence is added immediately after the 48th subtitle sentence data counted from the beginning of the subtitle sentence, the subtitle sentence displayed on the screen is deleted after displaying the subtitle sentence up to the first 48 characters. Subtitle sentences after the 49th character can be displayed. Also, if a TIME control statement is added immediately before the CS control statement together with arbitrary time information, the CS control statement is executed after waiting for the specified time to elapse, that is, from the first 48 characters. After the caption text is displayed, the displayed caption text is erased after the specified time has elapsed, and the 49th and subsequent characters are displayed.

そして、このように48文字単位でTIME制御文とCS制御文を順次追加していくことで、48文字の字幕文が所定時間ごとに順次表示されることになる。すなわち48文字を超える字幕文を分割して、分割されたそれぞれの字幕文の表示タイミングを変えて順次表示していくことができる。   Then, by sequentially adding a TIME control sentence and a CS control sentence in units of 48 characters in this way, 48-character subtitle sentences are sequentially displayed every predetermined time. That is, subtitle sentences exceeding 48 characters can be divided and sequentially displayed by changing the display timing of each divided subtitle sentence.

また分割された48文字の字幕文には、改行を示す制御符号を任意の位置に追加することで、48文字をさらに改行により分割して表示させることも可能である。さらに、TIME制御文とCS制御文の直前の行と同じ字幕文を、TIME制御文とCS制御文の直後の行に追加することで、表示されていた最下行の字幕文が、次に表示される画面では最上行に表示されるので、字幕文をロールアップして表示させることも可能である。   Further, by adding a control code indicating a line break to an arbitrary position in the divided 48-character subtitle sentence, it is also possible to display the 48 characters further divided by line breaks. Furthermore, the same subtitle sentence as the line immediately before the TIME control sentence and the CS control sentence is added to the line immediately after the TIME control sentence and the CS control sentence, so that the subtitle sentence at the bottom line displayed is displayed next. Since the screen is displayed on the top line, it is also possible to roll up and display the subtitle text.

なおTIME制御文とCS制御文の追加は48文字おきでなくても、48文字より少ない文字数であればよい。また、使用されている文字サイズが中型である場合は、表示可能な文字数は96文字となるので、使用されている文字サイズの個数を確認しながら、適宜TIME制御文とCS制御文を追加していく実施形態でもよい。   Note that the TIME control statement and the CS control statement need not be added every 48 characters as long as the number of characters is less than 48 characters. In addition, when the character size used is medium, the number of characters that can be displayed is 96, so add the TIME control statement and CS control statement as appropriate while checking the number of character sizes used. Embodiment which goes on may be sufficient.

なおフルセグ放送波の字幕データは、1字幕PESパケットが最小100msec間隔で入力されるので、字幕文変換処理によって文字数が変換されても“標準”換算で48文字を超えた字幕文をTIME制御文で分割する場合に指定する処理待ち時間は、100msecという数値を考慮する必要がある。   Note that subtitle data for full-segment broadcasting waves is input with a subtitle PES packet at a minimum interval of 100 msec. Therefore, even if the number of characters is converted by subtitle text conversion processing, subtitle text exceeding 48 characters in terms of “standard” is converted to a TIME control text. The processing waiting time designated when dividing by 1 needs to consider a numerical value of 100 msec.

[字幕文結合処理の実施例]
次に、図4または図5で示した字幕文変換処理を施した字幕文を結合する字幕文結合処理の一実施形態を、図6を用いて説明する。
図6は、図2で説明した字幕文結合処理部214によって実行される、字幕文変換処理を施した複数の字幕文を結合する字幕文結合処理の一実施形態を示すフローチャートである。
[Example of subtitle sentence combination processing]
Next, an embodiment of a caption sentence combination process for combining caption sentences subjected to the caption sentence conversion process shown in FIG. 4 or FIG. 5 will be described with reference to FIG.
FIG. 6 is a flowchart illustrating an embodiment of a caption sentence combination process for combining a plurality of caption sentences subjected to caption sentence conversion processing, which is executed by the caption sentence combination processing unit 214 described in FIG.

図3に示すように、フルセグ放送波の字幕データの1PESパケットは最小100msec間隔で送出される。一方ワンセグ放送波の字幕データの1PESパケットは最小1000msec間隔で送出される。すなわち、ワンセグ放送波の字幕データを1PESパケット送出するときに、フルセグ放送波の10PESパケット分の字幕データを送出しなければならない場合がある。なお、フルセグ放送波の10PESパケット分の字幕データをワンセグ放送波の字幕データに変換したときのデータ量が、ワンセグ放送波の字幕データの1PESパケットで送出可能なデータ量であれば、フルセグ放送波の10PESパケット分の字幕データを結合して送出することが可能である。そして10PESパケットの字幕データの字幕データを結合する処理においても、TIME制御文およびCS制御文を用いることができる。   As shown in FIG. 3, one PES packet of full-segment broadcasting wave caption data is transmitted at a minimum interval of 100 msec. On the other hand, 1 PES packet of subtitle data of one-segment broadcasting wave is transmitted at a minimum interval of 1000 msec. That is, when transmitting 1 PES packet of caption data of one-segment broadcasting wave, it may be necessary to transmit caption data of 10 PES packet of full-segment broadcasting wave. If the data amount when subtitle data for 10 PES packets of a full-seg broadcast wave is converted into subtitle data of a one-segment broadcast wave is a data amount that can be transmitted with one PES packet of subtitle data of the one-segment broadcast wave, a full-seg broadcast wave It is possible to combine and send subtitle data for 10 PES packets. The TIME control statement and the CS control statement can also be used in the process of combining the caption data of the caption data of the 10 PES packet.

つまり、字幕変換プログラム200が図4または図5に示す字幕文変換処理を行いながらも(S601)、字幕データ抽出部201は新たな字幕PESパケットを抽出して、字幕変換プログラム200が新たな字幕PESパケットに対して字幕文変換処理を行う(S602)。さらに、先に抽出した字幕PESパケットから取得したPTSと、新たに抽出した字幕PESパケットから取得したPTSとの時間の間隔、すなわち、連続して取得した複数の字幕PESパケットの字幕文の表示時間間隔が1000msecよりも小さいかの判定(S603)を行う。そして1000msec以上であった場合(S603のN)は字幕結合処理を終了する。一方1000msec未満であった場合(S603のY)は、字幕文結合処理部214は、先に取得した字幕文と新たに取得した字幕文を結合して1つのPESパケットとする字幕文結合処理を行う(S604)。   That is, while the caption conversion program 200 performs the caption sentence conversion processing shown in FIG. 4 or 5 (S601), the caption data extraction unit 201 extracts a new caption PES packet, and the caption conversion program 200 creates a new caption. Subtitle sentence conversion processing is performed on the PES packet (S602). Furthermore, the time interval between the PTS acquired from the previously extracted caption PES packet and the PTS acquired from the newly extracted caption PES packet, that is, the display time of the caption texts of a plurality of continuously acquired caption PES packets. It is determined whether the interval is smaller than 1000 msec (S603). If it is 1000 msec or longer (N in S603), the caption combining process is terminated. On the other hand, if it is less than 1000 msec (Y in S603), the subtitle sentence combination processing unit 214 performs a subtitle sentence combining process that combines the previously acquired subtitle sentence and the newly acquired subtitle sentence into one PES packet. This is performed (S604).

具体的には、先に取得した字幕文と新たに取得した字幕文との表示時間間隔が700msecであった場合は、700msecの処理待ちを行うTIME制御文とCS制御文を追加することで、フルセグ放送波の字幕データの字幕文を表示するのと同じタイミングで、ワング放送波の字幕文を表示できる字幕PESパケットを出力することができる。   Specifically, if the display time interval between the previously acquired caption text and the newly acquired caption text is 700 msec, by adding a TIME control statement and a CS control statement that wait for 700 msec processing, A subtitle PES packet capable of displaying a subtitle sentence of a Wang broadcast wave can be output at the same timing as displaying a subtitle sentence of subtitle data of a full segment broadcast wave.

[変形例1]
図2に示したように、本実施形態は字幕データ出力部222が出力バッファ221から入力されたワンセグ放送波の字幕データの字幕文をOSD生成部223に出力する形態であったが、HDD42やUSB_IF部47を介して接続された記録媒体であるUSBデバイスUD、通信部46を介して接続された記録装置などに出力して保存する実施形態であってもよい。すなわち、変換した字幕文を表示器33に表示するのではなく、ワンセグ放送波の映像音声データに付帯する字幕データとしてHDD42やUSBデバイスUD、外部記録装置などの記録媒体に保存する形態であってもよい。
[Modification 1]
As shown in FIG. 2, in this embodiment, the caption data output unit 222 outputs the caption text of the one-segment broadcast wave caption data input from the output buffer 221 to the OSD generation unit 223. In another embodiment, the data may be output and stored in a USB device UD, which is a recording medium connected via the USB_IF unit 47, a recording device connected via the communication unit 46, or the like. That is, the converted subtitle text is not displayed on the display device 33 but is stored in a recording medium such as the HDD 42, the USB device UD, or an external recording device as subtitle data attached to the video / audio data of the one-segment broadcasting wave. Also good.

[変形例2]
図2に示したように、本実施形態は字幕データ抽出部201がチューナ部45や通信部46、ODD43などからフルセグ放送波の字幕データを抽出してワンセグ放送波の字幕データに変換する形態であったが、ODD43に装着されたBDやDVDなどから、当該BDやDVDに格納されたコンテンツの字幕データを取得してワンセグ放送波の字幕データに変換する形態であってもよい。
[Modification 2]
As shown in FIG. 2, this embodiment is a form in which the caption data extraction unit 201 extracts caption data of a full segment broadcast wave from the tuner unit 45, the communication unit 46, the ODD 43, etc., and converts it into caption data of a one segment broadcast wave. However, the subtitle data of the content stored in the BD or DVD may be acquired from the BD or DVD mounted on the ODD 43 and converted into subtitle data of the one-segment broadcasting wave.

以上説明したように本実施形態によれば、フルセグ放送波の字幕文に対して、一文あたりの表示可能文字数が多い文字サイズへの変換処理や、不要な文字の削除処理、一文を分割して数回に分けて表示する分割処理などを施すので、情報量が多い(文字数が多い)字幕文であるフルセグ放送波の字幕文を、当該字幕文の文字視認性を保ちながら当該字幕文の意味を損なわないで、制約された文字数の字幕文であるワンセグ放送波の字幕文に変換することが可能である。   As described above, according to the present embodiment, for a subtitle sentence of a full-segment broadcasting wave, a conversion process to a character size with a large number of displayable characters per sentence, an unnecessary character deletion process, and a sentence are divided. The subtitle sentence of a full segment broadcast wave, which is a subtitle sentence with a large amount of information (a large number of characters), is displayed while maintaining the character visibility of the subtitle sentence. Can be converted into a one-segment broadcasting wave subtitle sentence, which is a subtitle sentence with a limited number of characters.

また本発明は、上述した実施形態に限定されるものではなく、本発明の要旨を変えない範囲において、種々の変更、改変等が可能である。   The present invention is not limited to the above-described embodiments, and various changes and modifications can be made without departing from the scope of the present invention.

10…コンピュータ装置、200…字幕変換プログラム、201…字幕データ抽出部、202…入力バッファ、211…管理データ変換処理部、212…DRCS変換処理部、213…字幕文変換処理部、214…字幕文結合処理部、221…出力バッファ、222…字幕データ出力部、223…OSD生成部。   DESCRIPTION OF SYMBOLS 10 ... Computer apparatus, 200 ... Subtitle conversion program, 201 ... Subtitle data extraction part, 202 ... Input buffer, 211 ... Management data conversion process part, 212 ... DRCS conversion process part, 213 ... Subtitle sentence conversion process part, 214 ... Subtitle sentence Combining processing unit, 221... Output buffer, 222... Caption data output unit, 223.

Claims (7)

所定の文字サイズ情報で定義された字幕文をコンテンツデータから抽出する字幕文抽出手段と、
前記字幕文抽出手段が抽出した字幕文の文字サイズ情報を前記字幕文の文字が小さくなるように変換する文字サイズ変換手段と、
前記文字サイズ変換手段が文字サイズ情報を変換した字幕文から特定の文字を削除する文字削除手段と、
前記字幕文抽出手段が所定時間内に複数の字幕文を抽出する場合に、前記抽出された複数の字幕文それぞれを結合する結合手段と
を具備することを特徴とする字幕変換装置。
Subtitle sentence extraction means for extracting subtitle sentences defined by predetermined character size information from the content data;
Character size conversion means for converting the character size information of the caption sentence extracted by the caption sentence extraction means so that the characters of the caption sentence become smaller;
A character deletion unit that deletes a specific character from the subtitle sentence in which the character size conversion unit has converted the character size information;
A subtitle conversion apparatus comprising: a combining unit configured to combine each of the plurality of extracted subtitle sentences when the subtitle sentence extracting unit extracts a plurality of subtitle sentences within a predetermined time .
前記文字サイズ変換手段は、任意の文字種類に優先順位を付して文字サイズ情報を変換することを特徴とする請求項1記載の字幕変換装置。   2. The caption conversion device according to claim 1, wherein the character size conversion unit converts character size information by assigning a priority to an arbitrary character type. 前記文字サイズ変換手段は、文字種類が英数、平仮名、カタカナの順で優先順位を付して文字サイズ情報を変換することを特徴とする請求項1記載の字幕変換装置。   2. The caption conversion device according to claim 1, wherein the character size conversion means converts the character size information by assigning priorities in the order of the character type: alphanumeric, hiragana and katakana. 前記文字削除手段が特定の文字を削除した字幕文の文字数が所定の文字数を超過している場合に、前記特定の文字を削除された字幕文を複数に分割する分割手段
を具備することを特徴とする請求項1記載の字幕変換装置。
Division means for dividing the subtitle sentence from which the specific character is deleted into a plurality of subtitle sentences when the number of characters of the subtitle sentence from which the character deletion means has deleted the specific character exceeds a predetermined number of characters
The subtitle conversion apparatus according to claim 1, further comprising:
前記結合手段は、前記字幕文抽出手段が所定時間内に複数の字幕文を抽出する場合に、前記抽出された複数の字幕文それぞれの文字のサイズを変換して特定の文字を削除してからそれぞれの字幕文を結合することを特徴とする請求項1から4のいずれかに記載の字幕変換装置。 When the subtitle sentence extraction means extracts a plurality of subtitle sentences within a predetermined time , the combining means converts the size of each of the extracted subtitle sentences and deletes a specific character. Subtitles conversion device according to any one of the Turkey be bonded each caption text from claim 1, wherein 4. 第1の時間よりも長い第2の時間以上の間隔で前記字幕文を出力する字幕文出力部  A caption text output unit that outputs the caption text at intervals of a second time longer than the first time.
を備え、  With
前記字幕抽出手段は、前記第1の時間以上の間隔で字幕文の抽出を行い、  The caption extraction means extracts caption sentences at intervals of the first time or more;
前記結合手段は、前記字幕文抽出手段において連続して抽出した複数の字幕文の表示時間間隔が、前記第2の時間未満の場合に、当該連続して抽出された複数の字幕文を結合することを特徴とする請求項1から5のいずれかに記載の字幕変換装置。  The combining unit combines the plurality of continuously extracted subtitle sentences when the display time interval of the plurality of subtitle sentences continuously extracted by the subtitle sentence extracting unit is less than the second time. The subtitle conversion apparatus according to claim 1, wherein the subtitle conversion apparatus is a subtitle conversion apparatus.
所定の文字サイズ情報で定義された字幕文をコンテンツデータから抽出し、
前記字幕文の文字サイズ情報を前記字幕文の文字が小さくなるように変換し、
前記文字サイズ情報を変換された字幕文から特定の文字を削除
所定時間内に複数の字幕文を抽出する場合に、前記抽出された複数の字幕文それぞれを結合する、
ことを特徴とする字幕変換方法。
Extract subtitle text defined by the predetermined character size information from the content data,
The character size information of the subtitle sentence is converted so that the characters of the subtitle sentence become smaller,
Delete a specific character from the caption text converted from the character size information,
When extracting a plurality of subtitle sentences within a predetermined time, combining each of the extracted subtitle sentences;
A subtitle conversion method characterized by that.
JP2009035193A 2009-02-18 2009-02-18 Subtitle conversion apparatus and subtitle conversion method Expired - Fee Related JP5248364B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009035193A JP5248364B2 (en) 2009-02-18 2009-02-18 Subtitle conversion apparatus and subtitle conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009035193A JP5248364B2 (en) 2009-02-18 2009-02-18 Subtitle conversion apparatus and subtitle conversion method

Publications (2)

Publication Number Publication Date
JP2010193150A JP2010193150A (en) 2010-09-02
JP5248364B2 true JP5248364B2 (en) 2013-07-31

Family

ID=42818718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009035193A Expired - Fee Related JP5248364B2 (en) 2009-02-18 2009-02-18 Subtitle conversion apparatus and subtitle conversion method

Country Status (1)

Country Link
JP (1) JP5248364B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5060509B2 (en) * 2009-04-07 2012-10-31 株式会社東芝 Information processing apparatus and caption text data conversion method
JP2013229831A (en) * 2012-04-27 2013-11-07 Nippon Hoso Kyokai <Nhk> Data broadcast generation apparatus, broadcast system, and program
US20140002460A1 (en) * 2012-06-27 2014-01-02 Viacom International, Inc. Multi-Resolution Graphics
JP5380592B2 (en) * 2012-08-02 2014-01-08 株式会社東芝 Information processing apparatus and moving image data transmission method
JP6366070B2 (en) * 2014-07-10 2018-08-01 日本放送協会 A text content generation device, a transmission device, a reception device, and a program.
CN105704538A (en) * 2016-03-17 2016-06-22 广东小天才科技有限公司 Method and system for generating audio and video subtitles

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000041226A (en) * 1998-07-21 2000-02-08 Toshiba Corp Program information receiver, program information display method, program information transmitter and program information transmission method
JP2005293174A (en) * 2004-03-31 2005-10-20 Toshiba Corp Text data editing device, method and program
JP2006270139A (en) * 2005-03-22 2006-10-05 Matsushita Electric Ind Co Ltd Data reproducer and data reproducing method and system
JP4768411B2 (en) * 2005-11-15 2011-09-07 株式会社東芝 Mobile subtitle specification conversion device for digital broadcasting and its conversion method

Also Published As

Publication number Publication date
JP2010193150A (en) 2010-09-02

Similar Documents

Publication Publication Date Title
JP4541482B2 (en) Image processing apparatus and image processing method
JP5248364B2 (en) Subtitle conversion apparatus and subtitle conversion method
JP5423425B2 (en) Image processing device
JP4469788B2 (en) Information processing apparatus and reproducing method
KR20030065332A (en) Method for processing auxiliary information in a video system
US6750918B2 (en) Method and system for using single OSD pixmap across multiple video raster sizes by using multiple headers
JP2005033741A (en) Television character information display device, and television character information display method
JP4587821B2 (en) Video playback device
JP2024513380A (en) Subtitle processing methods, devices, devices and storage media
JP6045405B2 (en) Video processing apparatus, display apparatus, television receiver, and video processing method
KR101050031B1 (en) Closed Captioning System in Windows-based Graphics Systems
JP2007215141A (en) Image processing device and image processing method
KR100773883B1 (en) Method and system for processing video incorporating multiple on screen display formats, and on screen display memory for storing video
JP5330947B2 (en) Display device, display method, program, and recording medium
JP3872295B2 (en) Data display method, recording medium, and processor-based system
US20150002515A1 (en) Method for displaying multi-gradation characters, device for displaying multi-gradation characters, television receiver provided with device for displaying multi-gradation characters, mobile equipment provided with device for displaying multi-gradation characters, and recording medium
JP5380592B2 (en) Information processing apparatus and moving image data transmission method
JP2010273051A (en) Video processing apparatus, video display device and video processing method
US9489718B2 (en) Display apparatus and image processing method thereof which decode an image in unit of minimum coded unit
US8451274B2 (en) Method and device of displaying characters
JP2001268464A (en) Digital television broadcast receiver
JP2007011787A (en) Video apparatus, and display control method
KR100497347B1 (en) Apparatus and method for controlling the decoding font size according to a kind of character data
JP2010245768A (en) Image processing apparatus, and image processing method
JP2009003745A (en) Information display terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110411

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees