JP2016110645A - Dividing device, analysis device, and program - Google Patents

Dividing device, analysis device, and program Download PDF

Info

Publication number
JP2016110645A
JP2016110645A JP2015230099A JP2015230099A JP2016110645A JP 2016110645 A JP2016110645 A JP 2016110645A JP 2015230099 A JP2015230099 A JP 2015230099A JP 2015230099 A JP2015230099 A JP 2015230099A JP 2016110645 A JP2016110645 A JP 2016110645A
Authority
JP
Japan
Prior art keywords
information
text
fragment
text document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015230099A
Other languages
Japanese (ja)
Other versions
JP6796376B2 (en
Inventor
馬場 秋継
Akitsugu Baba
秋継 馬場
悠樹 広中
Yuki Hironaka
悠樹 広中
藤澤 和也
Kazuya Fujisawa
和也 藤澤
謙二郎 加井
Kenjiro Kai
謙二郎 加井
洋一 所
Yoichi Tokoro
洋一 所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Publication of JP2016110645A publication Critical patent/JP2016110645A/en
Application granted granted Critical
Publication of JP6796376B2 publication Critical patent/JP6796376B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a dividing device, an analysis device, and a program for appropriately dividing and sending out timed text such as subtitle text.SOLUTION: An acquisition unit 11 acquires text document data including a plurality of text sentences in which time-of-day information is added. A time-of-day analysis unit 12 generates fragmentation information for fragmenting the text document data into a plurality of groups including the text sentences on the basis of the time-of-day information. A reference relation analysis unit 14 analyzes, for each fragment that is a group of fragmented text sentences, the header description information of the text document referenced from the fragment, and generates reference relation information indicating the relationship of the fragment with the header description referenced from the fragment. A sending information generation unit generates fragmented text document sending information that includes the fragmentation information and the reference relation information.SELECTED DRAWING: Figure 1

Description

本発明は、データを分割するための分割装置および解析装置、ならびにプログラムに関する。   The present invention relates to a dividing device, an analyzing device, and a program for dividing data.

テレビ放送における字幕テキストを伝送し、表示するために、タイムドテキストの技術が用いられる。タイムドテキストとは、時刻情報を伴うテキストデータを構造化したものである。字幕テキストに関しては、時刻情報として提示時刻が付加される。放送局側から、映像や音声のコンテンツと共にタイムドテキストを送信し、受信機側では、付加された提示時刻に基づいて、そのテキストを、映像や音声と共に提示する。   Timed text technology is used to transmit and display subtitle text in television broadcasts. Timed text is structured text data with time information. For caption text, a presentation time is added as time information. The broadcast station transmits timed text together with video and audio content, and the receiver presents the text together with video and audio based on the added presentation time.

非特許文献1には、標準化された規格であるタイムドテキストマークアップ言語(TTML)によるデータの記述方法が記載されている。
また、非特許文献2には、非特許文献1のTTMLをベースとして、テキストに加え、画像、音声、WEBフォントによる非組込フォントの提示にも対応したタイムドテキストマークアップ言語(ARIB−TTML)によるデータの記述方法が記載されている。
さらに、非特許文献3の、例えば図9−2(p.114)には、ARIB−TTML文書ファイルを含む一連のファイルを伝送する方式の概要が記載されている。
Non-Patent Document 1 describes a data description method using a timed text markup language (TTML), which is a standardized standard.
Non-Patent Document 2 includes a timed text markup language (ARIB-TTML) that is based on the TTML of Non-Patent Document 1 and supports the presentation of non-embedded fonts in addition to text, images, sounds, and WEB fonts. ) Describes the data description method.
Further, for example, FIG. 9-2 (p. 114) of Non-Patent Document 3 describes an outline of a system for transmitting a series of files including an ARIB-TTML document file.

World Wide Web Consortium(W3C,ワールド・ワイド・ウェブ・コンソーシアム),「Timed Text Markup Language 1 (TTML1) (Second Edition)」,西暦2013年(平成25年)9月24日,[平成26年11月9日検索],インターネット<URL:http://www.w3.org/TR/ttaf1-dfxp/>World Wide Web Consortium (W3C, World Wide Web Consortium), “Timed Text Markup Language 1 (TTML1) (Second Edition)”, September 24, 2013 (November 2014) 9 days search], Internet <URL: http://www.w3.org/TR/ttaf1-dfxp/> 「標準規格 ARIB STD−B62 1.0版 デジタル放送におけるマルチメディア符号化方式(第2世代)」,「第一編第3部第3章 字幕・文字スーパーの記述言語」,p.63−78,平成26年7月31日,一般社団法人電波産業会“Standard ARIB STD-B62 Version 1.0 Multimedia Coding System for Digital Broadcasting (Second Generation)”, “Volume 1 Part 3 Chapter 3 Subtitle / Text Super Description Language”, p. 63-78, July 31, 2014, Japan Radio Industry Association 「標準規格 ARIB STD−B60 1.0版 デジタル放送におけるMMTによるメディアトランスポート方式」,「第9章 字幕・文字スーパーの伝送」,p.114−121,平成26年7月31日,一般社団法人電波産業会“Standard ARIB STD-B60 Version 1.0 Digital Transport with MMT Media Transport System”, “Chapter 9 Transmission of Subtitles / Superimposed Characters”, p. 114-121, July 31, 2014, Japan Radio Industry Association

従来の技術では、テレビ番組等、映像コンテンツの字幕テキストは、番組全体を単位として一つのTTML文書ファイルとして構成されている。DVDやブルーレイディスクなどの記録媒体に映像コンテンツを記録して販売する場合も同様である。また、ビデオオンデマンドのサービス(要求に応じてインターネット等の通信回線を用いてコンテンツを配信するサービス)においても、ひとつのまとまった番組の全体の字幕テキストを一度に送信する形態がとられる。   In the conventional technology, caption text of video content such as a television program is configured as one TTML document file for the entire program. The same applies when video content is recorded on a recording medium such as a DVD or a Blu-ray disc. Also, a video-on-demand service (a service that distributes content using a communication line such as the Internet in response to a request) also takes a form in which the entire subtitle text of a single program is transmitted at a time.

しかしながら、例えば、30分ないしは数時間におよぶ映像コンテンツの字幕テキストのデータ量は膨大であり、これを短時間内に放送波にのせて伝送することは困難である。また、受信機側では、視聴者は任意のタイミングで、受信機の電源をオンにしたり、放送サービス(放送チャンネル)を切り替えたりする。このため、視聴者があるタイミングで特定の放送番組の視聴を開始したときに、そのタイミングにおいて必要な字幕テキストをすばやく伝送する必要がある。番組の全体の字幕テキストを一度に送信する形態の場合、データ量が膨大であるため、すばやく伝送する事が困難であることに加え、番組が放送中の間に、繰り返し全体の字幕テキストを送信する必要があるため、放送の伝送帯域の多くを消費してしまう。   However, for example, the amount of subtitle text data of video content over 30 minutes or several hours is enormous, and it is difficult to transmit this over broadcast waves within a short time. On the receiver side, the viewer turns on the receiver power or switches the broadcast service (broadcast channel) at an arbitrary timing. For this reason, when the viewer starts viewing a specific broadcast program at a certain timing, it is necessary to quickly transmit the necessary subtitle text at that timing. In the case of transmitting the entire subtitle text of the program at once, the amount of data is enormous, making it difficult to transmit quickly, and it is necessary to repeatedly transmit the entire subtitle text while the program is broadcast This consumes much of the broadcast transmission bandwidth.

したがって、放送局側の設備として、一番組全体の分がまとまったTTML文書ファイル(字幕テキスト等)を、適切なサイズの断片に分割したり、分割された断片を単位として放送信号に載せて送出したりすることが求められる。
また、放送時にリアルタイムで字幕テキストを送出するためには、TTML文書ファイルの分割処理の負荷を軽減することが求められる。
Therefore, as a facility on the broadcasting station side, a TTML document file (subtitle text, etc.) for a whole program is divided into pieces of an appropriate size, or the divided pieces are put on a broadcast signal and sent as a unit. It is required to do.
Also, in order to transmit subtitle text in real time during broadcasting, it is required to reduce the load of the TTML document file division process.

本発明は、上記の課題認識に基づいて行なわれたものであり、例えば放送用の一番組全体の字幕テキスト等のタイムドテキストを、断片に分割するための、分割装置および解析装置、ならびにプログラムを提供するものである。   The present invention has been made based on the above problem recognition. For example, a dividing device, an analyzing device, and a program for dividing timed text such as subtitle text of an entire program for broadcasting into pieces. Is to provide.

[1]上記の課題を解決するため、本発明の一態様による解析装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を生成する送出情報生成部と、を具備することを特徴とする。   [1] In order to solve the above-described problem, an analysis apparatus according to an aspect of the present invention includes an acquisition unit that acquires text document data including a plurality of text sentences to which time information is added, and the above-described time information. A time analysis unit for generating fragmentation information for fragmenting text document data into a plurality of groups including the text sentence, and referring to each fragment that is a group of the fragmented text sentence from the fragment Analyzing the header description information of the text document to be generated, generating a reference relationship information representing a relationship between the fragment and the header description referenced from the fragment, the fragmentation information and the reference A transmission information generation unit that generates fragmented text document transmission information including relation information.

[2]また、本発明の一態様は、上記の解析装置において、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を生成する変換情報解析部、をさらに具備し、前記送出情報生成部は、前記放送ロケーション変換情報をも含んだ断片化テキスト文書送出情報を生成する、ことを特徴とする。   [2] Further, according to one aspect of the present invention, in the above analysis device, when the fragment is transmitted by broadcasting, an image file, an audio file, or a non-embedded font referred to from the text sentence included in the fragment File location information, location information description position specifying information indicating in which part of the text document data the location information of the image file, the audio file, and the non-embedded font file is described, and the image file And broadcast location information according to the broadcast name space for specifying the resource acquisition position in the broadcast signal when the audio file and the non-embedded font file are transmitted together with the fragment by broadcast. A conversion information analysis unit for generating information, and the transmission information generation unit , It generates the fragmentation text document delivery information including also broadcast location conversion information, wherein the.

[3]また、本発明の一態様は、上記[1]の解析装置において、前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、ことを特徴とする。
[4]また、本発明の一態様は、上記[2]の解析装置において、前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報と前記放送ロケーション変換情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、ことを特徴とする。
[3] Further, according to an aspect of the present invention, in the analysis device according to [1], the transmission information generation unit includes the fragmentation information, the reference relationship information, and the reference information in the text document data acquired by the acquisition unit. The fragmented text document transmission information including the information is added and output as information-added text document data.
[4] Further, according to an aspect of the present invention, in the analysis device according to [2], the transmission information generation unit includes the fragmentation information, the reference relationship information, and the reference information in the text document data acquired by the acquisition unit. The fragmented text document transmission information including the broadcast location conversion information is added and output as information-added text document data.

[5]また、本発明の一態様は、上記の解析装置において、前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
[5] Further, according to one aspect of the present invention, in the above analysis device, the information about each fragment included in the fragmentation information is for specifying a group of the text sentences included in the fragment.
(1) A list of IDs for identifying the text sentence included in the fragment and attached to the text sentence;
(2) Information of the start time added to the text sentence having the earliest time order among the text sentences included in the fragment;
(3) Information on a start time added to the text sentence with the earliest time order among the text sentences included in the fragment and an end time added to the text sentence with the latest time order;
The reference relationship information includes, as header description of the text document necessary for presentation of the fragment, information on non-embedded font, information on embedded image, information on text style, , Including at least one of the text presentation area information.

[6]上記の課題を解決するため、本発明の一態様による分割装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データに加え、前記時刻情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに断片化するための断片化情報と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述との関係を表す参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて、分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得された前記リソースファイルとを含むデータを出力する出力部と、を具備することを特徴とする。   [6] In order to solve the above-described problem, a dividing device according to an aspect of the present invention, in addition to text document data including a plurality of text sentences to which time information is added, adds the text document data based on the time information. The relationship between fragmentation information for fragmenting into a plurality of groups of the text sentence and the header description of the text document referenced from the fragment for each fragment that is a group of the fragmented text sentence. Reading fragmented text document transmission information including reference relationship information to be expressed, dividing the text document data into a plurality of groups of the text sentences based on the fragmentation information, and dividing based on the reference relationship information Division for adding information of the header description of the text document referred to by the fragment to the group of the text sentence that is a fragment A resource file data acquisition unit that acquires a resource file referenced from the fragment of the text sentence divided by the division unit, the text sentence divided by the division unit, and the resource file data acquisition unit And an output unit for outputting data including the resource file.

[7]また、本発明の一態様は、上記の分割装置において、前記分割部は、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を更に含む、前記断片化テキスト文書送出情報を読み込み、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記画像ファイルや前記音声ファイルや前記非組込フォントファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換えて前記断片に分割する、ことを特徴とする。   [7] In addition, according to one aspect of the present invention, in the above dividing device, the dividing unit transmits an image file or an audio file referred to from the text sentence included in the fragment when the fragment is transmitted by broadcasting. And location information description position designation information indicating in which part of the text document data the location information of the image file, the audio file, and the non-embedded font file is described. Broadcast location information based on a broadcast name space for specifying a resource acquisition position in a broadcast signal when the image file, the audio file, and the non-embedded font file are transmitted together with the fragment by broadcast. The fragmented text document transmission information further including the included broadcast location conversion information is read. Based on the broadcast location conversion information, the location information of the image file, the audio file, and the non-embedded font file included in the fragment is rewritten into location information based on a broadcast name space and divided into the fragments. It is characterized by that.

[8]また、本発明の一態様は、上記の分割装置において、前記分割部は、時刻情報が付加されたテキストを含むテキスト文書データに、前記断片化テキスト文書送出情報が付加されている情報付加済テキスト文書データを読み込み、前記断片化テキスト文書送出情報に含まれる前記断片化情報に基づいて前記テキスト文書データを、テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加し、また、前記分割部は、前記断片化テキスト文書情報に前記放送ロケーション変換情報が含まれる場合は、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換える、ことを特徴とする。   [8] Further, according to one aspect of the present invention, in the above dividing device, the dividing unit includes information in which the fragmented text document transmission information is added to text document data including text to which time information is added. Read the added text document data, divide the text document data into a plurality of groups of text sentences based on the fragmentation information included in the fragmented text document transmission information, and divide based on the reference relation information Information of a header of the text document referenced from the fragment is added to the group of text sentences that are the fragmented, and the dividing unit includes the broadcast location conversion information in the fragmented text document information. If included, the location of the resource file included in the fragment is based on the broadcast location conversion information. The ® down information, rewrites the location information by name space of broadcasting, characterized in that.

[9]また、本発明の一態様による分割装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、前記テキスト文書データに加え、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得されたリソースファイルとを含むデータを出力する出力部と、を具備することを特徴とする。   [9] Further, the dividing device according to one aspect of the present invention includes an acquisition unit that acquires text document data including a plurality of text sentences to which time information is added, and the text document data based on the time information. A time analysis unit that generates fragmentation information for fragmentation into a plurality of groups including a text sentence, and for each fragment that is a group of the fragmented text sentence, the text document referenced from the fragment Analyzing header description information, generating a reference relationship information representing a relationship between the fragment and the header description referenced from the fragment; in addition to the text document data, the fragmentation information and the fragmentation information The fragmented text document transmission information including the reference relation information is read, and the text document data is converted into a plurality of groups of the text sentence based on the fragmentation information. A division unit for adding information on a header description of the text document referred to from the fragment to a group of the text sentence that is a fragment divided based on the reference relation information; and A resource file data acquisition unit that acquires a resource file referenced from the fragment of the divided text sentence, the text sentence divided by the division unit, and a resource file acquired by the resource file data acquisition unit And an output unit that outputs data including the output data.

[10]また、本発明の一態様は、上記の分割装置において、前記出力部は、前記断片に含まれる前記テキスト文に付加された前記提示時刻情報のうち、一番早い提示開始時刻にしたがって、分割された前記テキスト文と、前記リソースファイルとを含むデータを順次出力する、ことを特徴とする。   [10] Further, according to one aspect of the present invention, in the dividing device, the output unit according to the earliest presentation start time among the presentation time information added to the text sentence included in the fragment. The data including the divided text sentence and the resource file are sequentially output.

[11]また、本発明の一態様は、上記の分割装置において、前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
[11] Further, according to one aspect of the present invention, in the above dividing device, the information about each fragment included in the fragmentation information is for specifying a group of the text sentences included in the fragment.
(1) A list of IDs for identifying the text sentence included in the fragment and attached to the text sentence;
(2) Information of the start time added to the text sentence having the earliest time order among the text sentences included in the fragment;
(3) Information on a start time added to the text sentence with the earliest time order among the text sentences included in the fragment and an end time added to the text sentence with the latest time order;
The reference relationship information includes, as header description of the text document necessary for presentation of the fragment, information on non-embedded font, information on embedded image, information on text style, , Including at least one of the text presentation area information.

[12]また、本発明の一態様は、上記の分割装置において、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。   [12] Further, according to an aspect of the present invention, in the above dividing apparatus, the reference relation information includes non-embedded font information, embedded image information as a header description of the text document necessary for presentation of the fragment. It includes at least one of information, text style information, and text presentation area information.

[13]また、本発明の一態様は、上記の解析装置としてコンピューターを機能させるためのプログラムである。   [13] One embodiment of the present invention is a program for causing a computer to function as the analysis apparatus.

[14]また、本発明の一態様は、上記の分割装置としてコンピューターを機能させるためのプログラムである。   [14] One embodiment of the present invention is a program for causing a computer to function as the above-described dividing device.

本発明によれば、時刻情報が付加されたテキスト情報を、放送等の伝送に適した形に分割して、出力することができる。
また、本発明による字幕情報が付加されたテキスト情報は、一番組全体のテキスト情報として記述、管理できるため、インターネットでのビデオオンデマンドサービスにおいて一般的に用いられる一番組全体のテキスト情報を一括して送信することにも対応でき、インターネットでの字幕テキストの提供に適した形式でも出力することができる。
According to the present invention, text information to which time information is added can be divided and output in a form suitable for transmission such as broadcasting.
In addition, since the text information to which the caption information according to the present invention is added can be described and managed as text information of the entire program, the text information of the entire program generally used in the video-on-demand service on the Internet is collected. Can also be output, and can be output in a format suitable for providing subtitle text on the Internet.

本発明の第1実施形態による分割装置(送出装置)の概略機能構成を示すブロック図である。It is a block diagram which shows schematic function structure of the division | segmentation apparatus (transmission apparatus) by 1st Embodiment of this invention. 同実施形態による分割装置が取得するテキスト文書データの構成を示す概略図である。It is the schematic which shows the structure of the text document data which the dividing device by the same embodiment acquires. 同実施形態による分割装置によって解析される情報を示す概略図である。It is the schematic which shows the information analyzed by the division | segmentation apparatus by the embodiment. 同実施形態による分割装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the division | segmentation apparatus by the embodiment. 本発明の第2実施形態による装置構成を示す概略ブロック図である。It is a schematic block diagram which shows the apparatus structure by 2nd Embodiment of this invention. 同実施形態による解析装置の概略機能構成を示すブロック図である。It is a block diagram which shows the schematic function structure of the analyzer by the same embodiment. 同実施形態による分割装置の概略機能構成を示すブロック図である。It is a block diagram which shows schematic function structure of the division | segmentation apparatus by the embodiment. 同実施形態による解析装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the analyzer by the same embodiment. 同実施形態による分割装置の処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the process of the division | segmentation apparatus by the embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(1/6)である。It is the schematic (1/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(2/6)である。It is the schematic (2/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(3/6)である。It is the schematic (3/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(4/6)である。It is the schematic (4/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(5/6)である。It is the schematic (5/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(6/6)である。It is the schematic (6/6) which shows the example of the text document data which added the information of the analysis result in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態において出力される断片化テキスト文書データの例を示す概略図である。It is the schematic which shows the example of the fragmented text document data output in 1st Embodiment and 2nd Embodiment. 第1実施形態および第2実施形態において出力される、パッケージ化した字幕データの構造の例を示す概略図である。It is the schematic which shows the example of the structure of the packaged subtitle data output in 1st Embodiment and 2nd Embodiment.

次に、図面を参照しながら、本発明の実施形態について説明する。
[第1実施形態]
図1は、第1実施形態による分割装置(送出装置)の概略機能構成を示すブロック図である。図示するように、分割装置1は、取得部11と、時刻解析部12と、変換情報解析部13と、参照関係解析部14と、分割部15と、出力部17と、リソースファイルデータ取得部18とを含んで構成される。また、図示するテキスト文書データ81と断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
Next, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a block diagram showing a schematic functional configuration of a dividing device (sending device) according to the first embodiment. As illustrated, the dividing device 1 includes an acquisition unit 11, a time analysis unit 12, a conversion information analysis unit 13, a reference relationship analysis unit 14, a division unit 15, an output unit 17, and a resource file data acquisition unit. 18. Further, the illustrated text document data 81 and fragmented caption data 85 are appropriately stored in a form recorded on a recording medium or the like. Specifically, a magnetic hard disk device, a semiconductor memory, or the like is used as the data storage means.

取得部11は、時刻情報が付加されたテキストを含むテキスト文書データ81を外部から取得する。テキスト文書データ81は、このテキスト文書データ81の詳細については後述する。
時刻解析部12は、テキスト文書データ81に含まれる時刻情報に基づいて、テキスト文書データ81を断片化するための断片化情報を生成する。ここで、断片化とは、時間軸にしたがって、テキスト文書データ81を、より短い適切な時間範囲を有する複数のグループに分割することである。なお、断片化によって分割された各グループは、1個または複数個のテキスト文を含む。また、時刻解析部12によって分割されたテキスト(所定の時間の範囲内のテキスト文)を、以後、断片(フラグメント)と呼ぶ場合がある。適切な時間範囲とは、例えば、テレビ放送の字幕としての伝送用に適した時間範囲である。
時刻解析部12は、生成した断片化情報を分割部15に渡す。
The acquisition unit 11 acquires text document data 81 including text to which time information is added from the outside. Details of the text document data 81 will be described later.
The time analysis unit 12 generates fragmentation information for fragmenting the text document data 81 based on the time information included in the text document data 81. Here, the fragmentation is to divide the text document data 81 into a plurality of groups having a shorter appropriate time range according to the time axis. Each group divided by fragmentation includes one or a plurality of text sentences. Further, the text (text sentence within a predetermined time range) divided by the time analysis unit 12 may be hereinafter referred to as a fragment. An appropriate time range is, for example, a time range suitable for transmission as captions for television broadcasting.
The time analysis unit 12 passes the generated fragmentation information to the dividing unit 15.

参照関係解析部14は、断片化されたテキスト文のグループである断片ごとに、その断片から参照されるテキスト文書のヘッダ記述の情報を解析し、その断片と、その断片から参照されるヘッダ記述との関係を表す参照関係情報を生成する。
参照関係解析部14は、生成した参照関係情報を分割部15に渡す。
なお、ヘッダ記述とは、テキスト文から参照されるテキスト文書データのヘッダ部に記述されているフォントの情報や埋め込み画像の情報やスタイル定義情報や字幕提示の領域情報などである。ヘッダ記述の詳細については後述する。
The reference relationship analysis unit 14 analyzes, for each fragment that is a fragmented text sentence group, the header description information of the text document referenced from the fragment, and the header description referenced from the fragment. Reference relationship information representing the relationship between and is generated.
The reference relationship analyzing unit 14 passes the generated reference relationship information to the dividing unit 15.
The header description includes font information, embedded image information, style definition information, caption presentation area information, and the like described in a header portion of text document data referred to from a text sentence. Details of the header description will be described later.

変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルを参照するためのロケーション情報を解析する。そして、変換情報解析部13は、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
変換情報解析部13は、生成した放送ロケーション変換情報を分割部15に渡す。
The conversion information analysis unit 13 analyzes location information for referring to a resource file included in a fragmented subtitle text group. Then, the conversion information analysis unit 13 generates broadcast location conversion information for rewriting the description of the original location information into location information in the broadcast name space.
The conversion information analysis unit 13 passes the generated broadcast location conversion information to the dividing unit 15.

分割部15は、テキスト文書データ81と、時刻解析部12から渡される断片化情報と、参照関係解析部14から渡される参照関係情報とを取得する。そして、分割部15は、断片化情報に基づいてテキスト文書データ81を、テキスト文を含んだ複数のグループに分割するとともに、分割された断片であるテキスト文のグループに、その断片から参照されるテキスト文書のヘッダ記述の情報を付加する。
出力部17は、分割部15によって分割されたテキスト文のグループである断片と、その断片から参照されるリソースファイルのデータとを、放送等で利用される伝送フォーマットにて出力する。このとき、出力部17は、断片に含まれるテキスト文に付加された時刻情報のうち一番早い開始時間にしたがって、分割されたテキスト文のグループである断片化テキスト文書データと、関連付けられたリソースのデータを放送等で利用される伝送フォーマットにて順次出力する。なお、出力部17は、リソースファイルのデータを、リソースファイルデータ取得部18から受け取る。
リソースファイルデータ取得部18は、テキスト文書データ81から参照されている外部のリソースファイル87を取得して、上記の出力部17に渡す。
The dividing unit 15 acquires the text document data 81, fragmentation information passed from the time analysis unit 12, and reference relationship information passed from the reference relationship analysis unit 14. Then, the dividing unit 15 divides the text document data 81 into a plurality of groups including the text sentence based on the fragmentation information, and is referenced from the fragment to the group of text sentences that are the divided fragments. Add header description information of text document.
The output unit 17 outputs a fragment that is a group of text sentences divided by the dividing unit 15 and data of a resource file referenced from the fragment in a transmission format used in broadcasting or the like. At this time, the output unit 17 generates the fragmented text document data that is a group of text sentences divided according to the earliest start time among the time information added to the text sentence included in the fragment, and the associated resource. Are sequentially output in a transmission format used in broadcasting or the like. The output unit 17 receives the resource file data from the resource file data acquisition unit 18.
The resource file data acquisition unit 18 acquires an external resource file 87 referred to from the text document data 81 and passes it to the output unit 17.

図2は、分割装置1が取得するテキスト文書データ81の概略構成を示す概略図である。同図に示すテキスト文書データ81は、テレビ放送の字幕のデータであり、TTML(Timed Text Markup Language,タイムドテキストマークアップ言語)の形式によるものである。TTMLは、例えば「標準規格 ARIB STD−B62 1.0版 デジタル放送におけるマルチメディア符号化方式(第2世代)」,「第一編第3部第3章 字幕・文字スーパーの記述言語」(p.63−78,平成26年7月31日,一般社団法人電波産業会)で規定されたARIB−TTMLにしたがう。TTML文書は、時刻情報が付加された複数のテキスト文を保持することができる。本実施形態におけるTTML文書は、テレビ放送の字幕テキストおよびそのテキストの提示時刻(presentation time)の情報を含む。TTML文書は、XML(Extensible Markup Language)文書の一種であり、時刻情報以外にも種々の情報を含んでいる。   FIG. 2 is a schematic diagram showing a schematic configuration of the text document data 81 acquired by the dividing device 1. The text document data 81 shown in the figure is television broadcast subtitle data, and is in a TTML (Timed Text Markup Language) format. TTML is, for example, “Standard ARIB STD-B62 Version 1.0, Multi-Media Coding System for Digital Broadcasting (2nd Generation)”, “Part 1, Part 3, Chapter 3, Subtitle / Text Super Description Language” (p 63-78, July 31, 2014, the Radio Industry Association of Japan) according to ARIB-TTML. The TTML document can hold a plurality of text sentences to which time information is added. The TTML document in the present embodiment includes subtitle text of television broadcasting and information on the presentation time of the text. The TTML document is a kind of XML (Extensible Markup Language) document and includes various information in addition to time information.

図示するように、テキスト文書データ81は、ヘッダ部(head要素)に、埋め込みイメージ情報や、非組込フォント情報や、スタイル情報や、字幕提示の領域情報を含む。
具体的には、テキスト文書データ81は、メタデータ(metadata要素)の一部として、埋め込みイメージ情報を持っている。埋め込みイメージ情報は、smpte:image要素として保持されるものであり、バイナリー形式のイメージを適宜コード化して文字としてテキスト文書データ81内に含まれる。
また、テキスト文書データ81は、スタイリング情報(styling要素)の一部として、非組込フォント情報(arib−tt:font−face要素)を持っている。非組込フォント情報には、TTML文書とともに表示可能な非組込フォントのリソースフィルのロケーション情報等を記述する。
また、テキスト文書データ81は、スタイリング情報の一部として、スタイル情報(style要素)を持っている。このスタイル情報は、文字色や、フォントファミリーや、フォントサイズや、文字の配置(アラインメント指定)などの情報を含む。後続のbody要素内に記述される字幕本文から、ここで定義したスタイル情報を参照して利用できる。
また、テキスト文書データ81は、レイアウト情報(layout要素)の一部として、字幕提示の領域情報(region要素)を含む。この領域情報は、テキストを表示する領域(座標範囲)に関する情報である。後続のbody要素内に記述される字幕本文から、ここで定義した領域情報を参照して利用できる。
As shown in the figure, the text document data 81 includes embedded image information, non-embedded font information, style information, and subtitle presentation area information in a header portion (head element).
Specifically, the text document data 81 has embedded image information as part of metadata (metadata element). The embedded image information is held as a “smpte: image” element, and an image in a binary format is appropriately encoded and included in the text document data 81 as characters.
Further, the text document data 81 has non-embedded font information (arib-tt: font-face element) as a part of styling information (styling element). The non-embedded font information describes the location information of the resource file of the non-embedded font that can be displayed together with the TTML document.
The text document data 81 has style information (style element) as part of styling information. This style information includes information such as character color, font family, font size, and character arrangement (alignment designation). It can be used by referring to the style information defined here from the subtitle text described in the subsequent body element.
Further, the text document data 81 includes caption presentation area information (region element) as part of layout information (layout element). This area information is information relating to an area (coordinate range) for displaying text. It can be used by referring to the area information defined here from the caption text described in the subsequent body element.

また、テキスト文書データ81は、ボディ部(body要素)に字幕本文のテキストの情報を保持する。字幕本文は、p要素や、div要素として、テキスト文書データ81内に含まれる。なお、字幕本文を保持するp要素やdiv要素は、上記のヘッダ部内の各情報(埋め込みイメージ情報、非組込フォント情報、スタイル情報、字幕提示の領域情報)を参照する。   Further, the text document data 81 holds the text information of the subtitle text in the body part (body element). The subtitle text is included in the text document data 81 as a p element or a div element. Note that the p element and div element that hold the caption text refer to each piece of information (embedded image information, non-embedded font information, style information, and caption presentation area information) in the header section.

分割装置1の入力となるテキスト文書データ81は、例えば放送番組の単位でひとまとまりのファイルである。番組の長さは、多くの場合、数分から数時間の範囲内のものである。このテキスト文書データ81は、例えば、DVDやブルーレイディスク等の記録媒体に記録されたパッケージの一部として組み込まれる場合には特段の不都合はないが、そのままでは、放送等のように逐次伝送される形態のコンテンツには向かない。   The text document data 81 to be input to the dividing device 1 is a group of files in units of broadcast programs, for example. The length of the program is often in the range of minutes to hours. The text document data 81 is not particularly inconvenient when it is incorporated as a part of a package recorded on a recording medium such as a DVD or a Blu-ray disc. Not suitable for form content.

分割装置1は、そのようなテキスト文書データ81を入力し、この文書に含まれるテキスト文をより短い時間帯ごとに分割して、放送用字幕用の複数のフラグメント(断片)のTTMLファイルとして出力する。分割装置によって分割された後のフラグメントのTTMLファイルは、各時間帯のテキスト文のグループの情報(1つまたは複数のp要素やdiv要素の情報)に、それらのp要素やdiv要素から参照されるテキスト文書データ81のヘッダ部に記述されている、埋め込みイメージ情報、非組込フォント情報、スタイル情報、字幕提示の領域情報を追加したTTMLの記述方式に従った文書である。なお、分割装置1は、入力する文書ファイルの中から、分割後のファイルに必要な要素のみを適宜選択して出力する。   The dividing device 1 inputs such text document data 81, divides a text sentence included in the document into shorter time zones, and outputs the divided text as a TTML file of a plurality of fragments for broadcasting subtitles. To do. The TTML file of the fragment after being divided by the dividing device is referred to by the text element group information (information of one or more p elements and div elements) of each time zone from those p elements and div elements. This is a document according to the TTML description method to which embedded image information, non-embedded font information, style information, and subtitle presentation area information described in the header portion of the text document data 81 is added. The dividing device 1 appropriately selects and outputs only the elements necessary for the divided file from the input document file.

つまり、分割装置1の時刻解析部12は、入力されたテキスト文書データ81に含まれる各テキスト文に付加された時刻情報(提示時刻の情報)に基づいて、テキスト文のグループへの断片化を行う。そして、時刻解析部12は、入力されたデータに、時刻解析の結果の情報を付加する。時刻解析の結果とは、入力されたデータを時間軸に沿っていかに断片化するかを表す情報である。つまり、時刻解析部12によって付加される断片化情報とは、各断片の開始時刻(および必要に応じて終了時刻)を表す情報である。TTMLにおいては、字幕本文の各時間帯のテキスト文(p要素やdiv要素)に開始時刻等を表す情報が記述されているため、p要素やdiv要素の属性値として記述されているid情報を指定することで、上記の各断片の開始時刻(および必要に応じて終了時刻)を特定でき、各断片に含まれるテキスト文のid情報を、いかに断片化するかを表す断片化情報とすることもできる。複数のテキスト文をまたがった時間を指定する場合には、複数のテキスト文のid値のリストを指定することもできる。   That is, the time analysis unit 12 of the dividing device 1 performs fragmentation of text sentences into groups based on time information (presentation time information) added to each text sentence included in the input text document data 81. Do. Then, the time analysis unit 12 adds information on the result of time analysis to the input data. The result of time analysis is information indicating whether input data is fragmented along the time axis. That is, the fragmentation information added by the time analysis unit 12 is information representing the start time (and the end time if necessary) of each fragment. In TTML, information indicating the start time and the like is described in the text sentence (p element and div element) in each time zone of the subtitle body. Therefore, the id information described as the attribute value of the p element or div element is used. By specifying, the start time (and end time if necessary) of each fragment above can be specified, and the id information of the text sentence included in each fragment should be fragmented information indicating how to fragment. You can also. When specifying a time spanning a plurality of text sentences, a list of id values of the plurality of text sentences can be specified.

また、参照関係解析部14は、入力されたテキスト文書データ81を分割するために、テキスト文書データ81に含まれる時間帯(時間軸で区切った断片)ごとの、テキスト文書データ81のヘッダ部のうち必要な部分の記述への参照の状況を解析する。そして、参照関係解析部14は、解析した結果である参照関係情報を、入力データに付加する。分割部15は、これらの、解析結果が付加されたデータを受け取り、それに基づいて分割されたファイルを生成する。
また、変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
In addition, the reference relationship analysis unit 14 divides the input text document data 81 in the header portion of the text document data 81 for each time zone (fragment divided by the time axis) included in the text document data 81. Analyze the situation of reference to the description of the necessary part. Then, the reference relationship analysis unit 14 adds the reference relationship information that is the analysis result to the input data. The dividing unit 15 receives the data to which the analysis result is added, and generates a divided file based on the data.
In addition, the conversion information analysis unit 13 analyzes the location information for referring to the resource file included in the fragmented subtitle text group, and rewrites the original location information description into the location information in the broadcast namespace. The broadcast location conversion information is generated.

図3は、分割装置1の時刻解析部12と参照関係解析部14と変換情報解析部13とによってそれぞれ解析された結果として付加される、データを時間軸に沿っていかに断片化するかをTTML文書内に記述するためのXMLの構造を示す概略図である。この付加情報を含むデータが、分割部15に渡される。同図は、便宜上、XML形式のデータの階層構造を表として表した形である。なお、同図における横方向のインデントの位置は、階層の深さに対応している。但し、分割部15が受け取るデータ(解析結果を付加したデータ)は、XML形式に限らず、同等の他の形式のデータであっても良い。また、この例ではTTML文書に中のmetadata要素としてデータを付加する例を示したが、字幕用のTTML文書とは別に、付加情報のファイルとして別のファイルを生成し、管理するようにしても良い。図示するように、図3は、TTML文書ファイル内の階層構成のタグ情報およびパラメーターの種類と、同ファイル内に含まれる各要素の出現回数を示している。   FIG. 3 shows TTML whether data to be fragmented along the time axis is added as a result of analysis by the time analysis unit 12, the reference relationship analysis unit 14, and the conversion information analysis unit 13 of the dividing device 1. It is the schematic which shows the structure of XML for describing in a document. Data including this additional information is passed to the dividing unit 15. This figure shows a hierarchical structure of XML data as a table for convenience. The position of the indent in the horizontal direction in the figure corresponds to the depth of the hierarchy. However, the data received by the dividing unit 15 (data to which the analysis result is added) is not limited to the XML format, and may be data in another equivalent format. In this example, data is added as a metadata element in a TTML document. However, a separate file is generated as an additional information file and managed separately from the caption TTML document. good. As shown in FIG. 3, FIG. 3 shows the tag information and parameter types of the hierarchical structure in the TTML document file, and the number of appearances of each element included in the file.

なお、同図においては、各要素および各属性の出現回数の情報をも示している。出現回数の欄に「1」と示す属性は、共通の上位要素に属する同一レベルのものとしては1回出現する。出現回数の欄に「0..1」と示す属性は、共通の上位要素に属する同一レベルのものとしては0回ないしは1回出現する。出現回数の欄に「0..n」と示す属性は、共通の上位要素に属する同一レベルのものとしては0回ないしはn回(nは自然数)出現する。   In the figure, information on the number of appearances of each element and each attribute is also shown. The attribute indicated by “1” in the appearance count column appears once for the same level belonging to the common upper element. The attribute indicated by “0..1” in the column of the number of appearances appears 0 times or once for the same level belonging to the common upper element. The attribute indicated by “0..n” in the appearance count column appears 0 times or n times (n is a natural number) at the same level belonging to a common upper element.

以下、各々の要素および属性について説明する。
tt要素は、TTML文書ファイルにおける最上位の要素である。
head要素は、TTML文書ファイルにおけるヘッダ部(head要素)である。
metadata要素は、ヘッダ部の中に含まれているメタデータである。TTMLにおいては、TTML文書に関する任意の情報おmedadata要素下に記述することができる。
captionExchangeInformation要素は、メタデータの一部として含まれている、字幕キャプションの交換に関する情報である。
transmissionInformation要素は、captionExchangeInformationの一部として含まれている、伝送に関する情報である。
transmissionUnits要素は、放送における伝送単位である「unit」を格納するための親要素である。
Hereinafter, each element and attribute will be described.
The tt element is the highest element in the TTML document file.
The head element is a header part (head element) in the TTML document file.
The metadata element is metadata included in the header part. In TTML, it can be described under any information and metadata elements related to a TTML document.
The captionExchangeInformation element is information regarding the exchange of caption captions included as part of the metadata.
The transmissionInformation element is information relating to transmission that is included as part of the captionExchangeInformation.
The transmissionUnits element is a parent element for storing “unit” which is a transmission unit in broadcasting.

unit要素は、放送で伝送される字幕データの伝送単位を示す要素である。
@xml:id属性は、unitの属性であり、字幕テキストの伝送単位の識別子を示す。この識別子により、伝送単位ごとの字幕データを番号等で管理することができる。なお、unitを識別するために、連番等を値として持つ@number要素を用いるようにしても良い。
@timecode属性は、unitの属性であり、提示時刻を示す。提示時刻は、当該伝送単位として伝送される字幕データを提示する時刻であり、例えば番組開始時点からの相対時刻で表される。提示時刻を表す形式は、例えば、「hh:mm:ss:nnn」(時−分−秒−ミリ秒)である。放送局側の送出装置(本実施形態における分割装置1)は、この提示時刻に基づき、字幕データを送出する。なお、提示時刻よりも所定時間(伝送や処理等に要するオーバーヘッド時間)前に、送出装置は、字幕データを送出する。なお、@timecode属性の値としての提示時刻には、当該伝送単位に含まれる各字幕テキストの提示開始時刻のうち、一番早い開始時間の値を用いる。これにより、放送信号を受信する受信機側での提示に間に合うように、断片化字幕データ85を送出することができる。
The unit element is an element indicating a transmission unit of caption data transmitted by broadcasting.
The @xml: id attribute is a unit attribute and indicates an identifier of a transmission unit of subtitle text. With this identifier, subtitle data for each transmission unit can be managed by a number or the like. In order to identify a unit, an @number element having a serial number or the like as a value may be used.
The @timecode attribute is a unit attribute and indicates a presentation time. The presentation time is a time at which caption data transmitted as the transmission unit is presented, and is represented by, for example, a relative time from the program start time. The format representing the presentation time is, for example, “hh: mm: ss: nnn” (hour-minute-second-millisecond). The broadcast station-side transmission device (dividing device 1 in the present embodiment) transmits subtitle data based on this presentation time. Note that the sending apparatus sends the caption data before a predetermined time (overhead time required for transmission, processing, etc.) before the presentation time. As the presentation time as the value of the @timecode attribute, the value of the earliest start time among the presentation start times of the subtitle texts included in the transmission unit is used. As a result, the fragmented caption data 85 can be sent out in time for presentation on the receiver side that receives the broadcast signal.

resource要素は、字幕データの伝送単位に含まれる各リソース(resource要素)に対応する要素である。resource要素は、そのリソースを構成するために必要な情報やデータを指し示すための情報を属性として含む。resource要素のdatatype属性(下記)に応じて、記述可能な他の属性を切り替える。具体的には、datatype=「0000」の場合と、datatype≠「0000」との場合で切り替える。   The resource element is an element corresponding to each resource (resource element) included in the transmission unit of caption data. The resource element includes information necessary for configuring the resource and information for indicating data as attributes. Other attributes that can be described are switched according to the datatype attribute (described below) of the resource element. Specifically, switching is performed between datatype = “0000” and datatype ≠ “0000”.

@datatype属性は、resourceの属性であり、データタイプを表す。例えば、ARIB標準規格である「デジタル放送におけるMMTによるメディアトランスポート方式」(ARIB STD-B60 1.0版,2004年7月31日策定)の第117ページには、表9−1として、伝送時のデータタイプの一覧が示されている。ここでのdatatype属性は、上記規格に準ずるものとして考えることができる。具体的には、datatypeの値が「0000」であることは、当該リソースが字幕テキストそのもの(ARIB−TTML文書ファイル)であることを示す。また、datatypeの値が「0000」以外であることは、TTML文書ファイル以外の外部リソースであることを示す。例えば、datatypeの値が「0001」であるとき、そのリソースはPNG形式の画像ファイルである。また、datatypeの値が「0010」であるとき、そのリソースはSVG形式の画像ファイルである。また、datatypeの値が「0110」であるとき、そのリソースはSVG形式のフォントファイルである。また、datatypeの値が「0111」であるとき、そのリソースはWOFF形式のフォントファイルである。   The @datatype attribute is a resource attribute and represents a data type. For example, on page 117 of the ARIB standard "Media transport system using MMT in digital broadcasting" (ARIB STD-B60 1.0 version, formulated on July 31, 2004), as shown in Table 9-1, A list of data types is shown. The datatype attribute here can be considered as conforming to the above standard. Specifically, the value “datatype” being “0000” indicates that the resource is the caption text itself (ARIB-TTML document file). A datatype value other than “0000” indicates an external resource other than a TTML document file. For example, when the value of datatype is “0001”, the resource is an image file in PNG format. Further, when the value of datatype is “0010”, the resource is an image file in the SVG format. When the value of datatype is “0110”, the resource is a font file in the SVG format. When the value of datatype is “0111”, the resource is a font file in the WOFF format.

datatypeに後続する属性の種類は、@datasize属性を除き、上記のdatatypeの値に応じて異なる。datatypeの値が「0000」の場合は、後続する属性として、@font−face、@style、@region、@subtitleが用いられる。datatypeの値が「0000」以外の場合は、後続する属性として、@idref、@srcpath、@srcvalue、@replacetoが用いられる。datatypeの値が「0000」以外の場合のこれらの属性情報は、外部リソースファイルのパスの情報や、放送伝送の名前空間への書き換えに関する情報を含むものである。
図中では、datatype=「0000」の場合と、datatype≠「0000」との場合とのそれぞれに、異なるハッチングパターンを付して示している。
The type of the attribute following datatype differs according to the value of the above datatype except for the @datasize attribute. When the value of datatype is “0000”, @ font-face, @style, @region, and @subtitle are used as subsequent attributes. When the value of datatype is other than “0000”, @idref, @srcpath, @srcvalue, and @replaceto are used as subsequent attributes. These attribute information when the value of datatype is other than “0000” includes information on the path of the external resource file and information on rewriting to the name space of broadcast transmission.
In the figure, different hatching patterns are shown for datatype = “0000” and datatype ≠ “0000”, respectively.

@datasize属性は、当該リソースのデータサイズを示すものである。この属性は、datatypeの値によらず記述することができる。   The @datasize attribute indicates the data size of the resource. This attribute can be described regardless of the value of datatype.

次に挙げる@image属性、@font−face属性、@style属性、@region属性、@subtitle属性は、いずれも、datatypeの値が「0000」の場合(TTML文書を表す)に記述されるものである。また、これらの@image属性、@font−face属性、@style属性、@region属性、@subtitle属性の値は、本unit要素で伝送する字幕データを伝送するため、番組単位のTTML文書を分割する際に、抽出すべき要素を指定している。つまり、分割後のTTML文書に含まれるテキスト文と、それらのテキスト文から参照するヘッダ部に記述された情報の参照関係を予め解析しておき、その解析結果(参照される要素の識別子の情報)を伝送情報(transmissionInformation)の一部として含めておく。言い換えれば、伝送単位(unit)ごとに、含まれるテキスト文の識別子と、参照先のヘッダ部内の情報の識別子の情報を保持しておくようにする。識別子はTTML文書内のimage要素、font−face要素、style要素、region要素、字幕本文のdiv要素やp要素のxml:id属性として指定された識別子を利用する。@image属性、@font−face属性、@style属性、@region属性、@subtitle属性には、それぞれ複数の識別子を記述することができ、複数の属性値を記述した場合は、複数の要素を分割後のTTML文書に含めることを意味する。なお、datatypeの値が「0000」であるresource要素は必ず1つのみ存在する。   The following @image attribute, @ font-face attribute, @style attribute, @region attribute, and @subtitle attribute are all described when the value of datatype is “0000” (represents a TTML document). is there. Also, the values of these @image attribute, @ font-face attribute, @style attribute, @region attribute, and @subtitle attribute divide the TTML document for each program in order to transmit subtitle data transmitted by this unit element. The element to be extracted is specified. In other words, the reference relation between the text sentence included in the divided TTML document and the information described in the header section referred to from the text sentence is analyzed in advance, and the analysis result (information on the identifier of the referenced element) ) Is included as part of transmission information (transmissionInformation). In other words, for each transmission unit (unit), the identifier of the included text sentence and the information of the identifier of the information in the header part of the reference destination are held. As an identifier, an identifier specified as an xml: id attribute of an image element, a font-face element, a style element, a region element, a div element of a caption text, or a p element in a TTML document is used. In @image attribute, @ font-face attribute, @style attribute, @region attribute, and @subtitle attribute, multiple identifiers can be described respectively. When multiple attribute values are described, multiple elements are divided. It means to be included in a later TTML document. Note that there is always only one resource element whose datatype value is “0000”.

resource要素の@subtitle属性は、TTML文書中のtt/body/div/div要素もしくはtt/body/div/p要素(これらはいずれも、字幕テキスト)における識別子を規定する。なお、tt/body/div/div要素およびtt/body/div/p要素においては、xml:id属性によってその字幕テキストの識別子を規定する。@subtitle属性に記述する情報は、番組単位の字幕テキスト文のうち、当該伝送単位(unit)にどのテキスト文を含めるかの情報であり、時刻解析部12が生成する断片化情報に該当する。   The @subtitle attribute of the resource element defines an identifier in the tt / body / div / div element or the tt / body / div / p element (both are subtitle text) in the TTML document. In the tt / body / div / div element and the tt / body / div / p element, the identifier of the caption text is defined by the xml: id attribute. The information described in the @subtitle attribute is information indicating which text sentence is included in the transmission unit (unit) among the subtitle text sentences of the program unit, and corresponds to the fragmentation information generated by the time analysis unit 12.

resource要素の@image属性は、TTML文書中の、tt/head/metadata/smpte:image要素(イメージ)における識別子を指定する。なお、tt/head/metadata/smpte:image要素においては、@xml:id属性によってそのイメージの識別子を規定する。   The @image attribute of the resource element specifies an identifier in the tt / head / metadata / smpte: image element (image) in the TTML document. In the tt / head / metadata / smpte: image element, the identifier of the image is defined by the @xml: id attribute.

resource要素の@font−face属性は、TTML文書中のtt/head/styling/arib−tt:font−face要素(フォント)における識別子を指定する。なお、tt/head/styling/arib−tt:font−face要素においては、id属性によってそのフォントフェースの識別子を規定する。   The @ font-face attribute of the resource element specifies an identifier in the tt / head / styling / arib-tt: font-face element (font) in the TTML document. In the tt / head / styling / arib-tt: font-face element, the identifier of the font face is defined by the id attribute.

resource要素の@style属性は、TTML文書中のtt/head/styling/style要素(様々な表示スタイルの規定)における識別子を指定する。なお、tt/head/styling/style要素においては、xml:id属性によってそのスタイルの識別子を規定する。   The @style attribute of the resource element specifies an identifier in a tt / head / styling / style element (definition of various display styles) in the TTML document. In the tt / head / styling / style element, the identifier of the style is defined by the xml: id attribute.

resource要素の@region属性は、TTML文書中のtt/head/layout/region要素(表示の領域)における識別子を規定する。なお、tt/head/layout/region要素においては、xml:id属性によってその領域の識別子を規定する。   The @region attribute of the resource element defines an identifier in the tt / head / layout / region element (display area) in the TTML document. In the tt / head / layout / region element, the identifier of the area is defined by the xml: id attribute.

なお、上記@image属性、@font−face属性、@style属性、@region属性に記述する情報は、参照関係解析部14が生成する各断片から参照されるテキスト文書のヘッダ記述の情報であり、それぞれ埋め込み画像の情報、非組込フォントの情報、スタイルの情報、字幕提示の領域情報などの参照関係情報に該当する。   Note that the information described in the @image attribute, @ font-face attribute, @style attribute, and @region attribute is information on the header description of the text document referenced from each fragment generated by the reference relationship analysis unit 14, These correspond to reference relationship information such as embedded image information, non-embedded font information, style information, and subtitle presentation area information.

resource要素のdatatypeの値が「0000」以外の場合は、前述のとおり、リソースがARIB−TTML文書以外であることを示し、resource要素には、当該伝送単位に含まれるが外部参照するリソースに関する情報を、リソース毎に記述する。つまり、datatypeの値が「0000」以外のresource要素が、unit要素にi個記述されている場合は、ARIB−TTML文書以外に、i個のリソースを伝送単位として送出する事を意味する。
resource要素の@idref属性は、伝送単位として一緒に送出するARIB−TTML文書において、外部リソースの参照を行っている要素を指定するものである。具体的には、@idref属性は、外部リソースを行っている要素の識別子(xml:id属性)を用いる。
resource要素の@srcpath属性(ソースパス)は、上記のidref属性で指定した要素を起点とした、リソースファイルのロケーションを指定する属性へのパスをxpath(http://www.w3.org/TR/xpath/)により指定するものである。
resource要素の@srcvalue属性(ソースバリュー)は、上記のsrcpath属性で示した属性の値(リソースファイルのロケーション情報)である。
resource要素の@replaceto属性(リプレース・トゥ)は、当該リソースを放送で伝送した場合に、受信機が当該リソースを放送信号中から取得できるようにするため、放送の名前空間によるリソースのロケーションを指定するものである。つまり、replaceto属性は、放送として伝送されるときには、ファイルの元の名(srcvalue属性で指定される値)を、このreplaceto属性で指定される名に置き換えることを指定するものである。
resource要素の@idref属性、@srcpath属性、@srcvalue属性、@replaceto属性の一連の属性によって、unit属性で指定した字幕の伝送単位において、ARIB−TTML文書から参照するリソースファイルの存在と、リソースファイルのロケーション情報を置き換えに必要な情報を指定することができる。つまり、これらの情報は、変換情報解析部13が生成する、放送ロケーション変換情報に該当する。
When the datatype value of the resource element is other than “0000”, as described above, it indicates that the resource is other than the ARIB-TTML document, and the resource element includes information on the resource included in the transmission unit but externally referenced. Is described for each resource. That is, when i resource elements other than “0000” in the datatype value are described in the unit element, this means that i resources are transmitted as a transmission unit in addition to the ARIB-TTML document.
The @idref attribute of the resource element specifies an element that refers to an external resource in the ARIB-TTML document that is sent together as a transmission unit. Specifically, for the @idref attribute, an identifier (xml: id attribute) of an element that performs an external resource is used.
For the @srcpath attribute (source path) of the resource element, the path to the attribute that specifies the location of the resource file starting from the element specified by the idref attribute is xpath (http://www.w3.org/TR / Xpath /).
The @srcvalue attribute (source value) of the resource element is the attribute value (resource file location information) indicated by the srcpath attribute.
The resource element's @replaceto attribute (replace to) specifies the location of the resource in the broadcast namespace so that the receiver can obtain the resource from the broadcast signal when the resource is transmitted in broadcast To do. That is, the replaceto attribute specifies that the original name of the file (value specified by the srcvalue attribute) is replaced with the name specified by the replaceto attribute when transmitted as a broadcast.
The existence of a resource file to be referred to from the ARIB-TTML document and the resource file in the transmission unit of the subtitle specified by the unit attribute by the series of attributes of @resource attribute, @srcref attribute, @srcpath attribute, @srcvalue attribute, and @replaceto attribute It is possible to specify information necessary for replacing the location information. That is, these pieces of information correspond to broadcast location conversion information generated by the conversion information analysis unit 13.

なお、上記の、resource要素の@srcvalue属性は、断片に含まれるテキスト文から参照されるリソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等)のロケーション情報である。
また、上記の、resource要素の@srcpath属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等)のロケーション情報がテキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報である。
また、上記の、resource要素の@replaceto属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等を断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報である。
ここで述べたロケーション情報と、ロケーション情報記述位置指定情報と、放送の名前空間による放送ロケーション情報とを含むものが、放送ロケーション変換情報である。
Note that the @srcvalue attribute of the resource element is location information of a resource file (such as an image file, an audio file, or a non-embedded font file) that is referenced from a text sentence included in the fragment.
Also, the @srcpath attribute of the resource element described above is a location information description that indicates in which part of the text document data the location information of the resource file (image file, audio file, non-embedded font file, etc.) is described. It is position designation information.
In addition, the above-described @replaceto attribute of the resource element is used to specify the resource acquisition position in the broadcast signal when transmitting the resource file (image file, audio file, non-embedded font file, etc. together with the fragment) Broadcast location information by the name space of the broadcast.
Broadcast location conversion information includes the location information described here, location information description position designation information, and broadcast location information based on a broadcast name space.

次に、本実施形態における処理手順について説明する。
図4は、分割装置1による処理の手順を示すフローチャートである。
同図に示すように、まずステップS11において、取得部11は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS11:YES)には、ステップS13に飛ぶ。また、IDが付与されていない場合(ステップS11:NO)には、次のステップS12に進む。
Next, a processing procedure in the present embodiment will be described.
FIG. 4 is a flowchart illustrating a processing procedure performed by the dividing apparatus 1.
As shown in the figure, first, in step S11, the acquisition unit 11 acquires text document data 81, and determines whether or not an ID (identifier) has been assigned to each element included in the acquired text document data 81. to decide. This determination is for skipping the reassignment process by using the assigned IDs when the IDs have been assigned to the elements of the text document data 81. If the ID has been assigned (step S11: YES), the process jumps to step S13. If no ID is assigned (step S11: NO), the process proceeds to the next step S12.

次にステップS12に進んだ場合、取得部11は、テキスト文書データ81に含まれている各要素の適宜IDを付与する。なお、ここで付与するIDは、要素を識別できるものであれば充分である。具体的に、本ステップにおいてIDが付与される要素は、TTML文書データにおける、次の6種類の要素である。即ち;
− tt/head/metadata/smpte:image
− tt/head/styling/arib−tt/font−face
− tt/head/styling/style
− tt/head/layout/region
− tt/head/div/div
− tt/head/div/p
Next, when the process proceeds to step S <b> 12, the acquisition unit 11 assigns an appropriate ID of each element included in the text document data 81. The ID assigned here is sufficient if it can identify the element. Specifically, the elements to which IDs are assigned in this step are the following six types of elements in the TTML document data. Ie;
-Tt / head / metadata / smpte: image
-Tt / head / styling / arib-tt / font-face
-Tt / head / styling / style
-Tt / head / layout / region
-Tt / head / div / div
-Tt / head / div / p

ここで、要素の種類を容易に区別できるようなIDの付与のしかたをしても良い。例えば、次の通りである。
tt/head/metadata/smpte:imageの要素に対しては、「SMPTE」で始まるIDを付与する。一例としては、「SMPTE_logo16」などといったIDを付与する。
tt/head/styling/arib−tt/font−faceの要素に対しては、「f」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「f01」、「f02」、・・・などといったIDを付与する。
tt/head/styling/styleの要素やtt/head/layout/regionの要素に対しては、「s」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「s1」、「s2」、・・・などといったIDを付与する。
tt/head/div/divやtt/head/div/pの要素に対しては、「c」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「c001」、「c002」、・・・などといったIDを付与する。
このように各要素にIDを付与することにより、以後の処理において、そのIDによってそれぞれの要素を参照することができる。
Here, an ID may be given so that the types of elements can be easily distinguished. For example:
tt / head / metadata / smpte: An ID starting with “SMPTE” is assigned to the image element. As an example, an ID such as “SMPTE_logo16” is assigned.
For an element of tt / head / styling / arib-tt / font-face, an ID starting with “f” followed by a serial number is assigned. As an example, IDs such as “f01”, “f02”,.
For an element of tt / head / styling / style and an element of tt / head / layout / region, an ID starting with “s” and subsequently accompanied by a serial number is assigned. As an example, IDs such as “s1”, “s2”,.
For the elements of tt / head / div / div and tt / head / div / p, an ID starting with “c” and followed by a serial number is assigned. As an example, IDs such as “c001”, “c002”,.
By assigning an ID to each element in this way, each element can be referred to by the ID in the subsequent processing.

次にステップS13において、時刻解析部12は、テキスト文書データ81に含まれる全ての字幕文テキストに付与されている提示時刻の解析を行い、そして各々が字幕文テキストを有する複数のグループに断片化する断片化情報を生成する。時刻解析部12による断片化の方法は、任意である。通常は、放送番組において特定の字幕テキストが表示されている時間(提示開始時刻から提示終了時刻まで)は、数秒から、せいぜい十数秒の範囲内に収まることが多い。また、番組の途中から視聴を開始する視聴者がいることを考慮すると、1つの伝送単位があまり長い時間(例えば10秒、あるいはそれ以上)に渡ることは好ましくない。一例として、時刻解析部12は、所定の時間(数秒程度)を超えるごとに伝送単位を区切る。また、他の例として、時刻解析部12は、字幕テキストに対応する1つのdiv要素あるいはp要素ごとに、伝送単位を区切る。その他、伝送容量を考慮して、時刻解析部12による伝送単位の区切り方を決めても良い。伝送単位の区切り方の詳細は、一種の設計事項である。
いずれの方法を取るにせよ、時刻解析部12は、断片化した結果の時刻の区切りに含まれる字幕テキスト文(tt/head/div/div要素やtt/head/div/p要素)のIDのリストの情報である断片化情報を生成して、参照関係解析部14および分割部15に渡す。
Next, in step S13, the time analysis unit 12 analyzes the presentation times given to all the caption texts included in the text document data 81, and fragments into a plurality of groups each having caption texts. Generate fragmentation information. The method of fragmentation by the time analysis unit 12 is arbitrary. Usually, the time during which a specific subtitle text is displayed in a broadcast program (from the presentation start time to the presentation end time) often falls within a range from several seconds to at most ten and several seconds. Also, considering that there is a viewer who starts watching from the middle of a program, it is not preferable that one transmission unit extends for a very long time (for example, 10 seconds or more). As an example, the time analysis unit 12 divides a transmission unit every time a predetermined time (about several seconds) is exceeded. As another example, the time analysis unit 12 divides the transmission unit for each div element or p element corresponding to the caption text. In addition, the transmission unit may be determined by the time analysis unit 12 in consideration of the transmission capacity. The details of how to separate transmission units are a kind of design matter.
Regardless of which method is used, the time analysis unit 12 uses the ID of the subtitle text sentence (tt / head / div / div element or tt / head / div / p element) included in the fragmented time separator. Fragmentation information, which is list information, is generated and passed to the reference relationship analysis unit 14 and the division unit 15.

次にステップS14において、参照関係解析部14は、断片化情報をもとに断片化された字幕テキストのグループからの、テキスト文書データ81のヘッダ部に記述された情報への参照関係を解析し、参照関係情報を生成する。ここで、参照関係の解析の対象となるヘッダ部内の情報は、次の通りである。即ち、スタイル(style要素)や、字幕提示の領域(region要素)や、埋め込みイメージ(smpte:image要素)や、非組込フォント(arib−t:font−face要素)などである。
そして、参照関係解析部14は、断片化情報に参照関係に関する情報を付加して、変換情報解析部13および分割部15に渡す。
Next, in step S14, the reference relationship analysis unit 14 analyzes the reference relationship from the fragmented caption text group to the information described in the header portion of the text document data 81 from the fragmented subtitle text group. , Generate reference relationship information. Here, the information in the header part to be analyzed for the reference relationship is as follows. That is, a style (style element), a subtitle presentation area (region element), an embedded image (smpte: image element), a non-embedded font (arib-t: font-face element), and the like.
Then, the reference relationship analysis unit 14 adds information related to the reference relationship to the fragmentation information and passes it to the conversion information analysis unit 13 and the division unit 15.

次にステップS15において、変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、放送ロケーション変換情報を生成し分割部15に渡す。なお、変換情報解析部13が生成する放送ロケーション変換情報は、具体的には、resource要素における@srcpath属性と、@srcvalue属性と、@replaceto属性の、それぞれの値である。なお、放送ロケーション変換情報に含まれるこれらの属性については、図3を参照しながら説明した通りである。   Next, in step S15, the conversion information analysis unit 13 analyzes location information for referring to the resource file included in the fragmented subtitle text group, generates broadcast location conversion information, and passes it to the division unit 15. Note that the broadcast location conversion information generated by the conversion information analysis unit 13 is specifically the values of the @srcpath attribute, @srcvalue attribute, and @replaceto attribute in the resource element. Note that these attributes included in the broadcast location conversion information are as described with reference to FIG.

なお、時刻解析部12、参照関係解析部14、変換情報解析部13による解析結果の情報生成(付加)の一例は、後で、図10,図11,図12,図13,図14,図15を参照しながら説明する。   An example of information generation (addition) of analysis results by the time analysis unit 12, the reference relationship analysis unit 14, and the conversion information analysis unit 13 will be described later with reference to FIG. 10, FIG. 11, FIG. 12, FIG. This will be described with reference to FIG.

次にステップS16において、分割部15は、ステップS13において生成した断片化の情報とステップS14において生成した参照関係の情報と、ステップS15において生成した放送ロケーション情報への変換に関する情報に基づいて、入力されたテキスト文書データ81を分割し、断片化された複数のテキスト文書データを生成する。   Next, in step S16, the dividing unit 15 inputs based on the fragmentation information generated in step S13, the reference relationship information generated in step S14, and the information related to the conversion to the broadcast location information generated in step S15. The divided text document data 81 is divided to generate a plurality of fragmented text document data.

次にステップS17において、出力部17は、分割部15によって生成された断片化テキスト文書データが、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、断片化テキスト文書データと、リソースファイルデータ取得部18によって取得した外部のリソースファイル87を結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成する。この断片化字幕データ85は、断片化によって区切られた時間帯の字幕テキストデータと、参照リソースファイルのデータとを含む。
そして、出力部17は、複数の断片化字幕データ85のそれぞれを、各断片に含まれる字幕テキストのうち一番早い提示開始時刻に合わせて(受信機側での提示に間に合うようなタイミングで)、出力(送出)する。
なお、分割部15によるファイル分割、および出力部17によるデータの送出の詳細な処理手順は、第2実施形態において説明する図9の手順と同様のものとしても良い。
以上で、本フローチャート全体の処理を終了する。
Next, in step S17, the output unit 17 determines that the fragmented text document data generated by the dividing unit 15 refers to an external image file, an external audio file, an external non-embedded font file, and the like. The data and the external resource file 87 acquired by the resource file data acquisition unit 18 are combined to generate fragmented subtitle data 85 packaged according to a format provided by broadcasting or the like. The fragmented subtitle data 85 includes subtitle text data in a time zone delimited by fragmentation, and reference resource file data.
Then, the output unit 17 matches each of the plurality of fragmented caption data 85 with the earliest presentation start time among the caption texts included in each fragment (at a timing in time for presentation on the receiver side). , Output (send).
The detailed processing procedure of file division by the dividing unit 15 and data transmission by the output unit 17 may be the same as the procedure of FIG. 9 described in the second embodiment.
Above, the process of the whole flowchart is complete | finished.

[第2実施形態]
次に、第2実施形態について説明する。なお、上述した実施形態と共通の事項については記載を省略し、本実施形態に特有の事項を中心に以下の説明を行う。
図5は、本実施形態による装置構成を示す概略ブロック図である。図示するように、本実施形態によるテキスト(字幕等)の分割・送出システムは、テキスト文書データ81と、解析装置5と、情報付加済テキスト文書データ83と、分割装置2(送出装置)と、断片化字幕データ85とを含んで構成される。なお、テキスト文書データ81と、情報付加済テキスト文書データ83と、断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
[Second Embodiment]
Next, a second embodiment will be described. In addition, description is abbreviate | omitted about the matter which is common in embodiment mentioned above, and the following description is performed focusing on the matter peculiar to this embodiment.
FIG. 5 is a schematic block diagram showing a device configuration according to the present embodiment. As shown in the figure, the text (caption etc.) dividing / sending system according to the present embodiment includes a text document data 81, an analysis device 5, an information-added text document data 83, a dividing device 2 (sending device), And fragmented subtitle data 85. The text document data 81, the information-added text document data 83, and the fragmented caption data 85 are appropriately stored in a form recorded on a recording medium or the like. Specifically, a magnetic hard disk device, a semiconductor memory, or the like is used as the data storage means.

同図に示す解析装置5は、テキスト文書データ81を読み込み、断片化のための解析を行い、解析結果を付加して、情報付加済テキスト文書データ83を出力する。解析装置5が行う解析には、断片化するための提示時刻の解析と、断片化した結果のテキスト文からのテキスト文書データ81のヘッダ部の情報への参照の解析と、断片化した結果のテキスト文がリソースファイルを参照する場合の、リソースファイルのロケーション情報の解析の結果を含む。
また、分割装置2は、上記の情報付加済テキスト文書データ83を読み込み、各断片の字幕テキストに対応した複数の断片化テキスト文書データを生成し、生成された断片化テキスト文書データが、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、断片化テキスト文書データと、リソースファイルデータ取得部によって取得した外部ファイルデータを結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成する。断片化字幕データ85は、入力された字幕テキストを、所定の提示時刻の範囲で区切って独立のまとまった単位のファイルとして構成されるものである。
The analysis device 5 shown in the figure reads the text document data 81, performs analysis for fragmentation, adds the analysis result, and outputs the information-added text document data 83. The analysis performed by the analysis apparatus 5 includes analysis of the presentation time for fragmentation, analysis of the reference to the information in the header part of the text document data 81 from the text sentence resulting from fragmentation, and the result of fragmentation. Contains the result of analyzing the location information of the resource file when the text statement references the resource file.
The dividing device 2 reads the information-added text document data 83, generates a plurality of fragmented text document data corresponding to the subtitle text of each fragment, and the generated fragmented text document data is an external image. When referring to files, external audio files, external non-embedded font files, etc., a package according to the format provided by broadcasting etc. by combining fragmented text document data and external file data acquired by the resource file data acquisition unit Fragmented fragmented caption data 85 is generated. The fragmented subtitle data 85 is configured as an independent unit file by dividing input subtitle text within a predetermined presentation time range.

図6は、本実施形態による解析装置5の概略機能構成を示すブロック図である。図示するように、解析装置5は、取得部31と、時刻解析部32と、変換情報解析部33と、参照関係解析部34と、付加部36(送出情報生成部)とを含んで構成される。   FIG. 6 is a block diagram illustrating a schematic functional configuration of the analysis apparatus 5 according to the present embodiment. As shown in the figure, the analysis device 5 includes an acquisition unit 31, a time analysis unit 32, a conversion information analysis unit 33, a reference relationship analysis unit 34, and an addition unit 36 (transmission information generation unit). The

取得部31は、時刻情報が付加されたテキストを含むテキスト文書データ81を外部から取得する。
時刻解析部32は、テキスト文書データ81に含まれる各テキスト文に付加された時刻情報に基づいて、テキスト文書データ81を複数のテキスト文のグループに断片化するための断片化情報を生成する。なお、断片化された後の各グループは、元のテキスト文書データ81に含まれるテキスト文の時間範囲よりも、短い時間範囲のテキスト文を含むものである。
なお、時刻解析部32は、生成した断片化情報を参照関係解析部34および付加部36に渡す。
参照関係解析部34は、断片化されたテキスト文のグループである断片ごとに、その断片に含まれるテキスト文から参照されるテキスト文書データ81のヘッダ部の情報を解析し、その断片と、参照される前記ヘッダ部の情報(ヘッダ記述)との関係を表す参照関係情報を生成する。
参照関係解析部34は、断片化情報と生成した参照関係情報を変換情報解析部および付加部36に渡す。
変換情報解析部33は、断片化されたテキスト文のグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
変換情報解析部33は、生成した放送ロケーション変換情報を付加部36に渡す。
付加部36は、取得部31によって取得されたテキスト文書データ81に、時刻解析部32から渡された断片化情報と参照関係解析部34から渡された参照関係情報と変換解析部33から渡された放送ロケーション変換情報を付加して、情報付加済テキスト文書データ83として出力する。
The acquisition unit 31 acquires text document data 81 including text to which time information is added from the outside.
The time analysis unit 32 generates fragmentation information for fragmenting the text document data 81 into a plurality of text sentence groups based on the time information added to each text sentence included in the text document data 81. Each group after fragmentation includes a text sentence in a time range shorter than the time range of the text sentence included in the original text document data 81.
The time analysis unit 32 passes the generated fragmentation information to the reference relationship analysis unit 34 and the addition unit 36.
The reference relationship analysis unit 34 analyzes the information of the header part of the text document data 81 referenced from the text sentence included in the fragment for each fragment which is a fragmented text sentence group, and the fragment and reference The reference relationship information representing the relationship with the information (header description) of the header portion to be generated is generated.
The reference relationship analysis unit 34 passes the fragmentation information and the generated reference relationship information to the conversion information analysis unit and addition unit 36.
The conversion information analysis unit 33 analyzes the location information for referring to the resource file included in the fragmented text sentence group, and rewrites the description of the original location information into the location information based on the broadcast namespace. Broadcast location conversion information is generated.
The conversion information analysis unit 33 passes the generated broadcast location conversion information to the addition unit 36.
The adding unit 36 is passed from the conversion analysis unit 33 to the text document data 81 acquired by the acquisition unit 31, the fragmentation information passed from the time analysis unit 32, the reference relationship information passed from the reference relationship analysis unit 34, and the conversion analysis unit 33. The broadcast location conversion information is added and output as information-added text document data 83.

図7は、本実施形態による分割装置2の概略機能構成を示すブロック図である。図示するように、分割装置2は、分割部35と、出力部37と、リソースファイルデータ取得部38とを含んで構成される。   FIG. 7 is a block diagram illustrating a schematic functional configuration of the dividing device 2 according to the present embodiment. As illustrated, the dividing device 2 includes a dividing unit 35, an output unit 37, and a resource file data acquisition unit 38.

分割部35は、情報付加済テキスト文書データ83を読み込み、情報付加済テキスト文書データ83に含まれる断片化情報に基づいて情報付加済テキスト文書データ83に含まれるテキスト文書を分割し断片化テキストデータを生成する。
なお、分割部35が読み込む情報付加済テキスト文書データ83は、前述の通り、時刻情報が付加された複数のテキスト文を含むテキスト文書データ81に、時刻情報に基づいてテキスト文の複数のグループに断片化するための断片化情報を付加し、さらに断片化されたテキスト文の各グループごとに、その断片から参照されるテキスト文書データ81のヘッダ部の情報との関係を表す参照関係情報を付加し、さらに断片化されたテキスト文の各グループがリソースファイルを参照する場合に、リソースァイルの参照のためのロケーション情報を元のロケーション情報の記述から放送の名前空間によるロケーション情報へ書き換えるための放送ロケーション変換情報を付加してなるものである。
The dividing unit 35 reads the information-added text document data 83, divides the text document included in the information-added text document data 83 based on the fragmentation information included in the information-added text document data 83, and generates fragmented text data. Is generated.
Note that the information-added text document data 83 read by the dividing unit 35 is, as described above, the text document data 81 including a plurality of text sentences to which time information is added, and a plurality of groups of text sentences based on the time information. Fragmentation information for fragmentation is added, and for each group of fragmented text sentences, reference relation information representing the relationship with the information of the header portion of the text document data 81 referenced from the fragment is added In addition, when each group of fragmented text statements refers to a resource file, the broadcast for rewriting the location information for referring to the resource file from the original location information description to the location information in the broadcast namespace Location conversion information is added.

出力部37は、分割部35によって分割されたテキストに加え、分割されたテキスト文書が、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、分割されたテキストと、リソースファイルデータ取得部によって取得した外部リソースファイルデータを結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成し出力する。断片化字幕データ85は、入力された字幕テキストを、所定の提示時刻の範囲で区切って独立のまとまった単位のファイルとして構成されるものである。このとき、出力部37は、各断片に含まれる字幕テキストのうち一番早い提示時刻情報に合わせて、分割されたテキスト含む断片化字幕データを順次出力する。
リソースファイルデータ取得部38は、情報付加済テキスト文書データ83から参照されているリソースファイル87を取得し、上記の出力部37に渡す。
When the divided text document refers to an external image file, an external audio file, an external non-embedded font file, etc. in addition to the text divided by the dividing unit 35, the output unit 37 The external resource file data acquired by the resource file data acquisition unit is combined to generate and output fragmented subtitle data 85 packaged according to a format provided by broadcasting or the like. The fragmented subtitle data 85 is configured as an independent unit file by dividing input subtitle text within a predetermined presentation time range. At this time, the output unit 37 sequentially outputs fragmented subtitle data including the divided text in accordance with the earliest presentation time information among the subtitle texts included in each fragment.
The resource file data acquisition unit 38 acquires the resource file 87 referred to from the information-added text document data 83 and passes it to the output unit 37.

次に、本実施形態における処理手順について説明する。
図8は、解析装置5による処理の手順を示すフローチャートである。
同図に示すように、まずステップS31において、取得部31は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS31:YES)には、ステップS33に飛ぶ。また、IDが付与されていない場合(ステップS31:NO)には、次のステップS32に進む。
Next, a processing procedure in the present embodiment will be described.
FIG. 8 is a flowchart illustrating a processing procedure performed by the analysis apparatus 5.
As shown in the figure, first, in step S31, the acquisition unit 31 acquires the text document data 81, and determines whether or not each element included in the acquired text document data 81 has been given an ID (identifier). to decide. This determination is for skipping the reassignment process by using the assigned IDs when the IDs have been assigned to the elements of the text document data 81. If the ID has been assigned (step S31: YES), the process jumps to step S33. If no ID is assigned (step S31: NO), the process proceeds to the next step S32.

次にステップS32に進んだ場合、取得部31は、テキスト文書データ81に含まれている各要素の適宜IDを付与する。なお、本ステップにおける処理は、第1実施形態でのステップS12における処理と同様である。よって、ここでは詳細な説明を省略する。   Next, when the process proceeds to step S <b> 32, the acquisition unit 31 assigns an appropriate ID of each element included in the text document data 81. Note that the processing in this step is the same as the processing in step S12 in the first embodiment. Therefore, detailed description is omitted here.

次にステップS33において、時刻解析部32は、テキスト文書データ81に含まれる全ての字幕文テキストに付与されている提示時刻の解析を行い、そして複数の字幕文テキストのグループに断片化する断片化情報を生成する。なお、本ステップにおける処理は、第1実施形態でのステップS13における処理と同様である。よって、ここでは詳細な説明を省略する。   Next, in step S33, the time analysis unit 32 analyzes the presentation times given to all the subtitle texts included in the text document data 81, and fragments into a plurality of subtitle sentence text groups. Generate information. Note that the processing in this step is the same as the processing in step S13 in the first embodiment. Therefore, detailed description is omitted here.

次にステップS34において、参照関係解析部34は、断片化情報をもとに断片化された字幕テキストのグループからの、テキスト文書データ81のヘッダ部に記述された情報への参照関係を解析し、参照関係情報を付加する。なお、本ステップにおける処理は、第1実施形態でのステップS14における処理と同様である。よって、ここでは詳細な説明を省略する。   Next, in step S34, the reference relationship analysis unit 34 analyzes the reference relationship from the fragmented subtitle text group to the information described in the header portion of the text document data 81 from the fragmented text group. Reference relation information is added. Note that the processing in this step is the same as the processing in step S14 in the first embodiment. Therefore, detailed description is omitted here.

次にステップS35において、変換情報解析部33は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、放送ロケーション変換情報を生成し、分割部に渡す。なお、本ステップにおける処理は、第1実施形態でのステップS15における処理と同様である。よって、ここでは詳細な説明を省略する。   Next, in step S35, the conversion information analysis unit 33 analyzes the location information for referring to the resource file included in the fragmented caption text group, generates broadcast location conversion information, and passes it to the dividing unit. Note that the processing in this step is the same as the processing in step S15 in the first embodiment. Therefore, detailed description is omitted here.

次にステップS36において、付加部36は、テキスト文書データ81を適切に分割するために必要な情報を付加する。ここで付加部36が付加する情報は、大きく、ステップS33において生成された断片化情報と、ステップS34において生成された参照関係情報と、ステップS35において生成された放送ロケーション変換情報である。付加部36は、TTML文書データとしてのテキスト文書データ81におけるヘッダ部(head要素)の中の、メタデータ(metadata要素)の部分に上記の付加情報を格納し、情報付加済テキスト文書データ83として出力する。   In step S36, the adding unit 36 adds information necessary for appropriately dividing the text document data 81. Here, the information added by the adding unit 36 is largely fragmentation information generated in step S33, reference relationship information generated in step S34, and broadcast location conversion information generated in step S35. The adding unit 36 stores the additional information in the metadata (metadata element) portion of the header (head element) in the text document data 81 as the TTML document data, and the information added text document data 83 is stored. Output.

なお、本実施形態においても、テキスト文書データ81におけるヘッダ部に上記の付加情報を格納することによって情報付加済テキスト文書データ83を出力する代わりに、付加情報を例えば別ファイルの形態として生成し、分割装置2に渡すようにしても良い。   In this embodiment, instead of outputting the information-added text document data 83 by storing the additional information in the header portion of the text document data 81, the additional information is generated in the form of a separate file, for example. You may make it pass to the division | segmentation apparatus 2. FIG.

次に、分割装置2の処理手順について説明する。
図9は、分割装置2による処理の手順を示すフローチャートである。
同図に示すように、まずステップS41において、分割部35は、付加情報を含むテキスト文書データである情報付加済テキスト文書データ83を読み込む。この情報付加済テキスト文書データ83はXML文書データの一種であり、分割部35は読み込んだXMLデータをパージングすることにより、DOM(ドキュメントオブジェクトモデル,Document Object Model)を作成する。これにより、分割部35は、読み込んだ情報付加済テキスト文書データ83の構成をツリー構造で把握する。
Next, a processing procedure of the dividing device 2 will be described.
FIG. 9 is a flowchart illustrating a processing procedure performed by the dividing device 2.
As shown in the figure, first, in step S41, the dividing unit 35 reads the information added text document data 83 which is text document data including additional information. This information-added text document data 83 is a kind of XML document data, and the dividing unit 35 parses the read XML data to create a DOM (Document Object Model). Thereby, the dividing unit 35 grasps the configuration of the read information-added text document data 83 in a tree structure.

次のステップS42からS45までの処理は、ステップS41で読み込んだデータのメタデータ内に含まれる伝送単位(unit要素)ごとに繰り返す。   The processing from the next step S42 to S45 is repeated for each transmission unit (unit element) included in the metadata of the data read in step S41.

ステップS42において、分割部35は、ユニット(伝送単位、unit要素)内の1つ目のリソース(resource要素)を読み込み、出力要素を追加する。ここで、出力要素とは、埋め込み画像(image属性により指定)と、非組込フォントフォント(font−face属性により指定)と、スタイル(style属性により指定)と、字幕提示の領域(region属性により指定)と、字幕テキスト文(subtitle属性により指定)のための要素(p要素やdiv要素)を追加する。なお、あるユニット内の最初のリソースに関して、データタイプ(datatype属性)の値は、必ず「0000」である。   In step S42, the dividing unit 35 reads the first resource (resource element) in the unit (transmission unit, unit element), and adds an output element. Here, the output elements are an embedded image (specified by the image attribute), a non-embedded font font (specified by the font-face attribute), a style (specified by the style attribute), and a subtitle presentation area (by the region attribute). And an element (p element or div element) for subtitle text (specified by the subtitle attribute). Note that the value of the data type (datatype attribute) is always “0000” for the first resource in a unit.

なお、ステップS42における処理の詳細は次の通りである。
分割部35は、ユニット内の1つ目のリソースを読み込み、そのリソース(resource要素)の属性ごとに、下記の(1)から(5)までの処理を行うことによって、空のTTML文書に要素を追加する。なお、空のTTML文書とは、「<tt></tt>」(tt要素の開始と終了)のみからなる文書である。なお、下の説明において、IDリストとは、単数または複数のID(識別子)を持ち得るリストの表現である。具体的な例として、IDリストが複数のIDを含む場合には、それら複数のIDを空白文字で区切って並べた文字列が、IDリストである。
Details of the processing in step S42 are as follows.
The dividing unit 35 reads the first resource in the unit, and performs the following processing (1) to (5) for each attribute of the resource (resource element), thereby generating an element in an empty TTML document. Add An empty TTML document is a document consisting only of “<tt></tt>” (start and end of tt element). In the description below, an ID list is an expression of a list that can have one or more IDs (identifiers). As a specific example, when the ID list includes a plurality of IDs, a character string in which the plurality of IDs are separated by a blank character and arranged is the ID list.

(1)1つ目のresource要素のimage属性に指定されたIDリストを基に、入力側のTTML文書(情報付加済テキスト文書データ83のこと。以下においても、同様。)中のtt/head/metadata/smpte:image要素であって上記IDリストと同一のIDを持つ要素を、出力側のTTML文書(断片化テキスト文書データのこと。以下においても、同様。)中にコピーする。
(2)1つ目のresource要素のfont−face属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/styling/arib−tt:font−face要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(3)1つ目のresource要素のstyle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/syling/style要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(4)1つ目のresource要素のregion属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/layout/region要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(5)1つ目のresource要素のsubtitle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/body/div要素の下の、div要素またはp要素であって、同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(1) tt / head in the TTML document (information-added text document data 83; the same applies hereinafter) based on the ID list specified in the image attribute of the first resource element / Metadata / smpte: An image element having the same ID as that in the ID list is copied into an output TTML document (fragmented text document data; the same applies hereinafter).
(2) tt / head / styling / arib-tt: font-face elements in the TTML document on the input side based on the ID list specified in the font-face attribute of the first resource element, which are the same The element having the ID is copied into the TTML document on the output side.
(3) Based on the ID list specified in the style attribute of the first resource element, an tt / head / syling / style element in the TTML document on the input side having the same ID is output on the output side. Copy into the TTML document.
(4) Based on the ID list specified in the region attribute of the first resource element, the tt / head / layout / region element having the same ID in the TTML document on the input side is output to the output side. Copy into the TTML document.
(5) Based on the ID list specified in the subtitle attribute of the first resource element, it is a div element or p element under the tt / body / div element in the input side TTML document, and the same The element having the ID is copied into the TTML document on the output side.

次のステップS43の処理は、現在のunit要素内の2つ目以後のresource要素の各々について、繰り返して実行する。なお、2つ目以後のresource要素においては、datatype属性の値は「0000」以外である。
ステップS43において、分割部35は、unit要素内の2つ目以後のリソース要素を読み込み、下記の(1)、(2)の処理を行う。
(1)出力側の文書中のidref要素で指定されたIDを持つ要素を起点に、srcpath要素に記述されているxpathによって指定された要素または属性の値を、replaceto要素で指定さえた値に置き換える。
(2)srcvalue属性で指定された外部リソースファイルを、放送伝送用のデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
The processing in the next step S43 is repeatedly executed for each of the second and subsequent resource elements in the current unit element. In the second and subsequent resource elements, the value of the datatype attribute is other than “0000”.
In step S43, the dividing unit 35 reads the second and subsequent resource elements in the unit element, and performs the following processes (1) and (2).
(1) Starting from the element having the ID specified by the idref element in the output side document, the value of the element or attribute specified by xpath described in the srcpath element is set to the value specified by the replaceto element. replace.
(2) The external resource file specified by the srcvalue attribute is converted into a data format for broadcast transmission. The specific conversion method varies depending on the transmission method. For example, in the case of the TS (transport stream) system, the data is converted into data for carousel transmission. Also, in the case of the MMT (MPEG media transport) system, conversion to MMT MFU (media fragment unit) is performed.

当該unit要素内のすべてのresource要素についてのステップS43の処理が終了すると、次のステップS44の処理に移る。
ステップS44において、出力部37は、伝送単位に応じて生成されたTTML文書(断片化テキスト文書データの1つ)を、放送として送出伝送するためのデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
When the process of step S43 is completed for all resource elements in the unit element, the process proceeds to the next step S44.
In step S44, the output unit 37 converts the TTML document (one of the fragmented text document data) generated according to the transmission unit into a data format for transmission as a broadcast. The specific conversion method varies depending on the transmission method. For example, in the case of the TS (transport stream) system, the data is converted into data for carousel transmission. Also, in the case of the MMT (MPEG media transport) system, conversion to MMT MFU (media fragment unit) is performed.

次にステップS45において、出力部37は、生成されたTTML文書(断片化テキスト文書データの1つ)とリソースファイル用のデータを、放送として送出伝送するためのデータ形式にパッケージ化し、timecode要素(タイムコード)で指定された提示時刻での受信機側での提示に間に合うように、放送に多重するようにして送出する。具体的には、出力部37は、指定された提示時刻と、伝送に要する時間と、送出装置側および受信機側のそれぞれの側での処理のオーバーヘッドとして必要な時間とに基づいて、間に合うようにデータの送出を行う。例えば、MMT方式により伝送する場合は、MFU(メディアフラグメントユニット)をMPU(メディアプロセッシングユニット)にパッケージ化して送出する。なお、パッケージ化した字幕データの構造の例については、後で、図17を参照しながら説明する。   In step S45, the output unit 37 packages the generated TTML document (one of the fragmented text document data) and the data for the resource file into a data format for transmission as a broadcast, and a timecode element ( The broadcast is multiplexed and sent out in time for presentation on the receiver side at the presentation time designated by (time code). Specifically, the output unit 37 is in time for the designated presentation time, the time required for transmission, and the time required as processing overhead on each of the sending device side and the receiver side. Send data to. For example, in the case of transmission by the MMT method, an MFU (Media Fragment Unit) is packaged in an MPU (Media Processing Unit) and sent out. An example of the structure of packaged caption data will be described later with reference to FIG.

すべての伝送ユニット(unit要素)に関して、以上のS41からS45までの処理が終了すると、分割装置2は、このフローチャート全体の処理を終了する。   When the above processing from S41 to S45 is completed for all transmission units (unit elements), the dividing device 2 ends the processing of the entire flowchart.

次に、実際のデータ例について説明する。図10、図11、図12、図13、図14、図15は、図5において示した情報付加済テキスト文書データ83の一例を示す概略図である。
この図10、図11、図12、図13、図14、図15を順に連結したデータが、1件の情報付加済テキスト文書データ83に当たる。なお、情報付加済テキスト文書データ83は、一種のXMLデータである。これらの図の中において、便宜上、ファイル内の行番号を示している。これらの行番号自体は、ファイル内に含まれているものではない。以下では、これらの図および行番号を参照しながら、情報付加済テキスト文書データ83の例について説明する。
Next, actual data examples will be described. 10, FIG. 11, FIG. 12, FIG. 13, FIG. 14 and FIG. 15 are schematic views showing an example of the text document data 83 with information added shown in FIG.
Data obtained by concatenating FIG. 10, FIG. 11, FIG. 12, FIG. 13, FIG. 14 and FIG. 15 corresponds to one piece of information-added text document data 83. The information-added text document data 83 is a kind of XML data. In these figures, line numbers in the file are shown for convenience. These line numbers themselves are not included in the file. Hereinafter, an example of the information-added text document data 83 will be described with reference to these drawings and line numbers.

なお、第1実施形態では分割装置1の分割部15が、情報付加済テキスト文書データ83と同等のデータを受け取る。ここで、情報付加済テキスト文書データ83と同等のデータとは、テキスト文書データをどう分割するかを表す情報と、分割後のテキスト文書データからテキスト文書データのヘッダ部に記述された情報を参照するための参照関係を示す情報と、分割後のテキスト文書がリソースファイルを参照する場合にリソースファイルのロケーション情報を放送の名前空間に対応するようにテキスト文章データ中のロケーション情報をどう書き換えるかを表す情報であり、分割装置1の内部的な情報の形式は任意である。
また、第2実施形態では分割装置2の分割部35が、解析装置5から渡される情報付加済テキスト文書データ83を読み込む。
In the first embodiment, the dividing unit 15 of the dividing device 1 receives data equivalent to the information-added text document data 83. Here, the data equivalent to the information-added text document data 83 refers to information indicating how the text document data is divided and information described in the header portion of the text document data from the divided text document data. Information that indicates the reference relationship to be used, and how the location information in the text document data is rewritten so that the location information of the resource file corresponds to the broadcast namespace when the divided text document references the resource file The format of the internal information of the dividing device 1 is arbitrary.
In the second embodiment, the dividing unit 35 of the dividing device 2 reads the information-added text document data 83 passed from the analyzing device 5.

第2行目から第105行目までは、tt要素である。
第10行目から第85行目までは、ヘッダ部(head要素)である。
第86行目から第104行目までは、ボディ部(body要素)である。
The second to 105th lines are tt elements.
The 10th to 85th lines are header parts (head elements).
The 86th to 104th lines are body parts (body elements).

ヘッダ部内において、第12行目から第48行目までは、メタデータ(metadata要素)である。このメタデータは、字幕交換情報(captionExchangeInformation要素)と、埋め込みイメージ(smpte:image要素)とを含む。
第13行目から第42行目までがキャプション交換情報である。
キャプション交換情報は、伝送情報(transmissionInformation要素)を含む。
第14行目から第41行目までが伝送情報である。
また、第45行目から第47行目までが、埋め込みイメージである。
伝送情報は、複数の伝送単位のまとまり(transmissionUnits要素)を含んでいる。第15行目から第40行目までがtransmissionUnits要素である。
このtransmissionUnits要素は、個々に番号付けされた複数の伝送単位(unit要素)を有している。
In the header part, the 12th to 48th lines are metadata (metadata elements). This metadata includes caption exchange information (captionExchangeInformation element) and an embedded image (smpte: image element).
The 13th to 42nd lines are caption exchange information.
The caption exchange information includes transmission information (transmissionInformation element).
The transmission information is from the 14th line to the 41st line.
The 45th to 47th lines are embedded images.
The transmission information includes a group of transmission units (transmissionUnits element). The transmissionUnits element is from the 15th line to the 40th line.
The transmissionUnits element has a plurality of transmission units (unit elements) numbered individually.

個々の伝送単位(unit要素)は、時刻解析部(12または32)によって解析された結果として断片化された、断片に対応している。個々の伝送単位は、提示時刻(timecode属性)を有している。提示時刻は、番組開始時点をゼロとする相対時刻であり、「hh:mm:ss.nnn」(時−分−秒−ミリ秒)の形式の文字列として表現される。なお、@timecode属性の提示時刻は当該伝送単位に含まれる字幕テキストの提示開始時刻のうち、一番早い開始時間の値である。
本例においては、6個の伝送単位(unit要素)が存在し、それらのそれぞれがxml:id属性として「1」から「6」までの値をもっている。xml:id属性が「1」である伝送単位は、第16行目から第19行目までである。xml:id属性が「2」である伝送単位は、第20行目から第24行目までである。xml:id属性が「3」である伝送単位は、第25行目から第28行目までである。xml:id属性が「4」である伝送単位は、第28行目から第32行目までである。xml:id属性が「5」である伝送単位は、第34行目から第36行目までである。xml:id属性が「6」である伝送単位は、第37行目から第39行目までである。
Each transmission unit (unit element) corresponds to a fragment that is fragmented as a result of analysis by the time analysis unit (12 or 32). Each transmission unit has a presentation time (timecode attribute). The presentation time is a relative time with the program start time being zero, and is represented as a character string in the format of “hh: mm: ss.nnn” (hour-minute-second-millisecond). The presentation time of the @timecode attribute is the earliest start time value among the presentation start times of the caption text included in the transmission unit.
In this example, there are six transmission units (unit elements), each of which has a value from “1” to “6” as an xml: id attribute. The transmission unit having the xml: id attribute “1” is from the 16th line to the 19th line. The transmission unit having the xml: id attribute “2” is from the 20th line to the 24th line. The transmission unit having the xml: id attribute “3” is from the 25th line to the 28th line. The transmission unit having the xml: id attribute “4” is from the 28th line to the 32nd line. The transmission unit having the xml: id attribute “5” is from the 34th line to the 36th line. The transmission unit having the xml: id attribute “6” is from the 37th line to the 39th line.

各伝送単位の情報は、その伝送単位に含まれる字幕テキストの断片と、参照されるリソースとの関係を含んでいる。なお、字幕テキストの断片そのものもリソースの一種である。参照関係解析部(14または34)によって解析された結果、各伝送単位において必要とされるリソースの参照関係情報のみが、unit要素の中に含まれる。これにより、後で実際に断片化ファイルを生成する際に、余分な情報を参照したり解析したりする必要がなく、直接必要な情報のみを取り出しやすい。   The information of each transmission unit includes the relationship between the subtitle text fragment included in the transmission unit and the resource to be referred to. Note that subtitle text fragments themselves are also a type of resource. As a result of the analysis by the reference relationship analysis unit (14 or 34), only the reference relationship information of the resources required in each transmission unit is included in the unit element. As a result, when the fragmented file is actually generated later, it is not necessary to refer to or analyze extra information, and it is easy to extract only necessary information.

xml:id属性が「1」である伝送単位は、2つのリソース(resource要素)を含んでいる。
その第1のリソースのデータタイプ(datatype属性)は「0000」であり、これは字幕テキストそのものに対応している。このリソースは、非組込フォント(font−face属性)、スタイル(style属性)、字幕提示の領域(region属性)、字幕テキスト文(subtitle属性)を有している。各属性の値は、参照のためのIDである。なお、subtitle属性の値は「C001」である。なお、このリソース(resource要素)において、font−face属性や、style属性や、region属性が、参照関係情報の例である。また、このリソースにおいて、subtitle属性が、断片化情報の例であり、「C001」という値によってテキスト文の断片(グループ)を参照している。これらの参照関係情報や断片化情報は、以下のリソース(データタイプが「0000」)においても同様である。
また、第2のリソースのデータタイプは「0110」であり、これはリソースがフォントであることを表す。このリソースは、idref属性を有し、その値は「f05」である。これは、参照のために用いられるIDである。また、srcpath属性は、リソースファイルのロケーション記述へのパス(idref属性を有する要素を起点としたリソースファイルのロケーション情報の記述へのXPATH情報)を示す。また、srcvalue属性は、リソースファイルのロケーション情報を指定するものである。また、replaeto属性は、放送として送出される際の放送の名前空間によるロケーション情報の値を示す。なお、このリソース(resource要素)において、srcpath属性や、srcvalue属性や、replaceto属性が、放送ロケーション変換情報の例である。放送ロケーション変換情報については、以下のリソース(データタイプが「0000」ではない)においても同様である。
A transmission unit having an xml: id attribute of “1” includes two resources (resource elements).
The data type (datatype attribute) of the first resource is “0000”, which corresponds to the caption text itself. This resource has a non-embedded font (font-face attribute), a style (style attribute), a subtitle presentation area (region attribute), and a subtitle text sentence (subtitle attribute). The value of each attribute is an ID for reference. The value of the subtitle attribute is “C001”. In this resource (resource element), the front-face attribute, the style attribute, and the region attribute are examples of the reference relationship information. Also, in this resource, the subtitle attribute is an example of fragmentation information, and a text sentence fragment (group) is referred to by the value “C001”. These reference relationship information and fragmentation information are the same in the following resources (data type is “0000”).
The data type of the second resource is “0110”, which represents that the resource is a font. This resource has an idref attribute, and its value is “f05”. This is an ID used for reference. The srcpath attribute indicates the path to the location description of the resource file (XPATH information to the description of the location information of the resource file starting from the element having the idref attribute). The srcvalue attribute specifies location information of the resource file. The replay attribute indicates the value of location information based on the name space of the broadcast when it is transmitted as a broadcast. In this resource (resource element), the srcpath attribute, the srcvalue attribute, and the replaceto attribute are examples of broadcast location conversion information. The same applies to the broadcast location conversion information in the following resources (data type is not “0000”).

xml:id属性が「2」である伝送単位は、3つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。このリソースにおけるfonto−face属性は、「f03」および「f04」という2つのIDを示すものであり、これら両者を空白で連結したものを属性値としている。なお、subtitle属性の値は「C002」である。
第2および第3のリソースのデータタイプは「0110」であり、これはフォントに対応する。フォントであるリソースの属性については、既に述べたとおりである。
A transmission unit having an xml: id attribute of “2” includes three resources (resource elements).
The data type (datatype attribute) of the first resource is “0000”, which indicates the caption text itself. The front-face attribute in this resource indicates two IDs “f03” and “f04”, and the attribute value is obtained by concatenating both of them with a blank. The value of the subtitle attribute is “C002”.
The data type of the second and third resources is “0110”, which corresponds to the font. The attribute of a resource that is a font has already been described.

xml:id属性が「3」である伝送単位は、2つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C003」である。
第2のリソースのデータタイプは「0001」であり、これは画像に対応する。このリソースは、外部の画像に対応する。
A transmission unit having an xml: id attribute of “3” includes two resources (resource elements).
The data type (datatype attribute) of the first resource is “0000”, which indicates the caption text itself. The value of the subtitle attribute is “C003”.
The data type of the second resource is “0001”, which corresponds to an image. This resource corresponds to an external image.

xml:id属性が「4」である伝送単位は、3つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C004」および「C005」(両者を空白で連結)である。
第2および第3のリソースおデータタイプは「0001」であり、これは画像に対応する。これらのリソースは、それぞれ、外部の画像に対応する。
A transmission unit having an xml: id attribute of “4” includes three resources (resource elements).
The data type (datatype attribute) of the first resource is “0000”, which indicates the caption text itself. The value of the subtitle attribute is “C004” and “C005” (both are connected with a blank).
The second and third resource data types are “0001”, which corresponds to an image. Each of these resources corresponds to an external image.

xml:id属性が「5」である伝送単位は、1つのリソース(resource要素)を含んでいる。そのリソースのデータタイプの値は「0000」である。また、このリソースは、埋め込み画像に関する情報を含むものであり、image属性として「SMPTE_logo16」という値を有する。この「SMPTE_logo16」は、埋め込み画像を参照するためのIDである。なお、このリソースのsubtitle属性の値は、「C006」である。   A transmission unit having an xml: id attribute of “5” includes one resource (resource element). The value of the data type of the resource is “0000”. Further, this resource includes information related to an embedded image and has a value of “SMPTE_logo16” as an image attribute. This “SMPTE_logo16” is an ID for referring to an embedded image. Note that the value of the subtitle attribute of this resource is “C006”.

xml:id属性が「6」である伝送単位は、1つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプの値は「0000」である。このリソースのsubtitle属性の値は、「C007」である。
A transmission unit having an xml: id attribute of “6” includes one resource (resource element).
The value of the data type of the first resource is “0000”. The value of the subtitle attribute of this resource is “C007”.

第45行目から第47行目までは、埋め込み画像(smpte:image要素)である。xml:id属性はこの埋め込み画像のIDを示すものであり、その値は「SMPTE_logo16」である。imageType属性は、画像ファイルの形式を表しており、その値は「PNG」である。また、encoding属性は、バイナリーデータを文字データとして表現する際の符号化の方式を表しており、その値は「BASE64」である。また、「iVBORw・・・」という文字列が、画像そのものを表すものである。   The 45th to 47th lines are embedded images (smpte: image element). The xml: id attribute indicates the ID of this embedded image, and its value is “SMPTE_logo16”. The imageType attribute represents the format of the image file, and its value is “PNG”. The encoding attribute represents the encoding method used when expressing binary data as character data, and the value thereof is “BASE64”. The character string “iVBORw...” Represents the image itself.

ヘッダ部内における、メタデータ(metadata要素)の次の、第49行目から第74行目までは、スタイリング(styling要素)である。
本例におけるこのstyling要素は、5個のフォント(arib−tt:font−face要素)と、1個のスタイル(style要素)とを持つ。
第51行目から第65行目までが、5個の非組込フォントの情報である。第1から第5までのフォントのid要素の値は、それぞれ、「f01」、「f02」、「f03」、「f04」、「f05」であり、これらは参照のためのIDである。
また、第66行目から第73行目までが1個のスタイルである。このスタイルのxml:id属性の値は「s1」である。また、このスタイルは、色(tts:color属性)と、フォント(tts:fontFamily属性)と、フォントサイズ(fontSize属性)と、テキスト位置揃えの調整(tts:textAlign属性)と、領域の背景色がいつ提示されるかの指定(tts:showBackground)とを有する。
From the 49th line to the 74th line after the metadata (metadata element) in the header part is styling (styling element).
The styling element in this example has five fonts (arib-tt: font-face element) and one style (style element).
The information from the 51st line to the 65th line is information of five non-embedded fonts. The values of the id elements of the first to fifth fonts are “f01”, “f02”, “f03”, “f04”, and “f05”, respectively, and these are IDs for reference.
Further, the 66th to 73rd lines are one style. The value of the xml: id attribute of this style is “s1”. In addition, this style includes color (tts: color attribute), font (tts: fontFamily attribute), font size (fontSize attribute), text alignment adjustment (tts: textAlign attribute), and area background color. It has a designation (tts: showBackground) when it is presented.

ヘッダ部内における、スタイリング(styling要素)の次の、第75行目から第84行目までは、レイアウト(layout要素)である。このレイアウトは、領域(region要素)を含む。本例において、第76行目から第83行目までが、ひとつの領域を表すものである。この領域のxml:id属性の値は「all」である。つまり、この領域は、ID「all」を用いて参照される。また、この領域は、スタイル(style属性)と、その領域の原点(tts:origin属性)と、その領域の最大座標点(tts:extent属性)と、縦方向および横方向のパディングサイズ(tts:padding属性)と、提示する位置揃えの指定(tts:displayAlign属性)と、領域の背景色がいつ提示されるかの指定(tts:showBackground)とを有する。
なお、この領域における第77行目で指定しているスタイルのIDは「s1」である。これは、即ち、第66行目から始まるスタイルを参照している。
The 75th to 84th lines after the styling (styling element) in the header part are layouts (layout elements). This layout includes a region (region element). In this example, the 76th to 83rd lines represent one area. The value of the xml: id attribute of this area is “all”. That is, this area is referred to using the ID “all”. In addition, this area includes a style (style attribute), an origin of the area (tts: origin attribute), a maximum coordinate point of the area (tts: extent attribute), and padding sizes in the vertical and horizontal directions (tts: a padding attribute), a designation of alignment to be presented (tts: displayAlign attribute), and a designation of when the background color of the region is presented (tts: showBackground).
The ID of the style specified in the 77th line in this area is “s1”. This refers to the style starting on line 66.

ヘッダ部の説明は以上である。次にボディ部について説明する。   This is the end of the description of the header part. Next, the body part will be described.

ボディ部は、領域(region属性)を指定した1個のdiv要素を有する。このdiv要素は、第87行目から第103行目に記述されている。   The body part has one div element designating a region (region attribute). This div element is described from the 87th line to the 103rd line.

上記のdiv要素(body要素の直下のdiv要素)は、その下のレベルに、7個の要素を有する。
第1の要素は、第88行目に記述されているパラグラフ(段落、p要素)であり、そのxml:id属性の値は「C001」である。
第2の要素は、第89行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C002」である。
第3の要素は、第90行目から第92行目に記述されているdiv要素であり、そのxml:id属性の値は「C003」である。
第4の要素は、第93行目から第95行目に記述されているdiv要素であり、そのxml:id属性の値は「C004」である。
第5の要素は、第96行目から第98行目に記述されているdiv要素であり、そのxml:id属性の値は「C005」である。
第6の要素は、第99行目から第101行目に記述されているdiv要素であり、そのxml:id属性の値は「C006」である。
第7の要素は、第102行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C007」である。
The div element (div element immediately below the body element) has seven elements at the lower level.
The first element is a paragraph (paragraph, p element) described in the 88th line, and the value of its xml: id attribute is “C001”.
The second element is a paragraph (p element) described in the 89th line, and the value of its xml: id attribute is “C002”.
The third element is a div element described from the 90th line to the 92nd line, and the value of the xml: id attribute is “C003”.
The fourth element is a div element described from the 93rd line to the 95th line, and the value of the xml: id attribute is “C004”.
The fifth element is a div element described from the 96th line to the 98th line, and the value of its xml: id attribute is “C005”.
The sixth element is a div element described from the 99th line to the 101st line, and the value of its xml: id attribute is “C006”.
The seventh element is a paragraph (p element) described in the 102nd line, and the value of its xml: id attribute is “C007”.

以上説明したように、分割部15(第1実施形態)または分割部35(第2実施形態)が受け取るデータは、予め解析された結果として、内部で論理的に伝送単位の断片に分けられているデータである。また、同データは、各断片から参照されるデータとの関係を、情報としてすぐに取り出せる形で含んでいる。よって、断片化テキスト文書データ、および断片化テキスト文書データとリソースファイルのデータを含む断片化字幕データ85を素早く生成し、リアルタイムな放送信号の伝送に間に合うように出力することができるようになる。   As described above, the data received by the dividing unit 15 (first embodiment) or the dividing unit 35 (second embodiment) is logically divided into transmission unit fragments internally as a result of analysis in advance. Data. The data also includes the relationship with the data referenced from each fragment in a form that can be readily extracted as information. Therefore, the fragmented text document data and the fragmented caption data 85 including the fragmented text document data and the resource file data can be quickly generated and output in time for transmission of the real-time broadcast signal.

図16は、断片化字幕データ85に含まれる断片化テキスト文書データの例を示す概略図である。第1実施形態においては、断片化テキスト文書データを含む断片化字幕データ85は、分割装置1の出力部17から出力される。第2実施形態においては、断片化テキスト文書データを含む断片化字幕データ85は、分割装置2の出力部37から出力される。なお、断片化テキスト文書データもまた、TTML文書データであり、一種のXMLデータである。同図において、便宜上、ファイル内の行番号を示している。これらの行番号自体は、ファイル内に含まれているものではない。以下では、これらの図および行番号を参照しながら、断片化テキスト文書データの例について説明する。   FIG. 16 is a schematic diagram illustrating an example of fragmented text document data included in the fragmented subtitle data 85. In the first embodiment, fragmented subtitle data 85 including fragmented text document data is output from the output unit 17 of the dividing device 1. In the second embodiment, fragmented subtitle data 85 including fragmented text document data is output from the output unit 37 of the dividing device 2. The fragmented text document data is also TTML document data, which is a kind of XML data. In the figure, for convenience, line numbers in the file are shown. These line numbers themselves are not included in the file. Hereinafter, an example of fragmented text document data will be described with reference to these drawings and line numbers.

同図に示す断片化テキスト文書データは、図10の第16行目から第19行目において記述されているunit要素(xml:id属性は「1」)の内容と、それに対応する図14の第88行目に記述されているp要素とに基づく。これらの両者は、ID「C001」によって相互に関連付いている。断片化テキスト文書データは、このように、分割装置1(第1実施形態の場合)あるいは解析装置5(第2実施形態の場合)による解析結果の情報に基づいて生成されるものである。   The fragmented text document data shown in the figure includes the contents of the unit element (xml: id attribute is “1”) described in the 16th to 19th lines of FIG. 10 and the corresponding FIG. Based on the p element described in the 88th line. Both of these are related to each other by the ID “C001”. As described above, the fragmented text document data is generated based on the analysis result information by the dividing device 1 (in the case of the first embodiment) or the analyzing device 5 (in the case of the second embodiment).

図16において、第2行目から第22行目までが、tt要素である。
そして、第3行目から第14行目までは、ヘッダ部(head要素)である。
また、第15行目から第21行目までは、ボディ部(body要素)である。
In FIG. 16, the 2nd to 22nd lines are tt elements.
The third to the 14th lines are header parts (head elements).
The 15th to 21st lines are body parts (body elements).

ヘッダ部内において、第5行目から第10行目までは、スタイリング(styling要素)である。また、第11行目から第13行目までは、レイアウト(layout要素)である。
上記のスタイリングには、フォント(arib−tt:font−face要素)と、スタイル(style要素)とが含まれる。
In the header part, the 5th to 10th lines are styling (styling elements). The 11th to 13th lines are layouts (layout elements).
The styling includes a font (arib-tt: font-face element) and a style (style element).

図16内のこのフォント(arib−tt:font−face要素)におけるid属性の値は「f05」である。これは、図10における第17行目のリソース(データタイプは「0000」)が、「f05」というIDを用いて、図10における第18行目のリソース(フォントのリソース)を参照していることに対応する。また、図16内のフォントにおけるfont−family属性の値は「FA 丸ゴシックM」である。これは、図12における第63行目におけるfont−familyの定義に対応している。また、図16内のフォントにおけるunicode−range属性の値は「U+F002−F003」である。これは、図12における第63行目におけるunicode−rangeの定義に対応している。
また、図16の第7行目のarib−tt:src要素は、url属性を有している。このurl属性の値は、「subt://1」であり、放送名前空間におけるフォントの所在を示している。これは、図10の第18行目の定義におけるreplaceto属性にしたがって置き換えられた後の名前である。
The value of the id attribute in this font (arib-tt: font-face element) in FIG. 16 is “f05”. This is because the resource (data type is “0000”) on the 17th line in FIG. 10 refers to the resource (font resource) on the 18th line in FIG. 10 using the ID “f05”. Corresponding to that. Also, the value of the font-family attribute in the font in FIG. 16 is “FA Maru Gothic M”. This corresponds to the definition of font-family on the 63rd line in FIG. Also, the value of the Unicode-range attribute in the font in FIG. 16 is “U + F002-F003”. This corresponds to the definition of Unicode-range in the 63rd line in FIG.
Also, the arib-tt: src element on the seventh line in FIG. 16 has a url attribute. The value of this url attribute is “sub: /// 1”, which indicates the location of the font in the broadcast name space. This is the name after being replaced according to the replaceto attribute in the definition on the 18th line in FIG.

図16内の上記のスタイル(第9行目、style要素)では、xml:id属性の値は「s1」である。これは、図10の第17行目における、style属性の値「s1」に対応するものである。また、このスタイルは、ID「s1」によって図13の第66行目から第73行目に記述されているスタイルに関連付けられている。したがって、図16の第9行目におけるスタイル(style要素)の属性は、図13の第66行目から記述されているスタイルを引き継いでいる。即ち、具体的には、tts:color属性の値が「white」であり、tts:font−family属性の値が「FA丸ゴシック M」であり、tts:font−sizeの値が「80px」(80ピクセル)であり、tts:textAlign属性の値が「left」(左揃え)であり、tts:showBackground属性の値が「whenActive」(アクティブなとき)である。   In the above-described style in FIG. 16 (9th line, style element), the value of the xml: id attribute is “s1”. This corresponds to the value “s1” of the style attribute in the 17th line in FIG. This style is associated with the style described in the 66th to 73rd lines in FIG. 13 by the ID “s1”. Accordingly, the style (style element) attribute in the ninth line in FIG. 16 inherits the style described from the 66th line in FIG. Specifically, the value of the tts: color attribute is “white”, the value of the tts: font-family attribute is “FA Maru Gothic M”, and the value of tss: font-size is “80 px” ( 80 pixels), the value of the tts: textAlign attribute is “left” (left-aligned), and the value of the tts: showBackground attribute is “whenActive” (when active).

図16の第11行目から第13行目までのレイアウト(layout要素)は、直下のレベルに領域(region要素)を含む。この領域は、 図16の第12行目に記述されている。この領域のxml:id属性の値は「all」である。これは、図10の第17目においてregion属性の値としてID「all」が指定されていることに対応する。図16の第12行目に記述されている領域(region要素)の属性は、図13の第76行目から第83行目に記述されている属性を引き継いでいるものである。即ち、具体的には、style属性の値は「all」である。また、tts:origin属性(領域の開始点のx−y座標値(百分率))は「0% 0%」である。また、tts:extent属性(領域の終点のx−y座標値(百分率))は「100% 100%」である。また、tts:padding属性(領域内における表示位置のための外周隙間のx方向およびy方向)は「0px 0px」(縦横共に0ピクセル)である。また、tts:textAlign属性の値は「left」(左揃え)である。また、tts:showBackground属性の値は「whenActive」(アクティブなとき)である。   The layout (layout element) from the 11th line to the 13th line in FIG. 16 includes a region (region element) at a level immediately below. This area is described in the twelfth line of FIG. The value of the xml: id attribute of this area is “all”. This corresponds to the fact that the ID “all” is designated as the value of the region attribute in the 17th item of FIG. 10. The attributes of the region (region element) described in the 12th line of FIG. 16 are inherited from the attributes described in the 76th to 83rd lines of FIG. Specifically, the value of the style attribute is “all”. Also, the tts: origin attribute (the xy coordinate value (percentage) of the start point of the area) is “0% 0%”. Also, the tts: extent attribute (the xy coordinate value (percentage) of the end point of the area) is “100% 100%”. In addition, the tts: padding attribute (the x direction and the y direction of the outer peripheral gap for the display position in the region) is “0 px 0 px” (both vertically and horizontally 0 pixels). The value of the tts: textAlign attribute is “left” (left alignment). Also, the value of the tts: showBackground attribute is “whenActive” (when active).

図16に示すボディ部(body要素)には、div要素が含まれており、その直下のレベルにp要素が含まれている。
図16の第17行目に記述されている、p要素のxml:id属性の値は「C001」である。これは、図10の第17行目のsubtitle属性の値「C001」に対応している。
また、図16の第17行目に記述されている通り、p要素のregion属性の値は「all」である。これは、図10の第17行目のresource要素におけるregion属性の値を引き継いでいる。
また、図16の第17行目に記述されているp要素の全体を、図14の第88行目に記述されているp要素から引き継いでいる。
The body part (body element) shown in FIG. 16 includes a div element, and a p element is included at a level immediately below the div element.
The value of the xml: id attribute of the p element described in the 17th line in FIG. 16 is “C001”. This corresponds to the value “C001” of the subtitle attribute on the 17th line in FIG. 10.
Also, as described in the 17th line in FIG. 16, the value of the region attribute of the p element is “all”. This takes over the value of the region attribute in the resource element on the 17th line in FIG.
Further, the entire p element described in the 17th line in FIG. 16 is inherited from the p element described in the 88th line in FIG.

以上のように分割部15(第1実施形態)または分割部35(第2実施形態)は、簡単な処理で素早く断片化テキスト、および断片化テキストを含む断片化字幕データを生成し、送出することができる。   As described above, the dividing unit 15 (first embodiment) or the dividing unit 35 (second embodiment) quickly generates and transmits fragmented text and fragmented subtitle data including the fragmented text by simple processing. be able to.

図17は、パッケージ化した字幕データの構造の例を示す図である。第1実施形態においては、分割装置1の出力部17がこの字幕データを出力する。また、第2実施形態においては、分割装置2の出力部37がこの字幕データを出力する。同図に示す例は、MMTによる伝送を行う場合のものである。図示する1つのMPU(メディアプロセッシングユニット,Media Processing Unit)が、1つの断片に相当する。MPUは、複数のMFU(メディアフラグメントユニット,Media Fragment Unit)を含む。MPU中の1つのMFUは、TTML文書を格納している。そのMFUは、ヘッダとTTML文書そのものを含んで構成される。他のMFUは、TTML文書から参照されるリソースを格納している。同図に示すMPUは、参照リソース1,2,・・・,nを含む。参照リソースは、画像や非組込フォントなどである。これらの各MFUもまた、ヘッダと参照リソースそのものを含んで構成される。このように分割装置1(第1実施形態)や分割装置2(第2実施形態)は、字幕の断片と、関連する参照リソースとを、パッケージとして送出する。   FIG. 17 is a diagram illustrating an example of the structure of packaged caption data. In the first embodiment, the output unit 17 of the dividing device 1 outputs the caption data. In the second embodiment, the output unit 37 of the dividing device 2 outputs the caption data. The example shown in the figure is for transmission using MMT. One MPU (Media Processing Unit) shown in the figure corresponds to one fragment. The MPU includes a plurality of MFUs (Media Fragment Units). One MFU in the MPU stores a TTML document. The MFU includes a header and the TTML document itself. Other MFUs store resources referenced from TTML documents. The MPU shown in the figure includes reference resources 1, 2,. Reference resources include images and non-embedded fonts. Each of these MFUs is also configured to include a header and the reference resource itself. As described above, the dividing device 1 (first embodiment) and the dividing device 2 (second embodiment) transmit the subtitle fragments and the related reference resources as a package.

なお、上述した実施形態における解析装置や分析装置の機能をコンピューターで実現するようにしても良い。その場合、これらの機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。   In addition, you may make it implement | achieve the function of the analyzer and analyzer in embodiment mentioned above with a computer. In that case, the program for realizing these functions may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible disk, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, a “computer-readable recording medium” dynamically holds a program for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included, and a program that holds a program for a certain time. The program may be a program for realizing a part of the above-described functions, or may be a program that can realize the above-described functions in combination with a program already recorded in a computer system.

以上、複数の実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。
例えば、放送だけでなく、ビデオオンデマンドのサービスにおいて利用者からの要求に応じて特定のコンテンツを通信等で配信する場合に、本発明を適用しても良い。これにより、一時に大量の字幕テキストを送信するためにまとまった時間を必要とすることを、解消することができる。
Although a plurality of embodiments have been described above, the present invention can also be implemented in the following modifications.
For example, the present invention may be applied not only to broadcasting but also to distributing specific content by communication or the like in response to a request from a user in a video on demand service. As a result, it is possible to eliminate the need for a large amount of time to transmit a large amount of subtitle text at a time.

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

本発明は、例えば放送事業やビデオオンデマンドサービス事業など、映像コンテンツを提供するしくみの一部などとして利用可能である。   The present invention can be used as a part of a mechanism for providing video content such as a broadcasting business and a video-on-demand service business.

1,2 分割装置(送出装置)
5 解析装置
11 取得部
12 時刻解析部
13 変換情報解析部
14 参照関係解析部
15 分割部
17 出力部
18 リソースファイルデータ取得部
31 取得部
32 時刻解析部
33 変換情報解析部
34 参照関係解析部
35 分割部
36 付加部(送出情報生成部)
37 出力部
38 リソースファイルデータ取得部
1, 2 Split device (sending device)
5 Analysis Device 11 Acquisition Unit 12 Time Analysis Unit 13 Conversion Information Analysis Unit 14 Reference Relationship Analysis Unit 15 Division Unit 17 Output Unit 18 Resource File Data Acquisition Unit 31 Acquisition Unit 32 Time Analysis Unit 33 Conversion Information Analysis Unit 34 Reference Relationship Analysis Unit 35 Dividing unit 36 adding unit (transmission information generating unit)
37 Output unit 38 Resource file data acquisition unit

Claims (14)

時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、
前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、
前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を生成する送出情報生成部と、
を具備することを特徴とする解析装置。
An acquisition unit for acquiring text document data including a plurality of text sentences to which time information is added;
A time analysis unit that generates fragmentation information for fragmenting the text document data into a plurality of groups including the text sentence based on the time information;
For each fragment that is a group of the fragmented text sentence, the header description information of the text document referenced from the fragment is analyzed, and the relationship between the fragment and the header description referenced from the fragment is determined. A reference relationship analysis unit that generates reference relationship information to represent,
A transmission information generation unit for generating fragmented text document transmission information including the fragmentation information and the reference relation information;
An analysis apparatus comprising:
前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を生成する変換情報解析部、
をさらに具備し、
前記送出情報生成部は、前記放送ロケーション変換情報をも含んだ断片化テキスト文書送出情報を生成する、
ことを特徴とする請求項1に記載の解析装置。
Location information of an image file, an audio file, or a non-embedded font file referenced from the text sentence included in the fragment, and the image file, the audio file, or the non-embedded file when the fragment is transmitted by broadcasting The location information description position designation information indicating in which part of the text document data the location information of the font file is described, and the image file, the audio file, and the non-embedded font file are transmitted together with the fragment by broadcasting. A conversion information analysis unit for generating broadcast location conversion information including broadcast location information based on a broadcast name space for specifying a resource acquisition position in a broadcast signal when
Further comprising
The transmission information generation unit generates fragmented text document transmission information including the broadcast location conversion information;
The analysis apparatus according to claim 1, wherein:
前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、
ことを特徴とする請求項1に記載の解析装置。
The transmission information generation unit adds the fragmented text document transmission information including the fragmentation information and the reference relation information to the text document data acquired by the acquisition unit, and adds information-added text document data Output as
The analysis apparatus according to claim 1, wherein:
前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報と前記放送ロケーション変換情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、
ことを特徴とする請求項2に記載の解析装置。
The transmission information generation unit adds the fragmented text document transmission information including the fragmentation information, the reference relation information, and the broadcast location conversion information to the text document data acquired by the acquisition unit, Output as text document data with information added,
The analysis apparatus according to claim 2, wherein:
前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、
前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、
ことを特徴とする請求項1から4までのいずれか一項に記載の解析装置。
Information on each fragment included in the fragmentation information is used to specify the group of text sentences included in the fragment.
(1) A list of IDs for identifying the text sentence included in the fragment and attached to the text sentence;
(2) Information of the start time added to the text sentence having the earliest time order among the text sentences included in the fragment;
(3) Information on a start time added to the text sentence with the earliest time order among the text sentences included in the fragment and an end time added to the text sentence with the latest time order;
Including at least one of
The reference relationship information includes, as a header description of the text document necessary for presenting the fragment, information on a non-embedded font, information on an embedded image, information on a text style, and information on a text presentation area. Including at least one of the following:
The analysis apparatus according to any one of claims 1 to 4, wherein
時刻情報が付加された複数のテキスト文を含むテキスト文書データに加え、前記時刻情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに断片化するための断片化情報と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述との関係を表す参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて、分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得された前記リソースファイルとを含むデータを出力する出力部と、
を具備することを特徴とする分割装置。
In addition to text document data including a plurality of text sentences to which time information is added, fragmentation information for fragmenting the text document data into a plurality of groups of the text sentences based on the time information, and the fragmentation For each fragment that is a group of the text sentence, the fragmented text document transmission information including reference relationship information that represents the relationship with the header description of the text document referenced from the fragment is read, and the fragmentation information is read The text document data is divided into a plurality of groups of the text sentence based on the text document, and the text document referred to from the fragment into the group of the text sentence which is a divided fragment based on the reference relation information A division part for adding information of the header description of
A resource file data acquisition unit for acquiring a resource file referenced from a fragment of the text sentence divided by the division unit;
An output unit that outputs data including the text sentence divided by the dividing unit and the resource file acquired by the resource file data acquisition unit;
A dividing apparatus comprising:
前記分割部は、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を更に含む、前記断片化テキスト文書送出情報を読み込み、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記画像ファイルや前記音声ファイルや前記非組込フォントファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換えて前記断片に分割する、
ことを特徴とする請求項6に記載の分割装置。
The division unit includes location information of an image file, an audio file, or a non-embedded font file referred to from the text sentence included in the fragment, and the image file or the audio file when the fragment is transmitted by broadcasting. And location information description position designation information indicating in which part of the text document data the location information of the non-embedded font file, the image file, the audio file, and the non-embedded font file are The fragmented text document transmission information further including broadcast location conversion information including broadcast location information according to a broadcast name space for specifying a resource acquisition position in a broadcast signal when transmitted by broadcast together with the fragment. Read, based on the broadcast location conversion information, Wherein the image file and the location information of the audio files and the non-embedded font file is divided into the fragment rewrite the location information Namespaced broadcasting contained in,
The dividing apparatus according to claim 6.
前記分割部は、時刻情報が付加されたテキストを含むテキスト文書データに、前記断片化テキスト文書送出情報が付加されている情報付加済テキスト文書データを読み込み、前記断片化テキスト文書送出情報に含まれる前記断片化情報に基づいて前記テキスト文書データを、テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加し、
また、前記分割部は、前記断片化テキスト文書情報に前記放送ロケーション変換情報が含まれる場合は、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換える、
ことを特徴とする請求項6または7のいずれか一項に記載の分割装置。
The dividing unit reads information-added text document data to which the fragmented text document transmission information is added to text document data including text to which time information is added, and is included in the fragmented text document transmission information. The text document data is divided into a plurality of groups of text sentences based on the fragmentation information, and is referenced from the fragments to the group of text sentences, which is a fragment divided based on the reference relation information. Add header description information of the text document,
Further, when the fragmented text document information includes the broadcast location conversion information, the dividing unit converts the location information of the resource file included in the fragment based on the broadcast location conversion information to a broadcast name. Rewrite location information by space,
The dividing apparatus according to claim 6, wherein the dividing apparatus is characterized in that
時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、
前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、
前記テキスト文書データに加え、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得されたリソースファイルとを含むデータを出力する出力部と、
を具備することを特徴とする分割装置。
An acquisition unit for acquiring text document data including a plurality of text sentences to which time information is added;
A time analysis unit that generates fragmentation information for fragmenting the text document data into a plurality of groups including the text sentence based on the time information;
For each fragment that is a group of the fragmented text sentence, the header description information of the text document referenced from the fragment is analyzed, and the relationship between the fragment and the header description referenced from the fragment is determined. A reference relationship analysis unit that generates reference relationship information to represent,
Read fragmented text document transmission information including the fragmentation information and the reference relation information in addition to the text document data, and divide the text document data into a plurality of groups of the text sentences based on the fragmentation information And a dividing unit for adding header description information of the text document referenced from the fragment to the group of text sentences that is a fragment divided based on the reference relationship information;
A resource file data acquisition unit for acquiring a resource file referenced from a fragment of the text sentence divided by the division unit;
An output unit that outputs data including the text sentence divided by the dividing unit and the resource file acquired by the resource file data acquisition unit;
A dividing apparatus comprising:
前記出力部は、前記断片に含まれる前記テキスト文に付加された前記提示時刻情報のうち、一番早い提示開始時刻にしたがって、分割された前記テキスト文と、前記リソースファイルとを含むデータを順次出力する、
ことを特徴とする請求項6から9までのいずれか一項に記載の分割装置。
The output unit sequentially includes data including the divided text sentence and the resource file according to the earliest presentation start time among the presentation time information added to the text sentence included in the fragment. Output,
The dividing device according to claim 6, wherein the dividing device is characterized in that:
前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、
前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、
ことを特徴とする請求項6から10までのいずれか一項に記載の分割装置。
Information on each fragment included in the fragmentation information is used to specify the group of text sentences included in the fragment.
(1) A list of IDs for identifying the text sentence included in the fragment and attached to the text sentence;
(2) Information of the start time added to the text sentence having the earliest time order among the text sentences included in the fragment;
(3) Information on a start time added to the text sentence with the earliest time order among the text sentences included in the fragment and an end time added to the text sentence with the latest time order;
Including at least one of
The reference relationship information includes, as a header description of the text document necessary for presenting the fragment, information on a non-embedded font, information on an embedded image, information on a text style, and information on a text presentation area. Including at least one of the following:
The dividing device according to claim 6, wherein the dividing device is characterized in that:
前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、
ことを特徴とする請求項11に記載の分割装置。
The reference relationship information includes, as a header description of the text document necessary for presenting the fragment, information on a non-embedded font, information on an embedded image, information on a text style, and information on a text presentation area. Including at least one of the following:
The dividing apparatus according to claim 11.
請求項1から5までのいずれか一項に記載の解析装置としてコンピューターを機能させるためのプログラム。   The program for functioning a computer as an analysis apparatus as described in any one of Claim 1-5. 請求項6から12までのいずれか一項に記載の分割装置としてコンピューターを機能させるためのプログラム。   The program for functioning a computer as a division | segmentation apparatus as described in any one of Claim 6-12.
JP2015230099A 2014-11-28 2015-11-25 Divider and analyzer, and program Active JP6796376B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014241172 2014-11-28
JP2014241172 2014-11-28

Publications (2)

Publication Number Publication Date
JP2016110645A true JP2016110645A (en) 2016-06-20
JP6796376B2 JP6796376B2 (en) 2020-12-09

Family

ID=56124495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015230099A Active JP6796376B2 (en) 2014-11-28 2015-11-25 Divider and analyzer, and program

Country Status (1)

Country Link
JP (1) JP6796376B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126509A1 (en) * 2016-01-19 2017-07-27 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
WO2018021107A1 (en) * 2016-07-26 2018-02-01 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
JP2019213198A (en) * 2018-06-04 2019-12-12 エヌシーソフト・コーポレイションNcsoft Corporation Method and apparatus for generating caption
JP2022098735A (en) * 2020-12-22 2022-07-04 株式会社Play Subtitle generation device and subtitle generation program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003134435A (en) * 2001-10-30 2003-05-09 Matsushita Electric Ind Co Ltd Transmitting method and receiving method for video data and video monitor system
JP2004185634A (en) * 2004-01-06 2004-07-02 Fujitsu Ltd Information management device and information management program storage medium
JP2006238147A (en) * 2005-02-25 2006-09-07 Toshiba Corp Content reproducing device, subtitle reproducing method, and program
JP2007179492A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Division program, connection program and information processing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003134435A (en) * 2001-10-30 2003-05-09 Matsushita Electric Ind Co Ltd Transmitting method and receiving method for video data and video monitor system
JP2004185634A (en) * 2004-01-06 2004-07-02 Fujitsu Ltd Information management device and information management program storage medium
JP2006238147A (en) * 2005-02-25 2006-09-07 Toshiba Corp Content reproducing device, subtitle reproducing method, and program
JP2007179492A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Division program, connection program and information processing method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126509A1 (en) * 2016-01-19 2017-07-27 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
US11290785B2 (en) 2016-01-19 2022-03-29 Sony Corporation Transmission apparatus, transmission method, reception apparatus, and reception method for transmitting subtitle text information
JPWO2017126509A1 (en) * 2016-01-19 2018-11-08 ソニー株式会社 Transmitting apparatus, transmitting method, receiving apparatus, and receiving method
CN109479154B (en) * 2016-07-26 2021-11-05 索尼公司 Transmission device, transmission method, reception device, and reception method
CN109479154A (en) * 2016-07-26 2019-03-15 索尼公司 Sending device, sending method, reception device and method of reseptance
EP3493548B1 (en) * 2016-07-26 2022-01-26 Sony Group Corporation Transmission device, transmission method, reception device, and reception method
WO2018021107A1 (en) * 2016-07-26 2018-02-01 ソニー株式会社 Transmission device, transmission method, reception device, and reception method
EP3979654A1 (en) * 2016-07-26 2022-04-06 Sony Group Corporation Transmission device, transmission method, reception device, and reception method
JP2019213198A (en) * 2018-06-04 2019-12-12 エヌシーソフト・コーポレイションNcsoft Corporation Method and apparatus for generating caption
JP2021170803A (en) * 2018-06-04 2021-10-28 エヌシーソフト・コーポレイションNcsoft Corporation Method and apparatus for generating caption
US11330342B2 (en) 2018-06-04 2022-05-10 Ncsoft Corporation Method and apparatus for generating caption
JP7269286B2 (en) 2018-06-04 2023-05-08 エヌシーソフト・コーポレイション Caption generation method and caption generation device
JP2022098735A (en) * 2020-12-22 2022-07-04 株式会社Play Subtitle generation device and subtitle generation program
JP7201656B2 (en) 2020-12-22 2023-01-10 株式会社Play Caption generation device and caption generation program

Also Published As

Publication number Publication date
JP6796376B2 (en) 2020-12-09

Similar Documents

Publication Publication Date Title
US20080147823A1 (en) Structured data receiving apparatus, receiving method, reviving program, transmitting apparatus, and transmitting method
JP6796376B2 (en) Divider and analyzer, and program
JP6444016B1 (en) Transmission device and reception device, and program
US20120301110A1 (en) Image processing apparatus method and computer program product
US20140181882A1 (en) Method for transmitting metadata documents associated with a video
JP3932136B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932137B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932135B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932129B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932120B2 (en) Structured data receiving program, structured data receiving apparatus, and structured data receiving method
JP3932131B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932128B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932123B2 (en) Structured data receiving program, structured data receiving apparatus, and structured data receiving method
JP3932121B2 (en) Structured data receiving program, structured data receiving apparatus, and structured data receiving method
JP3932130B2 (en) Structured data transmission apparatus and structured data transmission method
JP3932122B2 (en) Structured data receiving program, structured data receiving apparatus, and structured data receiving method
KR20050015070A (en) Broadcasting program transmitting and receiving device and method for the same for
JP2005011374A (en) Device for transmitting structured data
JP2005063452A (en) Transmission device for structured data
JP2005038441A (en) Transmission device of structured data
JP2004320685A (en) Receiver for structured data
JP2004318772A (en) Receiver of structured data
JP2004320687A (en) Receiver for structured data
JP2004318771A (en) Receiver of structured data
JP2004318795A (en) Method for receiving structured data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181001

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201116

R150 Certificate of patent or registration of utility model

Ref document number: 6796376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250