TWI728061B

TWI728061B - 送訊裝置及收訊裝置

Info

Publication number: TWI728061B
Application number: TW106107063A
Authority: TW
Inventors: 越郁夫
Original assignee: 日商新力股份有限公司
Priority date: 2016-03-15
Filing date: 2017-03-03
Publication date: 2021-05-21
Also published as: US10979664B2; EP3734978A1; EP3432585B1; TW201739241A; WO2017159482A1; EP3432585A1; JPWO2017159482A1; ES2859660T3; US20190037168A1; JP7063261B2; CN108886627A; CN108886627B; EP3432585A4

Abstract

使得收訊側上的字幕顯示能夠良好地進行。

發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊。在字幕串流之容器中，***：使用字幕位置資訊而顯示字幕時所被使用的輔助資訊。例如，輔助資訊係為：尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊等。

Description

送訊裝置及收訊裝置

本技術係有關於送訊裝置、送訊方法、收訊裝置及收訊方法，尤其是有關於，連同視訊資料一併發送字幕之本文資訊的送訊裝置等。

先前，例如，在DVB(Digital Video Broadcasting)之播送等中，將字幕資訊以點陣圖資料加以發送的運用，已被進行。最近，將字幕資訊以本文之文字碼，亦即以本文基礎加以發送，係被提出。作為該本文資訊係例如，在W3C(World Wide Web Consortium)中係提倡為TTML(Timed Text Markup Language)(參照專利文獻1)。

先前，在字幕之本文資訊中所含之字幕顯示位置資訊中，將字幕顯示位置，例如以相對於視訊領域的相對位置來加以指定，係為人所知。此情況下，視訊領域的長寬比與顯示領域的長寬比為不一致的情況下，則隨著顯示方法，有時候字幕的一部分會從顯示領域超出而變成無法被顯示。又，先前，在字幕之本文資訊中含有字型指定資訊並加以發送，係為人所知。

〔先前技術文獻〕〔專利文獻〕

[專利文獻1]日本特開2012-169885號公報

為了避免如上述般地字幕之一部分超出顯示領域而變成無法被顯示，而考慮例如，在收訊側，不是以相對於視訊領域的相對位置，而是以相對於監視器(顯示器)中所被顯示之視訊領域(顯示視訊領域)的相對位置來進行處理。此時，視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，例如字幕顯示位置會變成只在水平方向上被壓縮，有可能變成對視聽者帶來異樣感的字幕顯示。又，如上述般地在字幕之本文資訊中包含有字型指定資訊而予以發送的情況下，若在收訊側並未搭載有所被指定的字型之檔案，則無法用所被指定之字型進行字幕顯示，有可能會變成不是製作者所意圖的字幕顯示。

本技術之目的在於，可使收訊側的字幕顯示能夠良好進行。

本技術的概念係在於，一種送訊裝置，其係具備：送訊部，係發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和資訊***部，係在上記字幕串流之容器中，***使用上記字幕位置資訊來顯示字幕時所被使用的輔助資訊。

於本技術中，藉由送訊部，含有視訊串流和字幕串流的所定格式之容器會被發送，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊。字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊。

藉由資訊***部，在字幕串流之容器中係被***有，使用字幕位置資訊來顯示字幕時所被使用的輔助資訊。例如，輔助資訊係亦可被***至PES封包及/或節目對映表。

例如，輔助資訊係亦可含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊。此情況下，例如，尺寸變更處理之相關資訊亦可係為，以字幕顯示位置之尺寸變更處理將垂直方向之尺寸予以壓縮的情況下表示應視為固定位置之掃描線位置的資訊。

又，例如，輔助資訊係亦可含有：用來決定字幕顯示範圍所需之資訊。此情況下，例如，用來決定字幕顯示範圍所需之資訊係亦可為，字幕顯示範圍的基準點資訊及長寬比資訊。

如此於本技術中，係在字幕串流之容器中被***有，使用字幕位置資訊來顯示字幕時所被使用的輔助資訊。因此，在收訊側，藉由與字幕位置資訊一併使用該輔助資訊，就可適切地取得字幕顯示位置而良好地進行字幕顯示。

又，本技術的另一概念係在於，一種收訊裝置，其係具備：收訊部，係接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和控制部，係控制：將上記視訊串流予以解碼而獲得視訊資料的處理、和將上記字幕串流進行解碼處理而獲得字幕之點陣圖資料的處理、和基於使用上記字幕顯示位置資訊及上記字幕串流之容器中所被***之使用上記字幕位置資訊來顯示字幕時所被使用之輔助資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制的處理、和將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料的處理。

於本技術中，藉由收訊部，含有視訊串流和字幕串流的所定格式之容器會被接收，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊。字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊。在字幕串流之容器中係被***有，使用字幕位置資訊來顯示字幕時所被使用的輔助資訊。

藉由控制部，將視訊串流予以解碼而獲得視訊資料的處理、和將字幕串流進行解碼處理而獲得字幕之點陣圖資料的處理、和基於使用字幕顯示位置資訊及輔助資訊而被取得的字幕顯示位置，而對字幕之點陣圖資料進行顯示位置控制的處理、和將進行過顯示位置控制的字幕之點陣圖資料，重疊至視訊資料的處理，會被控制。

亦可為，例如，輔助資訊係含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊；在進行顯示位置控制的處理中，在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，將顯示視訊領域當作字幕顯示範圍而基於字幕顯示位置資訊來決定字幕顯示位置，在該已被決定之字幕顯示位置使用尺寸變更處理之相關資訊來實施尺寸變更處理，基於已被實施過該尺寸變更處理的字幕顯示位置而對字幕之點陣圖資料進行顯示位置控制。

又，亦可為，例如，輔助資訊係含有：用來決定字幕顯示範圍所需之資訊；在進行顯示位置控制的處理中，在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，基於用來決定字幕顯示範圍所需之資訊而在顯示視訊領域中設定字幕顯示範圍，基於字幕顯示位置資訊來決定字幕顯示位置，基於該已被決定之字幕顯示位置而對字幕之點陣圖資料進行顯示位置控制。

如此於本技術中，在字幕串流之容器中係被***有，使用字幕位置資訊來顯示字幕時所被使用的輔助資訊；基於使用字幕顯示位置資訊及輔助資訊而被取得的字幕顯示位置，而對字幕之點陣圖資料進行顯示位置控制。因此，可良好地進行字幕顯示。

又，本技術的另一概念係在於，一種送訊裝置，其係具備：送訊部，係發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和資訊***部，係在上記字幕串流之容器中***：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊。

於本技術中，藉由送訊部，含有視訊串流和字幕串流的所定格式之容器會被發送，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊。字幕之本文資訊係具有：字型指定資訊。

藉由資訊***部，在字幕串流之容器中係被***有：用來下載至少已被字型指定資訊所指定之字型之檔案所需之下載資訊。例如，輔助資訊係亦可被***至PES封包及/或節目對映表。例如，下載資訊係可為用來從播送訊號取得字型檔案所需之資訊，或者亦可為用來從網路上的伺服器取得字型檔案所需之資訊。

如此於本技術中，係在字幕串流之容器中係被***有：用來下載至少已被字型指定資訊所指定之字型之檔案所需之下載資訊。因此，在收訊側是不具有被字型指定資訊所指定之字型的檔案的情況下，可基於該當下載資訊來取得被字型指定資訊所指定之字型的檔案，可良好地進行字幕顯示。

又，本技術的另一概念係在於，一種收訊裝置，其係具備：收訊部，係接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和控制部，係控制：將上記視訊串流予以解碼而獲得視訊資料的處理、和基於上記字幕串流之容器中所被***的用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊而取得已被上記字型指定資訊所指定之字型的字型檔案的處理、和將上記字幕串流予以解碼並基於上記已被取得之字型檔案而獲得字幕之點陣圖資料的處理、和將上記字幕之點陣圖資料重疊至上記視訊資料的處理。

於本技術中，藉由收訊部，含有視訊串流和字幕串流的所定格式之容器會被接收，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊。字幕之本文資訊係具有：字型指定資訊。在字幕串流之容器中係被***有：用來下載至少已被字型指定資訊所指定之字型之檔案所需之下載資訊。

藉由控制部，將視訊串流予以解碼而獲得視訊資料的處理、和基於下載資訊而取得已被字型指定資訊所指定之字型的字型檔案的處理、和將字幕串流予以解碼並基於已被取得之字型檔案而獲得字幕之點陣圖資料的處理、和將字幕之點陣圖資料重疊至視訊資料的處理，會被控制。

如此於本技術中，在字幕串流之容器中係被***有：用來下載至少已被字型指定資訊所指定之字型之檔案所需之下載資訊；已被字型指定資訊所指定之字型的字型檔案係基於該下載資訊而被取得，在獲得字幕之點陣圖資料之際會被使用。因此，即使在不具有被字型指定資訊所指定之字型的檔案的情況下，仍可良好地進行字幕顯示。

又，本技術的另一概念係在於，一種送訊裝置，其係具備：節區表***部，係在傳輸串流中，將具有各自不同之字型檔案的定數之節區表，予以依序重複***；和送訊部，係將已被***有上記節區表的傳輸串流，予以發送。

於本技術中，藉由節區表***部，在傳輸串流中，具有各自不同之字型檔案的所定數之節區表，係被依序重複***。藉由送訊部，已被***有節區表的傳輸串流，會被發送。此情況下，所定數之節區表，係會藉由資料輪播而被重複發送。

如此於本技術中，具有各自不同之字型檔案的所定數之節區表，係被依序重複***至傳輸串流。因此，在收訊側，可容易從傳輸串流取得，例如字幕之本文資訊所具有之字型指定資訊所指定之字型的字型檔案。

若依據本技術，則可良好地進行收訊側的字幕顯示。此外，本說明書中所記載之效果僅為例示並非限定，亦可還有附加性的效果。

10‧‧‧收送訊系統

100‧‧‧播送送出系統

110‧‧‧串流生成部

111‧‧‧控制部

112‧‧‧視訊編碼器

113‧‧‧音訊編碼器

114‧‧‧本文格式轉換部

115‧‧‧字幕編碼器

116‧‧‧TS格式器

200‧‧‧電視收訊機

201‧‧‧收訊部

202‧‧‧TS解析部

203‧‧‧視訊解碼器

204‧‧‧視訊重疊部

205‧‧‧面板驅動電路

206‧‧‧顯示面板

207‧‧‧音訊解碼器

208‧‧‧音訊輸出電路

209‧‧‧揚聲器

210‧‧‧字幕解碼器

221‧‧‧CPU

222‧‧‧快閃ROM

223‧‧‧DRAM

224‧‧‧內部匯流排

225‧‧‧遙控器收訊部

226‧‧‧遙控器送訊機

227‧‧‧通訊介面

[圖1]實施形態的收送訊系統之構成例的區塊圖。

[圖2]被字幕顯示位置資訊所決定之字幕顯示位置(區域)之一例的圖示。

[圖3]TTML的結構例(字幕顯示位置為1個)的圖示。

[圖4]TTML結構中的主要資訊之內容的圖示。

[圖5]TTML的結構例(字幕顯示位置為2個)的圖示。

[圖6]視訊領域的長寬比與顯示視訊領域的長寬比為相同時的字幕之顯示例(字幕顯示位置為1個)的圖示。

[圖7]視訊領域的長寬比與顯示視訊領域的長寬比為相同時的字幕之顯示例(字幕顯示位置為2個)的圖示。

[圖8]視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且顯示視訊領域是被視為字幕顯示範圍，基於字幕顯示位置資訊而決定字幕顯示位置時(第1方法)的字幕之顯示例(字幕顯示位置為1個)的圖示。

[圖9]尺寸變更處理已被實施時的顯示例的圖示。

[圖10]視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且顯示視訊領域是被視為字幕顯示範圍，基於字幕顯示位置資訊而決定字幕顯示位置，然後還實施了尺寸變更處理時(第1方法)的字幕之顯示例(字幕顯示位置為2個)的圖示。

[圖11]視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且顯示視訊領域中係被設定有字幕顯示範圍，基於字幕顯示位置資訊而決定字幕顯示位置時(第2方法)的字幕之顯示例(字幕顯示位置為1個)的圖示。

[圖12]視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且顯示視訊領域中係被設定有字幕顯示範圍，基於字幕顯示位置資訊而決定字幕顯示位置時(第2方法)的字幕之顯示例(字幕顯示位置為2個)的圖示。

[圖13]播送送出系統的串流生成部之構成例的區塊圖。

[圖14]字幕PES封包的結構例、和「PES_data_byte_field( )」的結構例的圖示。

[圖15]區段類型之定義之一例的圖示。

[圖16]TTML顯示區段的結構例的圖示。

[圖17]TTML顯示區段的結構例中的主要資訊之內容的圖示。

[圖18]字型下載區段的結構例的圖示。

[圖19]字型下載區段的結構例中的主要資訊之內容的圖示。

[圖20]URL訊令區段的結構例的圖示。

[圖21]URL訊令區段的結構例中的主要資訊之內容的圖示。

[圖22]TTML顯示描述元的結構例的圖示。

[圖23]字型下載描述元的結構例的圖示。

[圖24]字型下載描述元的結構例的圖示。

[圖25]將已被TTML之字型指定資訊所指定之字型之檔案從傳輸串流TS(播送訊號)加以取得的案例(Case1)與將該檔案從網路上的伺服器加以取得的案例(Case2)之概要的圖示。

[圖26]具有字型檔案(Font file)的N個節區表以外，具有字型表(Font table)的1個節區表是藉由資料輪播而被重複發送的模式性圖示。

[圖27]字型下載節區表的結構例的圖示。

[圖28]字型下載節區表的結構例中的主要資訊之內容的圖示。

[圖29]「data_downloading_id」為“0x00”時字型下載節區表中所被描述之字型表資訊的概念性圖示。

[圖30]「font_group_id」之值與字型群組之對應關係的圖示。

[圖31]字型表描述元的結構例的圖示。

[圖32]「data_downloading_id」為“0x00”以外時字型下載節區表中所被描述之字型表資訊的概念性圖示。

[圖33]字型檔案描述元的結構例的圖示。

[圖34]傳輸串流TS之構成例的圖示。

[圖35]電視收訊機之構成例的區塊圖。

[圖36]電視收訊機的CPU中的字幕顯示位置之決定及尺寸變更處理之程序之一例的流程圖。

[圖37]視訊領域的長寬比與監視器(顯示器)的長寬比之一例，和是否為視訊全領域顯示模式的判斷例的說明圖。

[圖38]視訊全領域顯示模式下，且字幕顯示範圍未指定時的字幕顯示位置之決定的說明圖。

[圖39]視訊全領域顯示模式下，且字幕顯示範圍有指定時的字幕顯示位置之決定的說明圖。

[圖40]非視訊全領域顯示模式下，且字幕顯示範圍未指定時及有指定時的字幕顯示位置之決定的說明圖。

[圖41]電視收訊機的CPU中的使用字型檔案之決定處理的程序之一例的流程圖。

[圖42]TTML的結構例(字幕顯示位置為2個)的圖示。

以下，說明用以實施發明的形態(以下稱作「實施形態」)。此外，說明是按照以下順序進行。

1.實施形態

2.變形例

<1.實施形態> [收送訊系統之構成例〕

圖1係圖示，作為實施形態的收送訊系統10的構成例。該收送訊系統10，係由播送送出系統100和電視收訊機200所構成。播送送出系統100，係將做容器(多工化串流)的MPEG-2 TS之傳輸串流(以下簡稱為「傳輸串流TS」)，裝載於播送波中而予以發送。

傳輸串流TS中係含有：具有視訊資料的視訊串流、和具有字幕(Subtitle)之本文資訊的字幕串流。此處，作為字幕之本文資訊，係考量有例如TTML或TTML的衍生格式等，但在本實施形態中，係假設為 TTML。該TTML係具有字幕顯示位置資訊，該字幕顯示位置資訊，係將字幕顯示位置(區域)，以相對於字幕顯示範圍的相對位置(比例值)而加以指定。又，該TTML係具有字型指定資訊。

播送送出系統100，係在該TTML及/或字幕串流之容器中***，使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊。於該實施形態中，播送送出系統100，係將該輔助資訊，包含在TTML中以外，還***至PES(Packetized Elementary Stream)封包和PMT(Program Map Table)中。

該輔助資訊中係含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊。該尺寸變更處理之相關資訊係為例如，以字幕顯示位置之尺寸變更處理將垂直方向之尺寸予以壓縮的情況下表示應視為固定位置之掃描線位置的資訊。又，該輔助資訊中係含有：用來決定字幕顯示範圍所需之資訊。例如，該用來決定字幕顯示範圍所需之資訊係亦可為，字幕顯示範圍的基準點資訊及長寬比資訊。

又，播送送出系統100，係在字幕串流之容器中***：用來下載至少已被字型指定資訊所指定之字型之檔案所需之下載資訊。該下載資訊係為，用來從播送訊號(傳輸串流TS)取得字型檔案所需之資訊或用來從網路上的伺服器取得字型檔案所需之資訊等。於該實施形態中，播送送出系統100，係將該下載資訊，***至PES(Packetized Elementary Stream)封包和PMT(Program Map Table)中。

又，播送送出系統100，係在作為播送訊號的傳輸串流TS中，將含有彼此互異之字型檔案的所定數之節區表，依序重複***。亦即，播送送出系統100，係將所定數之節區表，以資料輪播而重複發送。此外，***含有字型檔案之節區表的傳輸串流TS，係不需要是和上述的含字幕串流之傳輸串流TS相同，亦可為其他服務的傳輸串流TS。

電視收訊機200，係將從播送送出系統100所被送來的傳輸串流TS，予以接收。電視收訊機200，係對具有視訊資料的視訊串流實施解碼處理而獲得視訊資料，同時，對具有作為字幕之本文資訊之TTML的字幕串流實施解碼處理而獲得字幕之點陣圖資料。

電視收訊機200，係在獲得字幕之點陣圖資料之際，使用被TTML所具有之字型指定資訊所指定的字型之檔案。如上述，用來下載至少被字型指定資訊所指定之字型之檔案所需之下載資訊，係被***至PES封包和PMT(Program Map Table)中。電視收訊機200，係在沒有搭載被字型指定資訊所指定之字型之檔案時，基於下載資訊而下載該當字型之檔案來使用。

如上述在TTML所具有的字幕顯示位置資訊中，字幕顯示位置係以相對於字幕顯示範圍的相對位置，而被指定。又，如上述，使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊，除了被包含在TTML中，還被***至PES封包和PMT。

電視收訊機200，係使用字幕顯示位置資訊及輔助資訊而取得字幕顯示位置，基於該已被取得之字幕顯示位置，對字幕之點陣圖資料進行顯示位置控制。電視收訊機200，係將進行過顯示位置控制的字幕之點陣圖資料，重疊至視訊資料，獲得顯示用的視訊資料。

電視收訊機200，作為對字幕之點陣圖資料的顯示位置控制，若視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為不同的情況，則選擇性地執行以下的第1方法或是第2方法。

在第1方法中，電視收訊機200係在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，將顯示視訊領域當作字幕顯示範圍而基於字幕顯示位置資訊來決定字幕顯示位置後，對該已被決定之字幕顯示位置實施尺寸變更處理，取得最終的字幕顯示位置。電視收訊機200，係基於如此所被取得之字幕顯示位置，來對字幕之點陣圖資料進行顯示位置控制。

在尺寸變更處理中，作為字幕顯示位置是恢復原本之形狀的處理，例如，已被決定之字幕顯示位置是只在水平方向被壓縮的情況下，則在垂直方向上以同樣的比率進行壓縮。例如，以尺寸變更處理將垂直方向之尺寸予以壓縮的情況下，是以把頂端掃描線(上方的掃描線)、底端掃描線(下方的掃描線)、或是中央掃描線(中間的掃描線)等之所定之掃描線位置予以固定的狀態下，進行壓縮。

藉由適切地選擇該所定之掃描線位置，例如，若為2個字幕顯示位置的情況，則將該2個字幕顯示位置的垂直方向之間隔，即使進行尺寸變更處理仍可加以維持。電視收訊機200，係在TTML、PES封包、PMT等中，作為尺寸變更處理之相關資訊，是被***有表示應視為固定位置之掃描線位置的資訊時，就可利用該資訊。

在第2方法中，電視收訊機200係在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，在顯示視訊領域中設定字幕顯示範圍，基於字幕顯示位置資訊來決定字幕顯示位置，取得最終的字幕顯示位置。電視收訊機200，係基於如此所被取得之字幕顯示位置，來對字幕之點陣圖資料進行顯示位置控制。

電視收訊機200，係在TTML、PES封包、PMT等中所被***之用來決定字幕顯示範圍所需之資訊是有被***時，則可利用該資訊來適切地設定字幕顯示範圍。例如，電視收訊機200，係在TTML、PES封包、PMT等中含有用來決定字幕顯示範圍所需之資訊時則選擇第2方法，若不含有時則選擇第1方法。

圖2係圖示了，被字幕顯示位置資訊所決定之字幕顯示位置(區域)之一例。此例子係圖示了，在TTML中，字幕顯示位置資訊，是以表示字幕顯示位置之基點(origin)的資訊「origin=“OH%OV%”」、和表示字幕顯示位置之領域(extent)的資訊「extent=“EH%EV%”」而被給定的情形。“RP”係表示字幕顯示範圍之頂端-左端(top-left)的基準點(Reference Pont)。

圖2(a)係圖示了，視訊領域的長寬比與顯示視訊領域的長寬比為相同時的例子。在此例子中，視訊領域的長寬比是16：9，對此，監視器的長寬比係為16：9，顯示視訊領域的長寬比為16：9。此情況下，顯示視訊領域係被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊，而決定字幕顯示位置。

圖2(b)係為視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且顯示視訊領域是被視為字幕顯示範圍，基於字幕顯示位置資訊來決定字幕顯示位置時(第1方法)的例子。在此例子中，視訊領域的長寬比為16：9，對此，監視器的長寬比係為4：3，顯示方法為中央裁切(Center-cut)的情況，且顯示視訊領域的長寬比為4：3。此情況下，字幕顯示位置，相較於圖2(a)之情況，垂直方向係為相同幅度，但在水平方向上，其幅度係被壓縮。此情況下，字幕顯示位置的形狀，係與圖2(a)之情況不同。

圖2(c)係為視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況，且在顯示視訊領域中被設定有字幕顯示範圍，基於字幕顯示位置資訊來決定字幕顯示位置時(第2方法)的例子。在此例子中，視訊領域的長寬比為16：9，對此，監視器的長寬比係為4：3，顯示方法為中央裁切(Center-cut)的情況，且顯示視訊領域的長寬比為4：3。此情況下，字幕顯示位置，相較於圖2(a)之情況，垂直方向及水平方向之雙方，其幅度都被壓縮。所被設定的字幕顯示範圍的長寬比為16：9的情況下，則字幕顯示位置的形狀，係和圖2(a)的情況相同。

圖3係圖示了TTML結構之一例。此例子係為，字幕顯示位置(區域)為1個時的例子。TTML，係以XML為基礎而被記載。tt根容器中係被定義有，係語言(language)或命名空間(name space)。命名空間，係在系統或是規格體系中，作為可在全要素中做唯一識別所需之固有的要素名，而被定義。又，在<tt>中，「tts：extent」，係在一開始就宣告字幕的位置資訊之對象之基礎的視訊100%的對象領域，“Fullvideo”，係若以4K視訊為對象時則表示3840(H)×2160(V)之解析度的視訊全體，若以2K(Full HD)視訊為對象時則表示1920(H)×1080(V)之解析度的視訊全體。

「xmlns=http：//www.w3.org/ns/ttml」、「xmlns：ttp=http：//www.w3.org/ns/ttml#parameter」、「xmlns：tts=http：//www.w3.org/ns/ttml#styling」之命名空間，係省略詳細說明，但這些是預先在W3C中作為TTML之屬性分類而被確保的參數、風格等的命名空間。

「xmlns：dto=http：//www.example.org/ns/displaytextoverlay」，係為新定義的命名空間。該命名空間，係用來***字幕顯示範圍之資訊所需。然後，「dto：dispasp=“16：9”」及「dto：RPoffset=“Ax%,By%”」，係表示字幕顯示範圍之資訊。

「dto：dispasp=“16：9”」，係表示字幕顯示範圍的長寬比資訊，是表示字幕顯示範圍係為16：9的長寬比之領域。在圖示的例子中，雖然表示了字幕顯示範圍的長寬比為16：9這件事情，但作為字幕顯示範圍的長寬比，係亦可如圖4所示，指定4：3、21：9等。「dto：RPoffset=“Ax%,By%”」係表示字幕顯示範圍之基準點資訊，如圖4所示，是將顯示視訊領域的水平垂直都設成100%時的字幕顯示範圍之基準點(RP：Reference Point)之位置，以從顯示視訊領域之頂端-左端(top-left)起算之偏置的比率來表示。

頭部(head)中，係存在有構圖(layout)之要素。區域ID是以“r1”表示，作為字幕顯示位置資訊，字幕顯示位置之起點(origin)、和其領域(extent)，是以相對位置而被表示。亦即，「origin=“OH%OV%”」係表示字幕顯示位置之基點，表示了起點是從左(left)起OH、從上(top)起OV%。又，「extent=“EH%EV%”」係表示字幕顯示位置之領域，表示橫幅度為EH%，縱幅度為EV%。

又，在頭部(head)中，係存在有風格 (style)之要素。「fontFamily="proportionalSansSerif"」，係為字型指定資訊。此處，「proportionalSansSerif」，係表示了字型的泛用字集(總稱名)。

在本體(body)中，XML ID是以“p1”表示，區域ID是以“r1”表示，除了進行字型指定，還記載有字幕(subtitle)之本文資料。此處，本文資料係被設為「ABCDE」。「font-family：’Arial’,‘Tahoma’,sans-serif」，係為指定了p要素之字型的字型指定資訊。此處，「Arial」、「Tahoma」係表示個別字型名，「sans-serif」係表示字型的泛用字集(總稱名)。

「dto：scalingjustify=top」，係構成了尺寸變更處理之相關資訊，在字幕顯示位置之尺寸變更處理中將垂直方向之尺寸予以壓縮時，則表示了應視為固定位置的掃描線位置。在圖示的例子中雖然表示了，應視為固定位置的掃描線位置是頂端掃描線(上方的掃描線)，但亦可如圖4所示，指定底端掃描線(下方的掃描線)、中央掃描線(中間的掃描線)等。

圖5亦圖示了TTML結構之一例。此例子係為，字幕顯示位置(區域)為2個時的例子。tt根容器，係和圖3相同，因此省略其說明。

頭部(head)中，係存在有構圖(layout)之要素。第1字幕顯示位置的區域ID是以“r1”表示，作為字幕顯示位置資訊，字幕顯示位置之起點(origin)、和其領域(extent)，是以相對位置而被表示。亦即，藉由「origin=“OH1%OV1%”」，表示了起點是從左(left)起OH1%、從上(top)起OV1%。又，藉由「extent=“EH1%EV1%”」，表示了領域之橫幅度為EH1%，其縱幅度為EV1%。

又，第2字幕顯示位置的區域ID是以“r2”表示，作為字幕顯示位置資訊，字幕顯示位置之起點(origin)、和其領域(extent)，是以相對位置而被表示。亦即，藉由「origin=“OH2%OV2%”」，表示了起點是從左(left)起OH2%、從上(top)起OV2%。又，藉由「extent=“EH2%EV2%”」，表示了領域之橫幅度為EH2%，其縱幅度為EV2%。

又，在頭部(head)中，係存在有風格(style)之要素。「fontFamily="proportionalSansSerif"」，係為字型指定資訊。此處，「proportionalSansSerif」，係表示了字型的泛用字集(總稱名)。

在本體(body)中，係與第1字幕位置相關連，XML ID是以“p1”表示，區域ID是以“r1”表示，除了進行字型指定，還記載有字幕(subtitle)之本文資料。此處，本文資料係被設為「ABCDE」。「font-family：’Arial’,‘Tahoma’,sans-serif」，係為指定了p要素之字型的字型指定資訊。此處，「Arial」、「Tahoma」係表示個別字型名，「sans-serif」係表示字型的泛用字集(總稱名)。

「dto：scalingjustify=bottom」，係構成了尺寸變更處理之相關資訊，在字幕顯示位置之尺寸變更處理中將垂直方向之尺寸予以壓縮時，則表示了應視為固定位置的掃描線位置。在圖示的例子中係表示了，應視為固定位置的掃描線位置是底端掃描線(下方的掃描線)。

又，在本體(body)中，係與第2字幕位置相關連，XML ID是以“p2”表示，區域ID是以“r2”表示，同時，還記載有字幕(subtitle)之本文資料。此處，本文資料係被設為「FGH」。「font-family=“monospaceSerif”」，係為指定了p要素之字型的字型指定資訊。此處，「monospaceSerif」，係表示了字型的泛用字集(總稱名)。

(0055)

「dto：scalingjustify=top」，係構成了尺寸變更處理之相關資訊，在字幕顯示位置之尺寸變更處理中將垂直方向之尺寸予以壓縮時，則表示了應視為固定位置的掃描線位置。在圖示的例子中係表示了，應視為固定位置的掃描線位置是頂端掃描線(上方的掃描線)。

圖6係圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為相同時的字幕(subtitle)的顯示例。圖示的例子係為，視訊領域的長寬比為16：9，監視器的長寬比也是16：9的情況，且具有如圖3所示的TTML結構(字幕顯示位置為1個)時的例子。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，顯示視訊領域是被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)，而決定字幕顯示位置(區域)。“RP”係表示字幕顯示範圍之頂端-左端(top-left)的基準點(Reference Pont)。

在如此被決定之字幕顯示位置上，會顯示出本文資料所致之字幕「ABCDE」。此外，在圖示的例子中，雖然表示視訊領域、監視器領域及字幕顯示範圍的各框是有所錯開而被表示，但這是為了使各框能夠明確表示所需之處置，實際上各框係為重疊。雖然省略說明，但在以下的各圖中也是同樣如此表示。

圖7亦圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為相同時的字幕(subtitle)的顯示例。圖示的例子係為，視訊領域的長寬比為16：9，監視器的長寬比也是16：9的情況，且具有如圖5所示的TTML結構(字幕顯示位置為2個)時的例子。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，顯示視訊領域是被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「 origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)，而決定第1、第2字幕顯示位置(區域)。

然後，在第1字幕顯示位置(第1區域)中係顯示出本文資料所致之字幕「ABCDE」，在第2字幕顯示位置(第2區域)中係顯示出本文資料所致之字幕「FGH」。此情況下，2個字幕顯示位置(區域)之間隔，係被設成例如10掃描線。

圖8係圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為不同的情況，且顯示視訊領域是被視為字幕顯示範圍，基於字幕顯示位置資訊來字幕顯示位置時(第1方法)的字幕(subtitle)的顯示例。圖示的例子係為，視訊領域的長寬比為16：9，監視器的長寬比是4：3的情況，且具有如圖3所示的TTML結構(字幕顯示位置為1個)時的例子。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，顯示視訊領域是被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)，而決定字幕顯示位置(區域)。然後，在字幕顯示位置上，會顯示出本文資料所致之字幕「ABCDE」。

此情況下，字幕顯示位置，相較於圖6之情況，垂直方向係為相同幅度，但在水平方向上其幅度係被壓縮。此情況下，隨著字幕顯示位置之幅度被壓縮，字幕的字型尺寸也被調整成較小的尺寸。藉由如此調整字幕的字型尺寸，如圖示，關於水平方向係字幕顯示位置和其上所被顯示之字幕的關係會是匹配的狀態，但關於字幕顯示位置之幅度未被壓縮的垂直方向，則是字幕顯示位置和其上所被顯示之字幕的關係係為不匹配的狀態。此情況下，視聽者係會感受到，字幕顯示位置的黑領域浮起的感覺。

於是，如上述在第1方法中，係對已被決定之字幕顯示位置實施尺寸變更處理，使得字幕顯示位置和其上所被顯示之字幕的關係不只在水平方向就連垂直方向上都變成匹配的狀態。圖9係圖示了尺寸變更處理已被實施時的顯示例。此情況下，藉由尺寸變更處理，基於字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)而被決定而只有在水平方向上被壓縮的字幕顯示位置，係在垂直方向上也用相同的比率而被壓縮。此情況下，結果而言，字幕顯示位置，係變成藉由字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EVu%”」)而被決定。此情況下，會變成EVu=3/4＊EV之關係。

如此進行了尺寸變更處理的情況下，是以所定之掃描線位置會被固定的狀態，來進行垂直方向的幅度之壓縮。圖示的例子係為，基於TTML中所含之「dto：scalingjustify=top」之資訊，而把所定之掃描線位置設成頂端掃描線(上方的掃描線)的例子。此外，於圖示的例子中，虛線框係表示了，垂直方向的幅度之壓縮被進行前的字幕顯示位置。

圖10亦圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為不同的情況，且顯示視訊領域是被視為字幕顯示範圍，基於字幕顯示位置資訊來字幕顯示位置時(第1方法)的字幕(subtitle)的顯示例。圖示的例子係為，視訊領域的長寬比為16：9，監視器的長寬比是4：3的情況，且具有如圖5所示的TTML結構(字幕顯示位置為2個)時的例子，圖示了尺寸變更處理已被實施時的顯示例。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，顯示視訊領域是被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)，而決定第1、第2字幕顯示位置(區域)，其後再實施尺寸變更處理。

此情況下，第1字幕顯示位置(第1區域)，就結果而言，字幕顯示位置，係變成藉由字幕顯示位置資訊(「origin=“OH1%OV1%”」、「extent=“EH1%EV1u%”」)而被決定。此情況下，會變成EV1u=3/4＊EV1之關係。同樣地，此情況下，第2字幕顯示位置(第2區域)，就結果而言，字幕顯示位置，係變成藉由字幕顯示位置資訊(「origin=“OH2%OV2%”」、「extent=“EH2%EV2u%”」)而被決定。此情況下，會變成EV2u=3/4＊EV2之關係。

然後，在第1字幕顯示位置(第1區域)中係顯示出本文資料所致之字幕「ABCDE」，在第2字幕顯示位置(第2區域)中係顯示出本文資料所致之字幕「FGH」。此情況下，隨應於字幕顯示位置(區域)之壓縮，以匹配於其的方式，調整字幕的字型尺寸。

進行了尺寸變更處理的情況下，是以所定之掃描線位置會被固定的狀態，來進行垂直方向的幅度之壓縮。圖示的例子係為，基於TTML中所含之「dto：scalingjustify=bottom」之資訊，關於第1字幕顯示位置(第1區域)，係把所定之掃描線位置設成底端掃描線(下方的掃描線)的例子。又係為，基於TTML中所含之「dto：scalingjustify=top」之資訊，關於第2字幕顯示位置(第2區域)，係把所定之掃描線位置設成頂端掃描線(上方的掃描線)的例子。

如此藉由選擇第1、第2字幕顯示位置上的所定之掃描線位置，作為第1、第2字幕顯示位置之間隔，就可和圖7的顯示例的情況相同地，維持在例如10掃描線。因此，視聽者對於顯示影像上的字幕(subtitle)的感受性可大致維持。

圖11係圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為不同的情況，且在顯示視訊領域中被設定有字幕顯示範圍，基於字幕顯示位置資訊來字幕顯示位置時(第2方法)的字幕(subtitle)的顯示例。圖示的例子係表示，視訊領域的長寬比為16：9，監視器的長寬比是4：3的情況，且具有如圖3所示的TTML結構(字幕顯示位置為1個)時的顯示例。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，在顯示視訊領域中被設定有字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)，而決定字幕顯示位置(區域)。然後，在字幕顯示位置上，會顯示出本文資料所致之字幕「ABCDE」。此情況下，隨應於字幕顯示位置(區域)之壓縮，以匹配於其的方式，調整字幕的字型尺寸。

此情況下，例如，在顯示視訊領域被設定有，與視訊領域的長寬比相同長寬比的字幕顯示範圍。圖示的例子係為，基於TTML中所含之字幕顯示範圍之資訊，亦即字幕顯示範圍之基準點資訊(「dto：RPoffset=“Ax%,By%”」)、和字幕顯示範圍的長寬比資訊(「dto：dispasp=“16：9”」)，而在顯示視訊領域中被設定有長寬比為16：9的字幕顯示範圍的例子。

此情況下，字幕顯示位置，係在垂直方向及水平方向之雙方上其幅度都會被壓縮，字幕顯示位置的形狀係變成和圖6的情況相同，不需要伴隨字幕的字型尺寸之調整所致之字幕顯示位置之調整(尺寸變更處理)。

圖12亦圖示了，視訊領域的長寬比與顯示視訊領域(監視器中所被顯示之視訊領域)的長寬比為不同的情況，且在顯示視訊領域中被設定有字幕顯示範圍，基於字幕顯示位置資訊來字幕顯示位置時(第2方法)的字幕(subtitle)的顯示例。圖示的例子係表示，視訊領域的長寬比為16：9，監視器的長寬比是4：3的情況，且具有如圖5所示的TTML結構(字幕顯示位置為2個)時的顯示例。

在圖示的例子中，視訊領域是以虛線框來表示，監視器領域是以實線框來表示。此情況下，如一點鎖線框所示，顯示視訊領域是被視為字幕顯示範圍，基於以對其之相對位置而被指定的字幕顯示位置資訊(「origin=“OH1%OV1%”」、「extent=“EH1%EV1%”」、「origin=“OH2%OV2%”」、「extent=“EH2%EV2%”」)，而決定第1、第2字幕顯示位置(區域)。然後，在第1字幕顯示位置(第1區域)中係顯示出本文資料所致之字幕「ABCDE」，在第2字幕顯示位置(第2區域)中係顯示出本文資料所致之字幕「FGH」。

〔播送送出系統的串流生成部之構成例〕

圖13係圖示，播送送出系統100的串流生成部110 之構成例。此串流生成部110係具有：控制部111、視訊編碼器112、音訊編碼器113、本文格式轉換部114、字幕編碼器115、TS格式器(多工器)116。

控制部111，係為例如具備有CPU(Central Processing Unit)之構成，控制串流生成部110的各部之動作。視訊編碼器112，係將視訊資料DV予以輸入，對該視訊資料DV實施編碼，生成由在酬載中具有編碼視訊資料的視訊PES封包所構成的視訊串流(PES串流)。音訊編碼器113，係將音訊資料DA予以輸入，對該音訊資料DA實施編碼，生成由具有編碼音訊資料的音訊PES封包所構成的音訊串流(PES串流)。

本文格式轉換部114，係將本文資料(文字碼)DT予以輸入，獲得作為字幕資訊的TTML(Timed Text Markup Language)(參照圖3、圖5)。該TTML中係含有字幕顯示位置資訊。在該字幕顯示位置資訊中，字幕顯示位置(區域)是以相對於字幕顯示範圍的相對位置(比例值)，而被指定。又，該TTML中係含有字型指定資訊。

又，該TTML中係含有：視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側所被進行的字幕顯示位置之尺寸變更處理之相關資訊，例如，在字幕顯示位置之尺寸變更處理中要壓縮垂直方向之尺寸的情況下表示應視為固定位置的掃描線位置之資訊。又，該TTML中係含有，用來決定字幕顯未範圍所需之資訊(字幕顯示範圍之基準點資訊及長寬比資訊)。

字幕編碼器115，係將藉由本文格式轉換部114所得的TTML轉換成各種的區段，生成由在酬載中配置有這些區段的字幕PES封包所構成的字幕串流(PES串流)。

此情況下，字幕編碼器115，係在PES封包中***，與TTML中所含相同的尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊。具體而言，係生成具有這些資訊的新定義的TTML顯示區段(TTML_display_segment)，將該區段***至PES封包。

又，字幕編碼器115，係在PES封包中***，用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊。具體而言，係生成具有用來從播送訊號(傳輸串流TS)進行下載所需之資訊的新定義的字型下載區段(Font_download_segment)、和具有用來從網路上的伺服器進行下載所需之資訊的新定義的URL訊令區段(URL_signaling_segment)，將這些區段***至PES封包。

圖14(a)係圖示了字幕PES封包(PES_packet)的結構例(Syntax)。「PES_startcode_prefix」之24位元欄位中，係被配置有“0x000001”的固定樣式。「stream_id」之8位元欄位，係表示串流識別元。字幕PES封包的情況下，係被設成表示「private streaml的值“10111101”。「PES_packet_length」之16位元欄位，係表示作為PES封包之長度(大小)係為其後的位元組數。

在「PES_packet_length」之後，存在有「Optional_PES_header( )」之欄位。在該欄位中係被配置有PTS、DTS的時間戳記等。在該欄位之後，存在有「PES_packet_data_byte」之欄位。該欄位係相當於PES酬載。該欄位中係被配置有，用來將資料裝入容器所需之「PES_data_byte_field( )」。

圖14(b)係圖示了「PES_data_byte_field( )」的結構例(Syntax)。「data_identifier」之8位元欄位，係表示在容器部分中識別資料之種類的識別元。先前的字幕(點陣圖的情況)，係以“0x20”而被表示，因此在本文之情況，係可用新的值，例如“0x21”來加以識別。

「subtitle_stream_id」之8位元欄位，係表示用來識別字幕串流之種類的識別元。若為傳輸本文資訊的字幕串流之情況則設成新的值，例如“0x01”，可和先前的傳輸點陣圖的字幕串流“0x00”做區別。

在該「subtitle_stream_id」的欄位之後，接續於“00001111”的樣式之後，存在有「TimedTextSubtitling_segments( )」之欄位。該欄位中係被配置有區段封包。在該欄位之後，存在有「end_of_PES_data_field_marker」之8位元欄位。該欄位係為表示PES封包之最後的記號。

圖15係圖示了區段類型(segment_type)之定義的一例。“0xA0”，係表示這是傳輸TTML之文件之全體的區段。“0xA1”，係表示這是傳輸<tt>之部分的區段。“0xA2”，係表示這是傳輸<head>之部分的區段。“0xA3”，係表示這是傳輸<body>之部分的區段封包。“0xA4”，係表示這是TTML顯示區段。“0xA5”，係表示這是字型下載區段。“0xA6”，係表示這是URL訊令區段。

圖16係圖示了TTML顯示區段(TTML_display_segment)的結構例(Syntax)。圖17係圖示了該結構例中主要資訊內容(Semantics)。「sync_byte」之8位元欄位，係為表示區段開始的獨特字。「segment_type」之8位元欄位，係表示區段的種類。在該TTML顯示區段的情況下，「segment_type」係被設成“0xA4”(參照圖15)，表示這是TTML顯示區段。「segment_length」之16位元欄位，係表示作為TTML顯示區段之長度(大小)係為其後的位元組數。

「tds_version_number」之4位元欄位，係表示TTML顯示區段的更新。若要素中有變化，則值會增加一。「display_aspect_type」之8位元欄位，係表示字幕顯示範圍的長寬比。例如，“0x01”係表示16：9，“0x02”係表示4：3，“0x03”係表示21：9。該欄位之資訊，係對應於TTML中的「dto：dispasp」之資訊(參照圖3、圖5)。

「reference_point_offset_v」之8位元欄位係表示，將顯示視訊領域之垂直水平設成100%時的字幕顯示範圍的基準點之垂直位置，以從顯示視訊領域之左上(top-left)起算之偏置的比率加以表示。「reference_point_offset_h」之8位元欄位係表示，將顯示視訊領域之垂直水平設成100%時的字幕顯示範圍的基準點之水平位置，以從顯示視訊領域之左上(top-left)起算之偏置的比率加以表示。這些欄位之資訊，係對應於TTML中的「dto：RPoffset」之資訊(參照圖3、圖5)。

「scaling_justify_flag」之1位元欄位係表示，在進行區域(region)之比例縮放的情況下，是否指定比例縮放之基準點。“1”係表示要指定基準點，“0”係表示不指定基準點。要指定基準點的情況下，在區域有複數存在之際，最上位置之區域係以區域之下部為基準(bottom_line_justified)，最下位置之區域係以區域之上部為基準(top_line_justified)。該欄位之資訊，係對應於TTML中的「dto：scalingjustify」之資訊(參照圖3、圖5)。

圖18係圖示了字型下載區段(Font_download_segment)的結構例(Syntax)。圖19係圖示了該結構例中主要資訊內容(Semantics)。「sync_byte」之8位元欄位，係為表示區段開始的獨特字。「segment_type」之8位元欄位，係表示區段的種類。在該字型下載區段的情況下，「segment_type」係被設成“0xA5”(參照圖15)，表示這是字型下載區段。「segment_length」之16位元欄位，係表示作為字型下載區段之長度(大小)係為其後的位元組數。「fds_version_number」之4位元欄位，係表示字型下載區段的更新。若要素中有變化，則值會增加一。

「original_network_id」之16位元欄位，係表示下載資料所被傳輸的網路之識別資訊。「transport_stream_id」之16位元欄位，係表示個別的傳輸串流之識別資訊。「service_id」之16位元欄位，係表示下載所被進行的服務之識別資訊。若為配訊媒體間共通的下載對象，則可能不是在自身的傳輸串流，而是在其他傳輸串流中發送字型檔案，此時的作為用來特定參照目標之私人節區的資訊，就可指定這些「original_network_id」、「transport_stream_id」、「service_id」之資訊。

「font_file_id」之8位元欄位，係表示字型檔案所被分配的識別號碼。「ISO_639_language_code」之24位元欄位，係表示用來識別語言的由3個文字所成之代碼。例如，“jpn”係表示日文，“eng”係表示英文。「font_group_id」之8位元欄位，係表示字型群組之識別資訊，相當於TTML的泛用字集。「font_name_id」之8位元欄位，係表示個別字型名。

「text_length」之8位元欄位，係將其以後的文字碼部分之長度(大小)，以位元組數來表示。文字碼，係被配置在「char」之欄位中。例如，作為文字碼，可以配置表示個別字型名等的文字碼。

此外，在圖18的例子中，雖然是含有一筆字型檔案之下載資訊，但亦可含有複數筆字型檔案之下載資訊。此情況下，係藉由for迴圈，而變成從「original_network_id」起之欄位係被重複的結構。或者，藉由將字型下載區段(Font_download_segment)予以複數傳輸，也可供給複數筆字型檔案之下載資訊。

圖20係圖示了URL訊令區段(URL_signaling_segment)的結構例(Syntax)。圖21係圖示了該結構例中主要資訊內容(Semantics)。「sync_byte」之8位元欄位，係為表示區段開始的獨特字。「segment_type」之8位元欄位，係表示區段的種類。在該URL訊令區段的情況下，「segment_type」係被設成“0xA6”(參照圖15)，表示這是URL訊令區段。「segment_length」之16位元欄位，係表示作為字型下載區段之長度(大小)係為其後的位元組數。「uss_version_number」之4位元欄位，係表示URL訊令區段的更新。若要素中有變化，則值會增加一。

「ISO_639_language_code」之24位元欄位，係表示用來識別語言的由3個文字所成之代碼。例如，“jpn”係表示日文，“eng”係表示英文。「font_group_id」之8位元欄位，係表示字型群組之識別資訊，相當於TTML的泛用字集。「font_name_id」之8 位元欄位，係表示個別字型名。

「url_type」之8位元欄位，係表示伺服器的類型。例如，“0x01”係表示字型伺服器(非壓縮URL)，“0x02”係表示一般的伺服器(非壓縮URL)，“0x11”係表示字型伺服器(壓縮URL)，“0x12”係表示一般的伺服器(壓縮URL)。「url_string_length」之8位元欄位，係將表示其以後的URL之字串的文字碼部分之長度(大小)，以位元組數來表示。文字碼，係被配置在「char」之欄位中。

此外，在圖20的例子中，雖然是含有一筆字型檔案之下載資訊，但亦可含有複數筆字型檔案之下載資訊。此情況下，係藉由for迴圈，而變成從「ISO_639_language_code」起之欄位係被重複的結構。或者，藉由將URL訊令區段(URL_signaling_segment)予以複數傳輸，也可供給複數筆字型檔案之下載資訊。

回到圖13，TS格式器116，係將視訊編碼器112中所被生成的視訊串流、音訊編碼器113中所被生成的音訊串流及字幕編碼器115中所被生成的字幕串流，進行傳輸封包化而予以多工，獲得作為容器(多工化串流)的傳輸串流TS。

此情況下，TS格式器116，係在PMT(Program Map Table)中***，與TTML中所含相同的尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊。具體而言，係生成具有這些資訊的新定義的TTML 顯示描述元(TTML_display_descriptor)，將該描述元***至PMT。

又，TS格式器116，係在PMT中***，用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊。具體而言，係生成具有用來從播送訊號(傳輸串流TS)進行下載所需之資訊的新定義的字型下載描述元(Font_download_descriptor)、和具有用來從網路上的伺服器進行下載所需之資訊的新定義的URL訊令描述元(URL_signaling_descriptor)，將這些描述元***至PMT。

圖22係圖示了TTML顯示描述元(TTML_display_descriptor)的結構例(Syntax)。「descriptor_tag」之8位元欄位，係表示描述元類型，此處是表示這是TTML顯示描述元。「descriptor_length」之8位元欄位，係表示描述元之長度(大小)，作為描述元之長度是表示以後的位元組數。

「display_aspect_type」之8位元欄位，係表示字幕顯示範圍的長寬比。該欄位之資訊，係對應於TTML中的「dto：dispasp」之資訊(參照圖3、圖5)。

「scaling_justify_flag」之1位元欄位係表示，在進行區域(region)之比例縮放的情況下，是否指定比例縮放之基準點。“1”係表示要指定基準點，“0”係表示不指定基準點。該欄位之資訊，係對應於TTML中的「dto：scalingjustify」之資訊(參照圖3、圖5)。

「text_length」之8位元欄位，係將其以後的文字碼部分之長度(大小)，以位元組數來表示。文字碼，係被配置在「char」之欄位中。例如，作為文字碼，可以配置表示長寬比等的文字碼。

圖23係圖示了字型下載描述元(Font_download_descriptor)的結構例(Syntax)。「descriptor_tag」之8位元欄位，係表示描述元類型，此處是表示這是字型下載描述元。「descriptor_length」之8位元欄位，係表示描述元之長度(大小)，作為描述元之長度是表示以後的位元組數。

「font_file_id」之8位元欄位，係表示字型檔案所被分配的識別號碼。「ISO_639_language_code」之24位元欄位，係表示用來識別語言的由3個文字所成之代碼。「font_group_id」之8位元欄位，係表示字型群組之識別資訊，相當於TTML的泛用字集。「font_name_id」之8位元欄位，係表示個別字型名。

「text_length」之8位元欄位，係將其以後的文字碼部分之長度(大小)以位元組數來表示。文字碼，係被配置在「char」之欄位中。例如，作為文字碼，可以配置表示個別字型名等的文字碼。

此外，在圖23的例子中，雖然是含有一筆字型檔案之下載資訊，但亦可含有複數筆字型檔案之下載資訊。此情況下，係藉由for迴圈，而變成從「original_network_id」起之欄位係被重複的結構。

圖24係圖示了字型下載描述元(Font_download_descriptor)的結構例(Syntax)。「descriptor_tag」之8位元欄位，係表示描述元類型，此處是表示這是字型下載描述元。「descriptor_length」之8位元欄位，係表示描述元之長度(大小)，作為描述元之長度是表示以後的位元組數。

「ISO_639_language_code」之24位元欄位，係表示用來識別語言的由3個文字所成之代碼。「font_group_id」之8位元欄位，係表示字型群組之識別資訊，相當於TTML的泛用字集。「font_name_id」之8位元欄位，係表示個別字型名。「url_type」之8位元欄位，係表示伺服器的類型。「url_string_length」之8位元欄位，係將表示其以後的URL之字串的文字碼部分之長度(大小)，以位元組數來表示。文字碼，係被配置在「char」之欄位中。

此外，在圖24的例子中，雖然是含有一筆字型檔案之下載資訊，但亦可含有複數筆字型檔案之下載資訊。此情況下，係藉由for迴圈，而變成從「ISO_639_language_code」起之欄位係被重複的結構。

如上述，基於PES封包中所被***的字型下載區段(參照圖18)、或PMT中所被***的字型下載描述元(參照圖23)中所含之資訊，電視收訊機200係如圖25(a)中作為「Font download case(Case1)」所示，可從傳輸串流TS(播送訊號)中，取得已被TTML之字型指定資訊所指定之字型之檔案。

又，如上述，基於PES封包中所被***的URL訊令區段(參照圖20)、或PMT中所被***的字型下載描述元(參照圖24)中所含之資訊，電視收訊機200係如圖25(b)中作為「Font download case(Case2)」所示，可從網路上的伺服器，取得已被TTML之字型指定資訊所指定之字型之檔案。

回到圖13，TS格式器116，係在傳輸串流TS中，將含有彼此互異之字型檔案(Font file)的所定數之節區表，依序重複***。亦即，播送送出系統100，係將該所定數之節區表，以資料輪播而重複發送。

圖26係圖示，具有字型檔案(Font file)的N個節區表以外，具有字型表(Font table)的1個節區表是藉由資料輪播而被重複發送，收訊機200係可將這些節區表不限定該時序地加以接收的模式性圖示。

此處，作為具有字型檔案或字型表的節區表，新定義了作為私人節區表的字型下載節區表(FDT：Font_downloading_section table)。在字型下載節區表中，表格結構係於後述，但存在有「data_downloading_id」、「section_number」、「last_section_number」等之欄位。

如圖26所示，在巡迴的字型下載節區表的「data_downloading_id」之欄位中係被***有例如0至N之值而可識別各個節區表。在巡迴的字型下載節區表的「section_number」之欄位中也是被***有和「data_downloading_id」之欄位相同的值，各節區表的「last_section_number」之欄位中係被***有N之值。

收訊機200，係可將巡迴供給中的位置關係，以所接收到的字型下載節區表的「section_number」、「last_section_number」之欄位之值，而加以辨識。亦即，收訊機200，係用「section_number」之欄位之值來辨識現在的節區表之位置，當「section_number」之欄位之值是與「last_section_number」之欄位之值一致時，辨識這是巡迴的最後之節區表，可利用於在一次巡迴中取得全部的節區表。

圖27係圖示了字型下載節區表(Font_downloading_section table)的結構例(Syntax)。圖28係圖示了該結構例中主要資訊內容(Semantics)。

「table_id」之8位元欄位，係表示表格識別資訊。作為該表格識別資訊是指定了，表示字型下載節區表的值。「data_downloading_id」之16位元欄位，係表示下載資料之識別資訊且為對每一「original_network_id」所被定義的獨特值。例如，以“0x00”表示這是字型表資訊，以“0x00”以外表示這是字型檔案資訊。「version_number」之5位元欄位，係表示字型下載節區表的更新。若要素中有變化，則值會增加一。

「original_network_id」之16位元欄位，係表示下載資料所被傳輸的網路之識別資訊。「transport_stream_id」之16位元欄位，係表示個別的傳輸串流之識別資訊。「service_id」之16位元欄位，係表示下載所被進行的服務之識別資訊。藉由一併使用這3個識別資訊，就可設成配訊媒體間共通之下載對象。

「descriptor( )」之欄位中，在「data_downloading_id」為“0x00”時係被配置有字型表描述元(Font_table_descriptor)，在「data_downloading_id」為“0x00”以外時則被配置有字型檔案描述元(Font_file_descriptor)。又，「data_downloading_id」為“0x00”以外時，在「data_byte」之欄位中係被配置有字型檔案(Font file)。

圖29係概念性圖示了，「data_downloading_id」為“0x00”時字型下載節區表中所被描述之字型表資訊。此情況下，如上述，在字型下載節區表中，係在「descriptor( )」之欄位裡，配置有字型表描述元(Font_table_descriptor)。

字型表描述元中係描述有，被巡迴送訊的所定數之字型檔案之資訊。作為字型檔案之資訊係含有：「Font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等之資訊。「font_file_id」，係表示字型檔案所被分配的識別號碼。「ISO_639_language_code」，係表示語言的識別代碼。「font_group_id」，係表示字型群組的識別資訊。「font_name_id」，係表示個別字型名。圖30係圖示了「font_group_id」之值與字型群組之對應關係。

圖31係圖示了字型表描述元(Font_table_descriptor)的結構例(Syntax)。「 descriptor_tag」之8位元欄位，係表示描述元類型，此處是表示這是字型表描述元。「descriptor_length」之8位元欄位，係表示描述元之長度(大小)，作為描述元之長度是表示以後的位元組數。

「number_of_font_files」之8位元欄位，係表示字型檔案之數量。該字型檔案之數量有多少個，「Font_file_id」之8位元欄位、「ISO_639_language_code」之24位元欄位、「font_group_id」之8位元欄位、「font_name_id」之8位元欄位就存在有多少個。

圖32係概念性圖示了，「data_downloading_id」為“0x00”以外時字型下載節區表中所被描述之字型表資訊。此情況下，如上述，在字型下載節區表中，係在「descriptor( )」之欄位裡配置有字型檔案描述元(Font_file_descriptor)，然後還在「data_byte」之欄位裡配置有字型檔案(Font file)。

字型檔案描述元中係描述有，所被發送的字型檔案之資訊。作為字型檔案之資訊係含有：「Font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等之資訊。「font_file_id」，係表示字型檔案所被分配的識別號碼。「ISO_639_language_code」，係表示語言的識別代碼。「font_group_id」，係表示字型群組的識別資訊。「font_name_id」，係表示個別字型名。

圖33係圖示了字型檔案描述元(Font_file_descriptor)的結構例(Syntax)。「descriptor_tag」之8位元欄位，係表示描述元類型，此處是表示這是字型檔案描述元。「descriptor_length」之8位元欄位，係表示描述元之長度(大小)，作為描述元之長度是表示以後的位元組數。

表示所發送的字型檔案之資訊的「Font_file_id」之8位元欄位、「ISO_639_language_code」之24位元欄位、「font_group_id」之8位元欄位、「font_name_id」之8位元欄位係會存在。「text_length」之8位元欄位，係將其以後的文字碼部分之長度(大小)，以位元組數來表示。文字碼，係被配置在「char」之欄位中。例如，作為文字碼，可以配置表示個別字型名等的文字碼。

簡單說明圖13所示的串流生成部110之動作。視訊資料DV，係被供給至視訊編碼器112。在視訊編碼器112中，係對該視訊資料DV實施編碼，生成由在酬載中具有編碼影像資料的視訊PES封包所成之視訊串流(PES串流)。該視訊串流，係被供給至TS格式器116。

又，音訊資料DA，係被供給至音訊編碼器 113。在音訊編碼器113中，係對音訊資料DA實施編碼，生成由具有編碼聲音資料的音訊PES封包所成之音訊串流(PES串流)。該音訊串流，係被供給至TS格式器116。

又，本文資料(文字碼)DT，係被供給至本文格式轉換部114。在該本文格式轉換部114中，會獲得作為字幕資訊的TTML(參照圖3、圖5)。該TTML中係含有，將字幕顯示位置(區域)以相對於字幕顯示範圍的相對位置(比例值)加以指定的字幕顯示位置資訊。又，TTML中係含有字型指定資訊。又，TTML中係含有：使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)。

該TTML，係被供給至字幕編碼器115。在該字幕編碼器115中，TTML係被轉換成各種的區段，生成由在酬載中配置有這些區段的字幕PES封包所成之字幕串流。該字幕串流，係被供給至TS格式器116。

此情況下，在字幕編碼器115中，係在PES封包中，***和TTML中所包含之相同的，使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)。具體而言，生成具有這些資訊的TTML顯示區段(參照圖16)，該區段係被***至PES封包。

又，在字幕編碼器115中，係在PES封包中 ***，用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊。具體而言，具有用來從播送訊號(傳輸串流TS)進行下載所需之資訊的字型下載區段(參照圖18)、和具有用來從網路上的伺服器進行下載所需之資訊的URL訊令區段(參照圖20)係被生成，這些區段係被***至PES封包。

在TS格式器116中，視訊編碼器112中所被生成的視訊串流、音訊編碼器113中所被生成的音訊串流及字幕編碼器115中所被生成的字幕串流，係被傳輸封包化而被多工化，生成作為容器(多工化串流)的傳輸串流TS。

此情況下，在TS格式器116中，係在PMT中，***和TTML中所包含之相同的，使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)。具體而言，生成具有這些資訊的TTML顯示描述元(參照圖22)，該描述元係被***至PMT。

又，在TS格式器116中，係在PMT中***，用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊。具體而言，具有用來從播送訊號(傳輸串流TS)進行下載所需之資訊的字型下載描述元(參照圖23)、和具有用來從網路上的伺服器進行下載所需之資訊的新定義的URL訊令描述元(參照圖24)係被生成，這些描述元係被***至PMT。

「傳輸串流TS之構成例」

圖34係圖示了傳輸串流TS之構成例。在該構成例中，關於視訊、音訊之部分的構成係被省略。在該構成例中，係存在有字幕串流之PES封包也就是字幕PES封包「Subtitle PES」。

於字幕PES封包中，在PES標頭中係被***有PTS的時間戳記，在PES酬載中係被***有，帶有TTML之文件之全體、或是TTML之文件之分割部分的區段(定時本文字幕區段：TimedText subtitle segments)。該區段中係含有：尺寸變更處理之相關資訊(「dto：scalingjustify」)、用來決定字幕顯示範圍所需之資訊(「dto：dispasp」、「dto：RPoffset」)。

又，該區段中係含有，字型指定資訊(「fontFamily」)。此外，該區段中，係如後述，也可考慮含有：下載資訊(「fontdlurl=http：//www.w3.org/ns/fontdlservice」、「fontdlurl：iso639languagecode="value"」、「fontdlurl：fontgroupid="value"」、「fontdlurl：fontnameid="value"、「fontdlurl：fontname="value”」。

又，在字幕PES封包的PES酬載中係被***有：TTML顯示區段(TTML_display_segment)(參照圖16)。該區段中係被***有：上述的定時本文字幕區段( TimedText subtitle segments)中所含之尺寸變更處理之相關資訊(「dto：scalingjustify」)、用來決定字幕顯示範圍所需之資訊(「dto：dispasp」、「dto：RPoffset」)所分別對應的，尺寸變更處理之相關資訊(「scaling_justify_flag」)、用來決定字幕顯示範圍所需之資訊(「display_aspect_type」、「reference_point_offset_v,reference_point_offset_h」)。

又，在字幕PES封包的PES酬載中係被***有：字型下載區段(Font_download_segment)(參照圖18)。該區段中係被***有：上述的定時本文字幕區段(TimedText subtitle segments)中所含之用來將已被字型指定資訊(「fontFamily」)所指定之字型之檔案從播送訊號(傳輸串流TS)進行下載所需之資訊(「font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等)。

又，在字幕PES封包的PES酬載中係被***有：URL訊令區段(URL_signalin_segment)(參照圖20)。該區段中係被***有：上述的定時本文字幕區段(TimedText subtitle segments)中所含之用來將已被字型指定資訊(「fontFamily」)所指定之字型之檔案從網路上的伺服器進行下載所需之資訊(「ISO_639_language_code」、「font_group_id」、「font_name_id」、「url_type」、「URL」等)。

又，在傳輸串流TS中，作為PSI(Program Specific Information)，係含有PMT(Program Map Table)。該PSI係用來表示，傳輸串流TS中所含之各元素串流是屬於哪個節目的資訊。PMT中係存在有，帶有與字幕串流關連之資訊的字幕元素串流迴圈(Subtitle ES loop)。

該字幕元素串流迴圈中，係隨應於字幕串流，而被配置有PID(封包識別元)等之資訊，同時，還配置有描述與該字幕串流相關連之資訊的描述元。作為描述元係被配置有：TTML顯示描述元(TTML_display_descriptor)(參照圖22)、字型下載描述元(Font_download_descriptor)(參照圖23)、URL訊令描述元(URL_signaling_descriptor)(參照圖24)。

TTML顯示描述元中係被***有：尺寸變更處理之相關資訊(「scaling_justify_flag」)、用來決定字幕顯示範圍所需之資訊(「display_aspect_type」、「reference_point_offset_v,reference_point_offset_h」)。字型下載描述元中係被***有：與字型下載區段相同的下載資訊(「font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等)。URL訊令描述元中係被***有：與URL訊令區段相同的下載資訊(「ISO_639_language_code」、「font_group_id」、「font_name_id」、「url_type」、「URL」等)。

此外，在傳輸串流TS的EIT(Event Information Table)之下，亦可配置有字型下載描述元及URL訊令描述元。藉此，就可每一節目的，描述下載資訊。

又，傳輸串流TS中係含有FDT(Font_downloading_section table)(參照圖27)。藉此，就以資料輪播而將字型表檔案做巡迴供給。該FDT中係被***有：字型表描述元(Font_table_descriptor)(參照圖31)、或是字型檔案描述元(Font_file_descriptor)(參照圖33)與字型檔案(Font_file)。此外，該FDT，係也有不存在於該當傳輸串流TS中的情況。此情況下，收訊機200，係基於PES封包之字型下載區段或是PMT之字型下載描述元中所含之下載資訊來下載字型檔案時，就會從其他傳輸串流TS來下載字型檔案。

〔電視收訊機之構成例〕

圖35係圖示了電視收訊機200的構成例。該電視收訊機200係具有：收訊部201、TS解析部(解多工器)202、視訊解碼器203、視訊重疊部204、面板驅動電路205、作為監視器(顯示器)的顯示面板206。又，該電視收訊機200係具有：音訊解碼器207、音訊輸出電路208、揚聲器209、字幕解碼器210。又，該電視收訊機200，係具有：CPU221、快閃ROM222、DRAM223、內部匯流排224、遙控器收訊部225、遙控器送訊機226、通訊介面227。

CPU221，係控制著電視收訊機200各部之動作。快閃ROM222，係進行控制軟體之儲存及資料之保管。DRAM223，係構成CPU221之工作區域。CPU221，係將從快閃ROM222讀出之軟體或資料，展開於DRAM223上而啟動軟體，控制電視收訊機200的各部。

遙控器收訊部225，係將從遙控器送訊機226所發送來之遙控訊號(遙控碼)，供給至CPU221。CPU221，係基於該遙控碼而控制著電視收訊機200的各部。CPU221、快閃ROM222及DRAM223係被連接至內部匯流排224。

通訊介面227，係基於CPU221之控制，與存在於網際網路等之網路上的伺服器之間進行通訊。該通訊介面227，係被連接至內部匯流排224。

收訊部201，係將從播送送出系統100被裝載於播送波而被發送過來的傳輸串流TS，加以接收。該傳輸串流TS中，係如上述，含有視訊串流、音訊串流及字幕串流。TS解析部202，係從傳輸串流TS，抽出視訊、音訊、字幕之各串流的PES封包。此情況下，TS解析部202，係將各TS封包的標頭中所被***的各種資訊加以解析，基於“PID”而將含有視訊、音訊、字幕之各PES封包之資料的TS封包予以選擇性抽出，獲得視訊、音訊、字幕之各PES封包。

又，TS解析部202，係將各TS封包的標頭中所被***的各種資訊加以解析，基於“PID”而將傳輸串流TS中所被***之各種資訊予以抽出，送往CPU221。該資訊中係也含有：TTML顯示描述元(TTML_display_descriptor)(參照圖22)、字型下載描述元(Font_download_descriptor)(參照圖23)及URL訊令描述元(URL_signaling_descriptor)(參照圖24)。

CPU221，係從TTML顯示描述元，取得字幕串流所具有之TTML的作為使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊的尺寸變更處理之相關資訊(「scaling_justify_flag」)、用來決定字幕顯示範圍所需之資訊(「display_aspect_type」、「reference_point_offset_v,reference_point_offset_h」)。

又，CPU221，係從字型下載描述元，取得字幕串流所具有之TTML中所含之用來將已被字型指定資訊所指定之字型之檔案從播送訊號(傳輸串流TS)進行下載所需之資訊(「font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等)。

又，CPU221係從URL訊令描述元，取得字幕串流所具有之TTML中所含之用來將已被字型指定資訊所指定之字型之檔案從網路上的伺服器進行下載所需之資訊(「ISO_639_language_code」、「font_group_id」、「font_name_id」、「url_type」、「URL」等)。

又，被TS解析部202所抽出的資訊中也含有，字幕串流所具有之TTML中所含之將已被字型指定資訊所指定之字型之檔案從播送訊號(傳輸串流TS)進行下載時的FDT(Font_downloading_section table)(參照圖27)。CPU221，係從該FDT，取得字幕串流所具有之TTML中所含之字型指定資訊所指定的字型之檔案。

音訊解碼器207，係對TS解析部202所得到的音訊PES封包實施解碼處理，獲得音訊資料。音訊輸出電路208，係對音訊資料，實施D/A轉換或增幅等之必要的處理，供給至揚聲器209。視訊解碼器203，係對TS解析部202所得到的視訊PES封包實施解碼處理，獲得視訊資料。此外，視訊解碼器203，係隨應於顯示模式等，還會適宜地進行視訊資料的解析度轉換。例如，視訊領域的長寬比為16：9且監視器(顯示器)的長寬比為4：3，顯示模式為信籤黑邊時，則會進行視訊資料的解析度轉換。

字幕解碼器210，係對TS解析部202所得到的字幕PES封包實施解碼處理，從定時本文字幕區段(TimedText subtitle segments)獲得TTML，送往CPU221。CPU221，係從該TTML，取得將字幕顯示位置(區域)以相對於字幕顯示範圍的相對位置(比例值)加以指定的字幕顯示位置資訊，還有作為使用該字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊的尺寸變更處理之相關資訊(「dto：scalingjustify」)、用來決定字幕顯示範圍所需之資訊(「dto：dispasp」、「dto：RPoffset」)等。

又，字幕解碼器210，係將TS解析部202所得到的字幕PES封包中所含之TTML顯示區段(TTML_display_segment)(參照圖16)、字型下載區段(Font_download_segment)(參照圖18)、URL訊令區段(URL_signalin_segment)(參照圖20)予以抽出，送往CPU221。

CPU221，係從TTML顯示區段，取得字幕串流所具有之TTML的作為使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊的尺寸變更處理之相關資訊(「scaling_justify_flag」)、用來決定字幕顯示範圍所需之資訊(「display_aspect_type」、「reference_point_offset_v,reference_point_offset_h」)。

又，CPU221，係從字型下載區段，取得字幕串流所具有之TTML中所含之用來將已被字型指定資訊所指定之字型之檔案從播送訊號(傳輸串流TS)進行下載所需之資訊(「font_file_id」、「ISO_639_language_code」、「font_group_id」、「font_name_id」等)。

又，CPU221係從URL訊令區段，取得字幕串流所具有之TTML中所含之用來將已被字型指定資訊所指定之字型之檔案從網路上的伺服器進行下載所需之資訊(「ISO_639_language_code」、「font_group_id」、「font_name_id」、「url_type」、「URL」等)。

又，字幕解碼器210，係基於CPU221之控制，將TTML中所含之各字幕顯示位置(區域)的字幕(subtitle)之本文資料(字型資料)，轉換成點陣圖資料(二進位影像資訊)。此情況下，字幕的字型尺寸，係基於CPU221之控制，隨應於已被字幕顯示位置資訊所決定的，或是還被尺寸變更處理所得到的字幕顯示位置之大小，從已被TTML所指定的字型尺寸，進行適宜調整。

CPU221，係基於字幕顯示位置資訊來決定字幕顯示位置，然後，因應需要，對已被決定之字幕顯示位置，實施尺寸變更處理。此時，CPU221，係適宜地使用，如上述被***至TTML、PES封包、PMT等中的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)。CPU221中的字幕顯示位置之決定及尺寸變更處理之程序的細節，係還會後述。

又，字幕解碼器210，係基於CPU221之控制，在獲得字幕之點陣圖資料之際，使用被TTML所具有之字型指定資訊所指定的字型之檔案。在電視收訊機200沒有搭載被字型指定資訊所指定之字型的檔案時，CPU221係適宜地，基於如上述被***至PES封包、PMT等的下載資訊，將該當字型檔案，從播送訊號(傳輸串流TS)或網路上的伺服器進行下載而使用。此外，在該當檔案之下載無法進行時，則使用代用的字型檔案(例如預設的字型檔案)。關於CPU221中的使用字型檔案之決定處理之程序之細節，係還會後述。

視訊重疊部204，係基於CPU221之控制，對視訊解碼器203所得到的視訊資料，重疊字幕解碼器210所得到的各字幕顯示位置的字幕之點陣圖資料，獲得顯示用視訊資料。此情況下，CPU221，係如上述，基於已被字幕顯示位置資訊所決定之、或是還經過尺寸變更處理所得到的字幕顯示位置，進行控制以使得字幕之點陣圖資料的重疊位置會是字幕顯示位置。

面板驅動電路205，係基於視訊重疊部204所得的顯示用的視訊資料，來驅動顯示面板206。顯示面板206係由例如：LCD(Liquid Crystal Display)、有機EL顯示器(organic electroluminescence display)等所構成。

簡單說明圖35所示的電視收訊機200之動作。在收訊部201中，從播送送出系統100被裝載於播送波而被發送過來的傳輸串流TS，會被接收。該傳輸串流TS中係含有視訊串流、音訊串流及字幕串流。該傳輸串流TS係被供給至TS解析部202。在TS解析部202中，係從傳輸串流TS，抽出視訊、音訊、字幕之各串流的PES封包。

又，在TS解析部202中，被***至傳輸串流TS中的各種資訊會被抽出，被送往CPU221。該資訊中係也含有：TTML顯示描述元、字型下載描述元及URL訊令描述元。

藉此，在CPU221中，字幕串流所具有之TTML的使用字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊(尺寸處理之相關資訊、用來決定字幕顯示範圍所需之資訊，會被取得。又，在CPU221中，字幕串流所具有之TTML中所含之用來將已被字型指定資訊所指定之字型之檔案從播送訊號(傳輸串流TS)或網路上的伺服器進行下載所需之下載資訊，會被取得。

又，在TS解析部202中，被字幕串流所具有之TTML中所含之字型指定資訊所指定之字型的檔案從播送訊號(傳輸串流TS)進行下載之際，會從傳輸串流TS抽出FDT，送往CPU221。藉此，在CPU221中，被字幕串流所具有之TTML中所含之字型指定資訊所指定之字型的檔案，就被取得。

已被TS解析部202所抽出的視訊PES封包，係被供給至視訊解碼器203。在視訊解碼器203中，係對該視訊PES封包實施解碼處理，獲得視訊資料。此情況下，在視訊解碼器203中，係也會因應顯示模式等，適宜地進行視訊資料的解析度轉換。

又，被TS解析部202所抽出的字幕PES封包，係被供給至字幕解碼器210。在該字幕解碼器210中，對TS解析部202所得到的字幕PES封包實施解碼處理，獲得TTML。該TTML係被送往CPU221。在CPU221中，係從該TTML，取得將字幕顯示位置(區域)以相對於字幕顯示範圍的相對位置(比例值)加以指定的字幕顯示位置資訊，還有使用該字幕顯示位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)等。

又，在字幕解碼器210中，係從TS解析部202所得到的字幕PES封包中抽出TTML顯示區段、字型下載區段及URL訊令區段，送往CPU221。

在字幕解碼器210中，係基於CPU221之控制，TTML中所含之各字幕顯示位置(區域)的字幕(subtitle)之本文資料(字型資料)，會被轉換成點陣圖資料(二進位影像資訊)。此情況下，字幕的字型尺寸，係基於CPU221之控制，隨應於已被字幕顯示位置資訊所決定的，或是還被尺寸變更處理所得到的字幕顯示位置之大小，從已被TTML所指定的字型尺寸，進行適宜調整。

又，此情況下，在獲得字幕之點陣圖資料之際，基本上，被TTML所具有之字型指定資訊所指定的字型之檔案，會被使用。在電視收訊機200沒有搭載被字型指定資訊所指定之字型的檔案時，基於被***至PES封包、PMT等的下載資訊，該當字型檔案，係被從播送訊號(傳輸串流TS)或網路上的伺服器進行下載而使用。此時，在無法下載該當字型檔案時，代用的字型檔案會被使用。

在CPU221中，係基於字幕顯示位置資訊來決定字幕顯示位置，然後，因應需要，對已被決定之字幕顯示位置，實施尺寸變更處理。此時，在CPU221中，如上述被***至TTML、PES封包、PMT等中的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)，係被適宜地使用。

從字幕解碼器210所被輸出的各字幕顯示位置的字幕之點陣圖資料，係被供給至視訊重疊部204。在視訊重疊部204中，對視訊解碼器203所得到的視訊資料，係會重疊字幕解碼器210所得到的各字幕顯示位置的字幕之點陣圖資料，獲得顯示用的視訊資料。此情況下，藉由CPU221，基於已被字幕顯示位置資訊所決定之、或是還經過尺寸變更處理所得到的字幕顯示位置，來進行控制，以使得字幕之點陣圖資料的重疊位置會是字幕顯示位置。

視訊重疊部204所得到的顯示用的視訊資料，係被供給至面板驅動電路205。在面板驅動電路205中，係基於顯示用的視訊資料，來驅動顯示面板206。藉此，在顯示面板206中係會顯示出，在各字幕顯示位置(區域)中重疊有顯示字幕(subtitle)的影像。

又，已被TS解析部202所抽出的音訊PES封包，係被供給至音訊解碼器207。在音訊解碼器207中，係對該音訊PES封包實施解碼處理，獲得音訊資料。該音訊資料，係被供給至音訊輸出電路208。在音訊輸出電路208中，係對音訊資料，進行D/A轉換或增幅等之必要的處理。然後，處理後的音訊資料係被供給至揚聲器209。藉此，從揚聲器209就會獲得對應於顯示面板206之顯示影像的聲音輸出。

「字幕顯示位置之決定及尺寸變更處理之程序」

說明CPU221中的字幕顯示位置之決定及尺寸變更處理之程序的細節。圖36的流程圖係圖示了，CPU221中的字幕顯示位置之決定及尺寸變更處理之程序之一例。

在此例子中，想定視訊領域的長寬比為16：9。然後想定了，會有如圖37(a)所示般地在TTML中沒有指定字幕顯示範圍的情況、和如圖37(b)、(c)所示般地在TTML中有指定字幕顯示範圍的情況之雙方。此外，此處，雖然例示所被指定之字幕顯示範圍的長寬比為16：9與4：3的例子，但所被指定之字幕顯示範圍的長寬比係不限定於此。又，此處，想定了監視器(顯示器)的長寬比為16：9之情況與4：3之情況之雙方。

CPU221，係在步驟ST1中開始處理，其後進入步驟ST2之處理。於此步驟ST2中，CPU221係判斷收訊機顯示是否為視訊全領域顯示模式。例如，監視器的長寬比為16：9的情況下(參照圖37(f))，或監視器的長寬比為4：3且採用信籤黑邊(Letter box)之顯示方法的情況下(參照圖37(g))，則判斷為視訊全領域顯示模式。又，例如，監視器的長寬比為4：3且採用中央裁切(Center-cut)之顯示方法的情況下(參照圖37(h))，則判斷為非視訊全領域顯示模式。

CPU221係在判斷為視訊全領域顯示模式時，進入步驟ST3之處理。於該步驟ST3中，CPU221係判斷是否有字幕顯示範圍之指定。例如，在TTML的tt根容器中存在有字幕顯示範圍的基準點資訊(RPoffset)及長寬比資訊(dispasp)的情況下，則判斷為有字幕顯示範圍之指定。

在無字幕顯示範圍之指定時，CPU221係進入步驟ST4之處理。於該步驟ST4中，CPU221係將顯示視訊領域視為字幕顯示範圍，決定字幕顯示位置(區域)。此時，CPU221，係將顯示視訊領域之頂端-左端(top-left)視為基準點RP，按照以相對於字幕顯示範圍的相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)之指示，來決定字幕顯示位置(區域)。

圖38(a)係圖示了監視器的長寬比為16：9時的例子。圖38(b)係圖示了監視器的長寬比為4：3且採用信籤黑邊(Letter box)之顯示方法時的例子。此外，“RP”係表示字幕顯示範圍之頂端-左端(top-left) 的基準點(Reference Pont)。

該步驟ST4的處理之後，CPU221係於步驟ST5中，結束處理。

在上述的步驟ST3中有字幕顯示範圍之指定時，CPU221係進入步驟ST6之處理。於該步驟ST6中，CPU221係於所被指定的字幕顯示範圍中，決定字幕顯示位置(區域)。此時，CPU221，作為字幕顯示範圍之資訊是僅使用長寬比資訊(dispasp)，在顯示視訊領域上設定字幕顯示範圍。然後，CPU221，係將字幕顯示範圍之頂端-左端(top-left)視為基準點RP，按照以相對於字幕顯示範圍的相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)之指示，來決定字幕顯示位置(區域)。

圖39(a)係圖示了監視器的長寬比為16：9，且長寬比資訊(dispasp)所示的長寬比為16：9時的例子。圖39(b)係圖示了監視器的長寬比為16：9，且長寬比資訊(dispasp)所示的長寬比為4：3時的例子。

此外，在如此長寬比資訊(dispasp)所示的長寬比是與監視器的長寬比不同的情況下，CPU221係在顯示視訊領域的中央設定：垂直方向幅度或是水平方向幅度呈一致、且長寬比資訊(dispasp)所示之長寬比的字幕顯示範圍。在圖示的例子中，監視器的長寬比為16：9，且長寬比資訊(dispasp)為4：3，因此垂直方向幅度為一致。

圖39(c)係圖示了監視器的長寬比為4：3並採用信籤黑邊之顯示方法，且長寬比資訊(dispasp)所示的長寬比為16：9時的例子。圖39(d)係圖示了監視器的長寬比為4：3並採用信籤黑邊之顯示方法，且長寬比資訊(dispasp)所示的長寬比為4：3時的例子。

該步驟ST6的處理之後，CPU221係於步驟ST5中，結束處理。

在上述的步驟ST2中判斷為非視訊全領域顯示模式時，進入步驟ST7之處理。於該步驟ST7中，CPU221係判斷是否有字幕顯示範圍之指定。例如，在TTML的tt根容器中存在有字幕顯示範圍的基準點資訊(RPoffset)及長寬比資訊(dispasp)的情況下，則判斷為有字幕顯示範圍之指定。

在無字幕顯示範圍之指定時，CPU221係進入步驟ST8之處理。於該步驟ST8中，CPU221係將顯示視訊領域視為字幕顯示範圍，決定字幕顯示位置(區域)。此時，CPU221，係將顯示視訊領域之頂端-左端(top-left)視為基準點RP，按照以相對於字幕顯示範圍的相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)之指示，來決定字幕顯示位置(區域)。

如此被決定之字幕顯示位置，係只有水平方向會壓縮其幅度。因此，CPU221，係還對已被決定之字幕顯示位置實施尺寸變更處理，也將垂直方向之幅度予以壓縮，獲得最終的字幕顯示位置。此情況下，CPU221，係例如，基於TTML中所含之「dto：scalingjustify=top」之資訊，以把所定之掃描線位置設成固定的狀態，進行垂直方向的幅度之壓縮。

圖40(a)係圖示了監視器的長寬比為4：3且採用中央裁切(Center-cut)之顯示方法時的例子。字幕顯示位置的垂直方向之幅度，係藉由尺寸變更處理，而從EV%被壓縮成EVu%。

該步驟ST8的處理之後，CPU221係於步驟ST5中，結束處理。

在上述的步驟ST7中有字幕顯示範圍之指定時，CPU221係進入步驟ST9之處理。於該步驟ST9中，CPU221係於所被指定的字幕顯示範圍中，決定字幕顯示位置(區域)。此時，CPU221，係使用字幕顯示範圍之資訊(基準點資訊(RPoffset)、長寬比資訊(dispasp))，在顯示視訊領域上設定字幕顯示範圍。

此情況下，CPU221係將從顯示視訊領域的頂端-左端(top-left)起偏移了基準點資訊(RPoffset)量的位置視為字幕顯示範圍的頂端-左端(top-left)，將長寬比資訊(dispasp)所示之長寬比所對應之範圍，設定成字幕顯示範圍。此情況下，字幕顯示範圍的水平方向幅度，係和顯示視訊領域的水平方向幅度一致。

然後，CPU221，係將如上述所被設定之字幕顯示範圍之頂端-左端(top-left)視為基準點RP，按照以相對於字幕顯示範圍的相對位置而被指定的字幕顯示位置資訊(「origin=“OH%OV%”」、「extent=“EH%EV%”」)之指示，來決定字幕顯示位置(區域)。

圖40(b)係圖示了監視器的長寬比為4：3並採用中央裁切之顯示方法，且長寬比資訊(dispasp)所示的長寬比為16：9時的例子。圖40(c)係圖示了監視器的長寬比為4：3並採用中央裁切之顯示方法，且長寬比資訊(dispasp)所示的長寬比為4：3時的例子。

該步驟ST9的處理之後，CPU221係於步驟ST5中，結束處理。

「使用字型檔案之決定處理之程序」

說明CPU221中的使用字型檔案之決定處理之程序之細節。圖41的流程圖係圖示了，CPU221中的使用字型檔案之決定處理之程序之一例。

CPU221，係在步驟ST11中開始處理，其後進入步驟ST12之處理。於該步驟ST12中，CPU221係以TTML接收字型指定。亦即，CPU221，係將含有字型指定資訊的TTML，從字幕解碼器210予以收取。

接著，CPU221，係於步驟ST13中，判斷電視收訊機200是否有搭載已被TTML之字型指定資訊所指定之字型檔案、指定字型檔案。在判斷為有搭載指定字型檔案時，CPU221係於步驟ST14中，決定要使用所搭載的指定字型檔案，其後於步驟ST15中，結束處理。

在步驟ST13中判斷為沒有搭載指定字型檔案時，CPU221係於步驟ST16中，判斷是否藉由私人節區表、亦即FDT(Font_downloading_section table)，而供給了指定字型檔案。此情況下，CPU221，係在字型下載區段(Font_download_segment)(參照圖18)、或是字型下載描述元(Font_download_descriptor)(參照圖23)，是含有指定字型檔案之下載資訊的情況下，則判斷為藉由FDT而被供給了指定字型檔案。

在判斷為藉由FDT而被供給了指定字型檔案時，CPU221，係於步驟ST17中，判斷是否從輪播傳輸成功下載了指定字型檔案。在成功下載了指定字型檔案時，CPU221係於步驟ST14中，決定要使用已被下載的指定字型檔案，其後於步驟ST15中，結束處理。

在步驟ST17中沒有成功下載了指定字型檔案之下載時，CPU221係進入步驟ST18之處理。於步驟ST16中判斷為並未藉由FDT而供給了指定字型檔案時也是，CPU221係進入該步驟ST18之處理。

於該步驟ST18中，CPU221，係判斷是否有指定字型檔案之下載用的URL資訊。此情況下，CPU221，係在URL訊令區段(URL_signalin_segment)(參照圖20)、或是URL訊令描述元(URL_signaling_descriptor)(參照圖24)，是含有指定字型檔案之下載用的URL資訊的情況下，則判斷為有指定字型檔案之下載用的URL資訊。

在判斷為有指定字型檔案之下載用的URL資訊時，CPU221，係於步驟ST19中，判斷是否從網路上的伺服器成功下載了指定字型檔案。在成功下載了指定字型檔案時，CPU221係於步驟ST14中，決定要使用已被下載的指定字型檔案，其後於步驟ST15中，結束處理。

在步驟ST19中沒有成功下載了指定字型檔案之下載時，CPU221係進入步驟ST20之處理。於步驟ST18中判斷為沒有指定字型檔案之下載用的URL資訊時也是，CPU221係進入該步驟ST20之處理。

於該步驟ST20中，CPU221，係決定不使用指定字型檔案，而使用代用之字型檔案，例如預設的字型之檔案，其後於步驟ST15中，結束處理。

如以上所說明，於圖1所示的收送訊系統10中，播送送出系統100係在字幕串流的容器(例如PES封包、PMT)中，***使用字幕位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)。因此，在收訊側，藉由與字幕位置資訊一併使用該輔助資訊，就可適切地取得字幕顯示位置而良好地進行字幕顯示。

又，於圖1所示的收送訊系統10中，電視收訊機200係基於使用字幕顯示位置資訊及輔助資訊而被取得的字幕顯示位置，而對字幕之點陣圖資料進行顯示位置控制。因此，可良好地進行字幕顯示。

又，於圖1所示的收送訊系統10中，播送送出系統100係在字幕串流的容器(例如PES封包、PMT)中，***用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊。因此，在收訊側是不具有被字型指定資訊所指定之字型的檔案的情況下，可基於該當下載資訊來取得被字型指定資訊所指定之字型的檔案，可良好地進行字幕顯示。

又，於圖1所示的收送訊系統10中，電視收訊機200係基於下載資訊而取得已被字型指定資訊所指定之字型的字型檔案，使用於獲得字幕之點陣圖資料之際。因此，即使在不具有被字型指定資訊所指定之字型的檔案的情況下，仍可良好地進行字幕顯示。

<2.變形例>

此外，於上述實施形態中，例示了在TTML中被***有字型下載資訊的例子(參照圖3、圖5)。可是，該TTML中，亦可考慮***字型下載資訊。圖42係圖示了此情況下的TTML結構之一例。此例子係和圖5同樣地地，字幕顯示位置(區域)為2個時的例子。「fontdlurl=http：//www.w3.org/ns/fontdlservice」、「fontdlurl：iso639languagecode="value"」、「fontdlurl：fontgroupid="value"」、「fontdlurl：fontnameid="value"」、「fontdlurl：fontname="value”」之各資訊係構成了下載資訊。此外，「fontdlurl：fontname」的"value”中，係直接反映出‘Arial’,‘Tahoma’之指定。

又，於上述實施形態中係展示了，作為所定格式之字幕之本文資訊是使用TTML的例子。可是，本技術係不限定於此，亦可考慮使用具有與TTML同等之資訊的其他本文資訊。例如，亦可使用TTML的衍生格式。

又，於上述實施形態中，係雖然展示了由播送送出系統100和電視收訊機200所成之收送訊系統10，但能夠適用本技術的收送訊系統之構成，係不限定於此。例如，電視收訊機200的部分，亦可為以HDMI(High-Definition Multimedia Interface)等之數位介面所被連接的機上盒及監視器之構成等。此外，「HDMI」係為註冊商標。

又，於上述實施形態中係展示了，容器是MPEG-2 TS之傳輸串流的例子。本技術係即使容器為MMT之傳輸串流或是DASH/ISOBMFF串流等的情況下，當然仍可同樣地適用。

又，本技術係亦可採取如下之構成。

(1)一種送訊裝置，係具備：送訊部，係發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和資訊***部，係在上記字幕串流之容器中，***使用上記字幕位置資訊來顯示字幕時所被使用的輔助資訊。

(2)如前記(1)所記載之送訊裝置，其中，上記輔助資訊係含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於上記字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊。

(3)如前記(2)所記載之送訊裝置，其中，上記尺寸變更處理之相關資訊係為，以上記字幕顯示位置之尺寸變更處理將垂直方向之尺寸予以壓縮的情況下表示應視為固定位置之掃描線位置的資訊。

(4)如前記(1)至(3)之任一項所記載之送訊裝置，其中，上記輔助資訊係含有：用來決定上記字幕顯示範圍所需之資訊。

(5)如前記(4)所記載之送訊裝置，其中，用來決定上記字幕顯示範圍所需之資訊，係為上記字幕顯示範圍的基準點資訊及長寬比資訊。

(6)如前記(1)至(5)之任一項所記載之送訊裝置，其中，上記資訊***部，係將上記輔助資訊，***至PES封包及/或節目對映表。

(7)一種送訊方法，係具有：送訊步驟，係藉由送訊部，發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和資訊***步驟，係在上記字幕串流之容器中，***使用上記字幕位置資訊而顯示字幕時所被使用的輔助資訊。

(8)一種收訊裝置，係具備：收訊部，係接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和視訊解碼部，係對上記視訊串流實施解碼處理而獲得視訊資料；和字幕解碼部，係對上記字幕串流實施解碼處理而獲得字幕之點陣圖資料；在上記字幕串流之容器中係被***有，使用上記字幕位置資訊來顯示字幕時所被使用的輔助資訊；還具備有：顯示控制部，係基於使用上記字幕顯示位置資訊及上記輔助資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制；和視訊重疊部，係將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料。

(9)如前記(8)所記載之收訊裝置，其中，上記輔助資訊係含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於上記字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊；上記顯示控制部，係在視訊領域的長寬比與上記顯示視訊領域的長寬比為不同的情況下，將顯示視訊領域當作字幕顯示範圍而基於上記字幕顯示位置資訊來決定字幕顯示位置，在該已被決定之字幕顯示位置使用上記尺寸變更處理之相關資訊來實施尺寸變更處理，基於已被實施過該尺寸變更處理的字幕顯示位置而對上記字幕之點陣圖資料進行顯示位置控制。

(10)如前記(8)所記載之收訊裝置，其中，上記輔助資訊係含有：用來決定上記字幕顯示範圍所需之資訊；上記顯示控制部，係在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，基於用來決定上記字幕顯示範圍所需之資訊而在顯示視訊領域中設定字幕顯示範圍，基於上記字幕顯示位置資訊來決定字幕顯示位置，基於該已被決定之字幕顯示位置而對上記字幕之點陣圖資料進行顯示位置控制。

(11)一種收訊方法，係具有：收訊步驟，係藉由收訊部，接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；和視訊解碼步驟，係對上記視訊串流實施解碼處理而獲得視訊資料；和字幕解碼步驟，係對上記字幕串流實施解碼處理而獲得字幕之點陣圖資料；在上記字幕串流之容器中係被***有，使用上記字幕位置資訊來顯示字幕時所被使用的輔助資訊；還具有：顯示控制步驟，係基於使用上記字幕顯示位置資訊及上記輔助資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制；和視訊重疊步驟，係將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料。

(12)一種送訊裝置，係具備：送訊部，係發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和資訊***部，係在上記字幕串流之容器中***：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊。

(13)如前記(12)所記載之送訊裝置，其中，上記下載資訊係為，用來從播送訊號取得上記字型檔案所需之資訊。

(14)如前記(12)或(13)所記載之送訊裝置，其中，上記下載資訊係為，用來從網路上的伺服器取得上記字型檔案所需之資訊。

(15)如前記(12)至(14)之任一項所記載之送訊裝置，其中，上記資訊***部，係將上記下載資訊，***至PES封包及/或節目對映表。

(16)一種送訊方法，係具有：送訊步驟，係藉由送訊部，發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和資訊***步驟，係在上記字幕串流之容器中***：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊。

(17)一種收訊裝置，係具備：收訊部，係接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和視訊解碼部，係對上記視訊串流實施解碼處理而獲得視訊資料；在上記字幕串流之容器中係被***有：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊；還具備有：字型檔案下載部，係基於上記下載資訊而取得已被上記字型指定資訊所指定之字型的字型檔案；和字幕解碼部，係對上記字幕串流實施解碼處理而基於上記所被取得之字型檔案來獲得字幕之點陣圖資料；和顯示控制部，係基於使用上記字幕顯示位置資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制；和視訊重疊部，係將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料。

(18)一種收訊方法，係具有：收訊步驟，係藉由收訊部，接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有字型指定資訊；和視訊解碼步驟，係對上記視訊串流實施解碼處理而獲得視訊資料；在上記字幕串流之容器中係被***有：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊；還具有：字型檔案下載步驟，係基於上記下載資訊而取得已被上記字型指定資訊所指定之字型的字型檔案；和字幕解碼步驟，係對上記字幕串流實施解碼處理而基於上記所被取得之字型檔案來獲得字幕之點陣圖資料；和顯示控制步驟，係基於使用上記字幕顯示位置資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制；和視訊重疊步驟，係將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料。

(19)一種送訊裝置，係具備：節區表***部，係在傳輸串流中，將具有各自不同之字型檔案的所定數之節區表，予以依序重複***；和送訊部，係將已被***有上記節區表的傳輸串流，予以發送。

(20)一種送訊方法，係具有：節區表***步驟，係在傳輸串流中，將具有各自不同之字型檔案的所定數之節區表，予以依序重複***；和送訊步驟，係藉由送訊部，將已被***有上記節區表的傳輸串流，予以發送。

本技術的主要特徵為，在字幕串流的容器(例如PES封包、PMT)中，***使用字幕位置資訊來顯示字幕時所被使用的輔助資訊(尺寸變更處理之相關資訊、用來決定字幕顯示範圍所需之資訊)，藉此，在收訊側，可與字幕位置資訊一併使用該輔助資訊而適切地取得字幕顯示位置而良好地進行字幕顯示(參照圖34)。

又，本技術的主要特徵為，在字幕串流的容器(例如PES封包、PMT)中，***用來下載至少已被TTML之字型指定資訊所指定之字型之檔案所需之下載資訊，藉此，在不具有被字型指定資訊所指定之字型的檔案的情況下，可基於該當下載資訊來取得被字型指定資訊所指定之字型的檔案，可良好地進行字幕顯示(參照圖34)。

Claims

一種送訊裝置，係具備電路，係被構成為：發送含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；其中，上記字幕顯示範圍係為被設定在顯示視訊領域中的用來顯示字幕所需之領域，上記顯示視訊領域係為在收訊側的監視器中所被顯示之視訊領域；在上記字幕串流之容器中，***使用上記字幕位置資訊來顯示字幕時所被使用的輔助資訊；其中，上記輔助資訊中係含有用來決定上記字幕顯示範圍所需之資訊；在傳輸串流中，將分別具有不同之字型檔案的所定數之節區表，予以依序重複***；其中，上記所定數之節區表的上記節區表係含有被定義作為私人節區表的具有複數欄位的字型下載節區表；將已被***有上記節區表的上記傳輸串流，予以發送。
如請求項1所記載之送訊裝置，其中，上記輔助資訊係含有：在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於上記字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊。
如請求項2所記載之送訊裝置，其中，上記尺寸變更處理之相關資訊係為，以上記字幕顯示位置之尺寸變更處理將垂直方向之尺寸予以壓縮的情況下表示應視為固定位置之掃描線位置的資訊。
如請求項1所記載之送訊裝置，其中，上記輔助資訊係含有：用來決定上記字幕顯示範圍所需之資訊。
如請求項4所記載之送訊裝置，其中，用來決定上記字幕顯示範圍所需之資訊，係為上記字幕顯示範圍的基準點資訊及長寬比資訊。
如請求項1所記載之送訊裝置，其中，上記電路係進一步被構成為：將上記輔助資訊，***至PES(packetized elementary stream)封包及/或節目對映表。
如請求項1所記載之送訊裝置，其中，上記本文資訊係具有字型指定資訊；上記電路部係進一步被構成為，在上記字幕串流之容器中***：用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊。
如請求項7所記載之送訊裝置，其中，上記下載資訊係為，用來從播送訊號取得上記字型檔案所需之資訊。
如請求項7所記載之送訊裝置，其中，上記下載資訊係為，用來從網路上的伺服器取得上記字型檔案所需之資訊。
如請求項7所記載之送訊裝置，其中，上記資訊***部，係將上記下載資訊，***至PES封包及/或節目對映表。
如請求項1所記載之送訊裝置，其中，上記所定數之節區表係含有：含有字型表的第1節區表、和分別含有1個不同之字型檔案的複數第2區節表。
如請求項1所記載之送訊裝置，其中，上記複數欄位係包含：「data_downloading_id」欄位、「section_number」欄位、及「last_section_number」欄位。
如請求項12所記載之送訊裝置，其中，上記「data_downloading_id」欄位中係含有：用來識別上記所定數之節區表之每一者的複數值；上記「section_number」欄位中係含有：用來識別上記所定數之節區表之一者的上記複數值中的值；上記「last_section_number」欄位中係含有：用來識別上記所定數之節區表之最後一者的上記複數值中的值。
一種收訊裝置，係具備電路，係被構成為：接收含有視訊串流和字幕串流的所定格式之容器，其中，該視訊串流係具有視訊資料，該字幕串流係具有字幕之本文資訊，該字幕之本文資訊係具有：將字幕顯示位置以相對於字幕顯示範圍之相對位置來加以指定的字幕顯示位置資訊；其中，上記字幕顯示範圍係為被設定在顯示視訊領域中的用來顯示字幕所需之領域，上記顯示視訊領域係為在收訊側的監視器中所被顯示之視訊領域；上記視訊串流係含有傳輸串流，其係被依序重複***分別具有不同之字型檔案的所定數之節區表；上記所定數之節區表的上記節區表係含有被定義作為私人節區表的具有複數欄位的字型下載節區表；控制：將上記視訊串流予以解碼而獲得視訊資料的處理、和將上記字幕串流予以解碼而獲得字幕之點陣圖資料的處理、和基於使用上記字幕顯示位置資訊及上記字幕串流之容器中所被***之使用上記字幕位置資訊來顯示字幕時所被使用之輔助資訊而被取得的字幕顯示位置，而對上記字幕之點陣圖資料進行顯示位置控制的處理、和辨識上記區節表的位置關係，而在一次巡迴中取得字幕用之區節表的不同字型檔案的處理、和將進行過上記顯示位置控制的字幕之點陣圖資料，重疊至上記視訊資料的處理；上記輔助資訊係從上記字幕串流的容器被抽出，並含有用來決定上記字幕顯示範圍所需之資訊。
如請求項14所記載之收訊裝置，其中，上記輔助資訊係含有；在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下在收訊側中所被進行的，基於上記字幕顯示位置資訊而被決定的字幕顯示位置之尺寸變更處理之相關資訊；在進行上記顯示位置控制的處理中，在視訊領域的長寬比與上記顯示視訊領域的長寬比為不同的情況下，將顯示視訊領域當作字幕顯示範圍而基於上記字幕顯示位置資訊來決定字幕顯示位置，在該已被決定之字幕顯示位置使用上記尺寸變更處理之相關資訊來實施尺寸變更處理，基於已被實施過該尺寸變更處理的字幕顯示位置而對上記字幕之點陣圖資料進行顯示位置控制。
如請求項14所記載之收訊裝置，其中，上記輔助資訊係含有：用來決定上記字幕顯示範圍所需之資訊；在進行上記顯示位置控制的處理中，在視訊領域的長寬比與顯示視訊領域的長寬比為不同的情況下，基於用來決定上記字幕顯示範圍所需之資訊而在顯示視訊領域中設定字幕顯示範圍，基於上記字幕顯示位置資訊來決定字幕顯示位置，基於該已被決定之字幕顯示位置而對上記字幕之點陣圖資料進行顯示位置控制。
如請求項14所記載之收訊裝置，其中，上記本文資訊係具有字型指定資訊；上記電路係進一步被構成為，控制：基於上記字幕串流之容器中所被***的用來下載至少已被上記字型指定資訊所指定之字型之檔案所需之下載資訊而取得已被上記字型指定資訊所指定之字型的字型檔案的處理、和將上記字幕串流予以解碼並基於上記已被取得之字型檔案而獲得字幕之點陣圖資料的處理、和將上記字幕之點陣圖資料重疊至上記視訊資料的處理。