CN1914684A - 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置 - Google Patents
具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置 Download PDFInfo
- Publication number
- CN1914684A CN1914684A CN 200480041527 CN200480041527A CN1914684A CN 1914684 A CN1914684 A CN 1914684A CN 200480041527 CN200480041527 CN 200480041527 CN 200480041527 A CN200480041527 A CN 200480041527A CN 1914684 A CN1914684 A CN 1914684A
- Authority
- CN
- China
- Prior art keywords
- dialog
- presentation segment
- dialog presentation
- segment
- recording medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
在用于管理文本字幕的数据结构中,对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据。对话呈现段提供定义呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使该呈现时隙不会与另一对话呈现段的呈现时隙重叠。
Description
技术领域
本发明涉及诸如只读蓝光盘(BD-ROM)等高密度记录介质。
背景技术
光盘作为光学记录介质而被广泛使用。近来,在各种光盘之中,一种用于记录并存储大最高清晰度的视频和音频数据的新型高密度光学记录介质(HD-DVD),诸如蓝光盘(以下称为“BD”)正在开发当中。目前,作为一种可存储的数据量远超过目前的DVD的下一代光学记录方案,下一代HD-DVD技术-蓝光盘(BD)的全球标准技术规范正在建立当中。
与此相关,蓝光盘(BD)标准的光学再现装置的开发也已经启动。但是,蓝光盘(BD)标准尚未完成,要开发完整的光学再现装置很困难。
尤其是,为能有效地再现来自蓝光盘(BD)的数据,作为主AV数据的补充,可再现诸如增补数据或补充数据(交互式图形数据、字幕数据等)等与主AV流相关的各种其它数据来为用户提供方便。由此,应提供管理信息来管理主数据和补充数据的再现。但是,在目前的蓝光盘(BD)标准中,因为管理各种数据尤其是补充数据的统一标准尚未完成,所以在蓝光盘(BD)光学再现装置的开发上就有很多的限制。
发明的开示
根据本发明的记录介质包括用于管理文本字幕的再现的数据结构。
在一个实施例中,该记录介质存储对话呈现段,它包括呈现时隙里呈现的每个文本字幕的文本字幕数据。对话呈现段提供定义呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使呈现时隙不会与另一对话呈现段的呈现时隙重叠。
在一个实施例中,对话呈现段定义若干个区域,并且每个区域都提供文本字幕数据。文本字幕数据可以是文本串和样式数据中的一种。
在另一个实施例中,对话呈现段参照每个区域的区域样式,并且所参照的区域样式定义区域的位置和大小。
在又一个实施例中,对话呈现段包括每个区域的连续呈现信息,它指示是否要从前一对话呈现段连续再现该区域。在此实施例中,当对话呈现段中的区域的连续呈现信息指示连续再现时,对话呈现段的呈现时间戳开始时间等于前一对话呈现段的对话呈现时间戳结束时间。
在另一个实施例中,记录介质存储文本字幕流。文本字幕流包括对话样式段,后面跟着一个或多个对话呈现段。对话样式段定义一种或多种样式。每个对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,并且每个对话呈现段参照对话样式段中的至少一种样式。
本发明还提供用于记录和再现根据本发明的数据结构的装置和方法。
附图简述
包括附图是为提供对本发明进一步的理解,它们被收录并构成此申请的一部分,附图示出了本发明的实施例,它们与说明书一起起到解释本发明的原理的作用。在附图中:
图1示出根据本发明的示例性实施例的用于管理盘上的各种数据的文件结构;
图2示出根据本发明的BD-ROM的盘卷的示例性实施例;
图3是根据本发明的一个实施例的在显示屏幕上显示的文本字幕流的图像的示意图;
图4图示出根据本发明的一个实施例的再现/管理文本字幕的数据结构和方法;
图5A到5C示出根据本发明的记录在文本字幕内的文本字幕回放管理信息,其中分别解释了对话信息、区域信息和样式信息(Style Info);
图6A和图6B示出使用对话、区域和样式信息作为文本字幕再现/管理信息来提供文本字幕的数据结构和方法;
图7是根据本发明的一个实施例的文本字幕流文件结构的示意图;
图8、图9A-9C到图10A-10C是根据本发明的实施例的文本字幕流的数据结构句法的示意图;以及
图11是根据本发明的一个实施例的光学记录/再现装置的框图。
实现本发明的最佳模式
现在将详细参考本发明的优选实施例,其示例在附图中示出。在可能的情况下,所有附图中将使用相同的附图标记来表示相同或相似的部分。
尽管本发明中所使用的词语是从广泛使用的一般词语中选择的,但是这些是申请人根据自己的意思选择的词语,并且这些词语的具体意思在本发明说明书的相关部分中描述。由此,本发明应根据公开中所提供的词语的意义来理解。就与本发明相关的术语而言,‘主数据’是诸如由作者提供给用户的语音和声音数据等记录在记录介质(例如,光盘)中的信息(例如,标题信息)。‘主数据’一般记录为MPEG2格式,并可被称为‘主AV流’。
‘辅助或补充数据’是与‘主数据’相关联、并为方便用户回放‘主数据’而提供的数据。例如,补充数据包括字幕信息、交互式图形流、呈现图形流、声音信息、可浏览幻灯片的辅助音频数据等。根据相应辅助数据的特征,‘辅助数据’可被记录为MPEG2格式并与主AV流多路复用,或可被记录为独立于主AV流的MPEG2格式或其它格式的流文件。
作为辅助数据的‘字幕’是一种文字说明信息。‘字幕’是指在想要观看当前播放的具有特定语言的文字说明的视频(主AV数据)的用户选择记录介质所支持的字幕中该特定语言的字幕的情况下在屏幕一侧显示的信息。因此,‘字幕’可用各种方式来提供。具体而言,记录为文本数据的‘字幕’是‘文本字幕’。
在本发明的以下示例性实施例中,‘文本字幕’被配置成MPEG2格式,并作为例如独立于‘主数据’的流文件而被记录。
参考图1和2来详细描述用于在诸如BD盘等记录介质上记录主数据和补充数据的格式、以及用于管理这些数据的文件结构。
图1示出根据本发明的一个示例性实施例的用于管理盘上的各种数据的文件结构。如图所示,一个根目录下存在至少一个BD目录BDMV。在BD目录BDMV中,包括索引文件index.bdmv和对象文件MovieObject.bdmv作为确保与用户的交互的通用文件(上层文件)信息。此外,BD目录BMDV中还包括播放列表目录PLAYLIST、剪辑信息目录CLIPINF、流目录STREAM以及辅助数据目录AUXDATA。
根据特定格式记录在盘中的称为‘主AV流’的视频和音频流的文件与诸如文本字幕等辅助流(以下称为文本字幕流)在流目录STREAM中独立存在。因为文本字幕流文件和AV流文件被记录为MPEG2格式(例如,MPEG2传输分组),所以每个流文件的扩展名使用“*.m2ts”(例如,01000.m2ts、02000.m2ts和10001.m2ts)。或者,在文本字幕流文件的情形中使用‘*.txtst’作为文件扩展名,因为文本字幕流具有与例如主AV流不同的辅助数据特征。
在BD规范中,AV流可称为剪辑流文件。就本发明而言,文本字幕数据将以独立于AV流文件的单独文件的形式存在。例如在图1中,文本字幕数据作为文本字幕流文件10001.m2ts或10001.txtst而存在。clipinfo(或剪辑信息)目录CLIPINF包括每个都与一个流文件具有一一对应关系的剪辑信息文件*.clpi。剪辑信息文件*.clpi具有相应流文件的属性信息和定时信息,并起到管理文件的作用。更具体地,剪辑信息文件中的信息包括使呈现时间戳(PTS)能映射到相应流文件的源分组的源分组号(SPN)的映射信息。此映射被称为入口点映射或“EP映射”。
流文件和相应的剪辑信息文件可被统称为“剪辑”。由此,剪辑信息目录CLIPINF中的文件“01000.clpi”具有关于流目录STREAM中的文件“01000.m2ts”的属性信息和定时信息,并且文件“01000.clpi”和“01000.m2ts”构成一个剪辑。
播放列表目录PLAYLIST包括播放列表文件*.mpls,它们每一个具有至少一个指定特定剪辑的播放间隔的播放项目PlayItem。播放项目PlayItem包括回放所使用的特定剪辑的播放开始时间In-Time和播放结束时间Out-Time的定时信息,并通过在Clip Information File name字段中提供剪辑信息文件名来标识剪辑。使用In-Time和Out-Time中的PTS信息,所命名的剪辑信息文件的EP映射将允许搜索并获得相应流文件的特定流地址或位置(例如,SPN),从而播放项目的再现导致剪辑的再现。
播放列表文件*.mpls起到基本管理文件的作用,它通过提供至少一个播放项目PlayItem来播放所需的剪辑。此外,播放列表文件*.mpls还可提供用于管理例如补充数据的再现的副播放项目SubPlayItem,其中补充数据可与播放项目PlayItem同步或不同步地再现。例如,在包括用于回放文本字幕的SubPlayItem的情形中,是将相应的SubPlayItem与PlayItem同步来回放数据的。但是,在包括用于回放可浏览幻灯片的音频数据的SubPlayItem的情形中,并不将相应的SubPlayItem与PlayItem同步。
在本发明中,包括文本字幕的辅助数据由例如将在以下详细解释的SubPlayItem管理。
辅助数据目录AUXDATA是用于单独记录回放所用的辅助数据文件的区。例如,为了支持更为用户友好的回放,其中记录了用于提供点击声的声音文件Sound.bmdv、配合文本字幕回放使用的字体文件*.font或*.otf等。
由此,作为一种辅助数据,文本字幕流10001.m2ts可被记录在辅助数据目录AUXDATA中。
此外,在上述BD目录BDMV中,索引文件index.bdmv和对象文件MovieObject.bdmv作为用于确保与用户的交互的通用文件而存在。索引文件index.bdmv具有索引表,它提供可供用户选择的菜单信息和标题信息。MovieObject.bdmv提供例如用于执行播放列表的导航命令,并可从在索引表中作出的选择来调用。
如图2中所示,BD-ROM的盘卷被组织为文件***信息区、数据库区和流区。文件***信息区存储用于管理盘的***信息。数据库区包括通用文件区以及播放列表和剪辑信息区。通用文件区存储诸如index.bdmv文件和MovieObject.bdmv文件等通用文件。播放列表和剪辑信息区存储PLAYLIST目录和CLIPINF目录。主数据和补充数据(STREAM和AUXDATA目录)记录在流区中。据此,再现装置通过使用数据库区中的文件信息和/或流区中的流管理信息来确定需要再现的主数据和补充数据。
因此,经由数据库区内的文件信息和/或流文件区(流区)内的流管理信息,用户决定要再现的主数据和辅助数据及其再现方法。
在以下描述中将描述用于管理文本字幕的再现的管理信息数据结构,并将描述使用所记录的管理信息来记录和再现管理信息及文本字幕的方法。
图3根据本发明的一个实施例示出文本字幕数据和主数据同时显示在显示屏幕上,其中文本字幕在时间上与主数据同步。
图4图示出根据本发明的一个实施例的用于再现/管理文本字幕的数据结构和方法。如图所示,一个播放列表文件中存在至少一个用于再现/管理主AV剪辑的播放项目。当与主AV数据相关联的文本字幕存在时,文本字幕由副播放项目管理。更具体地,单个副播放项目管理多个文本字幕剪辑。据此,副播放项目为每个剪辑提供单个的、相同播放间隔(例如,In-Time和Out-Time)。
例如,英文的文本字幕剪辑1和韩文的文本字幕剪辑2单独存在。相应的文本字幕剪辑1和剪辑2在时间上与主AV数据同步,并将在要求的呈现时间与主AV数据一起在屏幕上显示。在此为了再现文本字幕,要提供包括屏幕上回放呈现的时间、位置和大小的信息作为管理信息。以下详细解释将用于再现文本字幕的各种管理信息作为文件信息记录在记录介质中的数据结构和方法。
图5A到5C示出根据本发明的记录在文本字幕流内的文本字幕回放管理信息,其中分别解释对话信息、区域信息和样式信息(Style Info)。
图5A示出作为用于再现/管理本发明的文本字幕的信息的对话信息(对话),其中‘对话’是指用于管理特定呈现时间内存在的至少一个文本字幕数据的管理信息。
亦即,用于在屏幕上通知播放时间的呈现时间一般使用‘PTS(呈现时间戳)’来管理,并且在特定PTS间隔或时隙里显示的整个文本字幕被定义为‘对话’,由此提高了再现/管理的便利性。
例如,在PTS(k)与PTS(k+1)之间的时间里显示的文本字幕数据由两行构成,由此可以看到整个文本字幕数据由同一对话定义。并且,对话中所包括的文本字幕数据的行数的条件至少为一行是充分的。
图5B示出管理作为区域的文本字幕,其中‘区域’是指在对话的呈现时间里将以下详细解释的样式信息(Style Info,具体而言是‘全局样式信息’)应用于区域中的文本字幕的那个区域。在一个实施例中,可允许在一个对话存在最多两个区域。亦即,一个对话可管理一个区域或两个区域。并且,每个区域中所包括的文本字幕数据的行数可被定义为至少一行。
在本发明的此实施例中,可在一个对话内启用最多两个区域,这是考虑到回放文本字幕时的解码负荷。但是,在替换实现中可定义在一个对话内存在最多n个区域,其中n≥2。图5C示出根据本发明的一个实施例的作为文本字幕的回放管理信息的样式信息(Style Info)。‘样式信息(Style Info)’是用于指定在屏幕上显示文本字幕数据的方法的信息。例如,样式信息(Style Info)包括在屏幕上的位置、大小、背景色等等。此外,可提供诸如文本对齐、文本流向等各种信息作为样式信息(Style Info)。以下将参考图9A到10C来解释此样式信息(Style Info)的详细解释。
如图进一步示出的,样式信息(Style Info)可被分为‘全局样式信息(GlobalStyle Info)’和‘局部样式信息(Local Style Info)’。这使得在文本字幕数据的显示中有更大的灵活性。‘全局样式信息(Global Style Info)’是诸如位置、大小等应用于格个相关联的区域的样式信息(Style Info)。这种全局样式信息还可被称为‘区域样式信息(region_styles)’。图5C分别示出两个区域(region #1和区域#2)具有不同‘区域样式信息(region_styles)’的示例。区域1(region #1)的区域样式信息region_styles为‘位置1、大小1、颜色=蓝色’,而区域2(region #2)的区域样式信息region_styles为‘位置2、大小2、颜色=红色’。‘区域样式信息(region_styles)’将参考图9B来详细解释。
‘局部样式信息(Local Style Info)’是应用于区域内的每个数据行或每个文本数据字符的样式信息(Style Info),并且也可称为‘内联样式信息(inline_styles)’。例如,图5C示出在区域#1中应用内联样式信息(inline_styles)的示例,其中与其它文本不同的内联样式信息(inline_styles)被应用于文本数据的‘mountain’部分。内联样式信息(inline_styles)将参考图10C来详细解释。图6A和图6B示出使用对话、区域和样式信息作为文本字幕再现/管理信息来提供文本字幕的数据结构和方法。
图6A示出用于管理文本字幕的数据结构和方法,其中每个呈现时间戳(PTS)时隙或间隔由一个对话来管理。如图所示,在PTS1~PTS2之间显示了对话#1。对话#1包括单区域文本字幕‘文本#1’作为文本数据。在PTS2~PTS3之间显示对话#2,并且对话#2分别具有两个区域-文本字幕数据‘文本#1’和‘文本#2’的区域1和区域2。据此,区域1中的‘文本#1’和区域2中的‘文本#2’在呈现时间戳间隔PTS2~PTS3里作为文本数据被显示。在PTS3~PTS4之间显示对话#3,并且对话#3包括‘文本#2’作为文本数据。在PTS5~PTS6之间显示对话#4,并且对话#4包括‘文本#3’作为文本数据。PTS4~PTS5之间不存在文本字幕数据。
如从图6A中可见,对话并不重叠。换言之,在此实施例中,每个相应对话的呈现时间戳时隙不重叠。
详细解释以上定义每个对话信息的方法如下。首先,每个对话提供用于显示相应对话、样式信息(Style Info)和真实文本数据(称为‘对话数据’)的信息的时间信息(PTS集)。
时间信息(PTS集)作为‘PTS开始’信息和‘PTS结束’信息被记录在以下详细讨论的对话数据结构中。例如,对话#1的PTS开始信息是PTS#1,而对话#1的PTS结束信息是PTS#2。
样式信息(Style Info)包括‘全局样式信息(Global Style Info)’和‘局部样式信息(Local Style Info),它们分别作为‘区域样式信息(region_styles)’和‘内联样式信息(inline_styles)’被记录在如下详细讨论的对话数据结构中。实际所显示的文本数据作为‘对话数据’被记录在对话数据结构中。
回到图6A,因为对话#2包括两个区域-区域1和区域2,所以样式信息(StyleInfo)和对话数据分别与区域1和区域2中的每一个被相关联地记录。即,这两个区域的样式信息可相互互独立,并可独立于其它对话。
图6B示出在两个相邻对话之间连续再现文本字幕的数据结构和方法。例如,对话#1和对话#2的第一区域-区域1被连续再现,并且对话#2的第二区域-区域2和对话#3被连续再现。
图6B中所示的示例与图6A中所示的示例基本相同,区别在于,1)文本#1由对话#1和对话#2连续再现,而文本#2由对话#2和对话#3连续再现,2)对话#1和对话#2中文本#1的样式信息是相同的,以及3)对话#2和对话#3中文本#2的样式信息是相同的。
为能连续再现,诸对话的PTS间隔是连续的。如图6B中所示,当诸对话或其呈现时间戳间隔不重叠时,第一对话的结束时间与第二对话的开始时间在时间上是相同的。例如,PTS2是对话#1的结束时间,并且是对话#2的开始时间,而PTS3是对话#2的结束时间,并且是对话#3的开始时间。同样是为能连续再现,跨对话的连续的文本字幕的样式信息(Style Info)应当是完全相同的。据此,如图6B中所示,对话#1中以及对话#2的区域1中文本#1的样式信息是相同的(即,样式#1),而对话#2的区域2中以及对话#3中文本#2的样式信息是相同的(即,样式#2)。
此外,为能连续再现,对话数据结构中包括标记信息(continuous_present_flag),用于指示对话是否提供从前一对话的连续回放。亦即,当前对话信息包括指示此对话是否要求从前一对话连续回放的连续呈现标记。以下将参考图10A来更详细地解释此数据结构。据此,在图6B的示例中,第二和第三对话#2和#3包括指示这些对话要求从前一对话连续回放的标记信息。
图7示出根据本发明的一个实施例的文本字幕流文件的结构,其中示出了例如图1中的文本字幕流文件10001.m2ts的记录形式。
如图所示,文本字幕流被配置成MPEG2传输流。构成该流的每个传输分组TP被给予相同的分组标识符(PID),例如,‘PID=0x18xx’。由此,光学记录/再现装置(例如,图11的装置)从流中读出具有‘PID=0x18xx’的传输分组以读出文本字幕,由此来便于仅读出文本字幕流。
如图进一步示出的,多个传输分组TP构成一个分组基本流(PES)分组。在本发明的一个实施例中,一个‘PES分组’构成每个对话,由此便于对话的再现。
如图进一步示出的,‘对话样式单元(DSU)’(或称为对话样式段DSS)作为第一‘PES分组’被记录在文本字幕流内。DSU是用于提供样式信息(Style Info)的数据结构。其余PES分组是‘对话呈现单元(DPU)’(或称为对话呈现段DPS)。DPU作为记录真实对话数据的单元被记录在其中。由此,在再现文本字幕数据时,DPU可为样式信息参考DSU。亦即,在图7的文本字幕流结构中,诸如图6A和图6B中所定义的每个对话内的样式信息Style Info可以是用于将区域的文本字幕链接到DSU中所定义的各种样式信息集中的一个的信息。
接下来参考图8到10C来解释根据本发明的实施例的DSU和DPU的数据结构句法。图8示出根据本发明的一个实施例的文本字幕流“Text_subtitle_stream()”的数据结构句法。如以上在图7的描述中提及并在图8中示出的,本发明的‘Text_subtitle_stream()’数据结构包括定义样式信息(Style Info)集的一个‘dialog_style_unit()’数据结构、以及记录了真实对话信息的多个‘dialog_presentation_unit()’数据结构。字段‘num_of_dialog_units’指示文本字幕流中‘dialog_presentation_unit()’数据结构的个数。并且,文本字幕流指示‘video_format()’数据结构中文本字幕流的视频格式。
图9A到9C示出根据本发明的一个实施例的‘dialog_style_unit()’的数据结构,而图10A到10C示出根据本发明的一个实施例的‘dialog_presentation_unit()’的数据结构。
图9A示出‘dialog_style_unit()’总的或高级的数据结构。如图所示,‘dialog_style_unit()’包括标识此单元(或段)为DSU(或DSS)的‘unit_type’字段,以及指示DSU长度的‘unit_length’字段。
DSU被分为定义在对话中使用的各种样式信息Style_Info的集合的‘dialog_styleset()’(图9B)和定义可由用户调整的样式信息Style Info的集合的‘user_control_styleset()’(图9C)。
图9B示出根据本发明的一个实施例的‘dialog_styleset()’的数据结构句法。‘dialog_styleset()’提供为每个区域定义的或可被称为如上所述的‘区域样式信息(Global Style Info)’的‘全局样式信息(Global Style Info)’。如图9B中所示,‘dialog_styleset()’包括‘num_of_region_styles’字段,它指示由此‘dialog_styleset()’提供的区域样式的个数。每个区域样式顺次由以区域样式的个数为界的标识符‘region_style_id’引用。
由此,如以下将更加详细地讨论的,对话将通过指示区域样式标识符‘region_style_id’来指示要应用于对话的样式信息,并且记录/再现装置使用‘dialog_styleset()’内具有相同‘region_style_id’的样式信息来再现相应的对话。
对于每个‘region_style_id’,‘dialog_styleset()’提供‘region_horizontal position’、‘region_vertical_position’、‘region_width’和‘region_height’字段作为定义相应区域在显示屏幕内的位置和大小的信息。还提供‘text_horizontal_position’和‘text_vertical_position’字段作为定义文本在相应区域内的原点位置的信息。并且还提供‘region_bg_color_index’信息以指示相应区域的背景色。
接下来,定义‘text_flow’字段和‘text_alignment’字段,其中‘text_flow’字段定义文本写方向(从右到左、从左到右、从上到下),而‘text_alignment’字段定义文本对齐方向(左、中、右)。对于‘text_flow’字段,在一个实施例中,如果一个对话内存在多个区域,则相应对话内的每个区域被定义为具有相同的‘text_flow’值。这是为了避免用户在查看字幕时产生混乱。
单个的样式信息也可被包括在样式信息集中。例如,图9B示出提供‘line_space’信息,用于指定区域内行与行之间的间隔,还提供诸如‘font_type’、‘font_style’和‘font_color’信息等真实文本数据的字体信息。
图9C示出根据本发明的一个实施例的‘user_changeable_styleset()’的数据结构。‘user_changeable_styleset()’是用户可修改以改变文本字幕数据的样式信息的信息。但是,如果允许用户修改上述样式信息,则可能加重用户的混乱。由此,根据本发明的此实施例,仅将‘font_size’和‘region_horizontal/vertical_position’定义为用户可修改的样式信息。
如图所示,‘user_control_styleset()’句法包括‘num_of_font_sizes’字段,它指示‘user_control_styleset()’中所提供的字体大小的个数。对于每一种字体大小,‘user_control_styleset()’包括‘font_size_variation’信息,它指定可修改的‘font_size’的可变范围。‘user_control_styleset()’还包括‘num_of_region_positions’字段,它指示在‘user_control_styleset()’中提供的区域位置的个数。对于每个区域位置,‘user_control_styleset()’包括‘region_horizontal_position_variation’和‘region_vertical_position_variation’信息,它们指定可修改的‘region_horizontal/vertical_position’的可变范围。
图10A示出根据本发明的一个实施例的‘dialog_presentation_unit()’总的、高级的数据结构句法。如图所示,‘dialog_presentation_unit()’包括‘unit_type’字段,它标识此单元(或段)为DPU(或DPS),并包括‘unit_length’字段,用于指示DSU的长度。
DSU还包括‘dialog_start_PTS’和‘dialog_end_PTS’信息,它们指定‘dialog_presentation_unit’内所定义的相应对话的呈现时间戳间隔。
应用于相应对话的色彩改变信息由‘dialog_paletteset()’句法在‘dialog_presentation_unit()’句法内定义,这将在以下参考图10C来更加详细地描述。
如上所述,在本发明的此实施例中,一个对话可具有一个或两个区域,这由DPU中的‘num_of_regions’字段指示。对于每个区域,‘dialog_region()’句法在DPU内定义区域信息。每个区域‘dialog_region()’由顺序标识符‘region_id’索引,该序列以‘num_of_regions’字段中所阐明的区域个数为界。如图所示,每个区域的区域信息包括‘continuous_present_flag’字段、‘region_style_id’字段和‘region_subtitle’字段。
连续呈现标记‘continuous_present_flag’指示此DPU是否要求从前一DPU连续回放。‘region_style_id’字段指示由以上参考图9B所讨论的‘dialog_styleset()’定义的区域样式中的一个。此被标识的区域样式在再现期间将被应用于此区域的字幕数据。‘region_subtitle()’句法定义此对话区域中所包括的文本数据和/或局部样式信息(Local Style Info),并将在以下参考图10B来详细描述。
如前所述,图10B示出‘dialog_presentation_unit()’句法内所定义的‘region_subtitle()’数据结构的数据结构句法。如图所示,‘region_subtitle()’包括指示‘region_subtitle()’的长度的‘region_subtitle_length’字段和提供转义码的‘escape_code’字段。‘region_subtitle()’还包括‘inline_style()’数据结构和‘text_string’。
‘test_string’是记录在‘region_subtitle()’内的文本数据。‘inline_style()’数据结构包括指示由此数据结构定义的内联类型的个数的‘num_of_inline_styles’字段。对于以内联类型个数为界的每个被顺序索引的内联样式,提供‘inline_style_type’字段和‘inline_style_value’字段作为应用于‘region_subtitle()’内的特定‘text_string’的局部样式信息。
例如,图5C中区域#1相应的文本数据之中的‘mountain’被描述为一个‘text_string’(‘text_string=mountain’)。然后可通过将‘inline_style_type=Fontsize’以及‘inline_style_value()=xxx’作为局部样式信息(Local Style Info)来将相应的‘text_string=mountain’的字体大小(Font_size)设为某个值(xxx)。
可应用于每个‘text_string’的‘inline_style_ype’可以是字体类型、字体样式、字体大小、字体颜色等。由此,显然可按需定义各种样式信息。
图10C示出根据本发明的一个实施例的‘dialog_paletteset()’的数据结构句法。‘dialog_paletteset()’句法为对话内所写的文本字幕数据提供色彩改变信息。如图所示,‘dialog_paletteset()’包括指示此‘dialog_paletteset()’中所定义的调色板的个数的‘num_of_palettes’字段,以及指定文本数据的淡入/淡出效果的‘pallette_update_interval’字段。
对于每个调色板个数,‘dialog_paletteset()’包括由以调色板个数为界的顺序palette_id索引的‘dialog palette()’数据结构。每个‘dialog palette()’数据结构包括指示该对话调色板中的‘palette entries()’的个数的‘num_of_palette_entries’字段。对于每个‘palette entry()’,‘dialog palette()’提供‘palette_entry_id’字段、‘Y_value’字段、‘Cr_value’字段、‘Cb_value’字段和‘T_value’字段。‘palette_entry_id’字段提供此‘palette_entry()’的标识符。‘Y_value’字段提供亮度值,而‘Cr_value’和‘Cb_value’字段提供色度值,用于创建文本数据的亮度和色彩。‘T_value’是提供的用于指示文本数据透明度的信息。
由此,在文本字幕数据中,颜色可由Global Style Info或Local Style Info定义,而颜色的变化和/或透明度的信息可由‘dialog_paletteset()’句法提供。
图11是根据本发明的用于再现文本字幕流的光学记录/再现装置的框图。如图所示,该装置包括:拾取单元11,用于读出记录在光盘中的主数据、文本字幕流、以及相关联的再现/管理信息;伺服14,用于控制拾取单元11的操作;信号处理单元13,用于将从拾取单元11接收的再现信号恢复为想要的信号值,或将输入信号调制成将被记录在光盘中的信号;存储器15,用于存储***操作所需的信息(例如,以上参考图1-10C所讨论的再现管理信息);以及微机16,用于控制伺服14、信号处理器单元13和存储器15的操作。
如图进一步示出的,AV和文本字幕(ST)解码器17将从信号处理器单元13输出的并由缓冲器19缓冲后的数据解码。缓冲器19缓冲(即,存储)文本字幕流以将文本字幕数据解码。
为了执行将信号记录在光盘中的功能,AV编码器18在控制单元12的控制下将输入信号转换为诸如MPEG2传输流等特定格式化的信号,并将经转换的信号提供给信号处理单元13。
控制单元12控制光学记录/再现装置整体的操作。一旦经由操作地链接到控制单元12的用户界面输入了特定语言文本字幕回放请求命令,控制单元12即控制该装置将相应的文本字幕流预加载到缓冲器19中。控制单元12随后通过参考存储在缓冲器19中的文本字幕流信息中的上述对话信息、区域信息、样式信息(Style Info)等来控制解码器17,从而真实的文本数据以特定的大小被显示在屏幕上的特定位置处。为进行记录,控制单元12经由从用户界面接收的指令来控制AV编码器18将AV输入数据编码。控制单元12还控制信号处理器单元13来处理已编码数据和来自控制单元12的命令数据,以如以上参考图1到10C所讨论地将数据结构记录在记录介质上。
产业实用性
尽管参考了有限数量的实施例来公开本发明,但是受益于此发明的本领域技术人员将会认识到从其衍生的许多修改和变更。例如,尽管在数个实例中就蓝光ROM光盘进行描述,但是本发明并不限于此光盘标准或限于光盘。旨在使所有此类修改和变更落在本发明的精神和范围之内。
Claims (27)
1.一种具有用于管理文本字幕的再现的数据结构的记录介质,包括:
记录区,用于存储包括在呈现时隙里呈现的每个文本字幕的文本字幕数据的对话呈现段,所述对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
2.如权利要求1所述的记录介质,其特征在于,所述对话呈现段定义数个区域,每个区域提供文本字幕数据。
3.如权利要求2所述的记录介质,其特征在于,所述文本字幕数据是文本串数据和样式数据中的一种。
4.如权利要求2所述的记录介质,其特征在于,所述对话呈现段最多定义两个区域。
5.如权利要求2所述的记录介质,其特征在于,对于每个区域,所述对话呈现段参考一个区域样式,所参考的区域样式定义所述区域的位置和大小。
6.如权利要求5所述的记录介质,其特征在于,
所述记录区存储与所述对话呈现段相关联的对话样式段,并且所述对话样式段定义一个或多个区域样式。
7.如权利要求6所述的记录介质,其特征在于,
所述记录区存储包括所述对话样式段和所述对话呈现段的文本字幕流。
8.如权利要求2所述的记录介质,其特征在于,所述对话呈现段包括每个区域的连续呈现信息,用于指示是否要从前一对话呈现段开始连续再现所述区域。
9.如权利要求8所述的记录介质,其特征在于,所述每个区域的连续呈现信息是标记。
10.如权利要求8所述的记录介质,其特征在于,当所述对话呈现段中的一个区域的连续呈现信息指示连续再现时,所述对话呈现段的呈现时间戳开始时间等于所述前一对话呈现段的对话呈现时间戳结束时间。
11.如权利要求10所述的记录介质,其特征在于,所述对话呈现段为每个区域参考一个区域样式,所参考的区域样式定义所述区域的位置和大小,并且当所述对话呈现段的区域包括指示连续呈现的连续呈现信息时,所述区域所参考的区域样式与所述前一对话呈现段中的区域所参考的是同一区域样式。
12.如权利要求1所述的记录介质,其特征在于,所述对话呈现段包括连续呈现信息,用于指示是否要从前一对话呈现段开始连续再现所述对话呈现段。
13.如权利要求12所述的记录介质,其特征在于,所述每个区域的连续呈现信息是标记。
14.如权利要求12所述的记录介质,其特征在于,当所述对话呈现段中的连续呈现信息指示连续再现时,所述对话呈现段的呈现时间戳开始时间等于所述前一对话呈现段的对话呈现时间戳结束时间。
15.如权利要求14所述的记录介质,其特征在于,当所述对话呈现段中的连续呈现信息指示连续再现时,所述对话呈现段和所述前一对话呈现段参考同一样式信息。
16.如权利要求1所述的记录介质,其特征在于,所述记录区存储所述对话呈现段作为单个分组基本流。
17.如权利要求1所述的记录介质,其特征在于,所述对话呈现段包括类型指示符,用于指示所述对话呈现段是对话呈现段。
18.一种具有用于管理文本字幕的数据结构的记录介质,包括:
记录区,用于存储文本字幕流,所述文本字幕流包括一个对话样式段,后面跟着一个或多个对话呈现段,所述对话样式段定义一个或多个样式,每个对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,每个对话呈现段参考所述对话样式段中的各样式中的至少一个,并且每个对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
19.如权利要求18所述的记录介质,其特征在于,每个对话呈现段定义数个区域,每个区域提供文本字幕数据,并且所述对话呈现段为每个区域参考来自所述对话样式段的一个样式,所参考的样式定义所述区域的位置和大小。
20.如权利要求18所述的记录介质,其特征在于,每个对话呈现段定义数个区域,每个区域提供文本字幕数据,并且每个对话呈现段包括每个区域的连续呈现信息,用于指示是否要从前一对话呈现段连续再现所述区域。
21.如权利要求20所述的记录介质,其特征在于,每个对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,并且当当前对话呈现段中的一个区域的连续呈现信息指示连续再现时,所述当前对话呈现段的呈现时间戳开始时间等于所述前一对话呈现段的对话呈现时间戳结束时间。
22.如权利要求21所述的记录介质,其特征在于,每个对话呈现段对每个区域参考来自所述对话样式段的一个样式,所参考的样式定义所述区域的位置和大小,并且当所述当前对话呈现段的区域包括指示连续呈现的连续呈现信息时,所述区域的所参考的样式与所述前一对话呈现段中的区域所参考的是同一样式。
23.如权利要求18所述的记录介质,其特征在于,所述记录区存储所述对话样式段和每个对话呈现段作为单个分组基本流。
24.一种从记录介质再现用于管理文本字幕的数据结构的方法,包括:
从所述记录介质再现对话呈现段,所述对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,所述对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
25.一种在记录介质上记录用于管理文本字幕的数据结构的方法,包括:
在所述记录介质上记录对话呈现段,所述对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,所述对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
26.一种用于从记录介质再现用于管理文本字幕的数据结构的装置,包括:
驱动器,用于驱动光学再现装置再现记录在所述记录介质上的数据;以及
控制器,用于控制所述驱动器从所述记录介质再现对话呈现段,所述对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,所述对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
27.一种用于在记录介质上记录用于管理文本字幕的数据结构的装置,包括:
驱动器,用于驱动光学记录设备在所述记录介质上记录数据;
控制器,用于控制所述驱动器在所述记录介质上记录对话呈现段,所述对话呈现段包括在呈现时隙里呈现的每个文本字幕的文本字幕数据,所述对话呈现段提供定义所述呈现时隙的呈现时间戳开始时间和呈现时间戳结束时间,以使所述呈现时隙不会与另一对话呈现段的呈现时隙重叠。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54285004P | 2004-02-10 | 2004-02-10 | |
US60/542,850 | 2004-02-10 | ||
US60/542,852 | 2004-02-10 | ||
US60/543,328 | 2004-02-11 | ||
KR1020040013098 | 2004-02-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1914684A true CN1914684A (zh) | 2007-02-14 |
CN100555438C CN100555438C (zh) | 2009-10-28 |
Family
ID=37722648
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800415292A Expired - Fee Related CN100473133C (zh) | 2004-02-10 | 2004-10-12 | 再现文本字幕的方法和文本字幕解码*** |
CN 200480041530 Pending CN101080770A (zh) | 2004-02-10 | 2004-10-13 | 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置 |
CNB2004800415273A Expired - Fee Related CN100555438C (zh) | 2004-02-10 | 2004-11-26 | 具有用于管理文本字幕的数据结构的记录介质以及记录和再现方法和装置 |
CN200710139867A Expired - Fee Related CN100585717C (zh) | 2004-02-10 | 2004-11-26 | 在记录介质上生成、记录和再现文本字幕的方法与装置 |
CN 200480042284 Pending CN1926628A (zh) | 2004-02-10 | 2004-11-26 | 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置 |
CN 200480041531 Pending CN1914903A (zh) | 2004-02-10 | 2004-12-08 | 用于解码文本字幕流的文本字幕解码器和方法 |
CN 200580004498 Pending CN1918649A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
CN 200580004499 Pending CN1918650A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800415292A Expired - Fee Related CN100473133C (zh) | 2004-02-10 | 2004-10-12 | 再现文本字幕的方法和文本字幕解码*** |
CN 200480041530 Pending CN101080770A (zh) | 2004-02-10 | 2004-10-13 | 具有用于管理各种数据流的数据结构的记录介质以及记录和再现的方法和装置 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710139867A Expired - Fee Related CN100585717C (zh) | 2004-02-10 | 2004-11-26 | 在记录介质上生成、记录和再现文本字幕的方法与装置 |
CN 200480042284 Pending CN1926628A (zh) | 2004-02-10 | 2004-11-26 | 具有管理与不同语言相关联的数据流的数据结构的记录介质以及记录和再现方法和装置 |
CN 200480041531 Pending CN1914903A (zh) | 2004-02-10 | 2004-12-08 | 用于解码文本字幕流的文本字幕解码器和方法 |
CN 200580004498 Pending CN1918649A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
CN 200580004499 Pending CN1918650A (zh) | 2004-02-10 | 2005-01-12 | 用于解码文本字幕流的记录介质和方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (8) | CN100473133C (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101764949A (zh) * | 2008-11-10 | 2010-06-30 | 新奥特(北京)视频技术有限公司 | 一种基于区域划分的定时字幕的冲突检测方法 |
CN101616333B (zh) * | 2008-06-24 | 2011-10-05 | Nec卡西欧移动通信株式会社 | 带字幕影像再现装置及带字幕影像再现方法 |
CN106652983A (zh) * | 2016-09-18 | 2017-05-10 | 福建网龙计算机网络信息技术有限公司 | 一种字幕制作方法及*** |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100727921B1 (ko) * | 2004-02-28 | 2007-06-13 | 삼성전자주식회사 | 텍스트 기반의 서브타이틀 스트림을 기록한 저장 매체,재생 장치 및 그 재생 방법 |
US7529467B2 (en) | 2004-02-28 | 2009-05-05 | Samsung Electronics Co., Ltd. | Storage medium recording text-based subtitle stream, reproducing apparatus and reproducing method for reproducing text-based subtitle stream recorded on the storage medium |
KR20110018261A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 텍스트 서브타이틀 데이터 처리 방법 및 재생 장치 |
CN103067665A (zh) * | 2012-12-25 | 2013-04-24 | 天津市亚安科技股份有限公司 | 基于视频亮度自适应叠加字符颜色的实现方法 |
CN105338394B (zh) * | 2014-06-19 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 字幕数据的处理方法及*** |
CN107005733B (zh) * | 2014-12-19 | 2020-06-16 | 索尼公司 | 发送装置、发送方法、接收装置以及接收方法 |
CN108012176A (zh) * | 2016-10-28 | 2018-05-08 | 深圳市中兴微电子技术有限公司 | 一种数据切换方法、装置及终端 |
CN108040277B (zh) | 2017-12-04 | 2020-08-25 | 海信视像科技股份有限公司 | 针对解码后得到的多语种字幕的字幕切换方法及装置 |
CN110109965A (zh) * | 2018-02-02 | 2019-08-09 | 上海颐为网络科技有限公司 | 知识分享平台上建立知识结构的辅助提示方法和组件 |
CN108924622B (zh) * | 2018-07-24 | 2022-04-22 | 腾讯科技(深圳)有限公司 | 一种视频处理方法及其设备、存储介质、电子设备 |
CN111399788B (zh) * | 2018-12-29 | 2023-09-08 | 西安诺瓦星云科技股份有限公司 | 媒体文件播放方法和媒体文件播放装置 |
CN116634218B (zh) * | 2023-05-25 | 2024-04-02 | 优酷网络技术(北京)有限公司 | 推广信息显示方法、装置、设备、介质 |
-
2004
- 2004-10-12 CN CNB2004800415292A patent/CN100473133C/zh not_active Expired - Fee Related
- 2004-10-13 CN CN 200480041530 patent/CN101080770A/zh active Pending
- 2004-11-26 CN CNB2004800415273A patent/CN100555438C/zh not_active Expired - Fee Related
- 2004-11-26 CN CN200710139867A patent/CN100585717C/zh not_active Expired - Fee Related
- 2004-11-26 CN CN 200480042284 patent/CN1926628A/zh active Pending
- 2004-12-08 CN CN 200480041531 patent/CN1914903A/zh active Pending
-
2005
- 2005-01-12 CN CN 200580004498 patent/CN1918649A/zh active Pending
- 2005-01-12 CN CN 200580004499 patent/CN1918650A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616333B (zh) * | 2008-06-24 | 2011-10-05 | Nec卡西欧移动通信株式会社 | 带字幕影像再现装置及带字幕影像再现方法 |
CN101764949A (zh) * | 2008-11-10 | 2010-06-30 | 新奥特(北京)视频技术有限公司 | 一种基于区域划分的定时字幕的冲突检测方法 |
CN101764949B (zh) * | 2008-11-10 | 2013-05-01 | 新奥特(北京)视频技术有限公司 | 一种基于区域划分的定时字幕的冲突检测方法 |
CN106652983A (zh) * | 2016-09-18 | 2017-05-10 | 福建网龙计算机网络信息技术有限公司 | 一种字幕制作方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN101093709A (zh) | 2007-12-26 |
CN100555438C (zh) | 2009-10-28 |
CN1918650A (zh) | 2007-02-21 |
CN100585717C (zh) | 2010-01-27 |
CN1914906A (zh) | 2007-02-14 |
CN1914903A (zh) | 2007-02-14 |
CN101080770A (zh) | 2007-11-28 |
CN1926628A (zh) | 2007-03-07 |
CN1918649A (zh) | 2007-02-21 |
CN100473133C (zh) | 2009-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1856078B (zh) | 再现装置和再现方法 | |
US20070127885A1 (en) | Recording medium and method and apparatus for reproducing and recording text subtitle streams | |
US7558467B2 (en) | Recording medium and method and apparatus for reproducing and recording text subtitle streams | |
CN1914927A (zh) | 记录介质以及记录和再现方法和装置 | |
CN1918650A (zh) | 用于解码文本字幕流的记录介质和方法及装置 | |
CN1934624A (zh) | 用于再现记录在记录介质上的文本字幕流的记录介质、方法和装置 | |
CN1947195A (zh) | 记录介质、其再现方法和其再现设备 | |
KR20060136441A (ko) | 기록매체, 기록매체의 텍스트 서브타이틀 스트림 기록 및재생 방법과 장치 | |
KR20070026459A (ko) | 기록매체 및 기록매체상에 기록된 텍스트 서브타이틀스트림 재생 방법과 장치 | |
CN1918652A (zh) | 用于再现和记录文本字幕流的记录介质和方法及装置 | |
JP2007527593A (ja) | 多様なデータを管理するためのデータ構造を有する記録媒体、記録再生方法及び記録再生装置 | |
CN101059989A (zh) | 具有管理图形信息的数据结构的记录介质以及记录和再现方法和设备 | |
US8326118B2 (en) | Recording medium storing a text subtitle stream including a style segment and a plurality of presentation segments, method and apparatus for reproducing a text subtitle stream including a style segment and a plurality of presentation segments | |
US20050198053A1 (en) | Recording medium having a data structure for managing text subtitles and recording and reproducing methods and apparatuses | |
CN1922866A (zh) | 用于再现和记录文本字幕流的记录介质和方法及装置 | |
RU2378720C2 (ru) | Носитель записи и способ и устройство воспроизведения и записи потоков текстовых субтитров | |
CN1934645A (zh) | 用于再现文本字幕流的记录介质、方法和装置 | |
KR20050094566A (ko) | 고밀도 광디스크의 텍스트 서브타이틀 스트림 파일구성방법 및 재생방법과 재생장치 | |
CN1914681A (zh) | 具有用于管理文本字幕的字体信息的数据结构的记录介质以及记录和再现方法和装置 | |
KR20050094024A (ko) | 고밀도 광디스크의 데이터 파일 구성 방법 및 재생 방법과재생 장치 | |
KR20050092836A (ko) | 고밀도 광디스크의 텍스트 서브타이틀 재생방법과재생장치 | |
CN101124635A (zh) | 具有用于管理各种数据的数据结构的记录介质及再现方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091028 Termination date: 20101126 |