CN1762155A - 同步地使用音频视频数据的设备和方法 - Google Patents

同步地使用音频视频数据的设备和方法 Download PDF

Info

Publication number
CN1762155A
CN1762155A CNA2004800074391A CN200480007439A CN1762155A CN 1762155 A CN1762155 A CN 1762155A CN A2004800074391 A CNA2004800074391 A CN A2004800074391A CN 200480007439 A CN200480007439 A CN 200480007439A CN 1762155 A CN1762155 A CN 1762155A
Authority
CN
China
Prior art keywords
stream
decoding
captions
video
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800074391A
Other languages
English (en)
Other versions
CN100562084C (zh
Inventor
约瑟夫·麦克罗森
小冢雅之
南贤尚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1762155A publication Critical patent/CN1762155A/zh
Application granted granted Critical
Publication of CN100562084C publication Critical patent/CN100562084C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4856End-user interface for client configuration for language selection, e.g. for the menu or subtitles
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/45Picture in picture, e.g. displaying simultaneously another television channel in a region of the screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4316Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for displaying supplemental content in a region of the screen, e.g. an advertisement in a separate window
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • H04N9/8244Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal involving the use of subcodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

一种音频、视频、字幕解码***,用于从复合媒体流(102)中再生数据,其中,该媒体流可以包括对应解码器(146,154...)的多个字幕流,其中合成了经过解码的视频流(158),该视频流在显示单元(166)上与多个经过解码的字幕流进行同步,还提供了用于同步地使用多个流的用户模式。

Description

同步地使用音频视频数据的设备和方法
相关申请的交互参考
本申请要求序号为No.60/449,162的临时申请的权益,该临时申请在2003年2月21日申请,是关于对位于存储介质中的可互换AV数据的使用。这里结合该临时申请的全部内容作为参考。
技术领域
本发明涉及对视频、音频、字幕数据进行再生,更具体地说,是同步地对多个可互换类型数据进行再生。
背景技术
从概念层面上讲,设计用于发行和播放的音频视频(AV)多媒体内容,一般包括一个或者多个数据流,数据流中含有符合某种AV内容发行和/或播放标准的多个可互换组成部分或者子流。这种标准指定了一种播放器模式,在该播放器模式下,同一时刻只能够对来自数据流的某一特定类型或分类的仅仅一个数据流进行再生。例如,对于一个特定的AV应用,可以有多个可用的音频子流,但是只能选择一个音频流进行再生。
AV应用一般符合某种事实标准,从而播放器能够采用一种恒定方式对其进行解码和表示。现有格式包括数字化视频光盘(DVD-Video)格式,以及未来格式的例子包括高密度数字化视频光盘(HD-DVD)格式和蓝光光盘(BD)预打包格式。这些事实标准指定了一种概念模式,从而每种播放器都能够使用该模式确定正确的解码方式。AV应用会写入由概念播放器模式所定义的平台,并符合由该标准所定义的数据格式规范,以保证在不同的播放器之间播放方式的恒定性。
然而,这种设计是有缺点的,对于制作该AV应用的内容制作者来说,在事实标准建立之后,就不可能再利用在播放器中实现的更高的性能或者扩展功能。例如,在制作的时候,就已经基于播放器模式预先确定了图形显示数据的位置,该播放器模式定义了对每个流时间中的仅仅一个媒体子流进行同步播放。通过将包含在AV应用中的菜单设计成仅仅能够选择每个流类型中的子流用于再生,对该事实标准进行了增强。
例如,光存储介质中存储的AV应用经常包含带有可互换子流的几种不同类型的数据流。例如,一种音频类型数据流能够包含一个主音频子流,来自导演、演员或者制片人的解说子流,以及一个对话翻译子流。这些数据流实质上可以是音频的,也可以是视频的。在这样的AV应用中,用户仅能够从一个特定种类或者类型的数据流中选择一个子流用于在AV应用运行期间再现。
这就需要提供一种扩展的播放器模式,它可以克服根据事实标准所造成的媒介的局限和问题,这些事实标准将再生限制在多个子流中的仅仅一个子流上。
发明内容
如同在权利要求中所定义的,本发明描述了一种方法和设备,克服了现有的基于单子流解码的播放器模式的缺点,该方法和设备定义了用户界面(UI)模式和播放器模式(PM),从而可以在AV应用再生期间,对可互换子流进行同步使用。
采用本发明,例如,能够在AV应用再生期间,对光存储介质中包含的可互换子流进行同步使用,因此,除了AV应用本身已经定义的那些模式之外,还提供了用于数据的新的使用模式。此外,描述了一种将独立数据流联系起来的方法,从而也提供了新的应用模式。从一个能够进行同步解码并再现多个媒体数据流的***中,能够衍生几种应用:
1)语言教育。一个AV应用有两种或者更多的单一字幕流可用。本发明的***的一个实施例为用户提供了一个选项,该选项选择多个字幕子流用于再现,并且选择它们在屏幕中的显示位置。由于每种子字幕流都是不同的语言,该***能够为用户提供用于语言教育的一种有用工具。例如,在再生时,用户能够选择一种亚洲语言字幕子流中的一个子流和一种英语字幕子流中的一个子流进行同步显示。该***的用户将能够同时观看英语和该亚洲语言字幕,从而为语言学习提供一种帮助。
2)个人音轨。如果一个AV应用有两种或者更多的单音频流可用,本发明的一个实施例能够为每个用户提供一个个人音频播放***和一个选项,该选项确认在他们的个人音频播放***中对哪个音频流进行解码。例如,这种个人音频播放***可以是一个带有双耳式耳机的无线电接收器。这样一个***可以用于,在将相同的媒体显示提供给多个用户的同时,提供音频对话翻译或者解说子流。
3)个人视频对话翻译。如果一个AV应用有两种或者更多的单字幕子流可用,本发明的一个实施例能够为每个用户提供一个个人显示器和一个选项,该选项选择在用户的个人显示器上对哪个字幕子流进行解码。该应用可以用于,在将相同的媒体显示同时刻提供给多个用户,而这些用户希望观看一个其他用户不想观看的特定字幕子流时,提供个人对话翻译。该应用还可以用于公众集会,其中用户群从用于用户群的一个公共显示器中观看通常使用多于一种语言的媒体显示,用户群希望观看与上述媒体显示相关联的某一特定字幕流。
附图说明
参考以下结合附图的说明书,本发明的确切特性,和它的目的与优点会变得极为显而易见,在附图中,所有附图中的相同数字指示了相同的部件,其中:
图1是一个方框图,示出了根据第一实施例的多个字幕子流。
图2A是一个流程图,示出了一种用户选择方法,用于在一个单一显示单元上的多个字幕子流的显示位置,这里假设显示的优先级是按照子流被选定的顺序。
图2B是一个流程图,示出了一种用户选择方法,用于在一个单一显示单元上的多个字幕子流的显示的优先级。
图2C是一个流程图,示出了一种用户选择方法,用于在一个单一显示单元上的多个字幕子流的显示位置。
图2D是一个流程图,示出了为用户提供多字幕选择的一个表示。
图3是一个流程图,示出了一种用户选择方法,用于在多个显示单元再现多个字幕子流。
图4是一个方框图,示出了根据第二实施例的多音频子流。
图5A描述了在顶部和底部方位显示两个字幕流的一个例子。
图5B描述了在左右两边方位显示两个字幕流的一个例子。
图6是一个流程图,示出了与第二实施例相关的用户模式,用于选择多个音频子流。
图7是一个方框图,示出了根据第三实施例的多个字幕子流。
图8是一个方框图,示出了根据第四实施例的多个字幕子流。
图9是一个流程图,示出了与第一、第三和第四实施例相关的包括自动重放功能的用户模式。
图10是一个方框图,示出了根据第五实施例的多个视频子流。
图11是一个流程图,示出了一个用户选择方法,用于在一个单一显示单元上的多个视频子流的显示位置。
图12是一个流程图,示出了在二者选一型的自动重放设定之间的切换选择。
图13是一个流程图,示出了引入一个媒体元件之后的初始化设置。
具体实施方式
现在详细地介绍本发明的优选实施例,将会参考附图进行阐述实施例的例子。在结合实施例描述本发明时,应该了解到,并不是要将本发明局限于这些实施例。相反地,如同附带的权利要求所说明的,在本发明的精神和范围内,覆盖了其替换、修改和等效。
此外,在以下对本发明的详细描述中,为了彻底地理解本发明,阐述了许多特定的细节。然而,对本领域技术人员显而易见的是,没有这些特定的细节,也能够实施本发明。在其他实例中,未详细描述众所周知的方法、过程、元件和电路,但不会使本发明的各方面难以理解。
如权利要求中所说明的,本发明包括用户选择模式,用于与一种播放器模式相关联的多个子流解码和/或数据流组合,将现有技术的播放器设计进行扩展,从而基于包含多个可互换子流解码的用户选择信息,对解码动作进行合并。以下的当前优选实施例的描述教导了用户选择方法,这些用户选择方法用于选择在AV应用运行期间所使用的多个子流,该方法能够结合AV应用自身提供的流选择方法进行使用。
此外,当前优选实施例教导了这样的用户选择方法,这些用户选择方法用于提供包含两个或者多个可互换子流的新的应用使用模式,还提供了一个播放器模式,该模式将用户的选择信息进行合并以提供用于解码和使用两个或者多个可互换子流的一个框架,AV应用程序自身没有提供这样一种选项。可以通过基于屏幕或者基于设备的选择,来提供该用户选择方法,或者更简单地通过在一个远程控制单元上直接按键提供该用户选择方法。
当同步地将可互换子流在同一个显示器上可视地显示时,可以提供一种用户选择方法,用于调节视频子流的显示位置。一般地,AV应用程序自身提供了位置信息,其中,将子流指定在特定的显示位置进行显示。为了结合对视频子流位置的用户定义的偏好,本发明提供了用户选择模式,以定义播放器所使用的信息,从而改变由指定给AV应用的标准所定义的标准解码模式的动作;一般地,在制作AV应用时,就已经预先定义了视频子流的位置信息。
用户偏好信息可以与视频子流相关联的位置信息结合使用,以提供视频数据的偏移位置,或者可以取代与视频子流相关联的位置信息而使用。此外,在一个单一显示单元上进行显示之前,将进行同步显示的多个视频子流阿尔法叠加在一起,可以提供一种用户选择方法和播放器性能,以确定视频子流的叠加顺序,从而用户会决定子流的优先级,播放器会将拥有较高优先级的子流放在最后,在顶部进行叠加,低优先级的子流在显示器上共享相同的区域,看起来会很模糊。
当在将不同设备上同步对可互换子流进行同步再现时,可以提供一种用于从子流到设备的用户选择方法,并且扩展播放器模式从而可以与上述同步输出相结合。当从主播放环境远程再现该可互换子流时,提供了一种用于传输该子流的设备和一种远程播放设备。为了实现上述目的,包含例如一个视频流、一个音频流和一个字幕流等多个不同类型的流的一个复合媒体流还可以包括多个上述类型的子流。术语“子流”用于表示很多相同类型的相同流,并且不需要与某种特定类型的复合媒体流相区别,在该复合媒体流中仅仅包含该特定类型的一个流。
参考图1,在第一实施例中示出了一个音频视频(AV)再生***100,用于使用一个显示单元,在播放环境中再生包含多个字幕子流的AV数据。再生***100还可以认为是一个播放器模式。AV播放器模式100接收由复合媒体源104提供的复合媒体流102。对于本实施例和其他实施例来说,复合媒体源104可以是用于例如数字化视频光盘(DVD)、高密度数字化视频光盘(HD-DVD)和蓝光光盘(BD)光媒体等固定媒体元件105的一种播放设备。
播放器设备能够从固定媒体元件105中读出信息并且生成复合媒体流102。对于本实施例或者其他实施例来说,可以替换的是,复合媒体源104可以是一个用于接收广播信号的媒体接收器。广播信号可以是一个空中传送(Over-The-Air)(OTA)信号,例如,该信号由电视台或者其他可以替换的发射源广播,广播信号可以是来自电缆服务提供商的电缆信号。媒体接收器能够接收射频(RF)信号,并且直接提取出复合信号流102,或者在提取出复合信号流102之前将该信号存储在另外一个媒体设备中。
复合信号流102包括一个视频数据流106、一个音频数据流108和一个包含多个字幕子流的字幕数据流110。在本描述中,项目流和数据流的含义相同。一个复合媒体流分离器单元112接收复合媒体流102,并在解码***控制器170的指示下提取出视频数据流106、音频流108和包含多个字幕子流的字幕数据流110。复合媒体流分离器单元112包括一个复合媒体流缓冲区114,用于接收和存储复合媒体流102,并且生成一个经过缓冲的复合媒体流116。将缓冲复合媒体流116提供给复合媒体流解码器118,复合媒体解码器118将视频子流106、音频子流108和字幕子流110从经过缓冲的复合媒体流116中分离出来。
视频解码器单元120接收视频流106并生成一个经过解码的视频输出122。视频解码器单元120包括一个视频缓冲区124,该视频缓冲区124接收视频流106并生成一个经过缓冲的视频流126。视频解码器接收经过缓冲的视频流126并生成经过解码的视频输出122。
音频解码器单元130接收音频流108并生成一个经过解码的音频输出132。音频解码器单元130包括一个音频缓冲区134,该音频缓冲区134接收音频流108并生成一个经过缓冲的音频流136。音频解码138接收经过缓冲的音频流136并生成经过解码的音频输出132。
本实施例的一个字幕解码器单元140对多个字幕子流进行同步解码,以生成相应的多个经过解码的字幕输出。字幕解码器单元140接收包含多个字幕子流的字幕数据流110,并对每个字幕子流进行缓冲,生成相应的多个经过缓冲的字幕子流。
例如,由第一字幕缓冲区142对第一个字幕子流进行缓冲,生成经过缓冲的第一字幕子流144。第一字幕解码146接收经过缓冲的第一字幕子流144,生成经过解码的第一字幕输出148。类似地,由第二字幕缓冲区150对第二个字幕子流进行缓冲,生成经过缓冲的第二字幕子流152。第二字幕解码器154接收经过缓冲的第二字幕子流152,生成经过解码的第二字幕输出156。为用户选定的每个字幕子流都进行上述缓冲和解码。用户选定的字幕子流定义了一个显示配置,该显示配置决定哪个字幕子流被选定,和如何显示该字幕子流。
这里所述的缓冲和解码仅仅描绘成了一个概念模式,而实际应用可以采用仅使用软件的解码过程,或者采用硬件解码器,该硬件解码器能够在受同步播放AV应用的约束的情况下,对两个或者更多的流进行解码。措词同步解码包含能够串行或者并行解码的能力,从而可以在媒体表示的相同的相关端口中使用经过解码的数据,而不仅仅是采用单独的解码单元进行综合并行解码。
视频再现单元158接收经过解码的视频输出122和多个经过解码的字幕输出(148,156),生成由所选定的解码信息的叠加所构成的再现的视频输出160,并且根据提供给字幕子流选择器单元174和解码***控制器170的用户定义的优先级信息进行显示。再现的视频输出160是在经过解码的视频输出122上的多个经过解码的字幕输出的阿尔法叠加。解码后的音频输出132和再现的视频输出160被应用到包括音频再生单元164和视频再生单元166的一个再生单元162。音频再生单元164接收经过解码的音频输出132,并且以音频的形式再生经过解码的音频输出。视频再生单元166接收再现的视频输出160,并且以视频的形式再生该再现的视频输出160。
解码***控制器170为AV再生***100提供配置和同步处理。除了AV应用提供的有关所需要的子流解码的信息之外,解码***控制器170还从用户命令单元172接收用户偏好信息。用户命令单元172包括一个字幕子流选择器174,字幕子流选择器174提供和字幕子流选择相关的一个被选定字幕子流用户输176。除了由AV应用所提供的字幕子流选择之外,***控制器170还使用该信息,从而同时使用AV应用信息和播放器模式所支持的附加用户输入,以决定在再生期间要再现哪个子流。
可以用附加用户输入取代由AV应用提供的字幕子流选择,从而给播放器决定对哪个子流进行解码的完全控制权。用户命令单元172可以包括一个字幕子流显示区域选择器178,用于提供关于被选定字幕子流的被选定显示位置的一个显示位置用户输180。***控制器170使用该信息确定经过解码的字幕子流(148,158)的显示位置,并且***控制器170将该信息传递给字幕解码器(146,154)。***控制器170可以给字幕解码器(146,154)发信号指示,除了由AV应用选定的实际字幕子流中所包含的信息外,还使用该用户输入,以提供视频数据的偏移。
可替换的是,可以使用用户输入显示位置取代由AV应用描述的显示位置信息并且根本不考虑该信息,该信息提供了视频数据的绝对位置。用户命令单元172可以包括一个自动重放选择器182,自动重放选择器182提供了一个自动重放用户输入184,用于命令按照与上一次再生相同的显示配置,或者按照与上一次再生不同的显示配置,对再现的视频输出160的一个预先确定的部分进行自动重复再生,该显示配置显示相同的选定字幕设定或不同的选定字幕设定。用户所选定的字幕子流定义了一个显示配置,该配置确定选择了哪个字幕子流和如何显示该字幕子流。自动重放选择器使用一个用户输入,采用所选定的显示配置自动地重复再生复合媒体流的预定部分。
在不同的显示配置的情况下,在播放开始之前或者运行过程中,用户可以通过访问播放菜单或者通过远程控制按键,在二中选一型的显示配置上提供信息。当发生自动重放时,***控制器170可以使播放位置跳回一个特定的用户定义的数量、跳回媒体表示中的一个用户定义的点、跳回由媒体源104定义的或者在媒体元件105中所包含的一些点。AV应用运行时间196表示AV应用在运行期间的当前状态。它包括用于执行命令并存储结果的虚拟机的状态,以及播放器状态,播放器状态包含处于解码过程中的当前子流上的信息。AV应用运行时间196将关于流播放的控制信息198提供给***控制器170。该信息包括(但不局限于):要进行解码和回放的流,例如包括播放位置、播放开始、播放暂停或停止和特技播放(快速前放或者快速后放)。
解码***控制器170既提供控制信号给AV再生***100的各种资源,还从这些资源中接收状态信息。解码***控制器170通过一个媒体源信号186与复合媒体源104进行通讯。媒体源信号186包括从解码***控制器170到复合媒体源104的信号,以操作复合媒体源104,以及从复合媒体源104到解码***控制器170的状态信号。
例如,状态信号可以表示已经将一个固定媒体元件105***了复合媒体源104中并且准备好进行读取。可替换的是,状态信号可以表示接收到一个广播信号或者正在接收过程中。解码***控制170能够向复合媒体源中的控制器声明一个信号,命令复合媒体源开始从所***的固定媒体元件105中读取数据,或者开始从对诸如复合媒体流102这样的一个元件的读取中输出信息。
***控制器170通过媒体分离器信号188与复合媒体流分离器单元112进行通讯。媒体分离器信号188包括从解码***控制170到复合媒体流分离器单元112的信号,以控制流缓冲区114和流解码器118。媒体分离器信号188包括从媒体流分离器单元112到解码***控制器170的信号,以表示复合媒体流缓冲区114的状态,例如复合媒体流缓冲区114是否为空、半满或者全满。类似地,复合媒体流解码器118向解码***控制器170声明状态信号和信息,包括:例如,诸如帧边界信息的流管理信息,子流的数量和类型,以及诸如校验数量的流确认信息。
解码***控制器170还提供同步功能,通过该功能可以对相关的媒体流进行排列以进行解码和输出,从而与标准帧边界相一致。根据一种标准,在再生过程中,帧由一秒半的时间间隔组成。在其他标准中,可以将可选择性的再生时期连同其他时间相关的控制一起使用。例如,可以在当前帧使用暂停功能对再生进行暂停。在复合媒体流102来自一个固定媒体元件105的情况下,解码***控制器也会暂停对固定媒体元件105的读取,从而最小化所需复合媒体流缓冲区114的大小和开支。
对于本领域技术人员来说,详细的执行细节是公知的,为了不混淆本发明的新颖性,这里不再进行重复。现在将参考以下不具有限制性的例子,描述本发明的各种更进一步的优选特征和实施例。
图2A是一个流程图,在一个高级别上示出了用于选择多个字幕子流的用户选择模式,在这里,假设显示优先级是按照所选择的子流的顺序。在步骤202,用户启动多字幕选择。这可以通过在一个特定的可编程远程控制设备上按键完成,该设备通过红外光通道与AV再生***100进行通讯,或者通过在AV再生***自身的一个控制面板用户界面(未示出)直接输入信息完成该步骤。例如,用户能在远程控制单元或者控制面板上按下一个或者多个按钮,从而启动多字幕,并且选择应该显示哪个字幕流。
在另外一种替代方案中,用户能够通过一个屏幕上的菜单输入该偏好信息。在步骤202中,启动多子流选择之后,用户为第一个流选择显示区域。在该选择之后,在步骤206设定对所选定的字幕进行显示。类似地,选择第二个字幕流,在步骤202中用户启动多子流选择,然后在步骤208为第二个流设定显示区域。在该选择之后,在步骤206设定对所选定的字幕进行显示,将最高显示优先级指定给第一个子流,将较低一级的显示优先级指定给第二个字幕子流。依次为所选定的子流重复该过程,这些子流按照递减的优先级进行显示。
如图2B所示,在一个替代选择模式中,一旦选定多个字幕子流,用户可以手动地为每个选定的字幕子流设定显示优先级。在步骤202启动多子流选择之后,在步骤210选定第一个流,在步骤212,可以通过在远程控制端使用数字键输入一个可变数字,或者从一个用于显示的固定选项栏为每个选定的字幕选择诸如高、普通、低,对显示优先级进行设定。一旦为所选定的子流设定了优先级,就在步骤214设定对所选定的多个字幕流进行显示。类似地,在步骤202中启动多子流选择,并且在步骤216中选定第二个流,并可以在步骤218设定显示优先级。为每个选定的子流重复该过程。
如果将一个后面的字幕子流设定为与之前定义的另一个子流相同的优先级,则可能产生一个错误状态。执行设置过程时给用户的反馈能够在视频再生单元166或者在一个远程设备上可视地示出。一旦选定多个字幕流,用户可以为每个所选定的字幕子流设定一个显示区域,如图2C所示。可以在步骤222为第一个字幕子流设定显示区域。这可以通过从一个用于显示区域的固定选项栏中为每个选定字幕选择诸如底部中央、顶部中央、顶部右侧、顶部左侧、底部右侧和底部左侧等来实现。如果为一个后面的字幕子流设定了和之前选定的区域相重叠的区域,则可能会产生一个错误状态。执行设置过程时给用户的反馈能够在视频再生单元166上可视性地示出。
图2C中示出了另外一种用于选择多个字幕子流并且为每个选定的子流选择一个显示区域的方法。在步骤202中启动多个子流的选择之后,在步骤220选择第一个流,然后可以在参考图2A所描述的步骤222中设定显示区域。一旦选定第一个流和为第一个流选定显示区域,就在步骤224设定对所选定的第一个字幕流进行显示。在步骤202启动多个子流的选择之后,在步骤226选择第二个流,然后可以在步骤228设定显示区域。一旦选定第二个流和为第二个流选定显示区域,就在步骤224设定对所选定的字幕流进行显示。
可以替换的是,再现的位置是灵活可变的,可以基于用户输入来确定,该用户输入包括定位一个定位点,比方说再现框的底部左侧角,基于用户输入确定在屏幕上的一个特定点,用户输入能够确定在显示屏幕上的一个X-Y(水平-垂直)位置。这些选择能够作为初始化或者设定过程的一部分,在访问一个选定复合媒体源104之前展示给用户。
显示位置\区域的选择能够作为初始化或者设定过程的一部分,在访问一个选定的复合媒体源104之前或者在播放AV显示之前展示给用户。可以替换的是,可以在AV应用播放过程中将它们展示给用户,其中,不会打断AV显示的播放,并且用户能够动态地选择字幕子流位于哪个区域。
图2D示出了通过在屏幕上和通过远程显示器将字幕选项展示给用户的一个可能的方法。在步骤202,启动多个流再生性能。一旦启动多个字幕流,就在步骤230进入用户进行多个子流选择的播放器模式。在步骤232,确定可用的字幕流。在步骤234,播放器能够使用语言和/或与字幕子流相关的特定描述,在屏幕上将选项展示给用户,从而选择在AV显示过程中要使用的多个字幕子流。
一旦确定该信息,就在步骤236将字幕流选择展示给用户。如果没有可用的语言和/或特定信息,播放器能够自动地将另外一个码值指定给每个流。如果没有用于选择的可用字幕子流,再生***能够在步骤238进入普通播放模式。如果有用于选择的可用字幕子流,则用户在步骤240进行对可用字幕子流的选择。
可以替换的是,可以使用一种在制作时预先确定的技术获得该信息。在该情况下,当制作AV应用时,AV应用会执行一个特定过程从而设定字幕子流。例如,这可以使用在保留域中的特定值或者提供一个在通常制作状况下不会发生的特定结构序列来实现。然后播放器能够使用AV应用程序的菜单,代替播放器生成的菜单,将设定多个流的选项提供给用户;每当用户从菜单中选择一个项目,播放器就检查确认是否已经设定了一个特定寄存器,如果已经设定了一个特定寄存器,则将对应的字幕子流加入要显示的子流列表中。播放器能够使用一个播放器特定显示或者在屏幕上的菜单上将反馈显示给用户。
例子1:一个AV应用中,有两个或者多个单一的字幕子流可用。***将一个要再现哪个字幕子流和每个字幕子流应该在屏幕的哪个位置进行显示的选项提供给用户。图1阐述了该播放器模式,图2至3示出用于该实施例的用户模式。
例子2:例如,每个字幕流可以采用不同的语言,并且该***能够提供给用户一个用于语言学习的有效工具:用户能够同时观看两个字幕子流,将一个字幕子流作为另外一个的参考。该应用例子对于亚洲市场特别有用,在该市场上,例如,能够同时显示英语和日语语言字幕流。当然,可以从复合媒体流中选择任意两种可用的语言。此外,基于用户的选择可以显示多于两种的字幕子流。
图5A至5B示出了该应用的例子,其中,以两种不同的配置示出了两个字幕子流。图5A示出了在顶部和底部方位显示两个字幕流的例子。通过一个特定的可编程远程控制单元502对AV再生***100进行编程。如参考图5A所述,在远程控制单元502上的第一个键用于启动多字幕子流。在该情况下,将第一个选定字幕子流504放置在接近画面底部的位置,将第二个选定字幕子流506放置在接近画面顶部的位置。第一个字幕子流的位置可以是接近视频再生单元166的画面底部的一个默认值。
类似地,图5B示出了在上面描述中选定的在并排方位显示的两个字幕流的例子。在该情况下,将第一个选定字幕子流508放置在接近画面底部左侧的位置,将第二个选定字幕子流510放置在接近画面底部右侧的位置。用户可以通过在特定的可编程远程控制设备502上按一个特定键,在这两个显示配置之间进行“切换”。用户所选定的字幕子流定义了一个显示配置,该配置确定选择了哪个字幕子流和如何显示该字幕子流。图5A定义了第一显示配置。图5B定义了第二显示配置。自动重放选择器将一个用户输入用于根据所选择的显示配置,自动地对复合媒体流的一个预先确定的部分进行重复再生,并且能够在预先确定的第一配置和第二配置之间进行切换。
根据一种工业标准,一个DVD视频应用能够包含最多32个字幕子流。当前,在DVD视频应用运行过程中,DVD视频播放器仅仅能够播放一种字幕流或者子流。当应用于DVD视频时,该创新定义了一种方法,用于对多个字幕子流进行同步再生,因此为语言教育提供了一种有用工具。
参考图4,在第二个实施例中示出了一个音频视频(AV)再生***400,用于在带有一个视频再生单元和多个音频再生单元的播放器模式中对包括多个音频子流的AV数据进行再生。AV再生***400接收由复合媒体源104提供的复合媒体流102。复合媒体源104可以是用于固定媒体元件405,例如数字化视频光盘(DVD)、或蓝光光盘(BD)的一种播放器设备。播放器设备能够从固定媒体元件405中读出信息并且生成复合媒体流402。
复合媒体流402包括:一个视频流106,包含多个音频子流的一个音频流108,和一个字幕流110。复合媒体流分离器单元112在解码***控制器170的控制下,接收复合媒体流102,生成视频流106、多个音频子流406和字幕流404。复合媒体流分离器单元112包括一个复合媒体流缓冲区114,用于接收和存储复合媒体流102并生成经过缓冲的复合媒体流116。将经过缓冲的复合媒体流116提供给复合媒体流解码器118,复合媒体流解码器118将视频数据流106、多个音频子流406和字幕流404从经过缓冲的复合媒体流116中分离出来。
视频解码器单元120接收视频数据流106并生成经过解码的视频输出122。视频解码器单元120包括一个视频缓冲区124,该视频缓冲区124接收视频数据流106并生成经过缓冲的视频流126。视频解码器接收经过缓冲的视频流126并生成经过解码的视频输出122。
本实施例的音频解码器单元412对多个音频子流进行同步解码,以生成对应的多个经过解码的音频输出。音频解码器单元412接收包含多个音频子流的音频流406并对每个音频子流进行缓冲,生成多个对应的经过缓冲的音频子流。
例如,采用第一音频缓冲区434对第一个音频子流进行缓冲,生成经过缓冲的第一音频子流436。第一音频解码器438接收经过缓冲的第一音频子流436,生成经过解码的第一音频输出432。类似地,采用第二音频缓冲区440对第二个音频子流进行缓冲,生成经过缓冲的第二音频子流442。第二音频解码器444接收经过缓冲的第二音频子流442,生成经过解码的第二音频输出448。
为用户选定的每个音频子流都进行这种缓冲和解码。该缓冲和解码仅仅是为了描述一个概念模式,而实际应用可以仅仅使用软件进行解码过程,或者使用硬件解码器,该解码器能够在实时AV应用播放的约束下,对两个或者更多的流进行解码。
字幕解码器单元408接收音频流404并生成经过解码的音频输出148。字幕解码器单元408包括一个字幕缓冲区142,该缓冲区接收字幕流404并生成经过缓冲的字幕流144。字幕解码器146接收经过缓冲的字幕流144并生成经过解码的字幕输出148。
视频再现单元158接收经过解码的视频输出122和经过解码的字幕输出148,生成再现后的视频输出410。再现后的视频输出410是经过解码的字幕输出148在经过解码的视频输出122上的叠加,其能够用于视频再生单元166。视频再生单元166接收再现后的视频输出410,并以视频形式进行再生。将上述多个经过解码的音频输出(432,448)中的每一个提供给多个音频再生单元420中的一个。例如,音频再生单元420接收经过解码的音频输出432,并以音频形式对经过解码的音频输出432进行再生。
音频再生单元420可以是包括双耳式耳机和播放解码器的远程音频播放器。所述多个经过解码的音频输出(432,448)可以包括一个立体声流,在该立体声流中,以互补形式对两个单声道流进行解码和再生。在该实施例中,多个用户能够在收听一个或者更多的选定音频流的同时,在视频再生单元166上观看经过再生的视频图像。例如,这种方式可以允许多个用户在公共的视频再生单元166上观看的同时,听到所选择语言的音频子流。
解码***控制器170为第二实施例的AV再生***400提供配置和同步。除了有关由AV应用提供的所希望的子流解码的信息之外,解码***控制器170还从用户命令单元414接收用户偏好信息。用户命令单元414包括一个多音频选择器416,多音频选择器416提供关于音频子流选择的一个被选定音频子流用户输418。术语“音频子流”是为了举例说明多个音频类型的流。第二实施例的每个音频子流在形式上都与第一实施例中的单一音频流相同。类似地,第一实施例的每个字幕子流在形式上都与第二实施例中的字幕流相同。
图6是一个流程图,示出了用于选择多个音频子流的一种用户选择方法。在步骤602,用户启动多音频流选择,其与步骤202中的描述相同。对于每个选定的音频子流都指定了一个特定的音频再生单元。例如,在步骤604设定对选定为第一音频子流的音频子流进行显示。一旦选定了第一音频子流,就在步骤606将其指定给第一音频再生单元。类似地,在步骤608设定对选定为第二音频子流的音频子流进行显示。一旦选定了第二音频子流,就在步骤610将其指定给第二显示单元。对每个选定的音频子流重复该步骤。
例子3:一个AV应用中,两个或者多个单一音频子流可用。***将一个个人音频播放***(例如双耳式耳机)和一个要在他们的个人音频播放***上对哪个音频子流进行解码的选项提供给用户。图4阐述了该播放器模式,其中,与双耳式耳机成对比,使用了一个远程播放设备。图6示出了用于本例子的一个用户模式。当在相同的时刻将相同的媒体显示提供给多个用户时,该例子应用可以用于提供音频对话翻译或者注释流。
例子4:根据一种工业标准,一个DVD视频应用能够包含最多8个音频子流。在DVD视频应用运行过程中,现有DVD视频播放器仅仅能够播放一种音频子流。当将本发明应用于一个标准DVD视频时,本发明定义了一种装置和一种方法,用于对多个音频流进行同步再生,因而为在一个DVD视频应用显示过程中输出个人化音频流提供了一种有用工具。
参考图7,在第三实施例中示出了一个音频视频(AV)再生***700,用于在具有多个视频再生单元的播放器模式中对AV数据进行再生,该AV数据包括多个字幕子流。AV再生***700接收由复合媒体源104提供的复合媒体流102。
复合媒体流102包括一个视频流106、一个音频流108和一个包含多个字幕子流的字幕流110。复合媒体流分离器单元112接收复合媒体流102,生成视频流106、音频流108和多个字幕子流。复合媒体流分离器单元112包括一个复合媒体流缓冲114,用于接收和存储复合媒体流102并生成经过缓冲的复合媒体流116。将经过缓冲的复合媒体流116提供给复合媒体流解码器118,复合媒体流解码器118从经过缓冲的复合媒体流116中分离出视频数据流106、音频流108和字幕流110。
视频解码器单元120接收视频数据流106并生成一个经过解码的视频输出122。音频解码器单元130接收音频流108并生成一个经过解码的音频输出132。本发明的字幕解码器单元140对多个字幕子流进行解码,并生成对应的多个经过解码的字幕输出(148,156)。对由用户选定的“n”个字幕子流中的每一个都执行这种缓冲和解码。
多个视频再现单元(158,702)中的每一个都接收经过解码的视频输出122和多个经过解码的字幕输出(148,156),以生成多个再现后的视频输出(160,704)。每个再现后的视频输出(160,704)都是对应的经过解码的字幕输出(148,156)在经过解码的视频输出122上的叠加。将经过解码的音频输出132和再现后的视频输出160提供给再生单元162,该再生单元162有一个音频再生单元164和一个视频再生单元166。音频再生单元164接收经过解码的音频输出132并以音频形式对经过解码的音频输出进行再生。视频再生单元166接收再现后的视频输出160并以视频形式对再现后的视频输出160进行再生。
解码***控制器170为再生***700提供配置和同步。除了有关由AV应用提供的所希望的子流解码的信息之外,解码***控制器170还从用户命令单元172接收用户偏好信息。用户命令单元172包括一个字幕子流选择器174,字幕子流选择器174提供关于字幕子流选择的一个被选定音频子流用户输入176。用户命令单元172可以包括一个字幕子流显示区域选择器178,其提供有关用于被选定字幕子流的选定的显示位置的一个显示位置用户输入180。
用户命令单元172还可以包括一个自动重放选择器182,自动重放选择器182提供了一个自动重放用户输入184,用于命令按照与上一次再生相同的显示配置,或者按照与上一次再生不同的显示配置,对再现后的视频输出160的一个预先确定的部分进行自动重复再生,该显示配置显示相同的选定字幕集合或不同的选定字幕集合。
图3是一个流程图,示出了一种用户选择方法,用于在多个视频再生单元上再现多个字幕子流。用户如上所述在步骤202中启动多字幕子流选择。对于每个选定的字幕子流都指定一个特定的视频再生单元。例如,在步骤302设定对被选定为第一字幕子流的字幕子流进行显示。一旦选定了第一字幕子流,就在步骤304将其指定给第一视频再生单元。类似地,在步骤306设定对选定为第二字幕子流的字幕子流进行显示。一旦选定了第二字幕子流,就在步骤308将其指定给第二显示单元。对每个选定的字幕子流重复该步骤。
参考图8,在第四实施例中示出了一个音频视频(AV)再生***800,用于在具有一个视频再生单元或显示的播放器模式中对AV数据进行再生,该AV数据包括多个字幕子流。AV再生***800接收由复合媒体源104提供的复合媒体流102。在该实施例中,将这些被选定的经过解码的字幕输出中的每一个都提供给远程字幕播放器804,例如个人数字助(PDA)或者其他用于对一个被选定的经过解码的字幕输出进行再生的设备。
解码***控制器170为AV再生***800提供配置和同步。除了有关由AV应用提供的所希望的子流解码的信息之外,解码***控制器170还从用户命令单元172接收用户偏好信息。用户命令单元802包括一个字幕子流选择器174,该字幕子流选择器174提供有关字幕子流选择的一个被选定字幕子流用户输入176。
图9是一个流程图,示出了与包含自动重放功能的第一、第三和第四实施例相关的一个用户模式。用户在步骤902启动多字幕子流的选择。在步骤904为第一个子流设定显示位置。在步骤906为第二个子流设定显示位置。一旦所有的被选定字幕子流都被选定后,用户仅仅用第一个字幕子流叠加在所述的视频再生单元上,对再生进行初始化。
用户可以初始化自动重放功能,该自动播放功能会重放相同的经过解码的视频输出,但是步骤912所示的第二再生过程中,会采用用于替代字幕显示的第二个字幕子流进行再现。可以通过在一个专门的可编程远程单元上按一个键,对自动重放功能进行初始化,或者可以在启动时或到达一个预先确定的帧时,对自动重放功能进行初始化。再现的视频输出因而可以在所有其他时间在两个选定的字幕子流之间切换。类似地,对于三个选定的字幕子流,每当重放第三次时,会重复一个字幕子流。
例子5:***能够提供一个界面,从而容易地重复AV节目的一个片段:“自动重放”功能。自动重放功能的片段长度可以由用户定义或者为固定长度。在每次自动重放时,一些媒体流在用户所进行的选择之间进行替换。媒体流可以是可互换的或者是独立的。***会提供给用户一个界面,用于定义哪些流应该是替换的。该界面会独立于AV节目播放。
例子6:目前,在DVD视频应用运行过程中,一个DVD视频播放器仅仅能够播放一个字幕流。改变字幕流需要在远程控制端进行按多次按钮(菜单按钮,设定菜单的选定,新字幕流的选定,重新开始播放按钮)。此外,用户还要将显示“倒回”到他们想要观看字幕改变的点上。当将本发明用于DVD视频时,定义了一种方法,能够在用户重复播放一个AV显示片段时,容易地在用户选定的字幕流之间进行切换。这对于语言学习是一个有用的工具。
例子7:目前,在DVD视频应用运行过程中,一个DVD视频播放器仅仅能够播放一个音频流。改变音频流需要在远程控制端进行按多次按钮(菜单按钮,设定菜单的选定,新音频流的选定,重新开始播放按钮)。此外,用户还不得不将显示“倒回”到他们想要听到音频改变的点上。当将本发明用于DVD视频时,定义了一种方法,能够在用户重复播放一个AV节目片段时,容易地(在远程控制器上按下一个键)在用户选定的音频流之间进行切换。这对于语言学习,和对于重复采用普通音频和特殊用途音频(注释等)的AV显示场景来说,是一个有用的工具。
例子8:目前,改变在一个DVD视频标题播放的音频和字幕流需要在远程控制端进行按多次按钮(菜单按钮,设定菜单的选定,新音频流的选定,字幕流的选定,重新开始播放按钮)。此外,用户还不得不将显示“倒回”到他们想要得到改变的点上。当将本发明用于DVD视频时,定义了一种方法,能够容易地(在远程控制器上按下一个键)在具有字幕播放和仅有音频播放的音频之间进行切换。这对于语言学习(观看带有音频和字幕的场景,然后观看仅仅带有音频的场景)来说,是一个有用的工具。
例子9:除了例子3所述的“自动重放”功能,***还可以为用户提供一种设备,用于在AV应用运行过程中定义一个“重放点”。该重放点会标识一个点,自动重放功能会在该点开始进行自动重复播放。本发明允许用户容易地对任意片段进行重复播放。
例子10:目前,DVD视频播放器不提供“自动重放”或者“重放点”功能。当将本发明用于DVD视频时,定义了一种方法,能够在用户重复播放一个AV显示片段时,容易地在用户选定的音频和/或字幕流之间进行切换。例如,能够通过在专门的可编程远程控制端按一个键,对自动重放功能进行初始化。可以通过在专门的可编程远程控制端按一个键,完成重放点的自身设定,因此用户能够定义重放点,其指示自动重放功能的开始点。用户可以在远程控制端按下一个特定的键设定重放点,然后在随后的时间按下自动重放按钮。按这两个按钮能够定义一个重复再生循环的两个端点,一个开始点和一个中止点。
例子11:作为替换,“自动重放”功能能够提供一种用于在制作时定义重放点的方法。这就允许内容制作者为容易地进行自动重放对片段进行定义。
例子12:目前,DVD视频格式没有为内容制作者提供用于定义重放点的方法。通过增加一种用于重放点的结构,内容制作者能够在一个DVD视频标题中,为用户在支持“自动重放”功能的播放器中的字幕和/或音频的自动重放而定义逻辑片段。这种结构能够通过使用现有结构中的保留字段进行添加,或者通过在光盘数据中添加新的结构进行添加。
例子13:在一个AV应用中有两个或者多个单一字幕流可用。***为每个用户提供一个个人显示器和在他们的个人显示器上对哪个字幕流进行解码的选项。图7至8示出了可以用于该例子的播放器模式,而图2A至2D示出了用户模式。该示例应用可以用于在相同的时间将相同的媒体显示提供给多个用户时,提供个人对话翻译。
参考图10,在第五实施例中示出了一个音频视频(AV)再生***1000,用于在带有一个单视频再生单元或者显示器的播放器模式中,对包含有多个视频子流的AV数据进行再生。AV再生***1000接收由复合媒体源104提供的复合媒体流102。
复合媒体流102包括多个视频流106、音频流108和字幕流110,视频流106包括多个视频子流或本领域中所称的“视角”。复合媒体流分离器单元112在解码***控制器170的控制下,接收复合媒体流102,并生成多个视频子流106、音频流108和字幕流110。复合媒体流分离器单元112包括一个复合媒体流缓冲区114,用于接收和存储复合媒体流102并且生成一个经过缓冲的复合媒体流116。将经过缓冲的复合媒体流116提供给复合媒体流解码器118,复合媒体流解码器118将视频流106、音频流108和字幕流110从经过缓冲的复合媒体流116中分离出来。
字幕解码单元148接收字幕流110并生成经过解码的字幕输出148。音频解码器单元130接收音频流108并生成经过解码的音频输出132。本实施例的视频解码器单元1060对多个视频子流或者视角进行同步解码,并生成对应的多个经过解码的视频输出(1024,1026)。对用户选定的“n”个视频子流中的每一个都执行这种缓冲和解码。
视频叠加单元1028接收经过解码的字幕输出148和多个经过解码的视频输出(1024,1026),以生成再现后的视频输出1030。解码***控制器170可以为视频叠加单元1028提供附加信息,从而基于由字幕子流选择器112提供给解码***控制器170的用户优先级信息,控制视频叠加的顺序。再现后的视频输出1030是多个经过解码的字幕输出和经过解码的视频输出(1024,1026)的阿尔法叠加。
将经过解码的音频输出132和再现后的视频输出1030提供给具有音频再生单元164和视频再生单元166的再生单元162。音频再生单元164接收经过解码的音频输出132并以音频的形式对经过解码的音频输出进行再生。视频再生单元166接收再现后的视频输出160并以视频的形式对再现后的视频输出160进行再生。
解码***控制器170为AV播放器模式100提供配置和同步处理。除了由AV应用提供的有关所希望的子流解码的信息之外,解码***控制器170还从解码命令单元172接收用户偏好信息。解码命令单元172包括一个视频多视角选择器1018,其提供关于视频子流选择的一个被选定视频子流用户输入176。除了由AV应用提供的字幕子流选择之外,解码***控制器170还使用该信息,从而同时使用播放器模式所支持的AV应用信息和附加用户输入,以决定在播放期间要再现哪个子流。可替换的是,可以使用附加用户输入替代由AV应用所提供的视频子流选择,从而提供播放器关于对哪些子流进行解码的完全控制。
解码器命令单元1014包括一个视角(视频)子流显示区域选择器178,其提供了关于所选定视角子流的所选定的显示位置的一个显示位置用户输入180。要将一个视频子流放置在正确的显示区域,可能需要对其进行缩放,这是解码过程的组成部分。
例子14:随着高清晰度显示器的出现,相对于DVD视频中所使用的标准清晰度分辨率,显示设备现在能够提供允许高于其6倍的分辨率。这就可以在一个高清晰度显示器上显示四个标准清晰度的视频流。例如,这可以用于同步显示与DVD标题不同的视角,而同时不降低质量。DVD视频支持最多九个不同的视频子流或者视角。
例子15:采用标准清晰度的显示器,能够将几个视频流缩放放置到显示器上。例如,这可以用于同步显示不同于DVD视频标题的视角,并为用户提供从每个摄像机的角度所拍摄的场景。
例子16:能够将不同的视频视角叠加到由AV应用所定义的当前视角上,从而提供视角的预览。对视角的预览用于给用户关于在每个视角中正在发生什么事的一个图片到图片的预览,从而允许用户在选择一个视角作为主显示之前,了解在该视角正在发生什么事。
图11中示出了一种方法,用于选择多个视频子流或者视角,然后为所选定的视频子流选择一个显示区域。在步骤1102中启动多子流选择之后,在步骤1104选定第一个视频子流,并且在步骤1106可以设定显示区域。一旦选定了第一个视频子流,并且为第一个视频子流选定了显示区域,就在步骤1108中设定对第一个选定视频子流进行显示。在步骤1110选定第二个视频子流,并且在步骤1112可以设定显示区域。一旦选定了第二个视频子流,并且为第二个视频子流选定了显示区域,就在步骤1108中设定对第二个选定视频子流进行显示。
参考图12,描述了一个带有两个字幕流子集的替代的自动重放模式,该模式包括在两个自动重放设定之间进行切换的能力。在步骤1202启动自动重放模式。在步骤1204中启动多字幕子流模式。在步骤1206中选定第一个重放设定并且控制流程进入步骤1208,为第一个重放设定来设定子流和显示区域,如参考图2A和2C所述。然后在步骤1210设定对在第一个重放设定中选定的字幕进行显示。类似地,如参考图2A和2C所述,在步骤1212中选定第二个重放设定并且控制流程进入步骤1214,为第二个重放设定来设定子流和显示区域。
然后在步骤1216设定对在第一个重放设定中选定的字幕进行显示。一旦完成了第一个重放设定和第二个重放设定,用户就可以使用用户选择方法在这两个自动重放设定之间进行切换,用户选择方法可以在屏幕上提供,或者在设备上提供,或者更简单地通过在一个远程控制单元上直接按键提供。如参考图5A至5B所述,自动重放选择提供了一个用户输入,从而采用所选定的显示配置自动地对复合媒体流的一个预定部分进行重复再生,并且能够在预定的第一和第二显示配置之间进行切换。
本发明的第六实施例接收一个复合媒体流,该复合媒体流包括如第二实施例的多个音频子流、如第三实施例中的多个字幕子流、和如第五实施例的多个视频子流。
图13是一个流程图,示出了引入一个媒体元件之后所进行的初始化设置。在步骤1302,将一个媒体元件105引入媒体源104。在步骤1304,解码***控制器170从媒体源104接收状态信息,该信息指明媒体元件105是否包括多个流的制作。如果媒体元件105包括多个流的制作,控制流程进入步骤1306,在该步骤中,启动用于多个流的选择的AV应用菜单。如果媒体元件105不包括多个流的制作,控制流程转移到附图2D中的步骤202,其中启动了多个字幕流的再生功能。
在步骤1306中,如果用户已经通过按键或者菜单选择,关闭了或者取消了多个流制作检测的自动检测能力,则如图2D所述,控制流程进入步骤202。如果激活了多个流制作的自动检测,则控制流程进入步骤1308,在该步骤中,启动多字幕子流。可以替换的是,能够检测多个音频子流,并且步骤1308会启动多个音频子流。
在启动多个音频子流之后,控制流程进入步骤1310,在该步骤中,进入用于对多个子流进行用户选择的播放器模式。一旦进入用于对多个子流进行用户选择的播放器模式,控制流程就进入步骤1312,在该步骤中,将AV应用子流选择菜单展示给用户。在该处,用户能够选择普通播放器模式,并且控制流程进入步骤1314,不选择多个子流。然而,在步骤1312,如果用户希望选择多个子流,则控制流程进入步骤1316,该步骤包括联系图2A和2C所述的用于多字幕子流选择的过程或者联系图2B所述的用于多音频子流选择的过程。
一旦选定了一个子流,控制流程就进入步骤1318,在该步骤中将选择作为一种确认而显示给用户,然后控制流程返回步骤1312。对于每个选定子流都重复从步骤1312到步骤1316、再到步骤1318、然后返回步骤1312的这个循环。一旦选定了所有想要的子流,用户从步骤1312选择进入步骤1314的播放器模式。
本领域技术人员会理解,能够对刚刚所述的优选实施例进行各种适应性改进和修改,而不偏离本发明的范围和思想。因此,应该理解,在附带的权利要求的范围内,本发明可以不按照这里所特定描述的来实施。

Claims (31)

1.一种音频视频(AV)再生***,用于在一种带有显示器的播放器模式中,对包括多个字幕子流的AV数据进行再生,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流,所述AV再生***包括:
复合媒体流分离器单元,用于接收复合媒体流并生成视频流、音频流和多个字幕流;
视频解码器单元,用于接收视频流并生成经过解码的视频输出;
音频解码器单元,用于接收音频流并生成经过解码的音频输出;
字幕解码器单元,用于同步地对多个字幕子流进行解码以生成对应的多个经过解码的字幕输出;
视频再现单元,用于接收所述经过解码的视频输出和所述多个经过解码的字幕输出并生成再现后的视频输出。
2.如权利要求1所述的AV再生***,
其中,所述再现后的视频输出是所述多个经过解码的字幕输出在所述经过解码的视频输出上的叠加,由视频显示单元进行再生。
3.如权利要求1所述的AV再生***,还包括:
解码***控制器,用于接收用户输入,以从多个字幕子流中选择字幕子流,从而对子流进行解码,并将经过解码的子流再现到视频显示器上,所述解码控制器用于接收用户输入,从而在视频显示器上为多个经过解码的字幕输出中的每一个选择一个显示位置,所述解码***控制器对经过解码的视频输出、经过解码的音频数据和多个经过解码的字幕输出进行同步。
4.如权利要求1所述的AV再生***,
其中,所述媒体流源是广播信号。
5.如权利要求1所述的AV再生***,
其中,所述媒体流源是固定媒体元件。
6.如权利要求5所述的AV再生***,
其中,所述固定媒体元件是数字化视频光盘(DVD)。
7.如权利要求5所述的AV再生***,
其中,所述固定媒体元件是蓝光光盘(BD)。
8.一种音频视频(AV)再生***,用于在一种带有显示器和多个音频播放器的播放器模式中,对包括多个音频子流的AV数据进行再生,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、包含多个音频子流的音频流和字幕流,所述AV再生***包括:
复合媒体流分离器单元,用于接收复合媒体流并生成视频流、多个音频子流和字幕流;
视频解码器单元,用于接收视频流并生成经过解码的视频输出;
音频解码器单元,用于同步地对多个音频子流进行解码并生成对应的多个经过解码的音频输出;
字幕解码器单元,用于接收字幕并且生成经过解码的字幕输出;以及
视频再现单元,用于接收经过解码的视频输出和经过解码的字幕输出,以生成再现后的视频输出。
9.如权利要求8所述的音频视频(AV)再生***,进一步包括:
解码***控制器,用于接收用户输入,以从多个音频子流中选择音频子流进行解码,所述解码***控制器将视频输出、多个音频输出和字幕输出同步。
10.如权利要求8所述的音频视频(AV)再生***,还包括:
多个远程音频播放器,用于接收多个经过解码的音频输出中的一个,并以音频形式播放所述经解码的音频输出。
11.一种音频视频(AV)再生***,用于在一种带有多个视频显示单元的播放器模式中,对包括多个字幕子流的AV数据进行再生,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流,所述AV再生***包括:
复合媒体流分离器单元,用于接收复合媒体流并生成视频流、音频子流和多个字幕流;
视频解码器单元,用于接收视频流并生成经过解码的视频输出;
音频解码器单元,用于接收音频流并生成经过解码的音频输出;
字幕解码器单元,用于同步地对多个字幕子流进行解码并生成对应的多个经过解码的字幕输出;和
多个视频再现单元,每个视频再现单元用于接收经过解码的视频输出和多个经过解码的字幕输出中的一个,以生成多个再现后的视频输出。
12.如权利要求11所述的音频视频(AV)再生***:
其中,每个再现后的视频输出都是选定的经过解码的字幕输出在经过解码的视频输出上的叠加,由多个视频显示器单元对其进行再生。
13.如权利要求11所述的音频视频(AV)再生***,还包括:
解码***控制器,用于接收用户输入,从多个字幕子流中选择若干个字幕子流进行解码,并在选定的视频显示器上再现每个经过解码的字幕输出,所述解码***控制器用于接收用户输入,选定多个字幕子流用于解码,并确定多个经过解码的字幕输出中的每一个在多个视频显示器上的显示位置,所述解码***控制器将视频输出、音频输出和多个字幕输出同步。
14.如权利要求11所述的音频视频(AV)再生***,还包括:
多个显示器单元,用于接收多个再现后的视频输出中的一个。
15.一种音频视频(AV)再生***,用于在一种带有多个远程字幕播放器单元的远程播放器模式中,对包括多个字幕子流的AV数据进行再生,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流,所述AV再生***包括:
复合媒体流分离器单元,用于接收复合媒体流并生成视频流、音频子流和多个字幕流;
视频解码器单元,用于接收视频流并生成经过解码的视频输出;
音频解码器单元,用于接收音频流并生成经过解码的音频输出;和
字幕解码器单元,用于同步地对多个字幕子流进行解码并生成对应的多个经过解码的字幕输出。
16.如权利要求15所述的音频视频(AV)再生***,还包括:
多个远程字幕播放器单元,用于接收所述多个经过解码的字幕输出中的一个。
17.如权利要求15所述的音频视频(AV)再生***,还包括:
解码***控制器,用于接收用户输出,从多个字幕子流中选择字幕子流进行解码,所述解码***控制器用于接收用户输入,选定多个字幕输出用于解码,所述解码***控制器对视频输出、音频输出和多个字幕输出进行同步。
18.一种在带有显示器的播放器模式中,对包括多个字幕子流的音频视频(AV)数据进行再生的方法,其包括:
接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流;
用户从所述多个字幕子流中选择若干字幕子流用于解码;
对所述视频流进行解码并生成经过解码的视频输出;
对所述音频流进行解码并生成经过解码的音频输出;
对若干选定的字幕子流进行解码并生成多个经过解码的字幕输出;
对所述经过解码的视频输出、经过解码的音频输出和多个经过解码的字幕输出进行同步;
用户为所述多个经过解码的字幕输出中的每一个选择一个显示位置;和
在对应的选定显示位置上,将所述多个经过解码的字幕输出叠加到经过解码的视频输出上,生成再现后的视频输出。
19.一种在带有显示器和多个音频播放器的播放器模式中,对包括多个音频子流的音频视频(AV)数据进行再生的方法,其包括:
接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、包含多个音频子流的音频流和字幕流;
用户从所述多个音频子流中选择若干音频子流用于解码;
对所述视频流进行解码并生成经过解码的视频输出;
对所述字幕流进行解码并生成经过解码的字幕输出;
对若干选定的音频子流进行解码并生成多个经过解码的音频输出;
对所述经过解码的视频输出、多个经过解码的音频输出和经过解码的字幕输出进行同步;和
在预先确定的显示位置上,将所述经过解码的字幕输出叠加在经过解码的视频输出上,生成再现后的视频输出。
20.一种在带有多个视频显示器单元的播放器模式中,对包括多个字幕子流的音频视频(AV)数据进行再生的方法,其包括:
接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流;
用户从所述多个字幕子流中选择若干字幕子流用于解码;
对所述视频流进行解码并生成经过解码的视频输出;
对所述音频流进行解码并生成经过解码的音频输出;
对若干选定的字幕子流进行解码并生成多个经过解码的字幕输出;
对所述经过解码的视频输出、经过解码的音频输出和多个经过解码的字幕输出进行同步;
用户为所述多个经过解码的字幕输出中的每一个选择一个显示位置;和
在预先确定的显示位置上,将所述多个经过解码的字幕输出中的每一个叠加到多个经过解码的视频输出中的一个上,生成多个再现后的视频输出,每个再现后的视频输出包括经过解码的字幕输出中一个的叠加。
21.一种在带有多个远程字幕播放器单元的播放器模式中,对包括多个字幕子流的音频视频(AV)数据进行再生的方法,其包括:
接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流;
用户从所述多个字幕子流中选择至少两个字幕子流用于解码;
对所述视频流进行解码并生成经过解码的视频输出;
对所述音频流进行解码并生成经过解码的音频输出;
对多个选定的字幕子流进行解码并生成多个经过解码的字幕输出;和
对所述经过解码的视频输出、经过解码的音频输出和多个经过解码的字幕输出进行同步。
22.一种音频视频(AV)再生***,用于在带有显示器的播放器模式中,对包括多个视频子流的AV数据进行再生,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括包含多个视频子流的视频流、音频流和字幕流,所述AV再生***包括:
复合媒体流分离器单元,用于接收复合媒体流并生成音频流、字幕流和多个视频子流;
视频解码器单元,用于同步地对多个视频子流进行解码并生成对应的多个经过解码的视频输出;
音频解码器单元,用于接收音频流并生成经过解码的音频输出;
字幕解码器单元,用于接收字幕流并生成经过解码的字幕输出;和
视频再现单元,用于接收多个经过解码的视频输出和经过解码的字幕输出并生成再现后的视频输出。
23.如权利要求3所述的AV再生***,
其中,选择多个字幕流的用户输入定义了第一显示配置,解码***控制器接收用户输入,从而对复合媒体流的一个预先确定的部分,采用第一显示配置自动地进行重复再生。
24.如权利要求23所述的AV再生***,
其中,选择多个字幕流的用户输入定义了第二显示配置,解码***控制器接收用户输入,从而对复合媒体流的一个预先确定的部分,采用第二显示配置自动地进行重复再生。
25.如权利要求24所述的AV再生***,
其中,用户输入在第一显示配置和第二显示配置之间进行选择切换。
26.一种机器可读媒介,所述媒介能够提供命令,在一系列处理器执行所述命令时,所述命令使所述一系列处理器执行如下操作:
接收复合媒体流,所述复合媒体流包括视频流、音频流和多个字幕子流;
对所述视频流进行解码并生成经过解码的视频输出;
对所述音频流进行解码并生成经过解码的音频输出;
对所述多个字幕子流进行解码并同步地生成多个经过解码的字幕输出;和
再现所述经过解码的视频输出和多个经过解码的字幕输出,生成再现后的视频输出。
27.一种机器可读媒介,所述媒介能够提供命令,在一系列处理器执行所述命令时,所述命令使所述一系列处理器执行如下操作:
接收复合媒体流,所述复合媒体流包括视频流、字幕流和多个音频子流。
对所述视频流进行解码并生成经过解码的视频输出;
对所述字幕流进行解码并生成经过解码的字幕输出;
对所述多个音频子流进行解码并同步地生成多个经过解码的音频输出;和
再现所述经过解码的视频输出和经过解码的字幕输出,生成再现后的视频输出。
28.一种机器可读媒介,所述媒介能够提供命令,在一系列处理器执行所述命令时,所述命令使所述一系列处理器执行如下:
接收复合媒体流,所述复合媒体流包括音频流、字幕流和多个视频子流。
对所述音频流进行解码并生成经过解码的音频输出;
对所述字幕流进行解码并生成经过解码的字幕输出;
对所述多个视频子流进行解码并同步地生成多个经过解码的视频输出;和
再现所述多个经过解码的视频输出和经过解码的字幕输出,生成再现后的视频输出。
29.一种机器可读媒介,所述媒介能够提供命令,在一系列处理器执行所述命令时,所述命令使所述一系列处理器执行如下操作:
接收复合媒体流,所述媒体包括视频流、音频流和多个字幕子流。
对所述视频流进行解码并生成经过解码的视频输出;
对所述音频流进行解码并生成经过解码的音频输出;
对所述多个字幕子流进行解码并同步地生成多个经过解码的字幕子流;和
再现所述经过解码的视频输出和多个经过解码的字幕输出中的每一个,生成多个再现后的视频输出。
30.在用于在带有显示器的播放器模式中对包含多个字幕子流的AV数据进行再生的音频视频(AV)再生***中,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流、音频流和包含多个字幕子流的字幕流,一种选择多个字幕子流在单一显示器单元上进行显示的方法,包括:
启动用户对于多个字幕流的选择;
对于多个字幕流中的每一个,用户(1)从多个字幕子流中选择一个字幕子流,用户(2)在单一显示器上为所选定的字幕子流设定对应的显示区域;和
在为所选定的字幕子流所设定的对应显示区域,显示所选定的多个字幕子流。
31.在用于在带有显示器的播放器模式中对包含多个字幕子流的AV数据进行再生的音频视频(AV)再生***中,所述AV再生***接收由复合媒体源提供的复合媒体流,所述复合媒体流包括视频流,音频流和包含多个字幕子流的字幕流,一种用于根据用户选定的优先级来选择多个字幕流在单一显示器单元上进行显示的方法,包括:
启动用户对于多个字幕流的选择;
对于多个字幕流中的每一个,用户(1)从多个字幕子流中选择一个字幕子流,用户(2)为所选定的字幕子流设定对应的显示优先级;和
根据为所选定的字幕子流所设定的对应的优先级,显示所选定的多个字幕子流。
CNB2004800074391A 2003-02-21 2004-02-20 同步地使用音频视频数据的设备和方法 Expired - Fee Related CN100562084C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US44916203P 2003-02-21 2003-02-21
US60/449,162 2003-02-21

Publications (2)

Publication Number Publication Date
CN1762155A true CN1762155A (zh) 2006-04-19
CN100562084C CN100562084C (zh) 2009-11-18

Family

ID=32927498

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800074391A Expired - Fee Related CN100562084C (zh) 2003-02-21 2004-02-20 同步地使用音频视频数据的设备和方法

Country Status (5)

Country Link
US (1) US20060210245A1 (zh)
EP (2) EP1604519B1 (zh)
JP (1) JP4550044B2 (zh)
CN (1) CN100562084C (zh)
WO (1) WO2004077811A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883228B (zh) * 2009-05-06 2012-06-13 三星电子(中国)研发中心 再现字幕的设备和方法
WO2012167638A1 (zh) * 2011-06-30 2012-12-13 华为技术有限公司 媒体数据控制方法及装置
CN104093085A (zh) * 2014-04-22 2014-10-08 腾讯科技(深圳)有限公司 信息显示方法和装置
CN104104990A (zh) * 2014-07-29 2014-10-15 小米科技有限责任公司 调整视频中字幕的方法及装置
CN105120324A (zh) * 2015-08-31 2015-12-02 北京暴风科技股份有限公司 一种分布式播放器实现方法及***
CN106340294A (zh) * 2016-09-29 2017-01-18 安徽声讯信息技术有限公司 基于同步翻译的新闻直播字幕在线制作***

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
TWI261753B (en) * 2004-01-09 2006-09-11 Rvideo Digital Technology Corp DVD playing structure and method for selection of playing multiple captions
JP4339206B2 (ja) * 2004-08-19 2009-10-07 ソニー株式会社 再生装置、再生方法および再生プログラム、ならびに、記録媒体
RU2008110923A (ru) * 2005-08-22 2009-09-27 Эл Джи Электроникс Инк. (Kr) Устройство и способ для воспроизведения данных, устройство и способ для записи данных и носитель записи
US20100220233A1 (en) * 2005-12-02 2010-09-02 Tte Technology, Inc. Closed caption data processing system and method
TWI269271B (en) * 2005-12-23 2006-12-21 Ren-Chi Jang DVD playback system capable of displaying multiple sentences and its subtitle generation method
US20100189415A1 (en) * 2006-01-20 2010-07-29 Pioneer Corporation Recording medium reproducing device and reproducing method
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
US8161111B2 (en) * 2006-03-27 2012-04-17 Packet Video, Corp System and method for identifying common media content
US20070234193A1 (en) * 2006-03-29 2007-10-04 Huan-Hung Peng Method for simultaneous display of multiple video tracks from multimedia content and playback system thereof
TWM304101U (en) * 2006-06-14 2007-01-01 Wei-Jing Yang DVD player capable of showing multi-national captions
US20090024922A1 (en) * 2006-07-31 2009-01-22 David Markowitz Method and system for synchronizing media files
US20080100631A1 (en) * 2006-10-30 2008-05-01 Doug Grearson Method and system for blu-ray/hd-dvd chip
KR101276833B1 (ko) 2006-11-10 2013-06-18 엘지전자 주식회사 수신기 및 이 수신기에서 데이터 방송을 시청하는 방법
CN103559165B (zh) 2007-01-05 2016-08-17 索尼克知识产权股份有限公司 包含连续播放的视频分配***
US8139632B2 (en) * 2007-03-23 2012-03-20 Advanced Micro Devices, Inc. Video decoder with adaptive outputs
JP4949912B2 (ja) * 2007-04-04 2012-06-13 株式会社タイトー 字幕表示領域決定装置及び字幕表示プログラム
KR20090032702A (ko) * 2007-09-28 2009-04-01 한국전자통신연구원 네트워크 기반의 맞춤형 콘텐츠 제공을 위한 사용자 장치및 그 방법과 저작 장치 및 그 방법
EP2223232A4 (en) 2007-11-16 2015-02-25 Sonic Ip Inc Hierarchical and reduced index structures for multimedia files
CN101540183A (zh) * 2008-03-18 2009-09-23 鸿富锦精密工业(深圳)有限公司 播放装置及其音频输出方法
TWI407362B (zh) * 2008-03-28 2013-09-01 Hon Hai Prec Ind Co Ltd 播放裝置及其音頻輸出方法
WO2009157893A1 (en) * 2008-06-24 2009-12-30 Thomson Licensing Method and system for redisplaying text
CA2782825C (en) 2009-12-04 2016-04-26 Divx, Llc Elementary bitstream cryptographic material transport systems and methods
JP5652642B2 (ja) * 2010-08-02 2015-01-14 ソニー株式会社 データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法
EP2416318B1 (en) * 2010-08-04 2016-10-12 Nero Ag Multi-language buffering during media playback
US10687118B2 (en) 2010-10-29 2020-06-16 Nbcuniversal Media, Llc Digital content and response processing system and method
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8806188B2 (en) 2011-08-31 2014-08-12 Sonic Ip, Inc. Systems and methods for performing adaptive bitrate streaming using automatically generated top level index files
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
CN105338394B (zh) 2014-06-19 2018-11-30 阿里巴巴集团控股有限公司 字幕数据的处理方法及***
ES2561936B1 (es) * 2014-08-29 2016-09-02 Oliver VIERA ALMOND Sistema para la reproducción simultánea de audio a partir de una única señal multiplexada
CN113259731B (zh) 2015-01-06 2023-07-04 帝威视有限公司 用于编码内容和在设备之间共享内容的***和方法
US10497382B2 (en) * 2016-12-16 2019-12-03 Google Llc Associating faces with voices for speaker diarization within videos
CN107707978B (zh) * 2017-09-28 2021-08-10 惠州Tcl移动通信有限公司 一种视频选择播放的控制方法、移动终端及存储介质
US20210074298A1 (en) * 2019-09-11 2021-03-11 Soundhound, Inc. Video conference captioning

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960003880B1 (ko) * 1992-10-12 1996-03-23 엘지전자주식회사 캡션 자막 표시 제어장치와 표시 제어방법
US5850500A (en) * 1995-06-28 1998-12-15 Kabushiki Kaisha Toshiba Recording medium comprising a plurality of different languages which are selectable independently of each other
US5684542A (en) * 1993-12-21 1997-11-04 Sony Corporation Video subtitle processing system
JP3577794B2 (ja) * 1995-07-18 2004-10-13 ソニー株式会社 データ復号化装置
JPH09102940A (ja) * 1995-08-02 1997-04-15 Sony Corp 動画像信号の符号化方法、符号化装置、復号化装置、記録媒体及び伝送方法
CN100364009C (zh) * 1995-08-21 2008-01-23 松下电器产业株式会社 再生设备及记录方法
EP0765082A3 (en) * 1995-09-25 1999-04-07 Sony Corporation Subtitle signal encoding/decoding
JP3728344B2 (ja) * 1996-03-22 2005-12-21 パイオニア株式会社 情報再生装置及び情報再生方法
DE69841532D1 (de) * 1997-08-29 2010-04-15 Panasonic Corp Optische Platte mit hierarchisch codiertem digitalen Videosignal, Wiedergabevorrichtung und Aufnahmevorrichtung für die optische Platte
US6408128B1 (en) * 1998-11-12 2002-06-18 Max Abecassis Replaying with supplementary information a segment of a video
US6476871B1 (en) * 1999-08-25 2002-11-05 Sharp Laboratories Of America, Inc. Text display on remote device
JP2001160940A (ja) * 1999-12-01 2001-06-12 Sony Corp 放送システム及び受信装置
JP2001169217A (ja) * 1999-12-06 2001-06-22 Onkyo Corp ビデオ出力装置
TW522379B (en) * 2000-05-26 2003-03-01 Cyberlink Corp DVD playback system for displaying two types of captions and the playback method
JP2002091409A (ja) * 2000-09-19 2002-03-27 Toshiba Corp 副映像処理機能付き再生装置
US6938101B2 (en) * 2001-01-29 2005-08-30 Universal Electronics Inc. Hand held device having a browser application
US7221405B2 (en) * 2001-01-31 2007-05-22 International Business Machines Corporation Universal closed caption portable receiver
DE10110043A1 (de) * 2001-03-02 2002-09-19 Bosch Gmbh Robert Verfahren zur Darstellung von Videodaten
JP4509436B2 (ja) * 2001-07-30 2010-07-21 船井電機株式会社 光ディスクの付加情報記録方法および光ディスク記録装置
DK1464172T3 (da) * 2001-12-24 2013-06-24 Intrasonics Sarl System til undertekstning
US7075587B2 (en) * 2002-01-04 2006-07-11 Industry-Academic Cooperation Foundation Yonsei University Video display apparatus with separate display means for textual information
JP4165895B2 (ja) * 2003-01-20 2008-10-15 エルジー エレクトロニクス インコーポレーテッド 記録された静止映像の再生を管理するためのデータ構造を有する記録媒体、それによる記録と再生の方法及び装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883228B (zh) * 2009-05-06 2012-06-13 三星电子(中国)研发中心 再现字幕的设备和方法
WO2012167638A1 (zh) * 2011-06-30 2012-12-13 华为技术有限公司 媒体数据控制方法及装置
CN102857478A (zh) * 2011-06-30 2013-01-02 华为技术有限公司 媒体数据控制方法及装置
CN102857478B (zh) * 2011-06-30 2016-09-28 华为技术有限公司 媒体数据控制方法及装置
CN104093085A (zh) * 2014-04-22 2014-10-08 腾讯科技(深圳)有限公司 信息显示方法和装置
CN104104990A (zh) * 2014-07-29 2014-10-15 小米科技有限责任公司 调整视频中字幕的方法及装置
CN104104990B (zh) * 2014-07-29 2018-06-19 小米科技有限责任公司 调整视频中字幕的方法及装置
CN105120324A (zh) * 2015-08-31 2015-12-02 北京暴风科技股份有限公司 一种分布式播放器实现方法及***
CN105120324B (zh) * 2015-08-31 2018-08-10 暴风集团股份有限公司 一种分布式播放器实现方法及***
CN106340294A (zh) * 2016-09-29 2017-01-18 安徽声讯信息技术有限公司 基于同步翻译的新闻直播字幕在线制作***

Also Published As

Publication number Publication date
EP2271089B1 (en) 2016-09-28
EP2271089A2 (en) 2011-01-05
US20060210245A1 (en) 2006-09-21
JP4550044B2 (ja) 2010-09-22
EP2271089A3 (en) 2011-08-03
WO2004077811A2 (en) 2004-09-10
CN100562084C (zh) 2009-11-18
WO2004077811A3 (en) 2004-12-09
EP1604519B1 (en) 2012-03-21
EP1604519A2 (en) 2005-12-14
JP2006521042A (ja) 2006-09-14
EP1604519A4 (en) 2006-04-26

Similar Documents

Publication Publication Date Title
CN1762155A (zh) 同步地使用音频视频数据的设备和方法
US10063775B2 (en) Content transmission apparatus, content transmission method, content reproduction apparatus, content reproduction method, program and content delivery system
CN1166193C (zh) 信息标记的方法和设备
CN100380287C (zh) 分层菜单图形用户接口
CN1218313C (zh) 用用户反馈回放有视频和图形项的记录载体的设备和方法
KR100438703B1 (ko) 계층적 이미지 인덱싱 방법 및 그 장치
RU2678323C2 (ru) Потоки данных элементов аудиовизуального контента
CN1604639A (zh) 小型化的视频馈送产生及用户界面
CN1637923A (zh) 活动画面数据的编辑设备和方法
CN1910696A (zh) 具有交互图形流的存储介质及用于再现该介质的设备
CN1976431A (zh) 控制设备及其与媒体源和娱乐***交互的方法
CN1175055A (zh) 信息记录介质、以及用于上述的记录装置和重放装置
CN1662047A (zh) 视频音频再生装置与视频音频再生方法
CN1228594A (zh) 数据记录介质及数据播放装置
CN101438583B (zh) 数字多功能光盘由内容而定的多视角浏览技术
CN101026725B (zh) 再现设备及再现方法
CN1745424A (zh) 存储剧情的信息存储介质以及记录该剧情的设备和方法
CN102378060A (zh) 音视频节目的浏览方法、装置及***
CN1901628A (zh) 在数字视频设备中再现文本的装置和方法
CN1901612A (zh) 图像显示装置的图像处理装置及方法
JP2009518881A (ja) コンテンツ提示オプティマイザ
CN100527797C (zh) 字幕显示位置自动侦测与调整装置及其方法
KR100850918B1 (ko) 디지털 방송 녹화기기에서의 광고 스킵방법
CN101079971A (zh) 接收多个电视频道和频道指南的家庭娱乐***及控制设备
CN1753097A (zh) 多制式信息记录介质,信息记录及播放的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091118

Termination date: 20200220