CN1757068A

CN1757068A - 用于混合音频流的方法和设备以及信息存储介质

Info

Publication number: CN1757068A
Application number: CNA2003801100083A
Authority: CN
Inventors: 许丁权; 朴成煜; 郑铉权; 郑吉洙
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2002-12-28
Filing date: 2003-12-23
Publication date: 2006-04-05
Also published as: KR20040060718A; TW200413882A; US20040138873A1

Abstract

一种用于混合音频流的方法和设备，以及一种用于存储混合信息的信息存储介质。所述信息存储介质包括包含从各个多声道获得的多种音频数据的至少一种音频流和用于混合至少部分的多种音频数据的混合信息。因此，在不改变不同音频流的声道格式的情况下，混合和再现不同类型的声道分量是可能的。另外，对多声道分量执行动态混合也是可能的，因此，使得能够适应在音频内容及其特性中的改变，从而更适当地再现音频数据。特别地，由于混合信息在允许与用户交互的交互数据中被描述，所以向用户提供更多的应用是可能的。

Description

用于混合音频流的方法和设备以及信息存储介质

技术领域

本发明涉及一种混合从各个多声道获得的多种音频数据的方法和设备。

背景技术

图1是用于调整安装在个人计算机(PC)等中的音频播放器的音量的传统用户界面的示意图。用户可使用图1所示的音量控制界面来调整音频播放器的音量。当用户通过使用键盘或鼠标升高或降低音量按钮100来调整音频播放器的音量时，对从各个多声道获得的音频数据的音频混合被同时执行。然而，不管音频流声道的数量和声道类型，音频混合由音频播放器任意地确定。

例如，当再现包含从两个声道获得的音频数据的音频流时，来自第一声道的第一音频数据和来自第二声道的第二音频数据的输出声级在音频播放器中被预定。因此，第一和第二音频数据的输出声级被调整为预设的输出声级，调整的第一和第二音频数据的输出声级被混合。

然而，上面任意的音频混合具有一些问题。首先，在将输出声级调整到期望声级并混合第一和第二音频数据的同时，对于内容提供者不可能同时提供从两个分离的声道获得的第一音频数据和第二音频数据。这是因为目前的音频混合技术在反映内容提供者的意图的同时不允许音频混合。换句话说，由于同安装在个人计算机中的音频播放器中预定一样调整音频数据的输出声级并执行音频混合，所以在音频混合中几乎无法适当地反映内容制作者的意图。

其次，对于诸如歌词或电影剧本的音频内容一旦确定音频混合方法，则该混合方法被维持直到其再现完成为止。即，动态改变对音频内容执行的音频混合方法是不可能的。因此，对任何音频内容或特性不可做出适配。

再次，当一种类型的音频内容的声道分量与另一种类型的音频内容的声道分量混合时，仅同一类型的声道分量可被混合。换句话说，即使内容提供者想要提供通过混合来自不同声道的音频数据而获得的音频内容，制作这些内容也是不可能的。特别地，如果一种类型的音频内容包含多声道数据并且另一种类型的音频内容包含两声道数据，则在不改变所述两声道数据的声道格式的情况下混合两个声道数据和多声道数据的环绕分量是困难的。为了混合两声道数据和多声道数据的声道分量，两声道数据需要被变换成多声道数据格式，即，其声道格式在发送之前必须被改变。因此，两个声道数据的传输需要使用专门用于多声道数据的资源，从而导致资源浪费。特别地，当在再现包含诸如DVD-视频的多声道音频分量的视频的同时再现经互联网下载的一首MP3音乐时，这个问题变得严重。MP3音乐包括两个声道，即左声道和右声道。因此，在DVD-视频的再现期间，右声道和左声道的MP3声道音频数据分别仅与包含在DVD-视频中的多声道音频的右声道音频数据和左声道音频数据混合。另外，混合的音频数据的输出声级需要根据音频播放器的特性而被改变。因此，对于内容提供者将MP3音乐调整到期望的输出声级并且将MP3音乐与包含在DVD-视频中的环绕多声道声道音频数据混合是困难的。

发明内容

本发明提供一种可以在不改变用于组成不同类型音频内容的音频流的声道格式的情况下混合并再现不同类型声道分量的音频混合方法和设备，和一种存储音频混合信息的信息存储介质。

本发明还提供一种可以动态地改变对多声道分量执行的音频混合方法从而使在音频内容或特性中能够作出改变的音频混合方法和设备，和一种存储音频混合信息的信息存储介质。

根据本发明的一方面，提供一种信息存储介质，所述信息存储介质包括：包含从各个多声道获得的多种音频数据的至少一种音频流；和用于混合至少部分的多种音频数据的混合信息。

信息的混合包括用于调整音频数据的输出声级的混合系数信息。另外，混合信息还包括用于指定从多种音频数据获得的音频数据的混合关系信息。

混合信息被记录在使与用户能够进行交互的程序数据中。所述程序数据包括用java程序语言创建的java数据。

根据本发明的另一方面，提供一种信息存储介质，所述信息存储介质包括：第一音频流，其包含从各个多声道获得的多种音频数据；第二音频流，其包含从各个多声道获得的多种音频数据；和混合信息，其被记录在交互数据中以将来自第一音频流的至少一种音频数据与来自第二音频流的至少一种音频数据混合。

混合信息被记录在程序数据中，所述程序数据基于用于读取混合信息的平台和用于实现混合信息的java语言之间定义的接口使与用户之间的交互能够进行。所述程序数据包括用java程序语言创建的java数据。

根据本发明的另一方面，提供一种再现音频流的方法，所述方法包括：对包含从各个多声道获得的多种音频数据的至少一种音频流解码；和基于记录在交互数据中的混合信息将来自多声道中的至少两个声道的音频数据混合。

根据本发明的另一方面，提供一种再现音频流的设备，所述设备包括：解码器，其对包含从各个多声道获得的多种音频数据的音频流解码；和混合器，其基于混合信息将解码的音频数据的至少两部分混合。

根据本发明的另一方面，提供一种再现音频流的设备，所述设备包括：解码器，其对包含从各个多声道获得的多种音频数据的第一音频流解码，并对包含从各个多声道获得的多种音频数据的第二音频流解码；和混合器，其基于混合信息将来自第一音频流的多声道中的至少一个声道的音频数据与来自第二音频流的多声道中的至少一个声道的音频数据混合。所述混合信息被记录在交互数据中。

本发明的另外方面和/或优点将在下面的描述中被部分地阐述，并且部分地根据描述将变得清楚，或可以通过实施本发明而被了解。

附图说明

通过结合附图，从实施例的下面描述中，本发明这些和/或其它方面及优点将会变得清楚，并且更易于理解，其中：

图1是用于调整安装在个人计算机(PC)等中的音频播放器的音量的传统用户界面的示意图；

图2A是示出根据本发明实施例的再现设备结构的方框图；

图2B是示出图2A的再现设备的实施例的结构的方框图；

图3A和3B示出根据本发明的包含从各个多声道获得的多种音频数据的音频流的例子；

图4是示出用于混合图3A的第一音频流和图3B的第二音频流的图2A的再现设备的另一实施例的结构的方框图；

图5示出根据本发明实施例的混合信息的数据结构；

图6示出根据本发明实施例的包含图5的混合信息的混合表；

图7是示出根据本发明的动态混合的示图；

图8示出根据本发明的定义混合信息的诸如应用程序接口(API)的接口的程序代码的例子；

图9示出使用ECMAScript定义被添加到标记文档的混合信息的图8的接口的代码的例子；

图10示出定义在图8中显示的IDL定义从而在java程序中使用IDL定义的JAVA包的代码的例子；

图11示出使用图10的JAVA包将混合信息添加到其中的java程序的代码的例子；

图12是示出根据本发明实施例的再现音频流的方法的流程图；

图13是示出根据本发明另一实施例的再现音频流的方法的流程图；和

图14A和14B示出图13的操作1306的实施例。

具体实施方式

现在将详细描述本发明的实施例，其示例在附图中示出，其中，相同的标号始终表示相同的部件。下面通过参照附图来描述这些实施例以解释本发明。

为了更好地理解本发明，将首先解释根据本发明的‘混合’。混合可被理解为以下之一：(i)调整来自多声道音频流中的至少两个声道的音频数据的输出声级；(ii)调整来自多声道音频流中的至少两个各声道的音频数据的各个输出声级，并将来自一个声道的调整的音频数据与至少一个其它声道的音频数据相结合；和(iii)将来自多声道音频流的各个多声道的音频数据相结合，并将结合结果输出到扬声器。另外，混合方法(i)至(iii)可应用于来自多个多声道音频流的各个多声道的音频数据。此外，动态混合包括根据本发明的‘混合’。

图2A是示出根据本发明实施例的再现设备的结构的方框图。参照图2A，再现设备基于根据本发明的混合信息混合来自至少一种多声道音频流的音频数据。再现设备包括解码器1和混合器2。解码器1对包含由其各个多声道来区分的多种音频数据的多声道音频流解码。混合器2基于混合信息混合解码的多种音频数据。更具体地讲，混合器2基于混合信息调整来自多音频流的音频数据的输出声级，并将包含在一种音频流中的音频数据与包含在另一音频流中的音频数据相结合。当音频流包含关于音频流的多样性混合信息时，混合器2根据内容或其它条件通过调整输出声级对音频流执行动态混合。动态混合随后将被详细描述。

图2B是示出图2A的再现设备的实施例的结构的方框图。参照图2B，记录设备包括解码器1、混合器2、网络收发器3和读取器4。网络收发器3将信息发送到网络和从网络接收信息。特别地，根据本发明的网络收发器3经网络接收音频流和/或混合信息。读取器4从诸如硬盘(HD)、压缩盘(CD)或数字多功能盘(DVD)的盘类型信息存储介质读取音频流和/或混合信息。音频流中的多种音频数据从各个多声道被获得并通过各个多声道被区分。混合信息可通过网络或从盘类型信息存储介质被获得。混合信息的详细的描述随后将被提供。

解码器1对由网络收发器3或读取器4提供的第一和第二音频流解码。混合器2基于从网络收发器3或读取器4获得的混合信息将来自第一多声道音频流的解码的音频数据与来自第二多声道音频流的解码的音频数据混合。更具体地讲，混合器2基于混合信息调整来自每一音频流的音频数据的输出声级并将包含在一种音频流中的音频数据与包含在另一音频流中的音频数据相结合，并将结合的结果发送到扬声器。

图3A和3B示出根据本发明的包含从各个多声道获得的多种音频数据的音频流的例子。

参照图3A，第一音频流包含从五个声道L、C、R、LS和RS获得的音频数据。这里，L、C、R、LS和RS分别指示左声道、中央声道、右声道、左环绕声道和右环绕声道。声道L、R和C提供稳定的虚拟声源，声道LS和RS提供三维(3D)、逼真声源。根据本发明，多种音频数据包含各个多声道信息。例如，如果从声道LS获得音频数据，则包含在该音频数据中的声道信息指示与声道LS对应的音频数据。

参照图3B，第二音频流包含从两个声道L和R获得的音频数据。这里，L和R分别指示左声道和右声道。第二音频流，即两声道音频流，使在右和左方向发出回声的声音能够再现。如关于图3A所解释的一样，来自各个多声道的各音频数据包含对应的声道信息。例如，如果音频数据从声道L被获得，则包含在所述音频数据中的声道信息指示音频数据与声道L对应。

图4是示出用于混合图3A的第一音频流和图3B的第二音频流的图2A的再现设备的另一实施例的结构的方框图。参照图4，再现设备包括具有第一解码器11和第二解码器12的解码单元1和混合器2。第一解码器11对包含对应于五个声道的音频数据的第一音频流解码，并根据五个声道L、R、C、LS和RS分别输出解码的音频数据。输出的音频数据作为五个分离的声道数据被发送到混合器2。第二解码器12对包含对应于两个声道L和R的音频数据的第二音频流解码，并且根据两个声道L和R分别输出解码的音频数据。输出的音频数据作为两个分离的声道数据也被发送到混合器2。

混合器2包括用于放大从第一解码器11和第二解码器12输入的音频数据的输出声级的放大器21至27，并包括将来自至少两个声道的多种音频数据相结合的加法器28和29。在图4中，两个加法器，即加法器28和29，作为例子被指定，但是对加法器的数量没有限制。如果必要，根据本发明的混合器2可包括用于结合来自图4中未示出的声道的音频数据的更多的加法器。

基于混合信息，混合器2使用放大器21至23通过混合系数1放大从第一解码器11输入的来自声道L、R和C的音频数据的输出声级，并使用放大器24和25通过混合系数0.5放大来自声道LS和RS的音频数据的输出声级。同样地，基于混合信息，混合器2使用放大器26和27通过使用放大器26和27的混合系数0.5来放大从第二解码器12输入的来自声道L和R的音频数据的输出声级。接着，混合器2使用加法器28和29将具有调整的输出声级的音频数据与来自声道LS和RS的音频数据相结合。即，来自第二音频流的声道L的音频数据和第二音频流的声道R的音频数据被分别与来自第一音频流的声道LS和RS的音频数据相结合。结合的结果经声道LS和RS被输出。因此，混合器2经五个声道L、R、C、LS和RS输出最终音频数据。

图5示出根据本发明实施例的混合信息的数据结构。参照图5，混合信息包含混合关系信息和/或混合系数信息。混合关系信息从多种音频数据中指定哪些音频数据被选择并被结合，混合系数信息指定当调整将被混合的音频数据的输出声级时使用的混合系数。另一方面，混合信息可仅包括混合关系信息和混合系数信息之一。

图6示出根据本发明实施例的包含图5的混合信息的混合表。参照图6，由包括在图4的再现设备中的混合器2使用的混合表包含包括混合关系信息和混合系数信息的混合信息。详细地，混合关系信息指定：输入到混合器2的音频流的标识符；输入到混合器2的音频流的声道分量；音频流标识符和将与另一随后的音频流的声道分量相结合的声道分量；和用于调整音频数据的输出声级的混合系数。混合表显示从第一音频流的声道L、R和C获得的音频数据的输出声级乘以混合系数1，来自声道LS和RS的音频数据的输出声级乘以混合系数0.5。即，来自声道LS和RS的音频数据的输出声级被减少一半，调整的音频数据与来自第二音频流的声道L和R的音频数据相结合。同时，来自第二音频流的声道L和R的音频数据的输出声级乘以混合系数0.5。即，来自第二音频流的声道L和R的音频数据的输出声级也被减少一半，并且调整的音频数据与来自第一音频流的声道LS和RS的音频数据相结合。

例如，如果第一音频流是AC3流而第二音频流是MP3流，则混合器2将来自AC3流的声道LS和RS的音频数据的输出声级减少一半；将来自MP3流的声道L和R的音频数据的输出声级减少一半；将来自声道LS和RS的调整的音频数据和来自声道L和R的调整的音频数据相结合；并且如混合表中指定的通过声道LS和RS发送结合的数据。

图7是示出根据本发明的动态混合的示图。详细地，图7示出包含从各个多声道L和S获得的音频数据并与视频数据一起被再现的音频流。在这种情况下，当再现时使用固定的混合系数可能不是最好的。例如，当电影与电影制片人的解说一起被显示时，可能应用这个方法。如果在安静场景和嘈杂的战争场景二者中以相同输出声级再现该解说，则输出声级可能太高而不能与安静场景的气氛匹配或在嘈杂的战争场景期间可能太低。为解决这个问题，以下内容被推荐：内容提供者提供列出用于适当地调整音频数据的输出声级以与电影中的各场景的气氛匹配的混合系数的多个混合表。如果混合表的数量多于一个，则参照定时信息还应该被提供。参照定时信息在图4中显示的再现设备的混合器2应该参照多个混合表的时间指定场合。混合器2通过调整不同的音频数据的输出声级使动态混合能够如参照定时信息所指示，在该参照定时信息中输出声级乘以多个混合表中列出的不同的混合系数。根据本发明的混合包括动态混合，在该动态混合中，当根据内容和内容提供者的意图，基于在再现内容的不同时间点上的不同的混合信息，音频混合被执行。

根据本发明的混合信息可被包括在交互数据中，该交互数据与比如高清晰度电影数据的音频/视频(AV)数据一起以传统的DVD-视频格式被存储。交互数据指示为了与用户交互或在浏览互联网的同时用于检测AV数据的标记数据和/或程序数据。标记数据指示以诸如超文本标记语言(HTML)或可扩展标记语言(XML)的标记语言描述的标记文档；或被***到标记文档中的诸如图形文件、图像文件或声音文件的标记资源。程序数据指示程序文件并向用户提供多种应用程序，其中，所述程序文件被包括在标记文档中或从标记文档被单独产生。通常，程序数据由脚本语言或java语言编写。

例如，交互数据格式的混合信息是应用程序接口(API)。对于API，用于再现存储在诸如DVD的信息存储介质中的混合信息的特殊平台和以其描述混合信息的特殊语言之间的接口必须被定义。特殊语言可以是标记数据中的JAVAScript或ECMAScript或与java数据中的JAVA语言对应。

图8示出定义根据本发明的混合信息的诸如应用程序接口(API)的接口的程序代码的例子。图8的接口表示平台和使用IDL定义的标记数据之间的接口。参照图8，第一流声道类型(FirstStream Channel Type)用预定整数指示用于进行音频混合的目标音频流的各个声道。通常，第一流指示传统的DVD-音频或存储在蓝光盘(BD)中的音频流。第二流声道类型(SecondStreamChannel Type)也用预定整数指示用于进行音频混合的目标音频流的各个多声道。通常，第二流指示被附加地与存储在DVD或BD中的音频数据一起再现的音频流。在这个公开中，为了方便而描述两个流声道，但是声道的数量没有被限制。

图8的属性(Attributes)部分中，audioFirstStreamMixLevel和audioSecondStreamMixLevel指示用于混合第一和第二流的系数，即，第一和第二流的音量声级。混合声级由从0至255范围内变化的系数确定。另外，SecondStream SyncTo FirstStreamPTS指示用于音频混合的参照定时信息，该参照定时信息指示第二音频流在第一音频流的特殊点PTS与第一音频流被同步再现。

另外，图8的接口示出用于混合第一和第二音频流的预定声道分量的setChannel()方法和用于音频数据再现的play()方法。

图9示出使用ECMAScript来定义被添加到标记文档的混合信息的图8的接口的代码的例子。

图10示出定义在图8中显示的IDL定义以在java程序中使用IDL定义的JAVA包的代码的例子。事实上，将JAVA包引入java程序使得能够使用在图8中定义的属性(Attributes)和方法(Methods)。

图11示出使用图10的JAVA包将混合信息添加到其中的java程序的代码的例子。

以下，将参照附图描述根据本发明实施例的再现音频数据的方法。

图12是示出根据本发明实施例的再现音频流的方法的流程图。参照图12，再现设备对包含从各个多声道获得的多种音频数据的音频流进行解码(操作1201)。然后，来自多声道中的至少两个声道的解码的音频数据基于混合信息被混合(操作1202)。这里，多种音频数据可属于单个音频流或不同的音频流。

图13是示出根据本发明另一实施例的再现音频流的方法。参照图13，再现设备经网络接收包含从各个多声道获得的多种音频数据的第一音频流(操作1301)。接着，再现设备经网络接收混合信息(操作1302)。接着，经网络接收到的第一音频流被解码(操作1303)。接着，包含从各个多声道获得的多种音频数据的第二音频流从盘类型信息存储介质被读取(操作1304)。接着，第二音频流被解码(操作1305)。接着，再现设备基于混合信息混合来自第一音频流的音频数据和来自第二音频流的音频数据(操作1306)。

图14A和14B示出图13的操作1306。参照图14A，再现设备基于包含在混合信息中的混合系数信息来调整来自多个音频流的音频数据的输出声级，并基于包含在混合信息中的混合关系信息来混合调整的音频数据(操作1401)。

参照图14B，再现设备基于包含在多种音频数据中的混合关系信息和声道信息检测将被结合的多种音频数据；基于混合系数信息调整检测到的多种音频数据的输出声级，并混合调整的多种音频数据(操作1402)。

产业上的可利用性

如上所述，根据本发明，在不改变不同音频流的声道格式的情况下混合和再现不同类型的声道分量是可能的。此外，对多声道分量执行动态混合也是可能的，因此使得能够适应在音频内容及其特性中的改变从而更适当地再现音频数据。特别地，根据本发明，由于混合信息在允许与用户交互的交互数据中被描述，所以向用户提供更多的应用是可能的。

尽管已经显示并描述了本发明的一些实施例，但本领域的技术人员应该理解，在不脱离由权利要求和其等同物限定其范围的本发明的原理和精神的情况下，可以在这个实施例中进行改变。

Claims

1、提供一种信息存储介质，包括：

至少一种音频流，其包含从各个多声道获得的多种音频数据；和

混合信息，其被用于混合至少部分的多种音频数据。

2、如权利要求1所述的信息存储介质，其中，所述混合信息包括用于调整所述音频数据的输出声级的混合系数信息。

3、如权利要求2所述的信息存储介质，其中，所述混合信息还包括用于指定从多种音频数据获得的音频数据的混合关系信息。

4、如权利要求1所述的信息存储介质，其中，所述混合信息被记录在交互数据中，所述交互数据与预定AV数据一起被再现以使与用户的交互能够进行。

5、如权利要求4所述的信息存储介质，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，其中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

6、如权利要求5所述的信息存储介质，其中，所述程序数据包括用java程序语言创建的java数据。

7、如权利要求4所述的信息存储介质，其中，所述混合信息被记录在使与用户能够进行交互的程序数据中。

8、如权利要求7所述的信息存储介质，其中，所述程序数据包括用java程序语言创建的java数据。

9、一种信息存储介质，包括：

第一音频流，其包含从各个多声道获得的多种音频数据；

第二音频流，其包含从各个多声道获得的多种音频数据；和

混合信息，其被记录在交互数据中以将来自第一音频流的至少一种音频数据与来自第二音频流的至少一种音频数据混合。

10、如权利要求9所述的信息存储介质，其中，所述混合信息包括用于指定音频数据的输出声级的混合系数信息。

11、如权利要求9所述的信息存储介质，其中，所述混合信息还包括用于指定从多种音频数据获得的音频数据的混合关系信息。

12、如权利要求9所述的信息存储介质，其中，所述混合信息包括关于第一和第二音频流的每一个的多个混合表。

13、如权利要求12所述的信息存储介质，其中，将被参照的参照定时信息被包括在每一混合表中。

14、如权利要求9所述的信息存储介质，其中，每一音频数据包括对应于相关声道的声道信息。

15、如权利要求9所述的信息存储介质，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，其中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

16、如权利要求9所述的信息存储介质，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在java数据中，其中，所述java数据被记录在与所述标记文档不同的文件中，和

其中，所述混合信息基于在用于读取所述混合信息的平台和用于实现混合所述混合信息的java语言之间定义的接口被记录。

17、如权利要求16所述的信息存储介质，其中，所述接口定义流声道类型信息，其中，所述流声道类型信息使用预定整数指定第一音频流的音频数据和第二音频流的音频数据，

其中，所述流声道类型信息具有表示用于确定所述音频数据的输出声级的混合系数信息的属性。

18、如权利要求17所述的信息存储介质，其中，所述混合信息包括所述流声道类型信息和所述属性。

19、如权利要求17所述的信息存储介质，其中，所述接口定义指定必须参照所述混合信息的时间的瞬间的参照定时信息，并定义混合第一和第二音频流的声道分量的方法。

20、如权利要求19所述的信息存储介质，其中，所述方法包括用于数据再现的setChannel方法和播放方法。

21、如权利要求9所述的信息存储介质，其中，所述混合信息被记录在使与用户的交互能够进行的程序数据中，和

其中，所述混合信息基于在用于读取混合信息的平台和用于实现混合信息的java程序语言之间定义的接口而被记录。

22、如权利要求21所述的信息存储介质，其中，所述程序数据包括用java程序语言创建的java数据。

23、一种再现音频流的方法，包括：

对包含从各个多声道获得的多种音频数据的至少一种音频流解码；和

基于记录在交互数据中的混合信息将来自各个多声道中的至少两个声道的音频数据混合。

24、如权利要求23所述的方法，其中，所述混合音频数据的步骤包括基于混合信息混合从多声道中的至少两个声道获得音频数据，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，其中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

25、如权利要求23所述的方法，其中，混合音频数据的步骤包括基于包括流声道类型信息和流声道类型信息的属性的混合信息调整音频数据的输出声级并且混合调整的输出声级，其中，所述流声道类型信息使用预定整数指定从各个多声道获得的多种音频数据，所述属性表示指定多种音频数据的输出声级的混合系数信息并从所述声道输出。

26、一种再现音频流的设备，包括：

解码器，其对包含从各个多声道获得的多种音频数据的音频流解码；和混合器，其基于混合信息将解码的音频数据的至少两部分混合。

27、如权利要求26所述的设备，其中，所述混合器基于包含在混合信息中的混合系数信息调整音频数据的输出声级。

28、如权利要求26所述的设备，其中，所述混合器基于包含在混合信息中的混合关系信息将来自多声道中的至少两个声道的音频数据相结合。

29、如权利要求26所述的设备，其中，所述混合器基于混合信息调整音频数据的输出声级并将从多声道中的至少两个声道获得的音频数据混合，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

30、如权利要求26所述的设备，其中，所述混合器基于包括流声道类型信息和所述流声道类型信息的属性的混合信息调整所述音频数据的输出声级，并且将从多声道中的至少两个声道获得的音频数据混合，其中，所述流声道类型信息使用预定整数指定从音频流的预定声道获得的音频数据，所述属性表示用于定义所述音频数据的输出声级的混合系数信息。

31、一种再现音频流的设备，包括：

解码器，其对包含从各个多声道获得的多种音频数据的第一音频流解码并对包含从各个多声道获得的多种音频数据的第二音频流解码；和

混合器，其基于混合信息将来自第一音频流的多声道中的至少一个声道的音频数据与来自第二音频流的多声道中的至少一个声道的音频数据混合。

32、如权利要求31所述的设备，还包括网络收发器，其经网络接收第一和第二音频流中的至少一个。

33、如权利要求31所述的设备，还包括读取器，其从盘类型信息存储介质读取第一和第二音频流中的至少一个。

34、如权利要求31所述的设备，还包括：

网络收发器，其经网络接收第一和第二音频流的至少一个声道；和

读取器，其从盘类型信息存储介质读取其它音频流。

35、如权利要求34所述的设备，其中，所述网络收发器经网络接收所述混合信息。

36、如权利要求34所述的设备，其中，所述读取器从所述盘类型信息存储介质读取混合信息。

37、如权利要求31所述的设备，其中，所述混合器基于包含在混合信息中的混合系数信息调整音频数据的输出声级，所述混合系数信息被用于调整音频数据的输出声级。

38、如权利要求31所述的设备，其中，所述混合器基于包含在混合信息中的混合关系信息将来自多个音频流的多声道中的至少两个声道的音频数据相结合，所述混合关系信息指定从多种音频数据获得的音频数据。

39、如权利要求31所述的设备，其中，所述混合器基于用于从多种音频数据获得的音频数据的混合关系信息和包含在音频数据中的声道信息检测音频数据，并基于包含在混合信息中的混合系数信息调整检测到的音频数据的输出声级，所述混合系数信息被用于调整检测到的音频数据的输出声级。

40、如权利要求31所述的设备，其中，所述混合器基于混合信息执行动态混合。

41、如权利要求31所述的设备，其中，所述混合器基于在交互数据中描述的混合信息调整音频数据的输出声级，并将从多声道中的至少两个声道获得的音频数据混合。

42、如权利要求31所述的设备，其中，所述混合器基于混合信息调整音频数据的输出声级并且将从多声道中的至少两个声道获得的音频数据混合，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，其中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

43、如权利要求31所述的设备，其中，所述混合器基于包括流声道类型信息和流声道类型信息的属性的混合信息调整音频数据的输出声级，并将从多声道中的至少两个声道获得的音频数据混合，流声道类型信息用预定整数指定以预定声道获得的音频数据，属性信息表示用于指定音频数据的输出声级的混合系数信息。

44、一种信息存储介质，包括：

至少一种音频流，其包含从多声道获得的多种音频数据；和

混合信息，其被用于在不改变不同音频流的声道格式的情况下将至少部分的多种音频数据相结合。

45、如权利要求44所述的信息存储介质，其中，所述混合信息被记录在交互数据中，所述交互数据与预定音频/可视数据一起被再现以使与用户的交互能够进行。

46、一种信息存储介质，包括：

第一音频流，其包含从第一源的多声道获得的多种音频数据；

第二音频流，其包含从第二源的多声道获得的多种音频数据；和

混合信息，其被记录在交互数据中，用于在不改变不同音频流的声道格式的情况下将来自第一音频流的至少一种音频数据与来自第二音频流的至少一种音频数据相结合。

47、如权利要求46所述的信息存储介质，其中，所述混合信息被用标记语言记录在使与用户的交互能够进行的标记文档中或被记录在程序数据中，其中，所述程序数据被记录在与所述标记文档不同的文件中并向用户提供预定应用程序。

48、一种再现音频流的方法，包括：

对包含从多声道获得的多种音频数据的至少一种音频流解码；和

在不改变不同音频流的声道格式的情况下，基于在记录在交互数据中的混合信息混合并再现来自多声道中的至少两个声道的音频数据。

49、一种用于再现音频流的设备，包括：

解码器，其对包含从各个多声道获得的多种音频数据的音频流解码；和

混合器，其在不改变不同音频流的声道格式的情况下基于记录在交互数据中的混合信息将至少两个部分的解码的音频数据混合。

50、如权利要求49所述的设备，其中，所述混合器基于包含在记录在交互数据中的混合信息中的混合系数信息调整音频数据的输出声级。

51、一种音频混合设备，包括：

解码器和混合器，其在不改变用于组成不同类型的音频内容的音频流的声道格式的情况下混合并再现不同类型的声道分量。

52、一种音频混合方法，包括：

在不改变用于组成不同类型音频内容的音频流的声道格式的情况下混合并再现不同类型的声道分量。

53、一种信息存储介质，包括：

可编程代码，用于在不改变用于组成不同类型的音频内容的音频流的声道格式的情况下混合并再现不同类型的声道分量。

54、一种再现设备，包括：

解码器和混合器，其基于包含在混合信息中的混合系数信息调整来自多个音频流的音频数据的输出声级，并基于包含在混合信息中的混合关系信息混合调整的音频数据。

55、一种再现方法，包括：

基于包含在多种音频数据中的混合关系信息和声道信息检测将被结合的多种音频数据；

基于混合系数信息调整检测到的多种音频数据的输出声级；和

将调整的多种音频数据混合。