CN1407795A

CN1407795A - 以选定的语言提供电视语音的装置和方法

Info

Publication number: CN1407795A
Application number: CN02141460A
Authority: CN
Inventors: C·J·斯通
Original assignee: General Instrument Corp
Current assignee: Arris Technology Inc
Priority date: 2001-08-30
Filing date: 2002-08-30
Publication date: 2003-04-02
Also published as: US20030046075A1; CA2398875A1

Abstract

根据收到的电视信号中的隐含字幕数据，以所需语言提供电视语音。代表文字的隐含字幕数据从电视信号中被提取，然后，隐含字幕数据经过一个语音合成器的处理，生成所述文字的所需语言的语音。隐含字幕数据在转换成语音的同时或者以前由第一语言被翻译成第二语言。或者，电视信号携带的隐含字幕数据可以有多种语言，所需语言的数据可以从电视信号中被选择和提取出来并转换成语音。

Description

以选定的语言提供电视语音的装置和方法

技术领域

本发明涉及电视***，尤其涉及让电视节目提供随节目录制的语言以外的另一种语言的装置和方法。

背景技术

电视节目包括音频部分和视频部分，音频部分以节目播放地的语言录制，然而，同一个地方并非所有的居民都说同一种语言，因此，应当提供对语言的选择，这样观众就可以更好的欣赏电视节目。

以前，解决语言问题的技术方法主要立足于提供一个以上的附加音频信号，每路附加音频信号携带电视节目不同的语言的音频部分。例如，在数字电视传输的许多建议中，有的主张提供第二音频节目(SAP)，可以用来以第二语言提供电视音频。这一解决方案存在一个问题，每路单独的音频信号需要占用额外的传输带宽。这种额外带宽的使用是不希望的，因为这些带宽本来可以用来提供如额外节目的服务。

以前，人们提供隐含字幕数据(closed caption data)，让听力障碍者可以以文字的形式欣赏到电视节目的音频部分。根据实用电视标准，这种数据以模拟和数字电视信号传输，例如，美国的国际电视***委员会的模拟电视标准，动画专家组的数字电视标准。过去，隐含字幕数据仅仅用于文字显示。

希望有一个***，它能够让观众可以在多种语言中选择电视节目音频部分使用的语言，而且这个***提供多种语言但每种语言又不占用额外的带宽。

本发明提供的一种电视音频***，除具有以上的优点外，还具有其它优点。

发明内容

本发明让电视观众可以选择电视语音的语言，为了达到这种功能，把隐含字幕数据从电视信号中提取出来。隐含字幕数据主要是文字，提取的隐含字幕数据经语音合成器处理生成所需语言的语音。

一个用户接口可以让用户从语音合成器提供的多种语言中选择一种，用户接口可以包括电视屏幕显示等。在一个实施例中，用户通过电视遥控所述屏幕显示进行交互。

由于电视信号已经包含第一种语言的音频，当选择另外一种语言时，该音频会被置于无声状态，这样，电视节目携带的音频就不会干扰语音合成器的音频输出。

在一个实施例中，隐含字幕数据首先被转换成文本，然后文本再转换成语音。隐含字幕数据可以是所需语言的文字，也可能不是所需语言的文字，这种情况下，在合成语音之前，要将其翻译成所需语言的文字。

实现本发明的实施例的设备包括：一个隐含字幕处理器，用以从已经有第一语言音频的电视节目中把隐含字幕数据提取出来，隐含字幕数据代表文字。一个语音合成器，用来把隐含字幕数据代表的文字转化成第二种语言的语音。

用户接口，用以让用户选择第二种语言。它可以包括一个可以让用户操控电视屏幕显示的遥控器，一个哑音电路，当语音合成器输出替换的语音时，将电视信号的音频置于无声状态。

本发明至少有一部分可以由软件程序实现，用来以所需语言提供电视语音。该软件包括，一个隐含字幕处理模块，用以从已经有第一语言音频的电视节目中把隐含字幕数据提取出来，所述隐含字幕数据代表文字，该软件可进一步包括一个语音合成模块，用来将所述隐含字幕数据代表的文字转换成第二语言的语音。

该软件还可进一步包括一个用户接口模块，让用户从多个不同的语言中选择一种作为第二语言。例如，用户接口模块可以包括一段软件代码，用以产生一个屏幕显示让用户通过遥控器选择想要的第二语言。还可以有一个哑音模块，当语音合成模块输出替换的语音时，启动哑音电路将电视信号的音频置于无声状态。

软件程序中的隐含字幕模块可以设计成能够把隐含字幕数据转化成文本，由语音合成模块处理成语音，文本可能是所需语言，也可能不是所需语言的文字，这种情况下，语音合成模块可以先将其翻译成第二语言再处理成语音，软件程序可以以机读媒体提供。

还有一种方法，在电视信号中提供多种语言其中一种的音频。电视信号中包含其中一种语言的音频，用户从中选择一种语言，如果所需语言并不是电视信号中包含的语言，电视信号中包含的语言就会被转换成所需语言的音频表示，一种情况，语言由隐含字幕信号提供的文本转换，另一种情况，语言由电视信号的音频转换。

附图说明

图1表示本发明***的主要部件的框图；

图2表示应用于本发明的软件举例的框图。

具体实施方式

本发明利用隐含字幕数据的文字，以及一个语音合成器，使电视音频以所需语言输出。这样，看电视时，观众就可以选择与节目相关联的主语言以外的另一种语言，作为听节目的语言。以前，观众要想听到节目随带的语言以外的语言，节目提供者就得在节目上提供另一种语言。这种需求限制了语言的数目，而且让节目提供者承担提供额外语言的重负。本发明解决了这一问题，它利用隐含字幕数据和文本至语音转换器(也就是一个语音合成器)，把隐含字幕文本转换成用户选择的语言，提供给用户的是所选择的语言而不是节目随带的语言。

图1表示本发明的相关硬件部件，一个隐含字幕处理器10从收到的电视节目中将隐含字幕数据(例如以文本的形式)提取出来，隐含字幕数据被传给文本至语音处理器12，它包含文本识别转换软件，用来将隐含字幕数据转换成所需语言。尽管图1表示处理器12可以把隐含字幕文本从英语转换成西班牙语、德语、法语和俄语，应当指出的是，只要有适当的软件，任何语言都可以作为起始语言，也可以提供任何目标语言。

文本至语音处理器技术已广为人知，任何适当的设备都可用以实施本发明，例如，日本东京的Oki Electric Industry Co.，Ltd.(Oki电子工业有限公司)销售的MSM7630型多路语音控制处理器能够对包括美式英语、欧洲英语、法语、德语、西班牙语和日语的六种语言进行文本至语音合成，该产品利用具有12位数模转换器的一个大型集成电路芯片，通过时域音调同步叠加技术(time domain-pitch synchronousoverlap-add technology)来提供人声音中的声波，从而提供自然发音，根据不同的应用，可以使用串口和并口，对用户词典进行编程以扩大词汇量，也可使用闪存(只读存储器)以便轻松升级。

本发明的文本至语音处理器12被编程以能够输出任何所需语言，语言还可以更换和扩充。例如，通过下载到设备上的软件模块，或者在设备的插口***一个永久存储卡(例如闪存)。为了进行语言选择，还可以为用户提供一个电动开关，或者图形化用户接口GUI。在一个实施例中，一个图形化用户接口(例如利用标准屏幕显示软硬件)出现在用户的电视屏幕上，上面列出该设备能“说”的语言，用户可以利用电视遥控器14选择一种语言，例如，按下对应于所需语言的按钮(比如数字按钮)，用户接口检测到遥控感应(比如通过红外线接收)，启动文本至语音处理器把收到的隐含字幕文本转换成所需的语言。

如果选择了节目随带的主语言以外的一种语言，文本至语音处理器12就向开关20发出一个切换信号，使文本至语音处理器的输出与电视音频放大器22和扬声器24连接。当开关20与文本至语音处理器连接时，原节目音频因为与音频电路22、24断开，所以处于无声状态。要想听节目原来的语言，就切换开关20，使原来的电视音频输出与放大器22和扬声器24连接。

图2给出了一个处理流程图和用于实现本发明的软件组件。特别指出，用户输入30传递给一个处理器32，处理器32可以是一个已经安装在电视机顶盒里的微处理器。微处理器控制的机顶盒例如美国宾夕法尼亚州摩托罗拉公司宽带通信部生产的DCT5000。处理器还接收包含主语言音频部分和隐含字幕数据的数字电视信号。需要指出，尽管图2说明了数字电视信号的处理过程，但是，隐含字幕数据也可以由模拟电视信号携带，再被提取出来以数字形式输入到处理器32。

处理器32以传统方式为用户电视提供视频34和音频36，根据本发明，所包括的软件38用以提供可以选择替换语言的电视音频36。软件38可以安装在机顶盒的永久存储部分(例如ROM)，可以在工厂或商店里安装，或者通过有线电视网、电话线以及无线通信途径下载到机顶盒。软件还可以存储在与机顶盒连接的个人多功能存储器、个人电脑等的硬盘和其他存储部分。

如图2所示，软件38包括一个使隐含字幕处理能把隐含字幕数据从电视信号中提取出来的隐含字幕处理模块，该隐含字幕处理模块把隐含字幕数据以文本形式提供给一个语音合成模块，把文本转换成所要的语言，并把由文本转化成的语音提供给用户电视或其他视频设备(比如磁带录像机、PVR等)的音频电路。

软件38还包括一个用户接口模块，它提供一个屏幕显示让用户可以选择他们想听的语言，该用户接口模块还负责电视(或者机顶盒，VCR，PVR等)遥控输入的信号的解码。还有一个哑音模块，用来将主要节目音频输出置于无声状态，从而可以通过电视音频***听到所选择的替换语言。需要指出的是，图2所示的实例只是用来说明本发明的目的，根据本发明还可以提供其他的实例。

这里应该指出，本发明给出了隐含字幕数据的一种新用途。这些数据用来让能听到语音的观众可以听到不同语言的语音，而不是为听力障碍者提供字幕文本。隐含字幕数据也可以以不同的语言由电视信号携带，可以直接输入到语音处理器，转换成语音而无需翻译。

尽管通过一个具体实例说明了本发明，但是应当理解，可以进行各种改动和变型而不脱离本发明的权利要求所述的范围。

Claims

1、一种以选定的语言提供电视语音的方法，该方法包括：

把隐含字幕数据从电视信号中提取出来，所述隐含字幕数据代表文字；以及

用一个语音合成器对提取出来的隐含字幕数据进行处理，提供所需语言的所述文字的语音。

2、如权利要求1所述的方法，包括提供一个用户接口，让用户从语音合成器能够提供的多种语言中选择一种语言。

3、如权利要求2所述的方法，其中所述用户接口包括一个电视屏幕显示。

4、如权利要求3所述的方法，其中所述用户通过一个电视遥控器所述屏幕显示进行交互。

5、如权利要求1所述的方法，其中所述电视信号包括一音频部分和一视频部分，所述方法包括进一步将所述音频部分置于无声状态。

6、如权利要求1所述的方法，其中所述处理步骤把所述隐含字幕数据转换成文本，然后将所述文本转换成语音。

7、如权利要求1所述的方法，其中所述隐含字幕数据代表所述所需语言的文字。

8、如权利要求1所述的方法，其中所述隐含字幕数据代表不同于所述所需语言的另一种语言的文字，所述处理步骤把所述文字翻译成所需语言。

9、一种以选定的语言提供电视语音的装置，该装置包括：

一隐含字幕处理器，用以把隐含字幕数据从带有第一语言音频部分的电视信号中提取出来，所述隐含字幕数据代表文字；以及

一个语音合成器，用来把所述隐含字幕数据代表的文字转换成第二种语言的语音。

10、如权利要求9所述的装置，进一步包括：

一个与所述语音合成器可操作地相联系的用户接口，让用户可以从多种不同的语言中选择出一种作为所述第二种语言。

11、如权利要求10所述的装置，其中所述用户接口包括一个电视屏幕显示。

12、如权利要求11所述的装置，其中所述用户接口进一步包括所述用户用来与所述屏幕显示进行交互的遥控器。

13、如权利要求9所述的装置，进一步包括一个哑音电路，用于在所述语音合成器提供替换的语音时，将所述电视信号的音频部分置于无声状态。

14、如权利要求9所述的装置，其中所述隐含字幕处理器将所述隐含字幕数据转换成文本以由所述语音合成器处理成语音。

15、如权利要求14所述的装置，其中所述文本是所述的第二语言文本。

16、如权利要求14所述的装置，其中所述文本是所述第二语言以外的一种语言的文本，所述语音合成器能够将所述文本翻译成所述第二语言以处理成语音。

17、一种以选定的语言提供电视语音的软件程序，该程序包括：

一个隐含字幕处理模块，用于把隐含字幕数据从具有第一语言音频部分的电视信号中提取出来，所述隐含字幕数据代表文字；以及

一个语音合成模块，用于将所述隐含字幕数据代表的文字转换成第二种语言的语音。

18、如权利要求17所述的软件程序，进一步包括一个用户接口模块，让用户可以从多种不同的语言中选择出一种作为所述的第二语言。

19、如权利要求18所述的软件程序，其中所述用户接口模块包括能产生一个屏幕显示让所述用户可以使用遥控器选择第二语言的软件代码。

20、如权利要求17所述的软件程序，进一步包括一个哑音模块，用以在所述语音合成模块输出替换的语音时，启动一哑音电路将所述电视信号的音频部分置于无声状态。

21、如权利要求17所述的软件程序，其中所述隐含字幕模块将所述隐含字幕数据转换成文本以由所述语音合成模块处理成语音。

22、如权利要求21所述的软件程序，其中所述文本是所述第二语言文本。

23、如权利要求21所述的软件程序，其中所述文本是所述第二语言以外的另一语言文本，所述语音合成模块用以将所述文本翻译成所述第二语言以用来处理成语音。

24、一个含有权利要求17所述软件程序的机读媒体。

25、一种根据电视信号以多种语言中的一种语言提供音频的方法，所述电视信号包含所述语言之一的所述音频，该方法包括：

允许用户从所述语言中选择一种；以及

如果所选择的语言并不包含在所述电视信号中，就将包含在所述电视信号中的语言转换成所选择的语言，以音频提供给所述用户。

26、如权利要求25所述的方法，其中所述语言是由隐含字幕信号提供的文本转换来的。

27、如权利要求25所述的方法，其中所述语言是由所述电视信号的音频部分转换来的。