CN107750009A

CN107750009A - 一种使用Android设备同步朗读视频文件外挂字幕的方法

Info

Publication number: CN107750009A
Application number: CN201711019961.7A
Authority: CN
Inventors: 李鸿利
Original assignee: Shenzhen Liandi Information Accessibility Co Ltd
Current assignee: Shenzhen Liandi Information Accessibility Co Ltd
Priority date: 2017-10-27
Filing date: 2017-10-27
Publication date: 2018-03-02

Abstract

本发明公开了一种使用Android设备同步朗读视频文件外挂字幕的方法，所述方法包括：步骤一、识别视频文件的身份标识；步骤二、识别该身份标识中的外文信息，并将该外文信息反馈给用户；步骤三、根据用户的选择，从服务器上调取与所述视频的身份标识唯一对应的视频字幕；步骤四、将所述唯一对应的视频字幕下载到本地；步骤五、调取文字转语音引擎，并根据设置阅读下载到本地的字幕。通过上述技术方案可以让视力障碍人可以和普通人一样的在Android设备上观看非母语的视频资源或者了解视频中的场景，从而解决视力障碍人无法看懂外语视频或者是错失视频中的关键场景的问题。

Description

一种使用Android设备同步朗读视频文件外挂字幕的方法

技术领域

本专利属于无障碍技术领域，具体而言涉及一种使用Android设备同步朗读视频文件外挂字幕的方法、

背景技术

无障碍技术是一种专门为身体功能有障碍的人士提供的辅助技术。例如，对于视觉有障碍的人士，提供一种通过听觉呈现视觉内容的技术，例如通过朗读网页来呈现网页上的内容。无障碍技术的应用为身体功能有障碍的人士提供了巨大的便利。但是随着信息化的发展，人们在日常生活中接触的媒体形态越来越多样，对于无障碍技术的挑战也越来越大。

例如，在视频播放中，当播放的视频使用的语言并不是母语时，需要视频观看者具有该视频语言理解的能力。这样才能理解视频中的内容。对于没有外语能力的人而言，现有技术中通常通过字幕的方式来呈现视频中的语言，字幕的出现能够帮助不具备外语能力或者外语能力较差的人理解视频中的外语，起到了很大的作用。但是对于具有视觉障碍的人士而言，字幕的出现就造成了极大的困扰，因为字幕的阅读是依靠视觉来完成的，而对于视觉有障碍的人士而言，不能够实现对于字幕的理解。

虽然在某些情况下，视觉障碍人士可以选择经过翻译的其它声音文件来获取相应的信息，但是对于当今时代，视频的大量传播而言，大量的视频都没有翻译的内容，只能通过字幕的方式来提供翻译，因此对视觉障碍人士的带来越来越多的困扰。

发明内容

本专利正是基于现有技术中的上述需求而提出的。本专利的提出是视觉功能障碍的人士，处于其知识背景和知识现状而提出的，因此本专利中本领域技术人员的标准应当考虑到视觉障碍人士的知识范畴，从而客观看待。

本专利要解决的技术问题是提供一种使Android设备同步朗读视频文件外挂字幕的方法，以方便视觉障碍人士获取视频中的外语信息。

为了解决该技术问题，本专利提供的技术方案包括：

一种使用Android设备同步朗读视频文件外挂字幕的方法，所述方法包括如下步骤：步骤一、识别视频文件的身份标识；在本步骤中，首先通过检测视频文件中的身份标识字段来识别视频的身份，所述视频的身份与该视频唯一对应。步骤二、识别该身份标识中的外文信息，并将该外文信息反馈给用户；在本步骤中，首先通过读取在所述视频中设置的外文信息的字段，所述字段包括专用标识外文信息的字段或者是视频的所述身份标识字段中的具体数字；识别出外文信息后，将所述外文信息反馈给用户，所述反馈包括语音反馈，或者是通过弹出对话框并通过读屏软件读取对话框的方式来反馈给用户相应的外文信息；步骤三、根据用户的选择，从服务器上调取与所述视频的身份标识唯一对应的视频字幕在本步骤中，根据外文信息反馈给用户后，所述用户选择了调取字幕时，与远程服务器进行匹配，调取与所述视频的身份标识唯一对应的视频字幕；所述匹配采用所述视频的身份标识完成，所述字幕包括将外文翻译成中文的字幕信息，和/或对于视频场景进行说明的信息；步骤四、将所述唯一对应的视频字幕下载到本地在本步骤中，将匹配完成后的视频字幕下载到本地，这种下载可以是一次下载完成，也可以是在视频播放的过程中进行下载；步骤五、调取文字转语音引擎，并根据设置阅读下载到本地的字幕。在本步骤中，通过调取文字转语音引擎来实现对于字幕的阅读，所述设置包括设置文字转语音引擎的阅读方式，包括但不限于，语音的时间轴、语速、音量。

通过上述技术方案可以让视力障碍人可以和普通人一样的在Android设备上观看非母语的视频资源或者了解视频中的场景，从而解决视力障碍人无法看懂外语视频或者是错失视频中的关键场景的问题。

具体实施方式

下面，对本专利的具体实施方式进行详细说明，需要指出的是该具体实施方式仅仅是对本专利优选技术方案的举例，并不能够理解为对本专利保护范围的限制。

本具体实施方式提供了一种使Android设备同步朗读视频文件外挂字幕的方法，所述方法包括如下步骤：

步骤一、识别视频文件的身份标识

在本步骤中，首先通过检测视频文件中的身份标识字段来识别视频的身份，所述视频的身份与该视频唯一对应。

在本步骤中，可以通过在视频文件的内容中设置视频身份标识的字段来标识视频文件的身份，例如，某视频文件头上设置″youku 100001″字段，来标识该视频文件。如果其它网站引用了该视频的链接，在播放时同样会通过读取视频文件的该字段来获取该视频文件的身份，或者是通过拷贝的方式离线播放该视频文件时，也可以得到该视频文件的身份，从而识别该文件。视频文件内容的读取可以通过播放器来完成，也可以通过其它能够读取该视频文件信息的软件来完成。

步骤二、识别该身份标识中的外文信息，并将该外文信息反馈给用户

在本步骤中，可以在所述视频中设置外文信息的字段，或者是直接在身份标识字段中设置外文信息的数字码来实现对于该视频是中文还是外文的识别。例如，在步骤一所举的例子中，可以通过设置字段″youku 100001″中数字的第一位的数值来标识该文件是中文还是外文，例如当第一位不是0时，可以认为该视频是外文视频，当第一位是0时，可以认为该视频是中文视频。此外还可以设置该第一位的具体数字，例如1代表英语，2代表法语，3代表西班牙语等等。

当识别出外文信息后，通过语音提示的方式反馈给用户，例如调用读音软件，读取″当前视频为外文视频，是否需要读取中文字幕？″。在将外文信息反馈给用户时，还可以通过设置对话框的方式来实现，例如设置弹出对话框，在弹出对话框后，通过读屏软件读取对话框的信息，这样也能够给视觉障碍人士来进行提示。同时对于没有视觉障碍的人士，也可以通过操作对话框的方式来实现字幕的调取和选择。

通常用户可以选择″是″或者″否″根据用户选择″是″，或者″否″来提供相应的读取字幕操作。

需要说明的是，该步骤二并不是本具体实施方式中必须的，在本具体实施方式中还可以直接进入步骤三，而无需检测外文信息，因为当视频的读取者在接触到外文时，可以自行判定是外文信息，从而给相关智能设备发送需要调取字幕的指令，从而实现对于外文视频的判断。但是通过设置步骤二的优点在于提示相关的视觉障碍人士具有外文视频字幕读取的功能，并引导他们进行相关的操作。

步骤三、根据用户的选择调取与所述视频的标识相应的视频字幕

在本步骤中，当用户选择了加载字幕之后，根据用户的上述选择，与远程的服务器通讯，从远程服务其上调取相应的视频字幕，所述视频字幕的调取可以根据相应的视频标识来完成，视频标识所标识的视频是唯一的，因此，根据视频标识就可以匹配到与该视频标识唯一对应的字幕。在本步骤中，需要远程服务器中存储相应的字幕，或者是能够提供获取这些字幕的途径。

在实际的环境中，可能出现这种情况，例如，视频的内容是相近似的，但是视频的拍摄角度或者是时间的截取上并不相同，这时，需要根据视频标识来选择加载相应的字幕，而不是根据视频的名称或者类似的信息来加载字幕，这样才能够保证字幕的准确性，从而便于视觉障碍的人士来获取相对准确的信息。所述字幕除了文字的翻译之外，还可以包括场景的说明，这需要根据具体的视频内容来单独制作，这样不仅能够解决外语造成的语言困扰，还能够通过文字或者其它方式来呈现视频中内容的状态，甚至对于观看者母语进行演讲的视频也可以添加相应的场景说明字幕从而提高视觉障碍人士对于视频信息获取的能力。

步骤四、将所述视频字幕下载到本地

在本步骤中，将匹配完成后的视频字幕下载到本地，这种下载可以是一次下载完成，也可以是在视频播放的过程中进行下载，比如随着视频的播放预先下载一段内容。这取决于视频的长短和字幕的大小；对于较小的字幕文件，或者是播放极短的视频时，采用一次性下载完成无疑是更为方便的。但是如果字幕文件包括了过多的信息，或者播放视频的时间足够长，也无需完全下载完成所有的字幕文件，而是根据视频播放来选择性地下载相应的字幕。所述字幕需要下载到本地，可以是易失性存储器也可以是非易失性存储器。因为在随后的步骤中需要对于所述字幕进行媒体的转换，因此在只有在本地存储有相应的数据，尽管这些数据可能不是全部的数据，才能够完成相应的媒体转换处理。

步骤五、调取文字转语音引擎，并根据设置阅读下载到本地的字幕。

在本步骤中，通过调取文字转语音引擎来实现对于字幕的阅读。所述文字转语音引擎可以采用现有技术中的插件或软件来实现，这在现有技术中已经有广泛的记载因此本专利并不详细展开。在本步骤中通过调取文字转语音引擎来阅读已经下载到本地的字幕，即完成了字幕的媒体转换，从而将外文信息或者是视频中的场景描述转化为文字然后再转换为语音，这样就给有视觉障碍的人员提供了了解视频内容的方便。此外，为了方便信息的传递，还可以设置文字转语音引擎的阅读方式，包括语音的时间轴，语速，音量等，这样可以提供更加丰富的视频浏览方式。

本发明可以让视力障碍人可以和普通人一样的在Android设备上观看非母语的视频资源，如美剧、国外的纪录片、TED演讲等；同时还能够通过字幕的加载让视觉障碍人士获取某些视频中的场景信息。通过在播放器播放视频文件的同时，再调用TTS(文字转语音)引擎将用户导入的外挂字幕文件按照时间轴与视频文件一起通过声音输出给用户，从而解决视力障碍人无法看懂外语视频或者是错失视频中的关键场景的问题。

Claims

1.一种使用Android设备同步朗读视频文件外挂字幕的方法，其特征在于，所述方法包括如下步骤：

步骤一、识别视频文件的身份标识

在本步骤中，首先通过读取在所述视频中设置的外文信息的字段，所述字段包括专用标识外文信息的字段或者是视频的所述身份标识字段中的具体数字；识别出外文信息后，将所述外文信息反馈给用户，所述反馈包括语音反馈，或者是通过弹出对话框并通过读屏软件读取对话框的方式来反馈给用户相应的外文信息；

步骤三、根据用户的选择，从服务器上调取与所述视频的身份标识唯一对应的视频字幕

在本步骤中，根据外文信息反馈给用户后，所述用户选择了调取字幕时，与远程服务器进行匹配，调取与所述视频的身份标识唯一对应的视频字幕；所述匹配采用所述视频的身份标识完成，所述字幕包括将外文翻译成中文的字幕信息，和/或对于视频场景进行说明的信息；

步骤四、将所述唯一对应的视频字幕下载到本地

在本步骤中，将匹配完成后的视频字幕下载到本地，这种下载可以是一次下载完成，也可以是在视频播放的过程中进行下载；

在本步骤中，通过调取文字转语音引擎来实现对于字幕的阅读，所述设置包括设置文字转语音引擎的阅读方式，包括但不限于，语音的时间轴、语速、音量。