CN107682739A - 一种视频的语种字幕的生成方法和*** - Google Patents

一种视频的语种字幕的生成方法和*** Download PDF

Info

Publication number
CN107682739A
CN107682739A CN201710852781.0A CN201710852781A CN107682739A CN 107682739 A CN107682739 A CN 107682739A CN 201710852781 A CN201710852781 A CN 201710852781A CN 107682739 A CN107682739 A CN 107682739A
Authority
CN
China
Prior art keywords
languages
captions
video
languages captions
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710852781.0A
Other languages
English (en)
Inventor
陈朱尧
邬育靖
周强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU SHIDAKE INFORMATION TECHNOLOGY Co Ltd
Original Assignee
CHENGDU SHIDAKE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU SHIDAKE INFORMATION TECHNOLOGY Co Ltd filed Critical CHENGDU SHIDAKE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201710852781.0A priority Critical patent/CN107682739A/zh
Publication of CN107682739A publication Critical patent/CN107682739A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明涉及一种视频的语种字幕的生成方法和***。其中,该方法包括:接收用户发送的第一语种字幕请求信息;根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;获取视频的第二语种字幕数据信息;根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;根据第一语言代码和第二语言代码确定是否生成第一语种字幕。通过本实施例提供的根据第一语言代码和第二语言代码确定是否生成第一语种字幕的技术方案,一方面,避免了现有技术中语种字幕生成的效率低、耗时长的技术弊端;另一方面,实现了高效快速判断是否生成语种字幕的技术效果。

Description

一种视频的语种字幕的生成方法和***
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频的语种字幕的生成方法和***。
背景技术
随着科学技术的发展和科技的不断进步,网络视频技术也在不断的发展和进步。音乐、电台等音频节目以及电视剧、电影、综艺、网络直播等视频节目成为人们日常生活中,必不可少的休闲方式。同时,随着多元化的推进和国际间的元素流动,国外的电视剧也越来越受欢迎。所以,播放视频时的对不同的语种字幕进行快速准确的切换成了急需解决的问题。
在现有技术中,播放视频时,获取到视频信息后,基于网络连接,在网络上搜寻视频的字幕,然后在播放界面进行显示。现有语种字幕制作技术是通过字幕人员记录字幕文本,人工翻译,使用字幕制作软件,手动添加时间轴,才得到最后的字幕文件。
然而,在发明人实现本发明的过程中,发现至少存在以下问题:
1、语种字幕生成的效率低、耗时长,浪费人力物力;
2、由于通过人工方式进行制作,人为因素不可控,准确率低。
发明内容
为解决上述技术问题,本发明提供了一种视频的语种字幕的生成方法和***。
根据本发明的一个方面,本发明实施例提供了,一种视频的语种字幕的生成方法,所述方法包括:
接收用户发送的第一语种字幕请求信息;
根据所述第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
获取所述视频的第二语种字幕数据信息;
根据所述第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
根据所述第一语言代码和所述第二语言代码确定是否生成所述第一语种字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
进一步地,所述根据所述第一语言代码和所述第二语言代码确定是否生成所述第一字幕语种,具体包括:
当所述第一语言代码与所述第二语言代码不相同时,则获取所述视频的视频流数据;
根据所述视频流数据确定所述视频的视频流数据分片;
根据所述视频流数据分片生成所述第一语种字幕。
通过本实施例提供的:如果第一语言代码和第二语言代码不相同,则需要生成第一语种字幕的技术方案,且具体方案为:根据获取到的视频流数据确定视频流数据分片,根据视频流数据分片生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
进一步地,所述根据所述视频流数据分片生成所述第一语种字幕,具体包括:
通过预先设置的多媒体视频处理工具对所述视频流数据分片进行分离,得到音频流分片文件;
根据所述音频流分片文件生成所述第一语种字幕。
本实施例是对根据视频流数据分片生成第一语种字幕的技术方案进行进一步地阐述。通过对视频流数据分片分离后得到音频分片文件,根据音频分片文件生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
进一步地,所述根据所述音频流分片文件生成所述第一语种字幕,具体包括:
对所述音频流分片文件进行语音识别,得到所述第二语种字幕对应的第二语法信息;
将所述第二语法信息转化为所述第一语种字幕对应的第一语法信息;
根据所述第一语法信息生成所述第一语种字幕。
本实施例是对根据音频流分片文件生成所述第一语种字幕的技术方案进行详细的阐述。根据音频流分片文件得到第二语法信息,将第二语法信息转换为第一语法信息,以根据第一语法信息生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
进一步地,所述根据所述第一语法信息生成所述第一语种字幕,具体包括:
根据所述第一语法信息确定第一语种字幕对应的字幕信息;
获取所述音频流分片文件中与所述字幕信息对应的音频数据字段的时间标示信息;
根据所述字幕信息和所述时间标示信息生成所述第一语种字幕。
本实施例是对根据第一语法信息生成所述第一语种字幕的技术方案进行详细的阐述。根据第一语法信息确定字幕信息,根据字幕信息和获取到的时间标示信息生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
根据本发明的另一个方面,本发明提供了与上述方法相对应的一种视频的语种字幕的生成***,所述***包括:
第一接收模块:用于接收用户发送的第一语种字幕请求信息;
第一获取模块:用于根据所述第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
第二接收模块:用于获取所述视频的第二语种字幕数据信息;
第二获取模块:根据所述第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
确定模块:用于根据所述第一语言代码和所述第二语言代码确定是否生成所述第一语种字幕。
进一步地,所述确定模块具体用于:
当所述第一语言代码与所述第二语言代码不相同时,则获取所述视频的视频流数据;
根据所述视频流数据确定所述视频的视频流数据分片;
根据所述视频流数据分片生成所述第一语种字幕。
进一步地,所述确定模块还具体用于:
通过预先设置的多媒体视频处理工具对所述视频流数据分片进行分离,得到音频流分片文件;
根据所述音频流分片文件生成所述第一语种字幕。
进一步地,所述确定模块还具体用于:
对所述音频流分片文件进行语音识别,得到所述第二语种字幕对应的第二语法信息;
将所述第二语法信息转化为所述第一语种字幕对应的第一语法信息;
根据所述第一语法信息生成所述第一语种字幕。
进一步地,所述确定模块还具体用于:
根据所述第一语法信息确定第一语种字幕对应的字幕信息;
获取所述音频流分片文件中与所述字幕信息对应的音频数据字段的时间标示信息;
根据所述字幕信息和所述时间标示信息生成所述第一语种字幕。
附图说明
图1为本发明实施例提供的一种视频的语种字幕的生成方法的流程示意图;
图2为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图;
图3为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图;
图4为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图;
图5为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图;
图6为本发明实施例提供的一种视频的语种字幕的生成***的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、接口、技术之类的具体细节,以便透切理解本发明。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明提供了一种视频的语种字幕的生成方法和***。
根据本发明的一个方面,本发明实施例提供了一种视频的语种字幕的生成方法。
请参阅图1,图1为本发明实施例提供的一种视频的语种字幕的生成方法的流程示意图。
如图1所示,该方法包括:
步骤S100:接收用户发送的第一语种字幕请求信息;
步骤S200:根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
步骤S300:获取视频的第二语种字幕数据信息;
步骤S400:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
步骤S500:根据第一语言代码和第二语言代码确定是否生成第一语种字幕。
在本实施例中,根据用户发送的第一语种字幕请求信息确定第一语言代码,根据第二语种字幕数据信息获取第二语言代码,根据第一语言代码和第二语言代码判断是否生成第一语种字幕。
具体地,通过ISO639_language_code将第一语种字幕请求信息转换成第一语言代码。
例如:用户A在看视频时,想看到中文字幕的视频。于是,发送中文字幕请求信息,***根据该请求信息获取中文字幕对应的中文代码。获取正在播放视频的字幕数据信息,此时的字幕语种为英语,则根据英语字幕数据信息得到英语代码。根据中文代码和英文代码决定是否生成中文字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
请参阅图2,图2为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图。
如图2所示,该方法包括:
步骤S100:接收用户发送的第一语种字幕请求信息;
步骤S200:根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
步骤S300:获取视频的第二语种字幕数据信息;
步骤S400:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
步骤S510:当第一语言代码与第二语言代码不相同时,则获取视频的视频流数据;
步骤S520:根据视频流数据确定视频的视频流数据分片;
步骤S530:根据视频流数据分片生成第一语种字幕。
在本实施例中,在本实施例中,根据用户发送的第一语种字幕请求信息确定第一语言代码,根据第二语种字幕数据信息获取第二语言代码,当第一语言代码和第二语言代码不相同时,则通过获取到的视频流数据确定视频流数据分片,以根据视频流数据分片生成第一语种字幕。
具体地,通过算法分析第二语种字幕数据信息中的字幕描述符的标签值,以得到第二语种字幕数据信息对应的第二语种字幕第二语言代码。
例如:用户A在看视频时,想看到中文字幕的视频。于是,发送中文字幕请求信息,***根据该请求信息获取中文字幕对应的中文代码。获取正在播放视频的字幕数据信息,此时的字幕语种为英语,则根据英语字幕数据信息得到英语代码。
明显的,中文代码和英文代码并不相同。所以,获取视频的视频流数据B。根据视频流数据B确定该视频的视频流数据分片C,再根据视频流数据分片C生成中文字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
更进一步地,本实施例根据获取到的视频流数据确定视频流数据分片,根据视频流数据分片生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
请参阅图3,图3为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图。
如图3所示,该方法包括:
步骤S100:接收用户发送的第一语种字幕请求信息;
步骤S200:根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
步骤S300:获取视频的第二语种字幕数据信息;
步骤S400:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
步骤S510:当第一语言代码与第二语言代码不相同时,则获取视频的视频流数据;
步骤S520:根据视频流数据确定视频的视频流数据分片;
步骤S531:通过预先设置的多媒体视频处理工具对视频流数据分片进行分离,得到音频流分片文件;
步骤S532:根据音频流分片文件生成第一语种字幕。
例如:用户A在看视频时,想看到中文字幕的视频。于是,发送中文字幕请求信息,***根据该请求信息获取中文字幕对应的中文代码。获取正在播放视频的字幕数据信息,此时的字幕语种为英语,则根据英语字幕数据信息得到英语代码。
明显的,中文代码和英文代码并不相同。所以,获取视频的视频流数据B。根据视频流数据B确定该视频的视频流数据分片C,通过ffmpeg对视频流数据分片C进行分离,以得到音频流数据分片D,再根据视音频流数据分片D生成中文字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
更进一步地,通过对视频流数据分片分离后得到音频分片文件,根据音频分片文件生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
请参阅图4,图4为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图。
如图4所示,该方法包括:
步骤S100:接收用户发送的第一语种字幕请求信息;
步骤S200:根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
步骤S300:获取视频的第二语种字幕数据信息;
步骤S400:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
步骤S510:当第一语言代码与第二语言代码不相同时,则获取视频的视频流数据;
步骤S520:根据视频流数据确定视频的视频流数据分片;
步骤S531:通过预先设置的多媒体视频处理工具对视频流数据分片进行分离,得到音频流分片文件;
步骤S5321:对音频流分片文件进行语音识别,得到第二语种字幕对应的第二语法信息;
步骤S5322:将第二语法信息转化为第一语种字幕对应的第一语法信息;
步骤S5323:根据第一语法信息生成第一语种字幕。
例如:用户A在看视频时,想看到中文字幕的视频。于是,发送中文字幕请求信息,***根据该请求信息获取中文字幕对应的中文代码。获取正在播放视频的字幕数据信息,此时的字幕语种为英语,则根据英语字幕数据信息得到英语代码。
明显的,中文代码和英文代码并不相同。所以,获取视频的视频流数据B。根据视频流数据B确定该视频的视频流数据分片C,通过ffmpeg对视频流数据分片C进行分离,以得到音频流数据分片D。对音频流数据分片D进行语音识别,识别后得到英语语法信息,将英语语法信息转化为中文语法信息,再根据中文语法信息生成中文字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
更进一步地,根据音频流分片文件得到第二语法信息,将第二语法信息转换为第一语法信息,以根据第一语法信息生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
请参阅图5,图5为本发明另一实施例提供的一种视频的语种字幕的生成方法的流程示意图。
如图5所示,该方法包括:
步骤S100:接收用户发送的第一语种字幕请求信息;
步骤S200:根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
步骤S300:获取视频的第二语种字幕数据信息;
步骤S400:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
步骤S510:当第一语言代码与第二语言代码不相同时,则获取视频的视频流数据;
步骤S520:根据视频流数据确定视频的视频流数据分片;
步骤S531:通过预先设置的多媒体视频处理工具对视频流数据分片进行分离,得到音频流分片文件;
步骤S5321:对音频流分片文件进行语音识别,得到第二语种字幕对应的第二语法信息;
步骤S5322:将第二语法信息转化为第一语种字幕对应的第一语法信息;
步骤S53231:根据第一语法信息确定第一语种字幕对应的字幕信息;
步骤S53232:获取音频流分片文件中与字幕信息对应的音频数据字段的时间标示信息;
步骤S53233:根据字幕信息和时间标示信息生成第一语种字幕。
例如:用户A在看视频时,想看到中文字幕的视频。于是,发送中文字幕请求信息,***根据该请求信息获取中文字幕对应的中文代码。获取正在播放视频的字幕数据信息,此时的字幕语种为英语,则根据英语字幕数据信息得到英语代码。
明显的,中文代码和英文代码并不相同。所以,获取视频的视频流数据B。根据视频流数据B确定该视频的视频流数据分片C,通过ffmpeg对视频流数据分片C进行分离,以得到音频流数据分片D。对音频流数据分片D进行语音识别,识别后得到英语语法信息,将英语语法信息转化为中文语法信息。根据中文语法信息确定中文字幕信息,获取音频流分片文件中与字幕信息对应的音频数据字段的时间标示信息,可以理解的是,在一段视频中,时间信息不同,对应的字幕也会不相同。再根据字幕信息和时间标示信息生成中文字幕。
通过本实施例提供的:根据第一语种字幕请求信息获取第一语言代码,根据第二语种字幕请求信息获取第二语言代码,根据获取到的第一语言代码和第二语言代码,确认是否生成第一语种字幕的技术方案。一方面,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;另一方面,通过快速获取相关信息(第一语言代码和第二语言代码),并根据相关信息进行判断,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
更进一步地,根据第一语法信息生成所述第一语种字幕的技术方案进行详细的阐述。根据第一语法信息确定字幕信息,根据字幕信息和获取到的时间标示信息生成第一语种字幕。进一步实现了快速生成语种字幕整体效率的技术效果。
根据本发明的另一个方面,本发明提供了与上述方法相对应的一种视频的语种字幕的生成***。
请参阅图6,图6为本发明实施例提供的一种视频的语种字幕的生成***的结构示意图。
如图6所示,该***包括:
第一接收模块:用于接收用户发送的第一语种字幕请求信息;
第一获取模块:用于根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
第二接收模块:用于获取视频的第二语种字幕数据信息;
第二获取模块:根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
确定模块:用于根据第一语言代码和第二语言代码确定是否生成第一语种字幕。
进一步地,确定模块具体用于:
当第一语言代码与第二语言代码不相同时,则获取视频的视频流数据;
根据视频流数据确定视频的视频流数据分片;
根据视频流数据分片生成第一语种字幕。
进一步地,确定模块还具体用于:
通过预先设置的多媒体视频处理工具对视频流数据分片进行分离,得到音频流分片文件;
根据音频流分片文件生成第一语种字幕。
进一步地,确定模块还具体用于:
对音频流分片文件进行语音识别,得到第二语种字幕对应的第二语法信息;
将第二语法信息转化为第一语种字幕对应的第一语法信息;
根据第一语法信息生成第一语种字幕。
进一步地,确定模块还具体用于:
根据第一语法信息确定第一语种字幕对应的字幕信息;
获取音频流分片文件中与字幕信息对应的音频数据字段的时间标示信息;
根据字幕信息和时间标示信息生成第一语种字幕。
本发明通过接收用户发送的第一语种字幕请求信息;根据第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;获取视频的第二语种字幕数据信息;根据第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;根据第一语言代码和第二语言代码确定是否生成第一语种字幕的技术方案,避免了现有技术中通过人工生成语种字幕的效率低、耗时长的技术弊端;的技术问题,实现了高效且迅速判断是否生成语种字幕的技术效果,以此实现提高生成语种字幕整体效率的技术效果。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种视频的语种字幕的生成方法,其特征在于,所述方法包括:
接收用户发送的第一语种字幕请求信息;
根据所述第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
获取所述视频的第二语种字幕数据信息;
根据所述第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
根据所述第一语言代码和所述第二语言代码确定是否生成所述第一语种字幕。
2.根据权利要求1所述的一种视频的语种字幕的生成方法,其特征在于,所述根据所述第一语言代码和所述第二语言代码确定是否生成所述第一字幕语种,具体包括:
当所述第一语言代码与所述第二语言代码不相同时,则获取所述视频的视频流数据;
根据所述视频流数据确定所述视频的视频流数据分片;
根据所述视频流数据分片生成所述第一语种字幕。
3.根据权利要求2所述的一种视频的语种字幕的生成方法,其特征在于,所述根据所述视频流数据分片生成所述第一语种字幕,具体包括:
通过预先设置的多媒体视频处理工具对所述视频流数据分片进行分离,得到音频流分片文件;
根据所述音频流分片文件生成所述第一语种字幕。
4.根据权利要求3所述的一种视频的语种字幕的生成方法,其特征在于,所述根据所述音频流分片文件生成所述第一语种字幕,具体包括:
对所述音频流分片文件进行语音识别,得到所述第二语种字幕对应的第二语法信息;
将所述第二语法信息转化为所述第一语种字幕对应的第一语法信息;
根据所述第一语法信息生成所述第一语种字幕。
5.根据权利要求4所述的一种视频的语种字幕的生成方法,其特征在于,所述根据所述第一语法信息生成所述第一语种字幕,具体包括:
根据所述第一语法信息确定第一语种字幕对应的字幕信息;
获取所述音频流分片文件中与所述字幕信息对应的音频数据字段的时间标示信息;
根据所述字幕信息和所述时间标示信息生成所述第一语种字幕。
6.一种视频的语种字幕的生成***,其特征在于,所述***包括:
第一接收模块:用于接收用户发送的第一语种字幕请求信息;
第一获取模块:用于根据所述第一语种字幕请求信息获取第一语种字幕对应的第一语言代码;
第二获取模块:用于获取所述视频的第二语种字幕数据信息;
第三获取模块:根据所述第二语种字幕数据信息获取第二语种字幕对应的第二语言代码;
确定模块:用于根据所述第一语言代码和所述第二语言代码确定是否生成所述第一语种字幕。
7.根据权利要求6所述的一种视频的语种字幕的生成***,其特征在于,所述确定模块具体用于:
当所述第一语言代码与所述第二语言代码不相同时,则获取所述视频的视频流数据;
根据所述视频流数据确定所述视频的视频流数据分片;
根据所述视频流数据分片生成所述第一语种字幕。
8.根据权利要求7所述的一种视频的语种字幕的生成***,其特征在于,所述确定模块还具体用于:
通过预先设置的多媒体视频处理工具对所述视频流数据分片进行分离,得到音频流分片文件;
根据所述音频流分片文件生成所述第一语种字幕。
9.根据权利要求8所述的一种视频的语种字幕的生成***,其特征在于,所述确定模块还具体用于:
对所述音频流分片文件进行语音识别,得到所述第二语种字幕对应的第二语法信息;
将所述第二语法信息转化为所述第一语种字幕对应的第一语法信息;
根据所述第一语法信息生成所述第一语种字幕。
10.根据权利要求9所述的一种视频的语种字幕的生成***,其特征在于,所述确定模块还具体用于:
根据所述第一语法信息确定第一语种字幕对应的字幕信息;
获取所述音频流分片文件中与所述字幕信息对应的音频数据字段的时间标示信息;
根据所述字幕信息和所述时间标示信息生成所述第一语种字幕。
CN201710852781.0A 2017-09-20 2017-09-20 一种视频的语种字幕的生成方法和*** Pending CN107682739A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710852781.0A CN107682739A (zh) 2017-09-20 2017-09-20 一种视频的语种字幕的生成方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710852781.0A CN107682739A (zh) 2017-09-20 2017-09-20 一种视频的语种字幕的生成方法和***

Publications (1)

Publication Number Publication Date
CN107682739A true CN107682739A (zh) 2018-02-09

Family

ID=61136605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710852781.0A Pending CN107682739A (zh) 2017-09-20 2017-09-20 一种视频的语种字幕的生成方法和***

Country Status (1)

Country Link
CN (1) CN107682739A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569700A (zh) * 2021-07-23 2021-10-29 杭州菲助科技有限公司 一种通过外语视频生成配音素材的方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067775A (zh) * 2013-01-28 2013-04-24 Tcl集团股份有限公司 一种音视频终端的字幕显示方法、音视频终端及服务器
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN106303303A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的翻译方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067775A (zh) * 2013-01-28 2013-04-24 Tcl集团股份有限公司 一种音视频终端的字幕显示方法、音视频终端及服务器
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN106303303A (zh) * 2016-08-17 2017-01-04 北京金山安全软件有限公司 一种媒体文件字幕的翻译方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569700A (zh) * 2021-07-23 2021-10-29 杭州菲助科技有限公司 一种通过外语视频生成配音素材的方法和***

Similar Documents

Publication Publication Date Title
CN102256049B (zh) 自动化故事生成
CN106710592B (zh) 一种智能硬件设备中的语音识别纠错方法和装置
CN108231089B (zh) 基于人工智能的语音处理方法及装置
US20050203750A1 (en) Displaying text of speech in synchronization with the speech
CN105304080A (zh) 语音合成装置及方法
CN105336329B (zh) 一种语音处理方法及***
JP2019061662A (ja) 情報を抽出する方法及び装置
CN104115221A (zh) 基于文本到语音转换以及语义的音频人类交互证明
CN109660865B (zh) 为视频自动打视频标签的方法及装置、介质和电子设备
CN103853703A (zh) 一种信息处理方法及电子设备
CN103167360A (zh) 实现多语字幕翻译的方法
CN106205601B (zh) 确定文本语音单元的方法及***
CN110853615A (zh) 一种数据处理方法、装置及存储介质
CN110517668A (zh) 一种中英文混合语音识别***及方法
CN111698552A (zh) 一种视频资源的生成方法和装置
CN107908674A (zh) 语音判断方法及装置、存储介质和处理器
CN105280206A (zh) 一种音频的播放方法、装置
CN106550268B (zh) 视频处理方法和视频处理装置
CN112270917B (zh) 一种语音合成方法、装置、电子设备及可读存储介质
CN109376145B (zh) 影视对白数据库的建立方法、建立装置及存储介质
CN109460548B (zh) 一种面向智能机器人的故事数据处理方法及***
CN107682739A (zh) 一种视频的语种字幕的生成方法和***
CN114598933A (zh) 一种视频内容处理方法、***、终端及存储介质
CN110992984B (zh) 音频处理方法及装置、存储介质
CN106653029A (zh) 一种音频批量分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180209