CN100452874C - 播放流媒体字幕的方法及其流媒体播放器 - Google Patents

播放流媒体字幕的方法及其流媒体播放器 Download PDF

Info

Publication number
CN100452874C
CN100452874C CNB2005100345489A CN200510034548A CN100452874C CN 100452874 C CN100452874 C CN 100452874C CN B2005100345489 A CNB2005100345489 A CN B2005100345489A CN 200510034548 A CN200510034548 A CN 200510034548A CN 100452874 C CN100452874 C CN 100452874C
Authority
CN
China
Prior art keywords
stream
media
caption
timestamp
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2005100345489A
Other languages
English (en)
Other versions
CN1859565A (zh
Inventor
伍海君
王宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CNB2005100345489A priority Critical patent/CN100452874C/zh
Publication of CN1859565A publication Critical patent/CN1859565A/zh
Application granted granted Critical
Publication of CN100452874C publication Critical patent/CN100452874C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种播放流媒体字幕的方法,以解决现有技术在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题;该方法通过向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕服务,由所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕流,所述流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播放。

Description

播放流媒体字幕的方法及其流媒体播放器
技术领域
本发明涉及流媒体技术,尤其涉及播放流媒体字幕的方法及流媒体播放器。
背景技术
流媒体(Streaming Media)技术是一种新兴的网络传输技术,用于在互联网上实时顺序地传输和播放视/音频等多媒体内容的连续时基数据流,流媒体技术包括流媒体数据采集、视/音频编解码、存储、传输、播放等领域。在网络上传播多媒体信息主要有两种方式:下载和流式传输。下载方式是传统的传输方式,指在播放之前由用户下载多媒体文件至本地。流式传输则把多媒体信息通过服务器向用户实时地提供,采用这种方式时,用户不必等到整个文件全部下载完毕,而只需经过几秒或几十秒的启动时延即可播放,之后,客户端边接收数据边播放。
目前,流媒体技术广泛应用在多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育、实时视频会议和即时通讯等互联网的信息服务上。为了向用户提供更丰富的流媒体服务,一般在向用户提供流媒体服务的同时还提供字幕服务,现有技术提供字幕服务有以下两种方案:
1、流媒体服务器端解决方案,该方案在制作媒体流的时候同时制作好字幕流,再存储为媒体流和字幕流按时间顺序交错的媒体流文件;播放时,由客户端播放器直接解码媒体流和字幕流。
这种方案的缺点是字幕流和媒体流交错存储在文件里,对所有的用户都是提供相同的字幕流,不能针对不同的用户发送不同的字幕流,其灵活性较差,而且修改字幕流也不方便。
2、流媒体播放器客户端解决方案,该方案预先制作和对应媒体流匹配的字幕流文件,将该文件保存在客户端本地,客户端播放媒体流文件的同时显示相应字幕。
这种方案的缺点是字幕流内容不受服务器端控制,而且字幕流也不受流媒体供应商控制,对于一些现场直播类媒体流的字幕服务不能及时更新,因此,其灵活性和动态可控性差。
发明内容
本发明提供一种播放流媒体字幕的方法及流媒体播放器,以解决现有技术在同时提供流媒体和字幕服务时存在灵活性和动态可控性差的问题。
一种传送流媒体字幕的方法,该方法包括下述步骤:
向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕服务;
所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕流;
流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播放。
其中:
先向流媒体服务器请求流媒体服务,并在得到流媒体服务器的应答后再向字幕服务器请求字幕流服务。
所述流媒体服务器和/或字幕服务器在收到请求后还要求验证签名,并在对请求方提供的签名验证成功后向流媒体播放器发送流媒体和/或字幕流。
在判断时间戳匹配时,若当前媒体样本的时间戳与当前字幕流样本的时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,否则确定时间戳不匹配。
若所述流媒体中包含有视频流,则从流媒体中分离出视频流并与所字幕流合成新的视频流后进行播放。
本发明在播放媒体流的过程中,将媒体流中的视频流与字幕流动态的合成新的视频流播放,因而在对IM用户提供流媒体服务的时候,可以灵活的提供对应的字幕服务,这种字幕可以是对应的视频对白、音频字幕、广告字幕、消息字幕等;在本发明中字幕服务由服务器端提供,其动态可控性好,能够根据需要及时更新。采用本发明不仅能够满足不同的业务需求,而且也可作为一种增值服务为流媒体服务商增加收入来源、为用户提供更丰富的流媒体服务。
附图说明
图1为实现本发明网络***结构示意图;
图2为媒体流和字幕流服务的流程示意图;
图3A为媒体流的存储格式示意图;
图3B为字幕流存储格式示意图;
图4为流媒体播放器结构示意图;
图5为字幕组件处理字幕流的流程图。
具体实施方式
为了满足多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育、实时视频会议和即时通讯等信息服务对流媒体字幕技术的不同需求,提高其灵活性,本发明由字幕服务器控制字幕流,在流媒体播放器请求流媒体服务器提供流媒体服务时,向字幕服务器请求该流媒体对应的字幕服务;流媒体播放器接收到流媒体服务器和字幕服务器发送来的媒体流和字幕流后匹配时间戳,在字幕流时间戳与媒体流时间戳匹配时,将该字幕流转换为视频流与所述媒体流同步播放。
以下主要以即时通讯服务为例,结合附图对实现本发明进行详细说明:
如图1所示,实现本发明的即时网络***包括即时通讯用户客户端(IMClient)400(用户客户端为多个)、即时通讯服务器(IM Server)100、流媒体服务器200和字幕服务器300。其中:即时通讯服务器100负责管理用户和对即时通讯用户(IM User)登录进行认证,并对用户发放签名。流媒体服务器200向用户提供流媒体服务,并对访问流媒体服务器的用户进行认证。字幕服务器300向用户提供字幕服务,并对访问字幕服务器的用户进行认证。
参阅图2所示,在即时通讯客户端具有流媒体播放器500,该流媒体播放器500包括媒体流处理单元510、合成单元520和播放单元530。媒体流处理单元510接收和解码流媒体服务器通过网络传送来的媒体流,合成单元520将媒体流处理单元510输出的媒体流和字幕服务器300通过网络传送来的字幕流合成新的媒体流,播放单元530播放合成单元520输出的媒体流。
流媒体播放器500中,除合成单元520外,媒体流处理单元510和播放单元530可以是Windows操作***上安装的Windows Media Player中的单元。
参阅图3A所示,媒体流在流媒体服务器200上的存储格式和普通的流媒体服务器媒体流储存格式一致。
参阅图3B所示,在字幕服务器300上,期望和媒体流里某时间点同时出现的字幕则打上和该媒体流里相同的时间戳,以保证流媒体播放和字幕流同步显示。字幕服务器300上的字幕流采用无损压缩编码算法进行编码,如LZ77算法。
参阅图4所示,媒体流处理单元510包括:接收/缓冲组件511、音/视频媒体流分离组件512、音频解码组件513和视频解码组件514。接收/缓冲组件511接收并缓存从流媒体服务器200传送来的流媒体;音/视频媒体流分离组件512将接收/缓冲组件511输出的媒体流分离为音频流和视频流,并分别输出到音频解码组件513和视频解码组件514;音频解码组件513对音频流进行解码,视频解码组件514对视频流进行解码。
合成单元520包括:字幕接收/缓冲组件521、字幕解码组件522和视频/字幕合成组件523。字幕接收/缓冲组件521接收由字幕服务器300发送来的字幕流,并把接收到的字幕流按字幕流时间样本先后顺序保存在本地的一个缓冲队列里;字幕解码组件522对字幕接收/缓冲组件521输出的已编码字幕流数据,采用相应的解码算法进行解码,并将解码后的数据流写入字幕缓冲文件,如,字幕服务器300上的字幕流采用LZ77算法编码,字幕解码组件522则采用LZ77解码算法进行解码。既使用和字幕流编码对应的解码算法解码。视频/字幕合成组件523将视频解码组件514输出的视频流和字幕解码组件522输出的字幕流合成新的视频流并输出。
播放单元530包括音频播放组件531和视频播放组件532,音频播放组件531用于播放音频解码组件513输出的音频流,视频播放组件532用于播放视频/字幕合成组件523输出的视频流。
为了使字幕流和对应的媒体流同步播放,字幕流的时间戳必须与对应的媒体流的时间戳匹配(或者说明媒体流和字幕流的时间戳必须一致)。流媒体播放器500在确定字幕流和媒体流的时间戳是否匹配时,以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,如果当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配。如:阈值设定为2,媒体流的第一个媒体样本的时间戳是10,字幕流第一个样本的时间戳是110,则参考值为110-10=100。若经过5秒以后,当前媒体流的时间戳为10+5=15,此时收到的字幕流样本的时间戳为116,则当前字幕流样本的时间戳与当前媒体流样本时间戳的差值101(116-15=101)与参考值100的差为1,此时该差值1小于阈值2,流媒体播放器500则确定字幕流时间戳与流媒体时间戳匹配。
参阅图5所示,播放流媒体字幕的过程如下:
步骤10:即时通讯用户A首先向流媒体服务器200申请流媒体服务(标识该流媒体为C),在收到流媒体服务器200的应答后,通讯用户A再向字幕服务器300申请媒体流C对应的字幕服务。流媒体服务器对即时通讯用户A的应答中包括了是否需要认证、是否提供字幕流服务等信息。
步骤20:流媒体服务器200和字幕服务器300分别检查后确认可为该新用户提供流媒体服务和字幕服务,并要求用户A提供签名。
步骤30:用户A向即时通讯服务器100获取用于访问流媒体服务器200和字幕服务器300的签名,即时通讯服务器100返回一个可访问流媒体服务器的签名S1和一个可访问字幕服务器的签名S2,由用户发送签名给流媒体服务器200和字幕服务器300。
步骤40:流媒体服务器200和字幕服务器300分别认证签名S1和签名S2,若两个签名均通过认证,则流媒体服务器200和字幕服务器300分别向用户A发送媒体流C和对应的字幕流。若签名未通过认证,则服务器不会向用户A提供服务。
步骤50:即时通讯用户A客户端(IM Client)上启动的流媒体播放器500接收媒体流C和对应的字幕流,由媒体流处理单元510解码媒体流C并分离出音频流和视频流,合成单元520接收到视频流和解码后的字幕服务流后,判断视频流的时间戳与字幕流的时间戳是否匹配,如果匹配,则将该视频流和字幕流合成新的视频流,播放单元530播放媒体流处理单元510输出的音频流和合成单元520输出的视频流,从而达到媒体流和对应的字幕流同频播放。若不匹配,则缓存该字幕流,如果该字幕流时间戳的绝对差值和当前媒体流时间戳的绝对差值大于限定值,则认为该字幕样本已经无效,丢弃该样本。
在媒体流处理单元510中,视频解码组件514将媒体流中的视频流解码后,以位图(Bitmap)的格式传输给合成单元520中的视频/字幕合成组件523,视频/字幕合成组件523合成新的视频帧时将要显示字幕点阵在位图上对应的位置的位图点阵替换成字幕颜色,处理完当前帧要显示的所有字符的点阵即完成一帧的字幕、视频合成。
若上述的媒体流中不包含视频流即仅有音频流,视频/字幕合成组件523将字幕流单独转化成视频流的格式发送给视频显示组件532进行显示。
当然,流媒体服务器200和字幕服务器300也可能不需要用户提供签名而直接提供服务,即在上述步骤20、步骤30和步骤40中没有要求签名、获取签名和签名认证过程。
本发明在多媒体新闻发布、网上演示、在线直播、网络广告、电子商务、视频点播、远程教育和实时视频会议服务上的实现与上述即时通讯服务上的实现同理,在此不再赘述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1、一种播放流媒体字幕的方法,其特征在于包括下述步骤:
向流媒体服务器和字幕服务器分别请求流媒体服务和该流媒体对应的字幕服务;
所述流媒体服务器和字幕服务器分别向流媒体播放器发送媒体流和字幕流;
流媒体播放器以第一个媒体流样本的时间戳与第一个字幕流样本的时间戳的差值为参考值,根据当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差以及设定的阈值判断当前字幕流时间戳与当前媒体流时间戳是否匹配,并至少将时间戳匹配的字幕流转换为视频流与所述媒体流同步播放。
2、如权利要求1所述的方法,其特征在于,先向流媒体服务器请求流媒体服务,并在得到流媒体服务器的应答后再向字幕服务器请求字幕流服务。
3、如权利要求1所述的方法,其特征在于,所述流媒体服务器和/或字幕服务器在收到请求后还要求验证签名,并在对请求方提供的签名验证成功后向流媒体播放器发送流媒体和/或字幕流。
4、如权利要求1所述的方法,其特征在于,在判断时间戳是否匹配时,若当前字幕流样本的时间戳与当前媒体流样本时间戳的差值与所述参考值之差不大于设定的阈值,则确定所述当前媒体流时间戳与当前字幕流时间戳匹配,否则确定时间戳不匹配。
5、如权利要求1至4任一项所述的方法,其特征在于,若所述流媒体中包含有视频流,则从流媒体中分离出视频流并与所字幕流合成新的视频流后进行播放。
6、如权利要求5所述的方法,其特征在于,在合成视频流前还分别对视频流和字幕流进行解码。
7、如权利要求6所述的方法,其特征在于,将视频流解码为位图格式,在合成视频流时,将位图上待显示字幕点阵所占用位置的位图点阵替换成字幕颜色。
CNB2005100345489A 2005-05-01 2005-05-01 播放流媒体字幕的方法及其流媒体播放器 Active CN100452874C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100345489A CN100452874C (zh) 2005-05-01 2005-05-01 播放流媒体字幕的方法及其流媒体播放器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100345489A CN100452874C (zh) 2005-05-01 2005-05-01 播放流媒体字幕的方法及其流媒体播放器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN 200810088098 Division CN101262611B (zh) 2005-05-01 2005-05-01 一种流媒体播放器

Publications (2)

Publication Number Publication Date
CN1859565A CN1859565A (zh) 2006-11-08
CN100452874C true CN100452874C (zh) 2009-01-14

Family

ID=37298421

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100345489A Active CN100452874C (zh) 2005-05-01 2005-05-01 播放流媒体字幕的方法及其流媒体播放器

Country Status (1)

Country Link
CN (1) CN100452874C (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102067586B (zh) * 2008-03-05 2014-01-01 惠普开发有限公司 使外部内容在数字显示***中同步和窗口化
CN101808202B (zh) * 2009-02-18 2013-09-04 联想(北京)有限公司 实现影音文件中声音与字幕同步的方法、设备和计算机
CN101727951B (zh) * 2009-11-27 2013-01-30 北京搜狗科技发展有限公司 一种自动更改字幕播放时间的方法和装置
CN102760464B (zh) * 2011-04-29 2015-11-11 腾讯科技(深圳)有限公司 显示flash视频文件字幕的方法和装置
CN102347044B (zh) * 2011-05-20 2014-01-22 合一网络技术(北京)有限公司 一种用于嵌入式媒体播放器的同步显示、控制方法和***及设备
CN102323924A (zh) * 2011-05-20 2012-01-18 合一网络技术(北京)有限公司 一种控制嵌入式媒体播放器同步显示字幕、演示文稿、笔记的方法、***及设备
JP2012249058A (ja) * 2011-05-27 2012-12-13 Nec Corp 映像音声ファイル更新システム及び映像音声ファイル更新方法
CN102802044A (zh) * 2012-06-29 2012-11-28 华为终端有限公司 视频处理方法、终端及字幕服务器
CN103731609B (zh) * 2012-10-11 2019-04-26 百度在线网络技术(北京)有限公司 一种视频播放方法及***
US9363575B2 (en) * 2013-02-26 2016-06-07 Roku, Inc. Method and apparatus for viewing instant replay
WO2015035566A1 (en) * 2013-09-11 2015-03-19 Intel Corporation Integrated presentation of secondary content
CN103986940A (zh) * 2014-06-03 2014-08-13 王军明 一种视频字幕的流化方法
CN105848005A (zh) * 2016-03-28 2016-08-10 乐视控股(北京)有限公司 一种视频字幕的显示方法和装置
CN105848004A (zh) * 2016-05-16 2016-08-10 乐视控股(北京)有限公司 字幕播放方法、字幕播放装置
CN110166788B (zh) * 2018-08-02 2021-11-02 腾讯科技(深圳)有限公司 信息同步播放方法、装置及存储介质
CN113014984A (zh) * 2019-12-18 2021-06-22 深圳市万普拉斯科技有限公司 实时添加字幕方法、装置、计算机设备和计算机存储介质
CN115474066A (zh) * 2021-06-11 2022-12-13 北京有竹居网络技术有限公司 一种字幕处理方法、装置、电子设备和存储介质
CN113596546B (zh) * 2021-07-26 2023-09-08 Vidaa(荷兰)国际控股有限公司 一种多流节目的播放方法及显示设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805153A (en) * 1995-11-28 1998-09-08 Sun Microsystems, Inc. Method and system for resizing the subtitles of a video
US20040044532A1 (en) * 2002-09-03 2004-03-04 International Business Machines Corporation System and method for remote audio caption visualizations
CN1505032A (zh) * 2002-12-04 2004-06-16 上海乐金广电电子有限公司 利用国际互联网的光盘播放方法
US20040168203A1 (en) * 2002-12-12 2004-08-26 Seo Kang Soo Method and apparatus for presenting video data in synchronization with text-based data
CN1543212A (zh) * 2003-04-28 2004-11-03 株式会社东芝 再现装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805153A (en) * 1995-11-28 1998-09-08 Sun Microsystems, Inc. Method and system for resizing the subtitles of a video
US20040044532A1 (en) * 2002-09-03 2004-03-04 International Business Machines Corporation System and method for remote audio caption visualizations
CN1505032A (zh) * 2002-12-04 2004-06-16 上海乐金广电电子有限公司 利用国际互联网的光盘播放方法
US20040168203A1 (en) * 2002-12-12 2004-08-26 Seo Kang Soo Method and apparatus for presenting video data in synchronization with text-based data
CN1543212A (zh) * 2003-04-28 2004-11-03 株式会社东芝 再现装置

Also Published As

Publication number Publication date
CN1859565A (zh) 2006-11-08

Similar Documents

Publication Publication Date Title
CN100452874C (zh) 播放流媒体字幕的方法及其流媒体播放器
CN101262611B (zh) 一种流媒体播放器
TW561374B (en) Method and apparatus for selecting streaming media in real-time
US8045054B2 (en) Closed captioning language translation
US7996540B2 (en) Method and system for replacing media stream in a communication process of a terminal
CN103096128B (zh) 一种实现视频互动的方法、服务器、终端及***
DK2180652T3 (en) Method and system for transmitting media information
US20220303328A1 (en) Systems and methods for cloud storage direct streaming
CN1714554B (zh) 视听媒体编码***
US20120304235A1 (en) Method and system for playing video file, and media resource server
CN103024454B (zh) 在广播电视节目中向受众传送互动入口信息的方法及其***
CN108040061A (zh) 一种云会议直播方法
JP2003284037A (ja) マルチメディアデータ受信装置及び方法、マルチメディアデータ送信装置及び方法
KR20060003651A (ko) 네트워크를 통한 원격 멀티미디어 서비스 제공시스템에서의 동영상 및 이미지 데이터의 동기화 방법
US20210392397A1 (en) Content-Modification System with Volume Level Adjustment Feature
US20220248079A1 (en) Content-modification system with testing and reporting feature
CN113301359A (zh) 音视频处理方法、装置及电子设备
KR101371064B1 (ko) 방송 신호 전송 방법
CN102664900B (zh) 媒体业务提供方法和装置、媒体业务显示方法和装置
CN113114687A (zh) 一种iptv合流方法及***
CN109413476A (zh) 一种音视频与钢琴动作同步直播方法及***
KR102533674B1 (ko) 수신 장치, 송신 장치 및 데이터 처리 방법
KR20230098146A (ko) 실시간 스트리밍 미디어에 대상 콘텐츠의 삽입
CN1231063C (zh) 用于对数字广播音频内容确定目标的***和方法
CN106454547B (zh) 一种实时字幕播出方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant