CN106506335A - 分享视频文件的方法及装置 - Google Patents

分享视频文件的方法及装置 Download PDF

Info

Publication number
CN106506335A
CN106506335A CN201610990308.4A CN201610990308A CN106506335A CN 106506335 A CN106506335 A CN 106506335A CN 201610990308 A CN201610990308 A CN 201610990308A CN 106506335 A CN106506335 A CN 106506335A
Authority
CN
China
Prior art keywords
file
video file
word message
video
temporal information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610990308.4A
Other languages
English (en)
Other versions
CN106506335B (zh
Inventor
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201610990308.4A priority Critical patent/CN106506335B/zh
Publication of CN106506335A publication Critical patent/CN106506335A/zh
Application granted granted Critical
Publication of CN106506335B publication Critical patent/CN106506335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种分享视频文件的方法及装置,属于互联网技术领域。所述方法包括:获取待分享的第一视频文件;根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;将所述字幕文件***所述第一视频文件中,得到第二视频文件;向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。本公开由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。

Description

分享视频文件的方法及装置
技术领域
本公开涉及互联网技术领域,尤其涉及一种分享视频文件的方法及装置。
背景技术
随着互联网技术的发展,社交应用的功能越来越多;社交应用不仅具有聊天功能,还具有分享视频片段等功能;例如,社交应用为用户提供一个信息展示平台,用户可以将自己拍摄的视频片段分享到该信息展示平台,好友用户可以从该信息展示平台观看该视频片段。
目前,用户终端开启摄像头开始进行拍摄,得到视频片段,向社交应用服务器发送该视频片段;社交应用服务器将该视频片段发布到该信息展示平台。
发明内容
为克服相关技术中存在的问题,本公开提供一种分享视频文件的方法及装置,所述技术方案如下:
根据本公开实施例的第一方面,提供一种分享视频文件的方法,所述方法包括:
获取待分享的第一视频文件;
根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;
将所述字幕文件***所述第一视频文件中,得到第二视频文件;
向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
在一种可能的实现方式中,所述方法还包括:
获取用户选择的视频特效模板;
对于所述第二视频文件中的每帧图像包括的每一个像素点,根据所述视频特效模板,对所述像素点的第一图像数据进行处理,得到第二图像数据,将所述第一图像数据修改为所述第二图像数据。
本公开实施例中,终端还可以根据用户选择的视频特效,对第二视频文件进行特效处理,满足用户需求,提高了用户粘度。
在一种可能的实现方式中,所述根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,包括:
根据所述音频数据中的语音信息,获取所述语音信息的时间信息;
识别所述语音信息,得到第一文字信息,关联所述时间信息和所述第一文字信息;
将所述时间信息和所述第一文字信息,组成所述字幕文件。
本公开实施例中,终端可以通过识别音频数据中的语音信息,获取该语音信息对应的第一文字信息和时间信息,该字幕文件包括时间信息和第一文字信息,提高了将字幕文件***第一视频文件的准确性。
在一种可能的实现方式中,所述识别所述语音信息,得到第一文字信息,包括:
识别所述语音信息,得到第二文字信息;
显示文本窗口,所述文本窗口包括所述第二文字信息;
如果检测到用户修正所述第二文字信息中包括的字符的操作,则将所述修正后的第二文字信息确定为所述第一文字信息。
本公开实施例中,终端显示文本窗口,文本窗口包括第二文字信息,用户可以在该文本窗口中修正第二文字信息,从而提高了第一文字信息的准确性。
在一种可能的实现方式中,所述方法还包括:
当检测到所述第一文字信息的语种与预设***语种不同时,对所述第一文字信息进行语种转换;或者,
当检测到当前界面中的翻译按钮被触发时,对所述第一文字信息进行语种转换。
本公开实施例中,终端还可以对第一文字信息进行语种转换,从而字幕文件中可以包括不同语种的文字信息,进一步增加了第二视频文件的信息量,提高了用户粘度。
在一种可能的实现方式中,所述将所述字幕文件***所述第一视频文件中,得到第二视频文件,包括:
根据所述时间信息,将所述文字信息***所述第一视频文件中,得到所述第二视频文件。
本公开实施例中,根据时间信息,将文字信息***第一视频文件中,保证了时间信息和文字信息的同步。
根据本公开实施例的第二方面,提供一种分享视频文件的装置,所述装置包括:
第一获取模块,用于获取待分享的第一视频文件;
生成模块,用于根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;
***模块,用于将所述字幕文件***所述第一视频文件中,得到第二视频文件;
发送模块,用于向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
在一种可能的实现方式中,所述装置还包括:
第二获取模块,用于获取用户选择的视频特效模板;
处理模块,用于对于所述第二视频文件中的每帧图像包括的每一个像素点,根据所述视频特效模板,对所述像素点的第一图像数据进行处理,得到第二图像数据,
修改模块,用于将所述第一图像数据修改为所述第二图像数据。
在一种可能的实现方式中,所述生成模块用于根据所述音频数据中的语音信息,获取所述语音信息的时间信息;识别所述语音信息,得到第一文字信息,关联所述时间信息和所述第一文字信息;将所述时间信息和所述第一文字信息,组成所述字幕文件。
在一种可能的实现方式中,所述生成模块用于识别所述语音信息,得到第二文字信息;显示文本窗口,所述文本窗口包括所述第二文字信息;如果检测到用户修正所述第二文字信息中包括的字符的操作,则将所述修正后的第二文字信息确定为所述第一文字信息。
在一种可能的实现方式中,所述装置还包括:
转换模块,用于当检测到所述第一文字信息的语种与预设***语种不同时,对所述第一文字信息进行语种转换;或者,当检测到当前界面中的翻译按钮被触发时,对所述第一文字信息进行语种转换。
在一种可能的实现方式中,所述***模块用于根据所述时间信息,将所述文字信息***所述第一视频文件中,得到所述第二视频文件。
根据本公开实施例的第三方面,提供一种分享视频文件的装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取待分享的第一视频文件;根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;将所述字幕文件***所述第一视频文件中,得到第二视频文件;向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种分享视频文件的方法流程图;
图2是根据一示例性实施例示出的一种分享视频文件的方法流程图;
图3是根据一示例性实施例示出的一种分享视频文件的装置的框图;
图4是根据一示例性实施例示出的一种分享视频文件的装置的框图;
图5是根据一示例性实施例示出的一种分享视频文件的装置的框图;
图6是根据一示例性实施例示出的一种分享视频文件的装置400的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
相关技术中,用户将自己拍摄的视频片段分享到社交应用的信息展示平台时,终端获取视频片段后,直接向社交应用服务器发送该视频片段;社交应用服务器将该视频片段发布到该信息展示平台。由于该视频片段中仅包括图像数据和音频数据;从而导致分享的视频片段中包括的信息量较少。
本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
图1是根据一示例性实施例示出的一种分享视频文件的方法流程图,该分享视频文件的方法应用于终端,如图1所示,包括以下步骤。
在步骤101中,获取待分享的第一视频文件。
在步骤102中,根据该第一视频文件包括的音频数据,生成该音频数据对应的字幕文件,该字幕文件包括时间信息和与该时间信息关联的文字信息。
在步骤103中,将该字幕文件***该第一视频文件中,得到第二视频文件。
在步骤104中,向社交应用服务器发送该第二视频文件,以使该服务器分享该第二视频文件。
本公开实施例的一种可能实现方式中,该方法还包括:
获取用户选择的视频特效模板;
对于该第二视频文件中的每帧图像包括的每一个像素点,根据该视频特效模板,对该像素点的第一图像数据进行处理,得到第二图像数据,将该第一图像数据修改为该第二图像数据。
本公开实施例的一种可能实现方式中,根据该第一视频文件包括的音频数据,生成该音频数据对应的字幕文件,包括:
根据该音频数据中的语音信息,获取该语音信息的时间信息;
识别该语音信息,得到第一文字信息,关联该时间信息和该第一文字信息;
将该时间信息和该第一文字信息,组成该字幕文件。
本公开实施例的一种可能实现方式中,识别该语音信息,得到第一文字信息,包括:
识别该语音信息,得到第二文字信息;
显示文本窗口,该文本窗口包括该第二文字信息;
如果检测到用户修正该第二文字信息中包括的字符的操作,则将该修正后的第二文字信息确定为该第一文字信息。
本公开实施例的一种可能实现方式中,该方法还包括:
当检测到该第一文字信息的语种与预设***语种不同时,对该第一文字信息进行语种转换;或者,
当检测到当前界面中的翻译按钮被触发时,对该第一文字信息进行语种转换。
本公开实施例的一种可能实现方式中,将该字幕文件***该第一视频文件中,得到第二视频文件,包括:
根据该时间信息,将该文字信息***该第一视频文件中,得到该第二视频文件。
本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种分享视频文件的方法流程图,该分享视频文件的方法应用于终端,如图2所示,包括以下步骤。
在步骤201中,终端获取待分享的第一视频文件。
在本步骤中,用户可以通过社交应用将第一视频文件分享给好友用户,也可以通过社交应用将第一视频文件分享到信息展示平台。如果用户通过社交应用将第一视频文件分享给好友用户,则用户与好友用户的对话框的工具栏中显示第一分享按钮和第二分享按钮;如果用户通过社交应用将视频文件分享到信息展示平台,则在信息展示平台中显示第一分享按钮和第二分享按钮。其中,第一分享按钮用于触发终端显示视频选择界面,用户可以在该视频选择界面中选择待分享的第一视频文件;第二分享按钮用于触发终端显示拍摄界面,用户可以在该拍摄界面中拍摄待分享的第一视频文件。
相应的,本步骤可以为:终端检测到第一分享按钮被触发时,显示视频选择界面,该视频选择界面包括终端中已存储的视频文件的缩略图,获取用户从视频文件的缩略图中选择的视频文件,将该选择的视频文件作为待分享的第一视频文件。或者,
终端检测到第二分享按钮被触发时,开启摄像头开始进行拍摄,将当前拍摄得到是视频文件作为待分享的第一视频文件。
本公开实施例的一种可能实现方式中,终端还可以为用户的好友用户分享的视频文件添加字幕文件,则步骤201可以替换为:
终端获取待播放的视频文件,将该视频文件作为第一视频文件,该待播放的视频文件为好友用户分享的视频文件。
由于第一视频文件仅仅包括音频数据和图像数据,也即第一视频文件包括的信息量较少,为了增加第一视频文件包括的信息量,终端可以通过以下步骤202-203为第一视频文件添加字幕文件。
在步骤202中,终端根据该第一视频文件包括的音频数据,生成该音频数据对应的字幕文件,该字幕文件包括时间信息和与该时间信息关联的文字信息。
本步骤中,终端可以获取该第一视频文件中的音频数据,并提取该音频数据中的语音信息;终端根据该语音信息,通过以下步骤2021-2022生成字幕文件。
在步骤2021中,终端根据该音频数据中的语音信息,获取该语音信息的时间信息;终端识别该语音信息,得到第一文字信息,关联该时间信息和该第一文字信息。
本步骤中,终端根据该音频数据中的语音信息,获取该语音信息的时间信息的步骤可以为:终端根据预设时长,将该语音信息切分成多帧语音信息,多帧语音信息中的每帧语音信息的时长不大于该预设时长;终端通过语音识别技术,获取每帧语音信息在该音频数据中对应的时间信息,将每帧语音信息在该音频数据中对应的时间信息组成该语音信息的时间信息。
其中,预设时长可以根据需要设置并更改,本公开实施例对预设时长并不做具体限定。例如,预设时长可以为25毫秒、0.1毫秒、1秒等。
为了便于后续终端确定语音信息中每帧语音信息对应的时间信息,在本步骤中,终端存储语音信息中每帧语音信息和每帧语音信息的时间信息的对应关系。
本公开实施例中,终端可以通过语音识别技术,将该语音信息转化为该语音信息对应的文字信息;由于该语音信息对应的文字信息可能存在错误字符,因此,终端识别该语音信息,得到第一文字信息的步骤可以通过以下步骤2021a-2021c实现。
在步骤2021a中,终端识别该语音信息,得到第二文字信息。
终端提取该语音信息中每帧语音信息的语音特征序列,将该每帧语音信息的语音特征序列同声学模型进行匹配,根据声学模型中的语音识别算法和每帧语音信息的语音特征序列,确定每帧语音信息对应的文字信息,将每帧语音信息对应的文字信息组成第二文字信息。
其中,第二文字信息中包括多个字符,终端可以存储每帧语音信息和字符的对应关系,便于之后终端根据每帧语音信息,获取每帧语音信息对应的字符。
在步骤2021b中,终端显示文本窗口,该文本窗口包括该第二文字信息。
为了便于用户直观的检查并修正该第二文字信息中的错误字符,终端可以在当前显示界面显示文本窗口,将该第二文字信息显示在该文本窗口中,用户可以在该文本窗口中修正第二文字信息包括的字符。
为了便于用户查看第二文字信息,终端还可以对第二文字信息进行分行处理,将处理后的第二文字信息显示在该文本窗口中。
由于终端存储了语音信息中每帧语音信息和时间信息的对应关系,以及每帧语音信息和字符的对应关系,因此,终端对第二文字信息进行分行处理的步骤可以为:
终端可以从每帧语音信息和时间信息的对应关系中,获取每帧语音信息对应的时间信息;终端从每帧语音信息和字符的对应关系中,获取每帧语音信息对应的字符,进而确定第二文字信息中每个字符对应的时间信息,根据每个字符对应的时间信息,确定第二文字信息中相邻字符的时间间隔,将时间间隔小于预设时间间隔的连续的多个字符按时间先后顺序排列成一行。其中,每行文字信息中可以包括一个字符,也可以包括多个字符。
终端对第二文字信息进行分行处理后,还可以获取每行文字信息的时间信息,在该文本窗口中显示该文字信息的时间信息。
在本步骤中,为了便于用户快速检查出第二文字信息中的错误字符,终端可以开启检查拼写和语法的功能,通过检查拼写和语法功能中的算法,检测第二文字信息中是否存在错误字符;如果终端检测出第二文字信息中存在错误字符,终端在文本窗口中标识第二文字信息中的错误字符。
本公开实施例提供的一种可能实现方式中,终端可以在社交应用的文本窗口中显示确定按钮,当用户修正第二文字信息中的错误字符或者确定第二文字信息不存在错误字符时,用户可以点击该确定按钮以触发终端获取修正后的第二文字信息。终端检测到该确定按钮被触发后,执行步骤2021c。
在步骤2021c中,如果终端检测到用户修正该第二文字信息中包括的字符的操作,则终端将修正后的第二文字信息确定为该第一文字信息。
如果终端没有检测到用户修正该第二文字信息中包括的字符的操作,则终端直接将第二文字信息确定为第一文字信息。
在步骤2022中,终端将该时间信息和该第一文字信息,组成该字幕文件。
本步骤中,该字幕文件中存储了第一文字信息中每行文字信息在视频数据的时间信息与该行文字信息的对应关系,因此,该字幕文件包括:第一文字信息、时间信息和第一文字信息中每行文字信息同时间信息的对应关系。
本公开实施提供的一种可能实现方式中,终端可以自动检测第一文字信息的语种是否和预设***语种相同;如果第一文字信息的语种和预设***语种不同,可以对该第一文字信息进行语种转换。也即将第一文字信息翻译为预设***语种对应的第三文字信息。
在本步骤中,为了便于用户阅读,终端将第三文字信息***到该字幕文件中。
本公开实施提供的一种可能实现方式中,终端在当前显示界面中显示翻译按钮,用户可以通过点击该翻译按钮触发终端对第一文字信息进行语种转换。当检测到该翻译按钮被触发时,终端显示语种选择界面,该语种选择界面中包括多个语种;获取用户选择的语种,将第一文字信息翻译为用户选择的语种对应的第四文字信息。
在本步骤中,为了便于用户阅读,终端将第四文字信息***到该字幕文件中。
例如,第一文字信息的语种为中文,用户选择的语种为英语,则终端将第一文字翻译为英文语种的第四文字信息。
在步骤203中,终端将该字幕文件***该第一视频文件中,得到第二视频文件。
该字幕文件包括时间信息和与该时间信息关联的文字信息,因此,本步骤可以为:终端根据时间信息,将该文字信息***该第一视频文件中,得到第二视频文件。
其中,终端获取第一视频文件包括的每帧图像;终端获取第一文字信息中每行文字信息,根据该行文字信息,从每行文字信息和时间信息的对应关系中,获取该行文字信息的时间信息,即该行文字信息在第一视频文件中对应的起始时间和终止时间。进而,终端获取第一视频文件中该行文字信息对应的起始时间和终止时间间隔内的目标帧图像;终端将该行文字信息***到第一视频文件中的目标帧图像中,得到该第二视频文件。
本公开实施例提供的一种可能实现方式中,为了方便用户浏览音频数据对应的文字信息,终端可以将该行文字信息在该行文字信息的起始时间之前提前第一预设时间显示,或者将该行文字信息在该行文字信息的终止时间之后延迟第二预设时间消失。因此,终端根据时间信息,将该文字信息***该第一视频文件中,得到第二视频文件的步骤可以为:
终端获取第一视频文件包括的每帧图像;终端获取第一文字信息中每行文字信息在第一视频文件中对应的起始时间和终止时间;终端将该起始时间减去第一预设时间,得到第一时间,终端将该终止时间加第二预设时间,得到第二时间;终端获取第一视频文件中第一时间和第二时间的间隔内的每帧图像;终端将该行文字信息***到第一视频文件中第一时间和第二时间的间隔内的每帧图像中,得到该第二视频文件。
本公开实施例中,为了提升用户浏览视频文件时的视觉效果,终端可以提供视频特效功能,用户可以在分享视频文件时选择该视频文件的视频特效;终端根据用户选择的视频特效,对第二视频文件中的图像数据进行处理。本步骤可以通过以下步骤204-205实现。
在步骤204中,终端获取用户选择的视频特效模板。
本步骤中,终端可以在社交应用的当前界面中显示视频特效按钮,终端检测到该视频特效按钮被触发时,终端显示多种视频特效模板,用户可以根据需要选择一种视频特效模板,终端获取用户选择的视频特效模板,执行步骤205。
其中,视频特效模板可以根据用户设置并更改,本公开实施例对视频特效模板并不作具体限定。例如,视频特效模板可以为毛玻璃效果、古典效果、黑白效果等。
在步骤205中,对于该第二视频文件中的每帧图像包括的每一个像素点,终端根据该视频特效模板,对该像素点的第一图像数据进行处理,得到第二图像数据,将该第一图像数据修改为该第二图像数据。
终端存储多种视频特效模板中的每种视频特效模板对应的算法,在本步骤中,终端根据该视频特效模板,对该像素点的第一图像数据进行处理,得到第二图像数据的步骤可以为:
终端获取用户选择的视频特效模板对应的算法,根据用户选择的视频特效模板对应的算法,对第一图像数据进行处理,得到第二图像数据。
例如,视频特效模板以毛玻璃效果为例进行说明,毛玻璃效果对应的算法可以为高斯模糊算法。对于每帧图像中的每一个像素点,终端提取该像素点的第一图像数据,对该第一图像数据进行高斯模糊处理,即通过高斯函数,确定该像素点的权重矩阵,根据该像素点的第一图像数据和权重矩阵,确定该像素点的第二图像数据;在第二视频文件中,终端将每帧图像的每一个像素点的第一图像数据修改为第二图像数据。
在步骤206中,终端向社交应用服务器发送该第二视频文件,以使该服务器分享该第二视频文件。
本公开实施例中,用户可以通过社交应用将第一视频文件分享给好友用户,也即以下第一种实现方式,用户也可以通过社交应用将第一视频文件分享到信息展示平台,也即以下第二种实现方式。
对于第一种实现方式,本步骤可以为:终端向社交应用服务器发送该第二视频文件、好友用户的用户标识;社交应用服务器接收终端发送的该第二视频文件和好友用户的用户标识,根据该好友用户的用户标识,将该第二视频文件发送给好友用户对应的终端。
当然,终端还可以将该第二视频文件分享到群组中,如果将该第二视频文件分享到群组中,则本步骤可以为:终端向社交应用服务器发送该第二视频文件、群组标识;社交应用服务器接收终端发送的该第二视频文件和群组标识,根据该群组标识,将该第二视频文件发送给该群组内包括的用户对应的终端。
对于第二种实现方式,本步骤可以为:终端向社交应用服务器发送该用户的用户标识和该第二视频文件;社交应用服务器接收终端发送的该用户的用户标识和该第二视频文件,根据该用户的用户标识,将该第二视频文件分享到该用户的信息展示平台中。
其中,用户标识可以为用户事先在社交应用服务器中注册的用户账号等。
本公开实施例中,终端向社交应用服务器发送该第二视频文件之前,终端可以在社交应用的当前界面提供预览按钮,当终端检测到用户触发预览按钮时,终端将该第二视频文件显示在终端屏幕上,以供用户预览。
本公开实施例提供的一种可能实现方式中,终端存储第二视频文件,以便于后续分享或观看该第二视频文件。
本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
图3是根据一示例性实施例示出的一种分享视频文件的装置的框图。参照图3,该装置包括第一获取模块301,生成模块302,***模块303和发送模块304。
第一获取模块301被配置为获取待分享的第一视频文件;
生成模块302被配置为根据该第一视频文件包括的音频数据,生成该音频数据对应的字幕文件,该字幕文件包括时间信息和与该时间信息关联的文字信息;
***模块303被配置为将该字幕文件***该第一视频文件中,得到第二视频文件;
发送模块304被配置为向社交应用服务器发送该第二视频文件,以使该服务器分享该第二视频文件。
在一种可能的实现方式中,如图4所示,该装置还包括:
第二获取模块305,被配置为获取用户选择的视频特效模板;
处理模块306,被配置为对于该第二视频文件中的每帧图像包括的每一个像素点,根据该视频特效模板,对该像素点的第一图像数据进行处理,得到第二图像数据;
修改模块307,被配置为将该第一图像数据修改为该第二图像数据。
在一种可能的实现方式中,该生成模块302被配置为根据该音频数据中的语音信息,获取该语音信息的时间信息;识别该语音信息,得到第一文字信息,关联该时间信息和该第一文字信息;将该时间信息和该第一文字信息,组成该字幕文件。
在一种可能的实现方式中,该生成模块302被配置为识别该语音信息,得到第二文字信息;显示文本窗口,该文本窗口包括该第二文字信息;如果检测到用户修正该第二文字信息中包括的字符的操作,则将该修正后的第二文字信息确定为该第一文字信息。
在一种可能的实现方式中,如图5所示,该装置还包括:
转换模块308,被配置为当检测到该第一文字信息的语种与预设***语种不同时,对该第一文字信息进行语种转换;或者,当检测到当前界面中的翻译按钮被触发时,对该第一文字信息进行语种转换。
在一种可能的实现方式中,该***模块303被配置为根据该时间信息,将该文字信息***该第一视频文件中,得到该第二视频文件。
本公开实施例中,终端获取待分享的第一视频文件,生成该音频数据对应的字幕文件,并将该字幕文件***该第一视频文件中,生成第二视频文件,向社交应用发送该第二视频文件,通过该社交应用服务器分享该第二视频文件。由于该第二视频文件不仅包括图像数据和音频数据,还包括字幕信息,因此增加了第二视频文件的信息量。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的分享视频文件的装置在分享视频文件时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的分享视频文件的装置与分享视频文件是方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是根据一示例性实施例示出的一种分享视频文件的装置400的框图。例如,装置400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置400可以包括以下一个或多个组件:处理组件402,存储器404,电源组件406,多媒体组件408,音频组件410,输入/输出(I/O)接口412,传感器组件414,以及通信组件416。
处理组件402通常控制装置400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。
存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理***,一个或多个电源,及其他与为装置400生成、管理和分配电力相关联的组件。
多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(MIC),当装置400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。
I/O接口412为处理组件402和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件414包括一个或多个传感器,用于为装置400提供各个方面的状态评估。例如,传感器组件414可以检测到装置400的打开/关闭状态,组件的相对定位,例如所述组件为装置400的显示器和小键盘,传感器组件414还可以检测装置400或装置400一个组件的位置改变,用户与装置400接触的存在或不存在,装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述分享视频文件的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由装置400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行上述分享视频文件的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (13)

1.一种分享视频文件的方法,其特征在于,所述方法包括:
获取待分享的第一视频文件;
根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;
将所述字幕文件***所述第一视频文件中,得到第二视频文件;
向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户选择的视频特效模板;
对于所述第二视频文件中的每帧图像包括的每一个像素点,根据所述视频特效模板,对所述像素点的第一图像数据进行处理,得到第二图像数据,将所述第一图像数据修改为所述第二图像数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,包括:
根据所述音频数据中的语音信息,获取所述语音信息的时间信息;
识别所述语音信息,得到第一文字信息,关联所述时间信息和所述第一文字信息;
将所述时间信息和所述第一文字信息,组成所述字幕文件。
4.根据权利要求3所述的方法,其特征在于,所述识别所述语音信息,得到第一文字信息,包括:
识别所述语音信息,得到第二文字信息;
显示文本窗口,所述文本窗口包括所述第二文字信息;
如果检测到用户修正所述第二文字信息中包括的字符的操作,则将所述修正后的第二文字信息确定为所述第一文字信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当检测到所述第一文字信息的语种与预设***语种不同时,对所述第一文字信息进行语种转换;或者,
当检测到当前界面中的翻译按钮被触发时,对所述第一文字信息进行语种转换。
6.根据权利要求1所述的方法,其特征在于,所述将所述字幕文件***所述第一视频文件中,得到第二视频文件,包括:
根据所述时间信息,将所述文字信息***所述第一视频文件中,得到所述第二视频文件。
7.一种分享视频文件的装置,其特征在于,所述装置包括:
第一获取模块,用于获取待分享的第一视频文件;
生成模块,用于根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;
***模块,用于将所述字幕文件***所述第一视频文件中,得到第二视频文件;
发送模块,用于向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取用户选择的视频特效模板;
处理模块,用于对于所述第二视频文件中的每帧图像包括的每一个像素点,根据所述视频特效模板,对所述像素点的第一图像数据进行处理,得到第二图像数据,
修改模块,用于将所述第一图像数据修改为所述第二图像数据。
9.根据权利要求7所述的装置,其特征在于,所述生成模块用于根据所述音频数据中的语音信息,获取所述语音信息的时间信息;识别所述语音信息,得到第一文字信息,关联所述时间信息和所述第一文字信息;将所述时间信息和所述第一文字信息,组成所述字幕文件。
10.根据权利要求9所述的装置,其特征在于,所述生成模块用于识别所述语音信息,得到第二文字信息;显示文本窗口,所述文本窗口包括所述第二文字信息;如果检测到用户修正所述第二文字信息中包括的字符的操作,则将所述修正后的第二文字信息确定为所述第一文字信息。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
转换模块,用于当检测到所述第一文字信息的语种与预设***语种不同时,对所述第一文字信息进行语种转换;或者,当检测到当前界面中的翻译按钮被触发时,对所述第一文字信息进行语种转换。
12.根据权利要求7所述的装置,其特征在于,所述***模块用于根据所述时间信息,将所述文字信息***所述第一视频文件中,得到所述第二视频文件。
13.一种分享视频文件的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取待分享的第一视频文件;根据所述第一视频文件包括的音频数据,生成所述音频数据对应的字幕文件,所述字幕文件包括时间信息和与所述时间信息关联的文字信息;将所述字幕文件***所述第一视频文件中,得到第二视频文件;向社交应用服务器发送所述第二视频文件,以使所述服务器分享所述第二视频文件。
CN201610990308.4A 2016-11-10 2016-11-10 分享视频文件的方法及装置 Active CN106506335B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610990308.4A CN106506335B (zh) 2016-11-10 2016-11-10 分享视频文件的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610990308.4A CN106506335B (zh) 2016-11-10 2016-11-10 分享视频文件的方法及装置

Publications (2)

Publication Number Publication Date
CN106506335A true CN106506335A (zh) 2017-03-15
CN106506335B CN106506335B (zh) 2019-08-30

Family

ID=58323904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610990308.4A Active CN106506335B (zh) 2016-11-10 2016-11-10 分享视频文件的方法及装置

Country Status (1)

Country Link
CN (1) CN106506335B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106851401A (zh) * 2017-03-20 2017-06-13 惠州Tcl移动通信有限公司 一种自动添加字幕的方法及***
CN108063722A (zh) * 2017-12-20 2018-05-22 北京时代脉搏信息技术有限公司 视频数据生成方法、计算机可读存储介质和电子设备
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
WO2018192242A1 (zh) * 2017-04-19 2018-10-25 腾讯科技(深圳)有限公司 视频播放方法、装置和存储介质
CN108924583A (zh) * 2018-07-19 2018-11-30 腾讯科技(深圳)有限公司 视频文件生成方法及其设备、***、存储介质
CN108962220A (zh) * 2018-07-26 2018-12-07 北京小米移动软件有限公司 多媒体文件播放场景下的文本显示方法及装置
CN109257659A (zh) * 2018-11-16 2019-01-22 北京微播视界科技有限公司 字幕添加方法、装置、电子设备及计算机可读存储介质
CN110708589A (zh) * 2017-11-30 2020-01-17 腾讯科技(深圳)有限公司 信息的分享方法和装置、存储介质、电子装置
CN111355978A (zh) * 2018-12-21 2020-06-30 北京字节跳动网络技术有限公司 视频文件的处理方法、装置、移动终端及存储介质
CN111355960A (zh) * 2018-12-21 2020-06-30 北京字节跳动网络技术有限公司 合成视频文件的方法、装置、移动终端及存储介质
CN113207032A (zh) * 2021-04-29 2021-08-03 读书郎教育科技有限公司 一种智慧课堂录制视频增加字幕的***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103402100A (zh) * 2013-08-23 2013-11-20 北京奇艺世纪科技有限公司 一种视频处理方法及移动终端
CN105845129A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和***
CN105898169A (zh) * 2015-08-19 2016-08-24 乐视网信息技术(北京)股份有限公司 一种视频处理方法及装置
CN106101767A (zh) * 2016-07-28 2016-11-09 维沃移动通信有限公司 一种屏幕录制方法及移动终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103402100A (zh) * 2013-08-23 2013-11-20 北京奇艺世纪科技有限公司 一种视频处理方法及移动终端
CN105898169A (zh) * 2015-08-19 2016-08-24 乐视网信息技术(北京)股份有限公司 一种视频处理方法及装置
CN105845129A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 一种在音频中切分句子的方法和***及视频文件的字幕自动生成方法和***
CN106101767A (zh) * 2016-07-28 2016-11-09 维沃移动通信有限公司 一种屏幕录制方法及移动终端

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106851401A (zh) * 2017-03-20 2017-06-13 惠州Tcl移动通信有限公司 一种自动添加字幕的方法及***
US10893333B2 (en) 2017-04-19 2021-01-12 Tencent Technology (Shenzhen) Company Limited Video playing method, device and storage
WO2018192242A1 (zh) * 2017-04-19 2018-10-25 腾讯科技(深圳)有限公司 视频播放方法、装置和存储介质
CN110708589A (zh) * 2017-11-30 2020-01-17 腾讯科技(深圳)有限公司 信息的分享方法和装置、存储介质、电子装置
CN108063722A (zh) * 2017-12-20 2018-05-22 北京时代脉搏信息技术有限公司 视频数据生成方法、计算机可读存储介质和电子设备
CN108289244A (zh) * 2017-12-28 2018-07-17 努比亚技术有限公司 视频字幕处理方法、移动终端及计算机可读存储介质
CN108924583A (zh) * 2018-07-19 2018-11-30 腾讯科技(深圳)有限公司 视频文件生成方法及其设备、***、存储介质
CN108924583B (zh) * 2018-07-19 2021-12-17 腾讯科技(深圳)有限公司 视频文件生成方法及其设备、***、存储介质
CN108962220A (zh) * 2018-07-26 2018-12-07 北京小米移动软件有限公司 多媒体文件播放场景下的文本显示方法及装置
CN108962220B (zh) * 2018-07-26 2021-03-09 北京小米移动软件有限公司 多媒体文件播放场景下的文本显示方法及装置
CN109257659A (zh) * 2018-11-16 2019-01-22 北京微播视界科技有限公司 字幕添加方法、装置、电子设备及计算机可读存储介质
CN111355960A (zh) * 2018-12-21 2020-06-30 北京字节跳动网络技术有限公司 合成视频文件的方法、装置、移动终端及存储介质
CN111355960B (zh) * 2018-12-21 2021-05-04 北京字节跳动网络技术有限公司 合成视频文件的方法、装置、移动终端及存储介质
CN111355978A (zh) * 2018-12-21 2020-06-30 北京字节跳动网络技术有限公司 视频文件的处理方法、装置、移动终端及存储介质
CN113207032A (zh) * 2021-04-29 2021-08-03 读书郎教育科技有限公司 一种智慧课堂录制视频增加字幕的***及方法

Also Published As

Publication number Publication date
CN106506335B (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN106506335A (zh) 分享视频文件的方法及装置
CN107025419B (zh) 指纹模板录入方法及装置
CN112752047A (zh) 视频录制方法、装置、设备及可读存储介质
CN107767864B (zh) 基于语音分享信息的方法、装置与移动终端
CN104731688B (zh) 提示阅读进度的方法及装置
CN108962220B (zh) 多媒体文件播放场景下的文本显示方法及装置
CN105389296A (zh) 信息分割方法及装置
CN104391711B (zh) 一种设置屏幕保护的方法及装置
CN105828101A (zh) 生成字幕文件的方法及装置
CN111382748B (zh) 图像翻译方法、装置及存储介质
CN112069952A (zh) 视频片段提取方法、视频片段提取装置及存储介质
CN106547850B (zh) 表情注释方法及装置
CN105511777B (zh) 触控显示屏上的会话显示方法及装置
CN106603381B (zh) 处理聊天信息的方法及装置
CN109766473B (zh) 信息交互方法、装置、电子设备及存储介质
CN105095366A (zh) 文字消息处理方法和装置
CN106331328B (zh) 信息提示的方法及装置
CN110730360A (zh) 视频上传、播放的方法、装置、客户端设备及存储介质
CN112200040A (zh) 遮挡图像检测方法、装置及介质
CN106375178A (zh) 基于即时通讯的消息显示方法及装置
CN109670025B (zh) 对话管理方法及装置
CN112948704A (zh) 用于信息推荐的模型训练方法、装置、电子设备以及介质
CN113936697B (zh) 语音处理方法、装置以及用于语音处理的装置
CN113343675A (zh) 一种字幕生成方法、装置和用于生成字幕的装置
CN105487799A (zh) 内容转换方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant