CN108600680A - 视频处理方法、终端及计算机可读存储介质 - Google Patents
视频处理方法、终端及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108600680A CN108600680A CN201810324795.XA CN201810324795A CN108600680A CN 108600680 A CN108600680 A CN 108600680A CN 201810324795 A CN201810324795 A CN 201810324795A CN 108600680 A CN108600680 A CN 108600680A
- Authority
- CN
- China
- Prior art keywords
- terminal
- picture
- information
- video
- action message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000009471 action Effects 0.000 claims abstract description 75
- 230000000694 effects Effects 0.000 claims abstract description 40
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 15
- 230000000875 corresponding effect Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Social Psychology (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种视频处理方法,包括以下步骤:在第一终端与第二终端建立视频聊天连接、且接收到第二终端发送的动作信息时,实时对第一图片进行图像识别操作;在第一图片中存在动作信息对应的图像信息时,获取动作信息及图像信息对应的图像效果信息;基于图像效果信息、动作信息及第一图片生成视频信息;输出视频信息,并将视频信息发送至第二终端。本发明还公开了一种视频处理终端及计算机可读存储介质。本发明能够根据动作信息在第一终端及第二终端的视频聊天画面中添加图像效果,进而实现视频聊天过程中各方的互动效果展示,使得用户可在视频聊天的过程中进行交互,提高了视频聊天的用户体验。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种视频处理方法、终端及计算机可读存储介质。
背景技术
随着计算机技术的日益成熟,现有的语音通话和短信交流方法已经不能够满足人们的要求,视频聊天等业务越来越受到人们的青睐。
目前,在视频直播等视频聊天中,主播为了提高视频聊天过程中观众的用户体验,主播可以做出特定的动作,在主播的动作被识别后,会在视频聊天中的观众的终端输出对应的效果。
但是,上述在视频聊天过程中,仅能够在观众的终端展示主播的互动效果,观众并不能参与互动,进而无法在视频聊天中实现多方的互动效果展示。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种视频处理方法、终端及计算机可读存储介质,旨在解决无法在视频聊天中实现多方的互动效果展示的技术问题。
为实现上述目的,本发明提供一种视频处理方法,所述视频处理方法包括以下步骤:
在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息;
在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息;
基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息;
输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息。
进一步地,在一实施例中,所述动作信息包括手势信息,所述视频处理方法还包括:
在第一终端与第二终端建立视频聊天连接时,对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息;
在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端。
进一步地,在一实施例中,所述在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端的步骤包括:
在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配;
在所述手势信息与预设手势信息匹配时,将所述手势信息发送至所述第二终端。
进一步地,在一实施例中,所述在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作的步骤之后,所述视频处理方法还包括:
停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,在一实施例中,所述输出所述视频信息,并将所述视频信息发送至所述第二终端的步骤之后,所述视频处理方法还包括:
继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,在一实施例中,所述在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作的步骤之后,所述视频处理方法还包括:
在获取到的第一图片中不存在所述动作信息对应的图像信息、且接收到所述第二终端发送的取消指令时,继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息。
进一步地,在一实施例中,所述动作信息包括语音信息,所述视频处理方法还包括:
在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息;
在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
进一步地,在一实施例中,所述实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息的步骤包括:
实时对所述第一图片进行图像识别操作,以获得图像识别结果;
将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息。
此外,为实现上述目的,本发明还提供一种视频处理终端,所述视频处理终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频处理程序,所述视频处理程序被所述处理器执行时实现上述任一项所述的视频处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有视频处理程序,所述视频处理程序被处理器执行时实现上述任一项所述的视频处理方法的步骤。
本发明通过在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,接着在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息,而后基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息,然后输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息,能够根据动作信息在第一终端及第二终端的视频聊天画面中添加图像效果,进而实现视频聊天过程中各方的互动效果展示,使得用户可在视频聊天的过程中进行交互,提高了视频聊天的用户体验。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的视频处理终端的结构示意图;
图2为本发明视频处理方法第一实施例的流程示意图;
图3为本发明视频处理方法第二实施例的流程示意图;
图4为本发明视频处理方法第二实施例中所述在所述第二图片中存在手势信息时,将所述手势信息发送至所述第三终端的步骤的细化流程示意图;
图5为本发明视频处理方法第四实施例的流程示意图;
图6为本发明视频处理方法第五实施例所述实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息的步骤的细化流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的视频处理终端的结构示意图。
本发明实施例视频处理终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该视频处理终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选,用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,视频处理终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在视频处理终端移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别视频处理终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,视频处理终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的视频处理终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及视频处理程序。
在图1所示的视频处理终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的视频处理程序。
在本实施例中,视频处理终端包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的视频处理程序,其中,处理器1001调用存储器1005中存储的视频处理程序时,并执行以下操作:
在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息;
在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息;
基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息;
输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
在第一终端与第二终端建立视频聊天连接时,对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息;
在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配;
在所述手势信息与预设手势信息匹配时,将所述手势信息发送至所述第二终端。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
在获取到的第一图片中不存在所述动作信息对应的图像信息、且接收到所述第二终端发送的取消指令时,继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息;
在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
进一步地,处理器1001可以调用存储器1005中存储的视频处理程序,还执行以下操作:
实时对所述第一图片进行图像识别操作,以获得图像识别结果;
将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息。
本发明还提供一种视频处理方法,参照图2,图2为本发明视频处理方法一实施例的流程示意图。
在本实施例中,该视频处理方法包括:
步骤S10,在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息;
其中,第一终端及第二终端均可以为手机、IPAD、PC以及智能可穿戴设备等具有图像显示功能的智能终端。该视频聊天连接可以为两方视频时建立的视频聊天连接;也可以为多方视频时建立的视频聊天连接,此时,第一终端包括视频聊天中除第二终端之外的其他智能终端,即第一终端包括两个及以上的智能终端。需要说明的是,本实施例中的第一终端为视频处理终端。
在本实施例中,在多个智能终端建立视频聊天连接,各个智能终端均监测终端当前拍摄的图像或录制的语音是否包括动作信息,该动作信息包括手势信息、语音信息等,在其中某一智能终端检测到相应的动作信息时,监测到动作信息的智能终端即为第二终端,该视频聊天连接中的其他终端即为第一终端,且第二终端将该动作信息发送至第一终端。
在本实施例中,在接收到第二终端发送的动作信息时,该第一终端实时对通过第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息,具体地,该第一终端对第一图片进行图像识别操作得到图像识别结果,而后将图像识别结果与动作信息对应的图像信息进行对比,以确定第一图片中是否存该图像信息。
步骤S20,在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息;
在本实施例中,在第一图片中存在该图像信息时,该第一终端获取该动作信息及图形信息对应的图像效果信息,其中,可在第一终端以及第二终端中预存各种动作信息及图形信息对应的图像效果信息,进而使得第一终端直接根据动作信息及图形信息获得对应的图像效果信息;或者,在与第一终端及第二终端连接的云服务器中预存各种动作信息及图形信息对应的图像效果信息,使得第一终端根据动作信息及图形信息在云服务器中获得对应的图像效果信息。
步骤S30,基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息;
在本实施例中,在获取到图像效果信息时,第一终端基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息。
步骤S40,输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息。
在本实施例中,在生成视频信息后,该第一终端输出该视频信息,并将所述视频信息发送至所述第二终端,以使第二终端输出所述视频信息。一般情况下,第一终端与第二终端均显示有其自身的视频画面以及其他终端的视频画面,因此,第一终端输出所述视频信息是指第一终端在其自身的视频画面的显示界面播放该视频信息,第二终端输出所述视频信息是指第一终端在输出第一终端发送的视频画面的显示界面播放该视频信息。
例如,在视频聊天的过程中,第二终端监测到其持有者做出的打脸手势,则该第二终端将该打脸手势发送至第一终端,第一终端在监测到其当前拍摄到的图片中包括脸部画面时,该第一终端获取对应的图像效果信息,并生成视频信息,输出所述视频信息,并将视频信息发送至所述第二终端,使第二终端输出所述视频信息,使得第一终端与第二终端均能够输出视频信息,若该视频信息为第一终端的持有者被打脸的过程,则第一终端的持有者与第二终端的持有者均能够看到第一终端的持有者从脸被打至脸颊肿起的整个过程,还可以听到打脸的声音效果。当然,若第二终端的动作信息为捏鼻子的手势信息,则可在第一终端与第二终端出书第一终端的持有者从鼻子被捏至鼻子拉长的整个过程。
本实施例提出的视频处理方法,通过在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,接着在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息,而后基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息,然后输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息,能够根据动作信息在第一终端及第二终端的视频聊天画面中添加图像效果,进而实现视频聊天过程中各方的互动效果展示,使得用户可在视频聊天的过程中进行交互,提高了视频聊天的用户体验。
基于第一实施例,提出本发明视频处理方法的第二实施例,参照图3,在本实施例中,该动作信息包括手势信息,该视频处理方法还包括:
步骤S50,在第一终端与第二终端建立视频聊天连接时,所述第一终端对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息;
步骤S60,在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端。
在本实施例中,在第一终端与第二终端建立视频聊天连接时,第一终端与第二终端均监测其当前拍摄的图像是否包括手势信息。具体地,第一终端对其摄像头当前拍摄的第二图片进行图像识别操作,以确定第二图片中是否存在手势信息,在第二图片中存在手势信息时,将手势信息发送至第二终端。
进一步地,在一实施方式中,在步骤S10之后,该视频处理方法还包括:停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
在本实施例中,在接收到所述第二终端发送的动作信息时,第一终端停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作的步骤,进而使第一终端停止对动作信息的监测,以避免后续可能造成的互动效果混乱,进一步提高了用户体验。
进一步地,又一实施例中,在步骤S40之后,视频处理方法还包括:继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
需要说明的是,第二终端在接收到视频信息时,该第二终端同样执行对第二终端的摄像头当前拍摄的图片进行图像识别操作,以确定第二终端拍摄的图片中是否存在手势信息,以实现手势信息的持续检测。
进一步地,再一实施方式中,在步骤S10之后,该视频处理方法还包括:在获取到的第一图片中不存在所述动作信息对应的图像信息、且接收到所述第二终端发送的取消指令时,继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息。
需要说明的是,该第二终端在检测到取消指令时,该第二终端同样执行对第二终端的摄像头当前拍摄的图片进行图像识别操作,以确定第二终端拍摄的图片中是否存在手势信息,以实现手势信息的检测。
需要说明的是,在接收到所述动作信息后的预设时间间隔内摄像头拍摄的第一图片中均不存在所述图像信息时,该第一终端继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。当然,该第一终端同时发送互动取消信息至第二终端,第二终端根据该互动取消信息执行对第二终端的摄像头当前拍摄的图片进行图像识别操作,以确定第二终端拍摄的图片中是否存在手势信息,以实现手势信息的持续检测。
本实施例提出的视频处理方法,通过在第一终端与第二终端建立视频聊天连接时,所述第一终端对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息,接着在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端,使得第一终端可实时对其持有者的手势信息进行监测,以使视频聊天过程中的用户交互顺利进行,提高了视频聊天的用户体验。
基于第二实施例,提出本发明视频处理方法的第三实施例,参照图4,在本实施例中,步骤S60包括:
步骤S61,在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配;
步骤S62,在所述手势信息与预设手势信息匹配成功时,将所述手势信息发送至所述第二终端。
在本实施例中,在第二图片中存在手势信息时,第一终端确定该手势信息与预设手势信息是否匹配,即确定预设手势信息中是否包括与该手势信息一致的手势,以确定该手势信息是否能够触发互动效果,并在该手势信息与预设手势信息匹配成功时,将该手势信息发送至第二终端,以触发该手势信息对应的互动效果,并避免在手势信息与预设手势信息不匹配时,将手势信息发送至第二终端而造成无法产生互动效果的问题。
本实施例提出的视频处理方法,通过在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配,接着在所述手势信息与预设手势信息匹配成功时,将所述手势信息发送至所述第二终端,能够避免在手势信息与预设手势信息不匹配时,将手势信息发送至第二终端而造成无法产生互动效果的问题,进一步提高了用户体验。
基于第一实施例,提出本发明视频处理方法的第四实施例,参照图5,在本实施例中,该动作信息包括语音信息,该视频处理方法还包括:
步骤S70,在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息;
步骤S80,在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
在本实施例中,在第一终端与第二终端建立视频聊天连接时,第一终端与第二终端均监测其当前获得的语音数据是否包括语音信息。具体地,第一终端对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息,在语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
本实施例提出的视频处理方法,通过在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息,接着在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端;使得第一终端可实时对其持有者的语音信息进行监测,以使视频聊天过程中的用户交互顺利进行,提高了视频聊天的用户体验。
基于上述实施例,提出本发明视频处理方法的第五实施例,参照图6,在本实施例中,步骤S10包括:
步骤S11,实时对所述第一图片进行图像识别操作,以获得图像识别结果;
步骤S12,将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息
在本实施例中,该第一终端对第一图片进行图像识别操作得到图像识别结果,而后将图像识别结果与动作信息对应的图像信息进行对比,根据对比结果确定第一图片中是否存该图像信息。
本实施例提出的视频处理方法,通过实时对所述第一图片进行图像识别操作,以获得图像识别结果,接着将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息,能够准确的确定第一图片中是否存在所述图像信息,进一步提高了用户体验。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有视频处理程序,所述视频处理程序被处理器执行时实现如下操作:
在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息;
在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息;
基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息;
输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
在第一终端与第二终端建立视频聊天连接时,对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息;
在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配;
在所述手势信息与预设手势信息匹配时,将所述手势信息发送至所述第二终端。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
在获取到的第一图片中不存在所述动作信息对应的图像信息、且接收到所述第二终端发送的取消指令时,继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息;
在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
进一步地,所述视频处理程序被处理器执行时还实现如下操作:
实时对所述第一图片进行图像识别操作,以获得图像识别结果;
将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种视频处理方法,其特征在于,所述视频处理方法包括以下步骤:
在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息;
在所述第一图片中存在所述动作信息对应的图像信息时,获取所述动作信息及所述图像信息对应的图像效果信息;
基于所述图像效果信息、所述动作信息及所述第一图片生成视频信息;
输出所述视频信息,并将所述视频信息发送至所述第二终端,以供所述第二终端输出所述视频信息。
2.如权利要求1所述的视频处理方法,其特征在于,所述动作信息包括手势信息,所述视频处理方法还包括:
在第一终端与第二终端建立视频聊天连接时,对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息;
在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端。
3.如权利要求2所述的视频处理方法,其特征在于,所述在所述第二图片中存在手势信息时,将所述手势信息发送至所述第二终端的步骤包括:
在所述第二图片中存在手势信息时,确定所述手势信息与预设手势信息是否匹配;
在所述手势信息与预设手势信息匹配时,将所述手势信息发送至所述第二终端。
4.如权利要求2所述的视频处理方法,其特征在于,所述在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作的步骤之后,所述视频处理方法还包括:
停止执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
5.如权利要求2所述的视频处理方法,其特征在于,所述输出所述视频信息,并将所述视频信息发送至所述第二终端的步骤之后,所述视频处理方法还包括:
继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息的步骤。
6.如权利要求2所述的视频处理方法,其特征在于,所述在第一终端与第二终端建立视频聊天连接、且接收到所述第二终端发送的动作信息时,实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作的步骤之后,所述视频处理方法还包括:
在获取到的第一图片中不存在所述动作信息对应的图像信息、且接收到所述第二终端发送的取消指令时,继续执行对所述摄像头当前拍摄的第二图片进行图像识别操作,以确定所述第二图片中是否存在手势信息。
7.如权利要求1所述的视频处理方法,其特征在于,所述动作信息包括语音信息,所述视频处理方法还包括:
在第一终端与第二终端建立视频聊天连接时,对所述第一终端的语音模块当前获取到的语音数据进行语音识别操作,以确定所述语音数据中是否存在与预设语音信息匹配的语音信息;
在所述语音数据中存在与预设语音信息匹配的语音信息时,将所述手势信息发送至所述第二终端。
8.如权利要求1至7中任一项所述的视频处理方法,其特征在于,所述实时对通过所述第一终端的摄像头当前拍摄的第一图片进行图像识别操作,以确定所述第一图片中是否存在所述动作信息对应的图像信息的步骤包括:
实时对所述第一图片进行图像识别操作,以获得图像识别结果;
将所述图像识别结果与所述图像信息进行对比,以确定所述第一图片中是否存在所述图像信息。
9.一种视频处理终端,其特征在于,所述视频处理终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频处理程序,所述视频处理程序被所述处理器执行时实现如权利要求1至8中任一项所述的视频处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频处理程序,所述视频处理程序被处理器执行时实现如权利要求1至8中任一项所述的视频处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810324795.XA CN108600680A (zh) | 2018-04-11 | 2018-04-11 | 视频处理方法、终端及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810324795.XA CN108600680A (zh) | 2018-04-11 | 2018-04-11 | 视频处理方法、终端及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108600680A true CN108600680A (zh) | 2018-09-28 |
Family
ID=63622088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810324795.XA Withdrawn CN108600680A (zh) | 2018-04-11 | 2018-04-11 | 视频处理方法、终端及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108600680A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111010526A (zh) * | 2019-11-11 | 2020-04-14 | 珠海格力电器股份有限公司 | 一种视频通讯中的互动方法及装置 |
CN111225237A (zh) * | 2020-04-23 | 2020-06-02 | 腾讯科技(深圳)有限公司 | 一种视频的音画匹配方法、相关装置以及存储介质 |
CN112752161A (zh) * | 2020-01-13 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种基于实时通信的互动方法、社交应用终端及相关装置 |
WO2021114710A1 (zh) * | 2019-12-09 | 2021-06-17 | 上海幻电信息科技有限公司 | 直播视频互动方法、装置以及计算机设备 |
WO2023040633A1 (zh) * | 2021-09-14 | 2023-03-23 | 北京字跳网络技术有限公司 | 一种视频生成方法、装置、终端设备及存储介质 |
-
2018
- 2018-04-11 CN CN201810324795.XA patent/CN108600680A/zh not_active Withdrawn
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111010526A (zh) * | 2019-11-11 | 2020-04-14 | 珠海格力电器股份有限公司 | 一种视频通讯中的互动方法及装置 |
WO2021114710A1 (zh) * | 2019-12-09 | 2021-06-17 | 上海幻电信息科技有限公司 | 直播视频互动方法、装置以及计算机设备 |
US11778263B2 (en) | 2019-12-09 | 2023-10-03 | Shanghai Hode Information Technology Co., Ltd. | Live streaming video interaction method and apparatus, and computer device |
CN112752161A (zh) * | 2020-01-13 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种基于实时通信的互动方法、社交应用终端及相关装置 |
CN112752161B (zh) * | 2020-01-13 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 一种基于实时通信的互动方法、社交应用终端及相关装置 |
CN111225237A (zh) * | 2020-04-23 | 2020-06-02 | 腾讯科技(深圳)有限公司 | 一种视频的音画匹配方法、相关装置以及存储介质 |
CN111225237B (zh) * | 2020-04-23 | 2020-08-21 | 腾讯科技(深圳)有限公司 | 一种视频的音画匹配方法、相关装置以及存储介质 |
US11972778B2 (en) | 2020-04-23 | 2024-04-30 | Tencent Technology (Shenzhen) Company Limited | Sound-picture matching method of video, related apparatus, and storage medium |
WO2023040633A1 (zh) * | 2021-09-14 | 2023-03-23 | 北京字跳网络技术有限公司 | 一种视频生成方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10659844B2 (en) | Interaction method and system based on recommended content | |
CN108600680A (zh) | 视频处理方法、终端及计算机可读存储介质 | |
US11405678B2 (en) | Live streaming interactive method, apparatus, electronic device, server and storage medium | |
KR102173479B1 (ko) | 의사소통 시 정보 교환을 위한 방법, 사용자 단말 및 서버 | |
US10805248B2 (en) | Instant messaging method and apparatus for selecting motion for a target virtual role | |
US20170163580A1 (en) | Interactive method and device for playback of multimedia | |
US11711414B2 (en) | Triggering changes to real-time special effects included in a live streaming video | |
CN107908765B (zh) | 一种游戏资源处理方法、移动终端及服务器 | |
CN108958606B (zh) | 分屏显示方法、装置、存储介质和电子设备 | |
CN105630846B (zh) | 头像更新方法及装置 | |
CN109993821B (zh) | 一种表情播放方法及移动终端 | |
CN108958629B (zh) | 分屏退出方法、装置、存储介质和电子设备 | |
CN108600089B (zh) | 一种表情图像的显示方法及终端设备 | |
CN109032732B (zh) | 通知显示方法、装置、存储介质及电子设备 | |
CN108874352A (zh) | 一种信息显示方法及移动终端 | |
US20230013341A1 (en) | Call processing method and electronic device | |
CN109166164B (zh) | 一种表情图片的生成方法及终端 | |
CN111124569A (zh) | 一种应用共享方法、电子设备及计算机可读存储介质 | |
CN108521365B (zh) | 一种添加好友的方法及移动终端 | |
CN108062195A (zh) | 一种通知事件的提示方法及移动终端 | |
CN110784394A (zh) | 一种提示方法及电子设备 | |
CN110750198A (zh) | 一种表情发送方法及移动终端 | |
CN115373577A (zh) | 一种图像处理方法、装置及计算机可读存储介质 | |
CN109918344A (zh) | 文件处理方法和装置以及终端 | |
AU2013222959A1 (en) | Method and apparatus for processing information of image including a face |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180928 |