CN116980683B - 基于视频的幻灯片播放方法、设备及存储介质 - Google Patents

基于视频的幻灯片播放方法、设备及存储介质 Download PDF

Info

Publication number
CN116980683B
CN116980683B CN202311235239.2A CN202311235239A CN116980683B CN 116980683 B CN116980683 B CN 116980683B CN 202311235239 A CN202311235239 A CN 202311235239A CN 116980683 B CN116980683 B CN 116980683B
Authority
CN
China
Prior art keywords
data
video
gesture
hand
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311235239.2A
Other languages
English (en)
Other versions
CN116980683A (zh
Inventor
李六七
肖勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Foresea Allchips Information & Technology Co ltd
Original Assignee
Shenzhen Foresea Allchips Information & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Foresea Allchips Information & Technology Co ltd filed Critical Shenzhen Foresea Allchips Information & Technology Co ltd
Priority to CN202311235239.2A priority Critical patent/CN116980683B/zh
Publication of CN116980683A publication Critical patent/CN116980683A/zh
Application granted granted Critical
Publication of CN116980683B publication Critical patent/CN116980683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • H04N21/4355Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream involving reformatting operations of additional data, e.g. HTML pages on a television screen
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4782Web browsing, e.g. WebTV

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明涉及幻灯片控制领域,公开了一种基于视频的幻灯片播放方法、设备及存储介质。该方法包括:接收视频数据;根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置;裁剪所述视频数据中识别位置的图像数据,得到手部图集;根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据;利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面,以便所述H5页面调整幻灯片的播放数据。在本发明实施例中,解决了当前H5页面播放PPT的技术在操作PPT播放上过于繁琐。

Description

基于视频的幻灯片播放方法、设备及存储介质
技术领域
本发明涉及幻灯片控制领域,尤其涉及一种基于视频的幻灯片播放方法、设备及存储介质。
背景技术
当前的PPT主要是利用PowerPoint进行播放信息,这种播放方式需要在手机、电脑等终端设备中先安装好特定软件,然后通过网络传输才能播放相关PPT文件。
然而,这种播放方式比较臃肿,给用户带来较大的不便。由此,为了克服传统的PPT播放缺点,现在使用HTML5的轻量级幻灯片,不需要特定软件也能制作PPT,并且通过URL分享给其他用户,带来了极大便利。
但是,当前利用URL地址分享PPT的技术方式,仍然需要用户去点击屏幕或者利用外设设备进行控制PPT的播放,这对于需要演讲的PPT还是过于繁琐。因此,针对当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题,需要一种新的技术。
发明内容
本发明的主要目的在于解决当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题。
本发明第一方面提供了一种基于视频的幻灯片播放方法,包括步骤:
接收视频数据;
根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置;
裁剪所述视频数据中识别位置的图像数据,得到手部图集;
根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据;
利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面,以便所述H5页面调整幻灯片的播放数据。
可选的,在本发明第一方面的第一种实现方式中,所述根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置包括:
拆分所述视频数据的帧图像,得到视频帧图集;
利用预置YOLO算法,对所述视频帧图集的每个图像进行特征识别处理,得到所述视频帧图集对应的识别区域集。
可选的,在本发明第一方面的第二种实现方式中,所述裁剪所述视频数据中识别位置的图像数据,得到手部图集包括:
提取所述识别区域集中的目标识别区域;
基于所述目标识别区域,提取所述视频帧图集中所述识别区域对应的目标视频帧图;
基于所述目标识别区域,对所述目标视频帧图进行裁剪处理,生成手部图。
可选的,在本发明第一方面的第三种实现方式中,所述根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据包括:
按顺序提取所述手部图集中的手部图;
根据预置手势识别算法,对所述手部图进行识别处理,得到手势识别数据;
将所述手势识别数据写入预置手势指令框架集中;
判断所述手部图集是否为空集;
若不为空集,则重新按顺序提取所述手部图集中的手部图;
若为空集,则根据预置变化时长分析算法,对所述手势指令框架集的所有数据进行时长分析处理,生成手势指令数据。
可选的,在本发明第一方面的第四种实现方式中,所述根据预置变化时长分析算法,对所述手势指令框架集的所有数据进行时长分析处理,生成手势指令数据包括:
分析所述手势指令框架集中的手势变化时长;
判断所述手势变化时长是否超过预置时长阈值;
若超过时长阈值,则提取所述手势指令框架集中手势变化数据,生成手势指令数据。
可选的,在本发明第一方面的第五种实现方式中,在所述利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面之后,还包括:
基于预置浏览器监听H5页面的网页加载数据;
判断所述网页加载数据是否存在修改;
若不存在修改,则将所述手势指令数据发送至预置播放云终端;
接收所述播放云终端反馈的URL地址,在预置浏览器中加载所述URL地址的网页数据。
可选的,在本发明第一方面的第六种实现方式中,所述接收视频数据包括:
基于TCP/IP协议,接收互联网传输的视频数据。
可选的,在本发明第一方面的第七种实现方式中,所述接收视频数据包括:
利用摄像头拍摄外部数据,生成视频数据。
本发明第二方面提供了一种基于视频的幻灯片播放设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于视频的幻灯片播放设备执行上述的基于视频的幻灯片播放方法。
本发明的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于视频的幻灯片播放方法。
在本发明实施例中,利用计算机视觉和图像处理算法分析操作者的视频,得到操作者对PPT操作的指令,然后利用浏览器的组件对H5页面进行调整,实现操作者利用手势控制PPT的播放,解决了当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题。
附图说明
图1为本发明实施例中基于视频的幻灯片播放方法的第一个实施例示意图;
图2为本发明实施例中基于视频的幻灯片播放方法的第二个实施例示意图;
图3为本发明实施例中基于视频的幻灯片播放方法的第三个实施例示意图;
图4为本发明实施例中基于视频的幻灯片播放方法的第四个实施例示意图;
图5为本发明实施例中基于视频的幻灯片播放方法的第五个实施例示意图;
图6为本发明实施例中基于视频的幻灯片播放方法的第六个实施例示意图;
图7为本发明实施例中基于视频的幻灯片播放设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于视频的幻灯片播放方法、设备及存储介质。
下面将参照附图更详细地描述本发明公开的实施例。虽然附图中显示了本发明公开的某些实施例,然而应当理解的是,本发明公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本发明公开的附图及实施例仅用于示例性作用,并非用于限制本发明公开的保护范围。
在本发明公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于视频的幻灯片播放方法的一个实施例包括:
101、接收视频数据;
在本实施例中,接收视频数据的传输可以由设备使用USB有线接口进行数据传输。
进一步的,101步骤可以执行:
1011、基于TCP/IP协议,接收互联网传输的视频数据。
在1011步骤中,作为一个远程协助控制的方案,远程用户可以利用视频远程控制当前显示H5页面的PPT的播放方式。
进一步的,101步骤还可以执行以下步骤:
1012、利用摄像头拍摄外部数据,生成视频数据。
在1012步骤中,视频数据直接由外部摄像头对外部视频数据进行采集,生成外部视频的实时采集数据,则用户在现场用手势即可控制PPT播放数据。
102、根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置;
在本实施例中,在利用部位识别算法,对视频数据的整个人的动作进行手部识别,只有手部的视频数据才是控制PPT播放的控制指令。
进一步的,可以参考图2,图2为本发明实施例中第二个实施例示意图,在102可以执行以下步骤:
1021、拆分所述视频数据的帧图像,得到视频帧图集;
1022、利用预置YOLO算法,对所述视频帧图集的每个图像进行特征识别处理,得到所述视频帧图集对应的识别区域集。
在1021-1022步骤中,对视频数据的进行逐帧拆分处理,生成按照视频数据排序的视频帧图集的图像数据。利用现有的YOLO神经网络对所述视频帧图集的每个图像进行目标特征识别处理,可以采用YOLO神经网络变种模型YOLOV5模型,具有更快的识别速度。在识别出特征时,YOLO模型会对图像中手部区域进行打标,产生每个图像对应的识别区域,所有的图像的识别区域按照视频帧的排序组合生成识别区域集。
103、裁剪所述视频数据中识别位置的图像数据,得到手部图集;
在本实施例中,裁剪视频数据中的被识别出是手部的图像数据,按照原有的帧数或者是设置的频数图帧进行手部图的裁剪,按照视频播放顺序排序生成手部图集。
进一步的,可以参考图3,图3为本发明实施例中第三个实施例示意图,在103可以执行以下步骤:
1031、提取所述识别区域集中的目标识别区域;
1032、基于所述目标识别区域,提取所述视频帧图集中所述识别区域对应的目标视频帧图;
1033、基于所述目标识别区域,对所述目标视频帧图进行裁剪处理,生成手部图。
在1031-1032步骤中,提取出识别区域集中的一个识别区域数据,对视频帧图集中找到对应的目标视频帧图,在识别区域集中的识别区域会记录一个视频帧ID,然后在视频帧图集中查询到视频帧ID,最后基于视频帧ID作为识别标识,利用目标识别区域的坐标范围,对目标视频帧图进行区域裁剪,得到一个手部图。
104、根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据;
在本实施例中,利用手势识别算法,对手部图集的每个图片进行识别处理,采用识别分类的处理,对手部图的每个图片进行识别处理转换生成手势指令数据。
进一步的,可以参考图4,图4为本发明实施例中第四个实施例示意图,在104步骤中可以执行以下步骤:
1041、按顺序提取所述手部图集中的手部图;
1042、根据预置手势识别算法,对所述手部图进行识别处理,得到手势识别数据;
1043、将所述手势识别数据写入预置手势指令框架集中;
1044、判断所述手部图集是否为空集;
1045、若不为空集,则重新按顺序提取所述手部图集中的手部图;
1046、若为空集,则根据预置变化时长分析算法,对所述手势指令框架集的所有数据进行时长分析处理,生成手势指令数据。
在1041-1046步骤中,按照手部图集的顺序提取手部图,然后基于手势识别算法,对手部图的手势进行分析识别处理,按照手势的种类进行分类划分生成手势识别数据。将已经分析出的手势识别数据写入手势指令框架集中,然后分析顺序提取的手部图集是否已经为空集,如果为空集则不需要再进行提取图片,而不是空集则仍然需要按照顺序提取所述手部图集中的手部图。
在当手部图集为空集时,利用变化时长分析算法,对手势指令框架持续时间较长的手势进行固定,然后分析这些固定顺序的手势给出手势指令数据。
进一步的,可以参考图5,图5为本发明实施例中第五个实施例示意图,在1046步骤中可以执行以下步骤:
10461、分析所述手势指令框架集中的手势变化时长;
10462、判断所述手势变化时长是否超过预置时长阈值;
10463、若超过时长阈值,则提取所述手势指令框架集中手势变化数据,生成手势指令数据。
在10461-10463步骤中,分析手势指令框架集中每个手势发生变化持续的时长,例如手势给出滑动的变化时长持续3秒,则认为播放下一张PPT的滑动手势生效,生成滑动手势对应为播放下一张PPT的手势指令数据。
105、利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面,以便所述H5页面调整幻灯片的播放数据。
在本实施例中,因为H5页面在云端数据库中传输播放PPT,因此利用Websocket服务将播放下一张PPT的手势指令数据发送至播放幻灯片H5页面中,然后云端数据库修改H5页面的播放PPT,实现了手势修改在H5页面上的PPT播放内容。
进一步的,可以参考图6,图6为本发明实施例中第六个实施例示意图,在105步骤中可以执行以下步骤:
1051、基于预置浏览器监听H5页面的网页加载数据;
1052、判断所述网页加载数据是否存在修改;
1053、若不存在修改,则将所述手势指令数据发送至预置播放云终端;
1054、接收所述播放云终端反馈的URL地址,在预置浏览器中加载所述URL地址的网页数据。
在1051-1054步骤中,通过浏览器的组件监听H5页面数据是否在预置1秒修改时间内出现修改,如果没有网页加载数据没有出现数据修改,则将手势指令数据直接发送播放云终端的IP地址,由播放云终端直接给出新的URL地址,在预置浏览器中加载所述URL地址的网页数据,实现用户在感官上是手势控制H5页面的PPT进行修改的显示效果。
在本发明实施例中,利用计算机视觉和图像处理算法分析操作者的视频,得到操作者对PPT操作的指令,然后利用浏览器的组件对H5页面进行调整,实现操作者利用手势控制PPT的播放,解决了当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题。
图7是本发明实施例提供的一种基于视频的幻灯片播放设备的结构示意图,该基于视频的幻灯片播放设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于视频的幻灯片播放设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在基于视频的幻灯片播放设备700上执行存储介质730中的一系列指令操作。
基于视频的幻灯片播放设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作***731,例如Windows Serve,Mac OS X,Unix,Linux,Free BSD等等。本领域技术人员可以理解,图7示出的基于视频的幻灯片播放设备结构并不构成对基于视频的幻灯片播放设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于视频的幻灯片播放方法的步骤。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (3)

1.一种基于视频的幻灯片播放方法,其特征在于,包括步骤:
接收视频数据;
根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置;
裁剪所述视频数据中识别位置的图像数据,得到手部图集;
根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据;
利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面,以便所述H5页面调整幻灯片的播放数据;
其中,所述根据预置手势识别算法,对所述手部图集进行识别处理,得到手势指令数据包括:
按顺序提取所述手部图集中的手部图;
根据预置手势识别算法,对所述手部图进行识别处理,得到手势识别数据;
将所述手势识别数据写入预置手势指令框架集中;
判断所述手部图集是否为空集;
若不为空集,则重新按顺序提取所述手部图集中的手部图;
若为空集,则根据预置变化时长分析算法,对所述手势指令框架集的所有数据进行时长分析处理,生成手势指令数据;
其中,所述根据预置变化时长分析算法,对所述手势指令框架集的所有数据进行时长分析处理,生成手势指令数据包括:
分析所述手势指令框架集中的手势变化时长;
判断所述手势变化时长是否超过预置时长阈值;
若超过时长阈值,则提取所述手势指令框架集中手势变化数据,生成手势指令数据;
其中,所述根据预置部位识别算法,对所述视频数据进行手部识别处理,得到识别位置包括:
拆分所述视频数据的帧图像,得到视频帧图集;
利用预置YOLO算法,对所述视频帧图集的每个图像进行特征识别处理,得到所述视频帧图集对应的识别区域集;
其中,所述裁剪所述视频数据中识别位置的图像数据,得到手部图集包括:
提取所述识别区域集中的目标识别区域;
基于所述目标识别区域,提取所述视频帧图集中所述目标识别区域对应的目标视频帧图;
基于所述目标识别区域,对所述目标视频帧图进行裁剪处理,生成手部图;
其中,在所述利用Websocket服务,将所述手势指令数据传输至播放幻灯片的H5页面之后,还包括:
基于预置浏览器监听H5页面的网页加载数据;
判断所述网页加载数据是否存在修改;
若不存在修改,则将所述手势指令数据发送至预置播放云终端;
接收所述播放云终端反馈的URL地址,在预置浏览器中加载所述URL地址的网页数据;
其中,所述接收视频数据包括:
基于TCP/IP协议,接收互联网传输的视频数据。
2.一种基于视频的幻灯片播放设备,其特征在于,所述基于视频的幻灯片播放设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于视频的幻灯片播放设备执行如权利要求1所述的基于视频的幻灯片播放方法。
3.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述的基于视频的幻灯片播放方法。
CN202311235239.2A 2023-09-25 2023-09-25 基于视频的幻灯片播放方法、设备及存储介质 Active CN116980683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311235239.2A CN116980683B (zh) 2023-09-25 2023-09-25 基于视频的幻灯片播放方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311235239.2A CN116980683B (zh) 2023-09-25 2023-09-25 基于视频的幻灯片播放方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN116980683A CN116980683A (zh) 2023-10-31
CN116980683B true CN116980683B (zh) 2024-04-16

Family

ID=88483559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311235239.2A Active CN116980683B (zh) 2023-09-25 2023-09-25 基于视频的幻灯片播放方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116980683B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609093A (zh) * 2012-02-16 2012-07-25 中国农业大学 用手势控制视频播放的方法及装置
CN105450944A (zh) * 2015-11-13 2016-03-30 北京自由坊科技有限责任公司 一种幻灯片和现场讲演语音同步录制与重现的方法及装置
CN111078078A (zh) * 2019-11-29 2020-04-28 深圳市咨聊科技有限公司 视频播放控制方法、装置、终端及计算机可读存储介质
CN112307226A (zh) * 2019-07-31 2021-02-02 西安诺瓦星云科技股份有限公司 一种幻灯片播控方法、装置及***和计算机可读存储介质
CN113536864A (zh) * 2020-04-22 2021-10-22 深圳市优必选科技股份有限公司 手势识别方法、装置、计算机可读存储介质及终端设备
CN114360044A (zh) * 2020-10-12 2022-04-15 武汉Tcl集团工业研究院有限公司 手势识别方法、装置、终端设备及计算机可读存储介质
CN114564104A (zh) * 2022-02-17 2022-05-31 西安电子科技大学 一种基于视频中动态手势控制的会议演示***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609093A (zh) * 2012-02-16 2012-07-25 中国农业大学 用手势控制视频播放的方法及装置
CN105450944A (zh) * 2015-11-13 2016-03-30 北京自由坊科技有限责任公司 一种幻灯片和现场讲演语音同步录制与重现的方法及装置
CN112307226A (zh) * 2019-07-31 2021-02-02 西安诺瓦星云科技股份有限公司 一种幻灯片播控方法、装置及***和计算机可读存储介质
CN111078078A (zh) * 2019-11-29 2020-04-28 深圳市咨聊科技有限公司 视频播放控制方法、装置、终端及计算机可读存储介质
CN113536864A (zh) * 2020-04-22 2021-10-22 深圳市优必选科技股份有限公司 手势识别方法、装置、计算机可读存储介质及终端设备
CN114360044A (zh) * 2020-10-12 2022-04-15 武汉Tcl集团工业研究院有限公司 手势识别方法、装置、终端设备及计算机可读存储介质
CN114564104A (zh) * 2022-02-17 2022-05-31 西安电子科技大学 一种基于视频中动态手势控制的会议演示***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于HTML5的幻灯片设计及实现智能手机的播放;刘俊轩;刘春鹏;许伟伟;赵越;周志恒;刘丽杰;;黑龙江八一农垦大学学报(第02期);第72-77页 *

Also Published As

Publication number Publication date
CN116980683A (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
WO2019242222A1 (zh) 用于生成信息的方法和装置
US10424338B2 (en) Method and apparatus for creating short video clips of important events
JP6339489B2 (ja) 画像分割方法および画像分割装置
WO2019047649A1 (zh) 用于确定无人车的驾驶行为的方法和装置
JP2020516188A (ja) 顔画像重複削除方法及び装置、電子機器、記憶媒体、プログラム
CN107392189B (zh) 用于确定无人车的驾驶行为的方法和装置
CN112927241A (zh) 图片截取和缩略图生成方法、***、设备及储存介质
US11120273B2 (en) Adaptive content classification of a video content item
CN116980683B (zh) 基于视频的幻灯片播放方法、设备及存储介质
CN111027195B (zh) 仿真场景的生成方法、装置及设备
CN116033259B (zh) 生成短视频方法、装置、计算机设备及存储介质
US8867837B2 (en) Detecting separator lines in a web page
CN108280184B (zh) 一种基于智能笔的试题摘录方法、***及智能笔
CN107283429B (zh) 基于人工智能的控制方法、装置、***以及终端
CN111813741B (zh) 文件的共享方法及电子设备
CN105068708B (zh) 一种指令获取、反馈方法及设备和云服务器
CN115357772A (zh) 数据处理方法及装置
CN110263743B (zh) 用于识别图像的方法和装置
CN110188833B (zh) 用于训练模型的方法和装置
CN113965798A (zh) 一种视频信息生成、展示方法、装置、设备及存储介质
CN110704294B (zh) 用于确定响应时间的方法和装置
CN111338461A (zh) 一种手势操作方法及装置、电子设备
CN114095648B (zh) 一种手势控制摄像头转动的方法和装置
CN111538858B (zh) 建立视频图谱的方法、装置、电子设备、存储介质
KR102599525B1 (ko) 관심 이미지의 시인성을 개선한 화면 표출 방법, 장치 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant