CN116980683B

CN116980683B - 基于视频的幻灯片播放方法、设备及存储介质

Info

Publication number: CN116980683B
Application number: CN202311235239.2A
Authority: CN
Inventors: 李六七; 肖勇
Original assignee: Shenzhen Foresea Allchips Information & Technology Co ltd
Current assignee: Shenzhen Foresea Allchips Information & Technology Co ltd
Priority date: 2023-09-25
Filing date: 2023-09-25
Publication date: 2024-04-16
Anticipated expiration: 2043-09-25
Also published as: CN116980683A

Abstract

本发明涉及幻灯片控制领域，公开了一种基于视频的幻灯片播放方法、设备及存储介质。该方法包括：接收视频数据；根据预置部位识别算法，对所述视频数据进行手部识别处理，得到识别位置；裁剪所述视频数据中识别位置的图像数据，得到手部图集；根据预置手势识别算法，对所述手部图集进行识别处理，得到手势指令数据；利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面，以便所述H5页面调整幻灯片的播放数据。在本发明实施例中，解决了当前H5页面播放PPT的技术在操作PPT播放上过于繁琐。

Description

基于视频的幻灯片播放方法、设备及存储介质

技术领域

本发明涉及幻灯片控制领域，尤其涉及一种基于视频的幻灯片播放方法、设备及存储介质。

背景技术

当前的PPT主要是利用PowerPoint进行播放信息，这种播放方式需要在手机、电脑等终端设备中先安装好特定软件，然后通过网络传输才能播放相关PPT文件。

然而，这种播放方式比较臃肿，给用户带来较大的不便。由此，为了克服传统的PPT播放缺点，现在使用HTML5的轻量级幻灯片，不需要特定软件也能制作PPT，并且通过URL分享给其他用户，带来了极大便利。

但是，当前利用URL地址分享PPT的技术方式，仍然需要用户去点击屏幕或者利用外设设备进行控制PPT的播放，这对于需要演讲的PPT还是过于繁琐。因此，针对当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题，需要一种新的技术。

发明内容

本发明的主要目的在于解决当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题。

本发明第一方面提供了一种基于视频的幻灯片播放方法，包括步骤：

接收视频数据；

根据预置部位识别算法，对所述视频数据进行手部识别处理，得到识别位置；

裁剪所述视频数据中识别位置的图像数据，得到手部图集；

根据预置手势识别算法，对所述手部图集进行识别处理，得到手势指令数据；

利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面，以便所述H5页面调整幻灯片的播放数据。

可选的，在本发明第一方面的第一种实现方式中，所述根据预置部位识别算法，对所述视频数据进行手部识别处理，得到识别位置包括：

拆分所述视频数据的帧图像，得到视频帧图集；

利用预置YOLO算法，对所述视频帧图集的每个图像进行特征识别处理，得到所述视频帧图集对应的识别区域集。

可选的，在本发明第一方面的第二种实现方式中，所述裁剪所述视频数据中识别位置的图像数据，得到手部图集包括：

提取所述识别区域集中的目标识别区域；

基于所述目标识别区域，提取所述视频帧图集中所述识别区域对应的目标视频帧图;

基于所述目标识别区域，对所述目标视频帧图进行裁剪处理，生成手部图。

可选的，在本发明第一方面的第三种实现方式中，所述根据预置手势识别算法，对所述手部图集进行识别处理，得到手势指令数据包括：

按顺序提取所述手部图集中的手部图;

根据预置手势识别算法，对所述手部图进行识别处理，得到手势识别数据；

将所述手势识别数据写入预置手势指令框架集中；

判断所述手部图集是否为空集；

若不为空集，则重新按顺序提取所述手部图集中的手部图；

若为空集，则根据预置变化时长分析算法，对所述手势指令框架集的所有数据进行时长分析处理，生成手势指令数据。

可选的，在本发明第一方面的第四种实现方式中，所述根据预置变化时长分析算法，对所述手势指令框架集的所有数据进行时长分析处理，生成手势指令数据包括：

分析所述手势指令框架集中的手势变化时长；

判断所述手势变化时长是否超过预置时长阈值；

若超过时长阈值，则提取所述手势指令框架集中手势变化数据，生成手势指令数据。

可选的，在本发明第一方面的第五种实现方式中，在所述利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面之后，还包括：

基于预置浏览器监听H5页面的网页加载数据；

判断所述网页加载数据是否存在修改；

若不存在修改，则将所述手势指令数据发送至预置播放云终端；

接收所述播放云终端反馈的URL地址，在预置浏览器中加载所述URL地址的网页数据。

可选的，在本发明第一方面的第六种实现方式中，所述接收视频数据包括：

基于TCP/IP协议，接收互联网传输的视频数据。

可选的，在本发明第一方面的第七种实现方式中，所述接收视频数据包括:

利用摄像头拍摄外部数据，生成视频数据。

本发明第二方面提供了一种基于视频的幻灯片播放设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述基于视频的幻灯片播放设备执行上述的基于视频的幻灯片播放方法。

本发明的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的基于视频的幻灯片播放方法。

在本发明实施例中，利用计算机视觉和图像处理算法分析操作者的视频，得到操作者对PPT操作的指令，然后利用浏览器的组件对H5页面进行调整，实现操作者利用手势控制PPT的播放，解决了当前H5页面播放PPT的技术在操作PPT播放上过于繁琐的技术问题。

附图说明

图1为本发明实施例中基于视频的幻灯片播放方法的第一个实施例示意图；

图2为本发明实施例中基于视频的幻灯片播放方法的第二个实施例示意图；

图3为本发明实施例中基于视频的幻灯片播放方法的第三个实施例示意图；

图4为本发明实施例中基于视频的幻灯片播放方法的第四个实施例示意图；

图5为本发明实施例中基于视频的幻灯片播放方法的第五个实施例示意图；

图6为本发明实施例中基于视频的幻灯片播放方法的第六个实施例示意图；

图7为本发明实施例中基于视频的幻灯片播放设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种基于视频的幻灯片播放方法、设备及存储介质。

下面将参照附图更详细地描述本发明公开的实施例。虽然附图中显示了本发明公开的某些实施例，然而应当理解的是，本发明公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本发明公开的附图及实施例仅用于示例性作用，并非用于限制本发明公开的保护范围。

在本发明公开的实施例的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中基于视频的幻灯片播放方法的一个实施例包括：

101、接收视频数据；

在本实施例中，接收视频数据的传输可以由设备使用USB有线接口进行数据传输。

进一步的，101步骤可以执行：

1011、基于TCP/IP协议，接收互联网传输的视频数据。

在1011步骤中，作为一个远程协助控制的方案，远程用户可以利用视频远程控制当前显示H5页面的PPT的播放方式。

进一步的，101步骤还可以执行以下步骤：

1012、利用摄像头拍摄外部数据，生成视频数据。

在1012步骤中，视频数据直接由外部摄像头对外部视频数据进行采集，生成外部视频的实时采集数据，则用户在现场用手势即可控制PPT播放数据。

102、根据预置部位识别算法，对所述视频数据进行手部识别处理，得到识别位置；

在本实施例中，在利用部位识别算法，对视频数据的整个人的动作进行手部识别，只有手部的视频数据才是控制PPT播放的控制指令。

进一步的，可以参考图2，图2为本发明实施例中第二个实施例示意图，在102可以执行以下步骤：

1021、拆分所述视频数据的帧图像，得到视频帧图集；

1022、利用预置YOLO算法，对所述视频帧图集的每个图像进行特征识别处理，得到所述视频帧图集对应的识别区域集。

在1021-1022步骤中，对视频数据的进行逐帧拆分处理，生成按照视频数据排序的视频帧图集的图像数据。利用现有的YOLO神经网络对所述视频帧图集的每个图像进行目标特征识别处理，可以采用YOLO神经网络变种模型YOLOV5模型，具有更快的识别速度。在识别出特征时，YOLO模型会对图像中手部区域进行打标，产生每个图像对应的识别区域，所有的图像的识别区域按照视频帧的排序组合生成识别区域集。

103、裁剪所述视频数据中识别位置的图像数据，得到手部图集；

在本实施例中，裁剪视频数据中的被识别出是手部的图像数据，按照原有的帧数或者是设置的频数图帧进行手部图的裁剪，按照视频播放顺序排序生成手部图集。

进一步的，可以参考图3，图3为本发明实施例中第三个实施例示意图，在103可以执行以下步骤：

1031、提取所述识别区域集中的目标识别区域；

1032、基于所述目标识别区域，提取所述视频帧图集中所述识别区域对应的目标视频帧图；

1033、基于所述目标识别区域，对所述目标视频帧图进行裁剪处理，生成手部图。

在1031-1032步骤中，提取出识别区域集中的一个识别区域数据，对视频帧图集中找到对应的目标视频帧图，在识别区域集中的识别区域会记录一个视频帧ID，然后在视频帧图集中查询到视频帧ID，最后基于视频帧ID作为识别标识，利用目标识别区域的坐标范围，对目标视频帧图进行区域裁剪，得到一个手部图。

104、根据预置手势识别算法，对所述手部图集进行识别处理，得到手势指令数据；

在本实施例中，利用手势识别算法，对手部图集的每个图片进行识别处理，采用识别分类的处理，对手部图的每个图片进行识别处理转换生成手势指令数据。

进一步的，可以参考图4，图4为本发明实施例中第四个实施例示意图，在104步骤中可以执行以下步骤：

1041、按顺序提取所述手部图集中的手部图；

1042、根据预置手势识别算法，对所述手部图进行识别处理，得到手势识别数据；

1043、将所述手势识别数据写入预置手势指令框架集中；

1044、判断所述手部图集是否为空集；

1045、若不为空集，则重新按顺序提取所述手部图集中的手部图；

1046、若为空集，则根据预置变化时长分析算法，对所述手势指令框架集的所有数据进行时长分析处理，生成手势指令数据。

在1041-1046步骤中，按照手部图集的顺序提取手部图，然后基于手势识别算法，对手部图的手势进行分析识别处理，按照手势的种类进行分类划分生成手势识别数据。将已经分析出的手势识别数据写入手势指令框架集中，然后分析顺序提取的手部图集是否已经为空集，如果为空集则不需要再进行提取图片，而不是空集则仍然需要按照顺序提取所述手部图集中的手部图。

在当手部图集为空集时，利用变化时长分析算法，对手势指令框架持续时间较长的手势进行固定，然后分析这些固定顺序的手势给出手势指令数据。

进一步的，可以参考图5，图5为本发明实施例中第五个实施例示意图，在1046步骤中可以执行以下步骤：

10461、分析所述手势指令框架集中的手势变化时长；

10462、判断所述手势变化时长是否超过预置时长阈值；

10463、若超过时长阈值，则提取所述手势指令框架集中手势变化数据，生成手势指令数据。

在10461-10463步骤中，分析手势指令框架集中每个手势发生变化持续的时长，例如手势给出滑动的变化时长持续3秒，则认为播放下一张PPT的滑动手势生效，生成滑动手势对应为播放下一张PPT的手势指令数据。

105、利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面，以便所述H5页面调整幻灯片的播放数据。

在本实施例中，因为H5页面在云端数据库中传输播放PPT，因此利用Websocket服务将播放下一张PPT的手势指令数据发送至播放幻灯片H5页面中，然后云端数据库修改H5页面的播放PPT，实现了手势修改在H5页面上的PPT播放内容。

进一步的，可以参考图6，图6为本发明实施例中第六个实施例示意图，在105步骤中可以执行以下步骤：

1051、基于预置浏览器监听H5页面的网页加载数据；

1052、判断所述网页加载数据是否存在修改；

1053、若不存在修改，则将所述手势指令数据发送至预置播放云终端；

1054、接收所述播放云终端反馈的URL地址，在预置浏览器中加载所述URL地址的网页数据。

在1051-1054步骤中，通过浏览器的组件监听H5页面数据是否在预置1秒修改时间内出现修改，如果没有网页加载数据没有出现数据修改，则将手势指令数据直接发送播放云终端的IP地址，由播放云终端直接给出新的URL地址，在预置浏览器中加载所述URL地址的网页数据，实现用户在感官上是手势控制H5页面的PPT进行修改的显示效果。

图7是本发明实施例提供的一种基于视频的幻灯片播放设备的结构示意图，该基于视频的幻灯片播放设备700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（central processing units，CPU）710（例如，一个或一个以上处理器）和存储器720，一个或一个以上存储应用程序733或数据732的存储介质730（例如一个或一个以上海量存储设备）。其中，存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对基于视频的幻灯片播放设备700中的一系列指令操作。更进一步地，处理器710可以设置为与存储介质730通信，在基于视频的幻灯片播放设备700上执行存储介质730中的一系列指令操作。

基于视频的幻灯片播放设备700还可以包括一个或一个以上电源740，一个或一个以上有线或无线网络接口750，一个或一个以上输入输出接口760，和/或，一个或一个以上操作***731，例如Windows Serve，Mac OS X，Unix，Linux，Free BSD等等。本领域技术人员可以理解，图7示出的基于视频的幻灯片播放设备结构并不构成对基于视频的幻灯片播放设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述基于视频的幻灯片播放方法的步骤。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种基于视频的幻灯片播放方法，其特征在于，包括步骤：

接收视频数据；

裁剪所述视频数据中识别位置的图像数据，得到手部图集；

利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面，以便所述H5页面调整幻灯片的播放数据；

其中，所述根据预置手势识别算法，对所述手部图集进行识别处理，得到手势指令数据包括：

按顺序提取所述手部图集中的手部图;

将所述手势识别数据写入预置手势指令框架集中；

判断所述手部图集是否为空集；

若不为空集，则重新按顺序提取所述手部图集中的手部图；

若为空集，则根据预置变化时长分析算法，对所述手势指令框架集的所有数据进行时长分析处理，生成手势指令数据；

其中，所述根据预置变化时长分析算法，对所述手势指令框架集的所有数据进行时长分析处理，生成手势指令数据包括：

分析所述手势指令框架集中的手势变化时长；

判断所述手势变化时长是否超过预置时长阈值；

若超过时长阈值，则提取所述手势指令框架集中手势变化数据，生成手势指令数据；

其中，所述根据预置部位识别算法，对所述视频数据进行手部识别处理，得到识别位置包括：

拆分所述视频数据的帧图像，得到视频帧图集；

利用预置YOLO算法，对所述视频帧图集的每个图像进行特征识别处理，得到所述视频帧图集对应的识别区域集；

其中，所述裁剪所述视频数据中识别位置的图像数据，得到手部图集包括：

提取所述识别区域集中的目标识别区域；

基于所述目标识别区域，提取所述视频帧图集中所述目标识别区域对应的目标视频帧图;

基于所述目标识别区域，对所述目标视频帧图进行裁剪处理，生成手部图；

其中，在所述利用Websocket服务，将所述手势指令数据传输至播放幻灯片的H5页面之后，还包括：

基于预置浏览器监听H5页面的网页加载数据；

判断所述网页加载数据是否存在修改；

接收所述播放云终端反馈的URL地址，在预置浏览器中加载所述URL地址的网页数据；

其中，所述接收视频数据包括：

基于TCP/IP协议，接收互联网传输的视频数据。

2.一种基于视频的幻灯片播放设备，其特征在于，所述基于视频的幻灯片播放设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述基于视频的幻灯片播放设备执行如权利要求1所述的基于视频的幻灯片播放方法。

3.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1所述的基于视频的幻灯片播放方法。