CN106375695A

CN106375695A - 音视频评分并存储的方法及装置

Info

Publication number: CN106375695A
Application number: CN201610768932.XA
Authority: CN
Inventors: 陈羽通; 蔡井彬; 占木土
Original assignee: Xiamen Network Technology Co Ltd
Current assignee: Geek Ruanchuang Xiamen Information Technology Co ltd
Priority date: 2016-08-30
Filing date: 2016-08-30
Publication date: 2017-02-01
Anticipated expiration: 2036-08-30
Also published as: CN106375695B

Abstract

本发明提出一种家庭视频评分并存储的方法及装置，该方法包括步骤：采集视频中的声音特征；采集视频中的动作特征；对视频中的声音特征评分；对视频中的动作特征评分；结合声音特征评分和动作特征评分对视频评分；将所有音视频按音视频评分从高到低进行排列，并存储音视频评分前排序位一定范围内的视频。该装置包括声音采集模块、动作采集模块、声音评分模块、动作评分模块、综合评分模块、存储模块。本发明不仅实现较为精准的区分家庭视频片段的精彩程度，还大大节约了存储成本。

Description

音视频评分并存储的方法及装置

技术领域

本发明涉及智能视频技术，具体涉及音视频评分并存储的方法及装置。

背景技术

在智能家居领域中，通过智能摄像技术能够捕捉家庭录像的片段，采集到的音视频片段数量较多，其中有一些枯燥无趣的短音视频片段，因而需要将枯燥无趣的短音视频片段自动过滤掉并筛选出较为精彩的音视频片段，以节约存储的成本，通过人工回放的方式获取用户认为较为精彩的音视频片段并过滤枯燥无趣的短音视频片段显然是较为低效的，因而需要引入一种全新的针对家庭采集音视频的评分机制以过滤出精彩度较高的少量短音视频，从而将大量的枯燥无趣的短音视频片段自动过滤掉，大大减少存储的容量，进而大大节俭存储的成本。

发明内容

为此，本发明提出一种音视频评分并存储的方法及装置，通过对音视频的声音特征以及动作特征赋予不同的权重进行评分，以实现较为精准的区分家庭音视频片段的精彩程度，并引入初步筛选获取精彩度较高的音视频录制方法，以更精确的对音视频评分。由于本发明能将枯燥无趣的片段过滤掉，并且帮用户筛选并提取出精彩程度较高的视频片段，从而让用户在回顾视频时，能够更快的找到自己感兴趣的视频片段，而不会被大量的录制下来的枯燥无味的片段所困扰。

具体方案如下：

音视频评分并存储的方法，包括步骤：

采集音视频中的声音特征；

采集音视频中的动作特征；

对音视频中的声音特征评分；

对音视频中的动作特征评分；

结合声音特征评分和动作特征评分；

将所有音视频按音视频评分从高到低进行排列，并存储音视频评分前排序位一定范围内的视频。

其中，在进行采集音视频中的动作特征步骤中，还包括一设置移动侦测区域的步骤：将音视频中的视频图像帧分割成若干图像块，各若干图像块设为移动侦测区域,并对移动侦测区域编号标记。

其中，所述的采集音视频中的声音特征具体方法是：

将完整的音视频按时间划分为多个声音采集周期；

采集每个声音采集周期内的声音特征：获取声音采集周期内的声音特征，所述的声音特征包括声音平均音量声音的最大值V_max以及声音的最小值V_min。

其中，所述的采集音视频中的动作特征具体方法是：

将完整的音视频按时间划分为多个动作采集周期；

采集每个动作采集周期内的动作特征：对该周期内的音视频中图像帧进行移动侦测检测，获取动作采集周期内的动作特征，所述的动作特征包括移动侦测触发区域M、移动侦测触发区域触发的移动侦测次数N。

其中，所述的对音视频中的声音特征评分的具体步骤是：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

ScoreV_m＝ScoreV_m-1+V_m+|V_m-VD_m|/(V_m+VD_m)*V_m，其中ScoreV_m-1为上一周期的声音评分值；

依次计算下一周期的声音评分值，直到获得最后一个周期的声音评分值，该声音评分值即为音视频的声音特征评分值，

所述的对音视频中的动作特征评分的具体步骤是：

初始化音视频的动作评分值ScoreM＝0；

获取第m个周期的移动侦测触发区域M及移动侦测触发区域触发的移动侦测次数N，记为Dm(M1，N1)...Dm(Mn，Nn)；

获取本周期内的移动侦测触发区域总数NT_dist以及移动侦测触发总次数NT_motion；

获取本周期与上一周期不同的移动侦测触发区域总数NTD_dist；

计算第m个周期的动作评分值：

ScoreM_m＝ScoreM_m-1+NT_dist+NT_motion+NTD_dist，其中ScoreM_m-1为上一周期的动作评分值；

依次计算下一周期的动作评分值，直到获得最后一个周期的动作评分值，该动作评分值即为音视频的动作特征评分值。

其中，所述的结合声音特征评分和动作特征评分对音视频评分的具体方法是：

计算音视频评分Score，其中Score＝ScoreV*rateV+ScoreM*rateM，rateV为声音评分值的权重值，rateM为动作评分值的权重值。

进一步的，在采集音视频的声音特征及动作特征之前,还包括初步筛选录制获取一音视频的步骤,该录制音视频方法包括步骤：

采集至少两个图像帧，并采集声音信息；

设置移动侦测区域：将图像帧分割成若干图像块，各若干图像块设为移动侦测区域；

设定一开始录制检测周期，对该周期内的图像帧进行移动侦测检测，统计出在开始录制检测周期内的移动侦测触发次数、移动侦测触发的不同区域数，并获取在开始录制检测周期内的声音信息中的声音平均音量，若移动侦测触发次数大于移动侦测触发次数阈值、移动侦测触发的不同区域数大于移动侦测触发的不同区域数阈值且声音平均音量大于声音平均音量阈值，则开始音视频录制；

设定一结束录制检测周期，对该周期内的图像帧进行移动侦测检测，统计出在结束录制检测周期内的移动侦测触发次数、移动侦测触发的不同区域数以及视频录制的持续时长，并获取在结束录制检测周期内的声音信息中的声音平均音量，若移动侦测触发次数小于移动侦测触发次数阈值、移动侦测触发的不同区域数小于移动侦测触发的不同区域数阈值、声音平均音量小于声音平均音量阈值或视频录制的持续时长大于时长阈值，则结束音视频录制；

存储从开始录制视频到结束视频录制的时间内的连续图像帧以及声音信息即形成音视频。

音视频评分并存储的装置，包括：

声音特征采集模块，被配置为采集音视频中的声音特征，

动作特征采集模块，被配置为采集音视频中的动作特征，

声音特征评分模块，被配置为对音视频中的声音特征评分，

动作特征评分模块，被配置为对音视频中的动作特征评分，

综合评分模块，被配置为结合声音特征评分和动作特征评分对音视频评分，

存储模块，被配置为将所有音视频按音视频评分从高到低进行排列，并存储音视频评分前排序位一定范围内的视频。

其中，所述的动作特征采集模块包括以一移动侦测区域设置模块：被配置为将音视频中的视频图像帧分割成若干图像块，各若干图像块设为移动侦测区域,并对移动侦测区域编号标记。

其中，所述的声音特征采集模块还用于：将完整的音视频按时间划分为多个声音采集周期；采集每个声音采集周期内的声音特征：获取声音采集周期内的声音特征，所述的声音特征包括声音平均音量声音的最大值V_max以及声音的最小值V_min。

其中，所述的动过特征采集模块还用于：将完整的音视频按时间划分为多个动作采集周期；

其中，所述的声音特征评分模块还用于：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

所述的动作特征评分模块还用于：

初始化音视频的动作评分值ScoreM＝0；

计算第m个周期的动作评分值：

其中，所述的综合评分模块还用于：

其中，还包括初步筛选录制获取一音视频的模块,该音视频录制模块包括：

采集模块，被配置为采集至少两个图像帧，并采集声音信息；

移动侦测设置模块，被配置为设置移动侦测区域：将图像帧分割成若干图像块，各若干图像块设为移动侦测区域；

录制开始单元，被配置为设定一开始录制检测周期，对该周期内的图像帧进行移动侦测检测，统计出在开始录制检测周期内的移动侦测触发次数、移动侦测触发的不同区域数，并获取在开始录制检测周期内的声音信息中的声音平均音量，若移动侦测触发次数大于移动侦测触发次数阈值、移动侦测触发的不同区域数大于移动侦测触发的不同区域数阈值且声音平均音量大于声音平均音量阈值，则开始音视频录制；

录制结束单元，被配置为设定一结束录制检测周期，对该周期内的图像帧进行移动侦测检测，统计出在结束录制检测周期内的移动侦测触发次数、移动侦测触发的不同区域数以及视频录制的持续时长，并获取在结束录制检测周期内的声音信息中的声音平均音量，若移动侦测触发次数小于移动侦测触发次数阈值、移动侦测触发的不同区域数小于移动侦测触发的不同区域数阈值、声音平均音量小于声音平均音量阈值或视频录制的持续时长大于时长阈值，则结束音视频录制；

存储单元，被配置为存储从开始录制视频到结束视频录制的时间内的连续图像帧以及声音信息即形成音视频。

传统的网络摄像机在录制视频文件时，并没有对录制文件当中所携带的动作以及声音的信息进行提取并数字化，从而无法为用户对该视频的精彩程度进行数字化评分，从而无法为用户做去粗取精的工作。而本发明的引入，加入了对视频精彩程度评分的机制，能够为用户对大量的视频文件进行精彩程度的排序，并为用户过滤掉低分值的枯燥乏味的视频，从而给用户回放视频文件带来更好的体验；

由于本发明引入了精彩评分的体系，能够自动识别并挑选出高分值的视频片段，将这些片段进行存储，并将其它低分值的片段自动清理删除，从而大大减少了存储的成本，并对经典视频片段的长久存储提供了可行的方案。相比传统的网络摄像机的云存储方案，只能够保存最新一周，一个月或者一年的视频片段，并且需要用户支付高昂的存储费用相比，本发明将在存储时间以及成本上都能改有大幅度的改善，更进一步的本发明引入一初步筛选获得音视频的方法，以更加精确的对视频进行评分。

附图说明

图1为本本发明音视频评分并存储的方法的流程图；

图2为本发明一实施例对图像设置移动侦测区域的示意图；

图3为本发明一实施例采集声音特征及动作特征流程图；

图4为本发明一实施例音视频评分流程示意图。

具体实施方式

为进一步说明各实施例，本发明提供有附图。这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。现结合附图和具体实施方式对本发明进一步说明。

本领域相关术语的解释：

移动侦测，指检测目标对象是否发生位置移动的变化。

移动侦测触发，指被检测的目标对象发生了位置移动的变化。

如图1所示，为本发明音视频评分并存储的方法的流程图，其包括以下步骤：

采集音视频中的声音特征；

采集音视频中的动作特征；

对音视频中的声音特征评分；

对音视频中的动作特征评分；

结合声音特征评分和动作特征评分对音视频评分；

应当说明的是，采集音视频中的声音特征的步骤与采集音视频中的动作特征的步骤并无先后顺序的差别，可先采集音视频中的声音特征，也可先采集音视频中的动作特征，同时采集音视频中的声音特征和动作特征也是可行的。

由于本实施例在采集音视频中的声音特征及采集音视频中的动作特征的过程中采用了基于移动侦测机制的方法，因而在进行声音特征及动作特征采集前，还包括有一移动侦测步骤，对画面进行移动侦测的相关设置如下：将音视频中图像帧分割成若干图像块，各若干图像块设为移动侦测区域,并对移动侦测区域编号标记，如图2所示，为本实施例对图像设置移动侦测区域的示意图，其中，将画面等分成60个小的检测区域，水平方向上等分12份，竖直方向上分成5分。每个区域的灵敏度，均设置成80％。本领域的相关技术人员可以灵活地对画面区域划分，以获得一较佳的侦测效果。

如图3所述，为本实施例采集音视频中的声音特征以及采集音视频中的动作特征的流程图；

将完整的音视频按时间划分为多个声音采集周期；

采集每个声音采集周期内的声音特征：对该周期内的音视频中图像帧进行移动侦测检测，获取声音采集周期内的声音特征，所述的声音特征包括声音平均音量声音的最大值V_max以及声音的最小值V_min。

将完整的音视频按时间划分为多个动作采集周期；

采集每个动作采集周期内的动作特征：对该周期内的图像帧进行移动侦测检测，获取动作采集周期内的动作特征，所述的动作特征包括移动侦测触发区域M、移动侦测触发区域触发的移动侦测次数N。

此过程中，算法当中的所有参数，均可根据算法在运行过程当中的实际效果进行灵活的调整。默认值为：声音特征采集周期：100ms，动作特征采集周期：200ms。

本实施例中，采集完成后，将数据打包，数据格式采用自定义数据格式，动作特点信息以及声音特点信息分别以各自的采样周期为基本数据单位进行打包成数据包信息。

解析出音视频的数据包信息，并对视频评分，如图4所示，为本实施例对音视频评分的算法流程图。

对音视频中的声音特征评分的具体步骤：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

对音视频中的动作特征评分的步骤是：

初始化音视频的动作评分值ScoreM＝0；

计算第m个周期的动作评分值：

最后计算音视频评分Score，其中Score＝ScoreV*rateV+ScoreM*rateM，rateV为声音评分值的权重值，rateM为动作评分值的权重值。在本实施例中rateM职位0.65，rateV值为0.35，应当说明的是，可以根据不同的需求设置不同的权重值。

完成评分后，将所有音视频按音视频评分将序排列，并存储音视频评分前排序位一定范围内的音视频，在本实施例中通过上面步骤中所得出的每个音视频的精彩程度的评分，将排名前20名的20个短音视频以及用户主动进行了收藏或者下载的音视频文件进行保留，其余的音视频片段全部删除。

另外本发明还引入一初步筛选获取精彩度较高的音视频录制方法，以更精确的对音视频评分，该音视频录制方法包括步骤：采集至少两个图像帧，并采集声音信息；

基于上述的音视频评分并存储的方法，本发明还提出一种音视频评分并存储的装置，包括：

声音特征采集模块，被配置为采集音视频中的声音特征，

动作特征采集模块，被配置为采集音视频中的动作特征，

声音特征评分模块，被配置为对音视频中的声音特征评分，

动作特征评分模块，被配置为对音视频中的动作特征评分，

其中，所述的声音特征评分模块还用于：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

所述的动作特征评分模块还用于：

初始化音视频的动作评分值ScoreM＝0；

获取第m个周期的移动侦测触发区域M及移动侦测触发区域触发的移动侦测

次数N，记为Dm(M1，N1)...Dm(Mn，Nn)；

计算第m个周期的动作评分值：

其中，所述的综合评分模块还用于：

本发明对视频精彩程度评分的机制，能够为用户对大量的视频文件进行精彩程度的排序，并为用户过滤低分值的枯燥乏味的视频，从而给用户回放视频文件带来更好的体验；本发明能够自动识别并挑选出高分值的视频片段，将这些片段进行存储，并将其它低分值的片段自动清理删除，从而大大减少了存储的成本，并对经典视频片段的长久存储提供了可行的方案。相比传统的网络摄像机的云存储方案，只能够保存最新一周，一个月或者一年的视频片段，并且需要用户支付高昂的存储费用相比，此方案将在存储时间以及成本上都能改有大幅度的改善。

本发明另外引入的视频录制方法，能初步的达到对音视频的过滤，以进一步的提高评分的精确性。

尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

Claims

1.音视频评分并存储的方法，其特征在于，包括步骤：

采集音视频中的声音特征；

采集音视频中的动作特征；

对音视频中的声音特征评分；

对音视频中的动作特征评分；

结合声音特征评分和动作特征评分对音视频评分；

2.根据权利要求1所述的音视频评分并存储的方法，其特征在于，在进行采集音视频中的动作特征步骤中，还包括一设置移动侦测区域的步骤：将音视频中的视频图像帧分割成若干图像块，各若干图像块设为移动侦测区域,并对移动侦测区域编号标记。

3.根据权利要求2所述的音视频评分并存储的方法，其特征在于，所述的采集音视频中的声音特征具体方法是：

将完整的音视频按时间划分为多个声音采集周期；

采集每个声音采集周期内的声音特征：获取声音采集周期内的声音特征，所

述的声音特征包括声音平均音量声音的最大值V_max以及声音的最小值V_min。

4.根据权利要求2所述的音视频评分并存储的方法，其特征在于，所述的采集音视频中的动作特征具体方法是：

将完整的音视频按时间划分为多个动作采集周期；

5.根据权利要求3或4所述的音视频评分并存储的方法，其特征在于，所述的对音视频中的声音特征评分的具体步骤是：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

所述的对音视频中的动作特征评分的具体步骤是：

初始化音视频的动作评分值ScoreM＝0；

计算第m个周期的动作评分值：

6.根据权利要求5所述的音视频评分并存储的方法，其特征在于，所述的结合声音特征评分和动作特征评分对音视频评分的具体方法是：

7.根据权利要求6所述的音视频评分并存储的方法，其特征在于，在采集音视频的声音特征及动作特征之前,还包括初步筛选录制获取一音视频的步骤,

该录制音视频方法包括步骤：

采集至少两个图像帧，并采集声音信息；

8.音视频评分并存储的装置，其特征在于，包括：

声音特征采集模块，被配置为采集音视频中的声音特征，

动作特征采集模块，被配置为采集音视频中的动作特征，

声音特征评分模块，被配置为对音视频中的声音特征评分，

动作特征评分模块，被配置为对音视频中的动作特征评分，

9.根据权利要求8所述的音视频评分并存储的装置，其特征在于，所述的动作特征采集模块包括以一移动侦测区域设置模块：被配置为将音视频中的视频图像帧分割成若干图像块，各若干图像块设为移动侦测区域,并对移动侦测区域编号标记。

10.根据权利要求9所述的音视频评分并存储的装置，其特征在于，所述的声音特征采集模块还用于：将完整的音视频按时间划分为多个声音采集周期；采集每个声音采集周期内的声音特征：获取声音采集周期内的声音特征，所述的声音特征包括声音平均音量声音的最大值V_max以及声音的最小值V_min。

11.根据权利要求9所述的音视频评分并存储的装置，其特征在于，所述的动作特征采集模块还用于：将完整的音视频按时间划分为多个动作采集周期；

12.根据权利要求10或11所述的音视频评分并存储的装置，其特征在于，所述的声音特征评分模块还用于：

初始化音视频的声音评分值ScoreV＝0；

计算第m个周期的平均音量信息V_m，其中并对V_m取整；

获取本周期与上一周期的音量差值的绝对值VD_m；

计算第m个周期的声音评分值：

所述的动作特征评分模块还用于：

初始化音视频的动作评分值ScoreM＝0；

计算第m个周期的动作评分值：

13.根据权利要求12所述的音视频评分并存储的装置，其特征在于，所述的综合评分模块还用于：

14.根据权利要求13所述的音视频评分并存储的装置，其特征在于,还包括初步筛选录制获取一音视频的模块,该音视频录制模块包括：

采集单元，被配置为采集至少两个图像帧，并采集声音信息；

移动侦测设置单元，被配置为设置移动侦测区域：将图像帧分割成若干图像块，各若干图像块设为移动侦测区域；