CN114928713B

CN114928713B - 一种用户远程视频会议的语音分析***

Info

Publication number: CN114928713B
Application number: CN202210838837.8A
Authority: CN
Inventors: 朱正辉
Original assignee: Guangzhou Baolun Electronics Co Ltd
Current assignee: Guangdong Baolun Electronics Co ltd
Priority date: 2022-07-18
Filing date: 2022-07-18
Publication date: 2022-10-21
Anticipated expiration: 2042-07-18
Also published as: CN114928713A

Abstract

本发明涉及语音识别技术领域，尤其涉及一种用户远程视频会议的语音分析***，包括：采集模块，其包括若干会议终端，用以采集各对应参会者的视频信息以及音频信息；记录模块，用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息；分析处理模块，用以分析所述音频信息，获取重要会议信息，并根据重要会议信息对应的时间轴剪辑视频信息和音频信息；输出模块，用以将所述分析处理模块剪辑的视频信息和音频信息输出，并根据音频信息编写会议纪要。利用构建采集模块、记录模块、分析处理模块以及输出模块的方式，将视频会议的重点内容标记并分拣出，获得会议纪要，从而提升视频会议记录的便捷性。

Description

一种用户远程视频会议的语音分析***

技术领域

本发明涉及语音识别技术领域，尤其涉及一种用户远程视频会议的语音分析***。

背景技术

远程会议因其特殊的形式，其时间长度和会议容量与传统会议相比都有大幅度的提升，对其内容的记录和过滤是极为浪费人力的工作，如何快速分拣出视频会议的有效内容，是对会议进行总结的重中之重。中国专利公开号CN114175148A公开了一种“语音分析***”，通过利用多台分析设备互相分析待测语音，从而提高语音识别的精度。中国专利公开号CN112715389A公开了“一种母猪产床用教槽料饲喂槽”，通过检测猪仔发出的声音判断其是否饥饿，并自动喂食。中国专利公开号CN109274922A公开了一种“一种基于语音识别的视频会议控制***”。

由此可见上述***和装置存在以下问题：无法快速识别会议的重点与有效内容，从而辅助参会人员提炼出会议的结论和精神的问题。

发明内容

为此，本发明提供一种用户远程视频会议的语音分析***，用以克服现有技术中无法快速识别会议的重点与有效内容，从而辅助参会人员提炼出会议的结论和精神的问题。

为实现上述目的，本发明提供一种用户远程视频会议的语音分析***，包括：

采集模块，其包括若干会议终端，用以采集各对应参会者的视频信息以及音频信息；

记录模块，用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息；

分析处理模块，用以分析所述音频信息，获取重要会议信息，并根据重要会议信息对应的时间轴剪辑视频信息和音频信息；

输出模块，用以将所述分析处理模块剪辑的视频信息和音频信息输出，并根据音频信息编写会议纪要；

利用采集模块以及记录模块记录会议内容，并利用分析处理模块分析会议中的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词，同时经由输出模块将对应的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词输出的方式，为会议编制会议纪要。

进一步地，所述会议终端包括单个本地视频会议终端和若干远程会议终端，其中，单个本地视频会议终端采集到的视频信息和音频信息对应若干参会者，单个远程视频会议终端对应单个参会者；

所述分析处理模块分析本地视频会议终端的视频信息时，将视频内会场分为若干大小均匀的区域，设定其中的一个区域为***台，其它区域均对应一个座位i，其中，位于座位i上的单个参会者记为第i位参会者，***台对应的区域为0号区域，i=1,2,3，…，n；

当所述***台出现参会者时，所述分析处理模块自出现该参会者时间点起将该参会者标记为主持人，直至该参会者离开***台回到座位i，此时分析处理模块将该时间段记为主持人i的主持时间Ti。

进一步地，当所述***台无参会者时，所述分析处理模块中针对无主持人时间记为

，以确定会议的连续性，设有第一预设时间

和第二预设时间

，其中0＜

＜

，

若

≤

，所述分析处理模块判定该时间段为间歇时间，并将该时间段计入前一主持人i的主持时间内，并将该时间段内产生的视频信息以及音频信息记入前一主持人i的会议内容中；

若

＜

≤

，所述分析处理模块判定该时间段为自由讨论时间，并不对该时间段内产生的视频信息以及音频信息进行记录，同时将主持人i离开***台的时间点作为该主持人i的主持时间Ti的结束时刻；

若

＜

，所述分析处理模块判定该时间段为休息时间，并中止记录会议的视频信息以及音频信息，并将前一主持人i主持会议时产生的视频信息以及音频信息记录。

进一步地，所述分析处理模块中设有第一音量预设值

、第二音量预设值

以及预设记录时间

，其中0＜

＜

；

当所述记录模块记录的本地视频会议音频信息中仅有单个参会者发言时，分析处理模块将该发言内容记为有效发言内容，并进行记录，若该参会者为当前主持人，其发言音量为

，若该参会者为第j个所述远程会议终端的持有者，其发言音量为

，

若

≤

，所述分析处理模块判定该音量下的发言内容为会议无关内容，并不进行任何处理；

若

≤

或

＜

≤

，所述分析处理模块判定该音量下的发言内容为非重点内容，在将其记录为文字信息后不再进行处理；

若

＜

或

＜

所述分析处理模块判定该音量下的内容为重点内容，并设定

＜

的时间节点记为重点时间开始时刻

，

＜

的持续时间记为重点时间，随后出现

＜

的时间节点记为重点时间结束时刻

，分析处理模块将以

-

时间节点开始至

+

时间节点结束的时间记为会议重点内容，并将其转化为文字进行记录，设定该文字内容为所述高音量重点文字内容

。

进一步地，对于第j个所述远程会议终端，其与单个参会者对应，同时将该参会者记为j，其中j=1,2,3，…，m；当第j个所述远程会议终端记录可被识别为文字的音频信息时，所述分析处理模块将该音频信息记为第j个参会者进行发言；

所述分析处理模块在识别到在第i个主持人进行发言时，第j个远程会议终端同时进行发言，分析处理模块将该发言内容记为争议重点内容，并分别标记同时发言的开始时间点

与结束时间点

，分析处理模块将以

时间点开始至

时间点结束的时间记为会议争议内容，并将第i个主持人与第j个参会者的发言内容转化为文字进行记录，设定该文字内容为所述争议重点文字内容

；

若在第i个主持人进行发言时，有数个远程会议终端同时进行发言，所述分析处理模块将该发言内容记为无效内容，并不进行任何处理。

进一步地，所述分析处理模块设有预设记录时间

，当分析处理模块在所述有效发言内容中获取到数字信息后，将该数字信息出现的时间节点记为

，并将处于

至

时间段内的发言内容转化为文字进行记录，设定该文字内容为数字重点文字内容

。

进一步地，所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较，并将出现频次最多的名词记为第i个主持人的发言关键词，设定该关键词为

。

进一步地，所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时，将该主持人标记为公共主持人，并将该主持人的发言信息记为引导信息，同时不记录该主持人的主持时间内的音频信息。

进一步地，所述分析处理模块将所述高音量重点文字内容

、争议重点文字内容

、数字重点文字内容

以及对应的关键词

共同构成第i个主持人主持视频会议时的会议纪要，并按时间顺序发送至所述输出模块。

进一步地，所述输出模块按时间顺序将所述会议纪要按时间顺次排列，并作为该次会议的会议纪要进行输出。

与现有技术相比，本发明的有益效果在于，利用构建采集模块、记录模块、分析处理模块以及输出模块的方式，将视频会议的重点内容标记并分拣出，获得会议纪要，从而提升视频会议记录的便捷性。

进一步地，利用对将视频会议终端分类为本地视频会议终端和远程视频会议终端，并对本地视频会议的会场进行分割编号的方式，在避免了因视频会议过程中发言者同时发言造成记录混乱的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用将本地视频会议的场地进行分割和标记并设立***台的方式，将主持人的编号作为视频会议的一个特征进行记录，在避免了因本地视频会议的场地中有多人同时发言造成记录不清晰的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用设置音量预设值的方式，将高于一定音量的发言记为重要发言，将低于一定音量的发言记为杂音，在避免了因外部干扰造成会议记录不清晰的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用设置争议内容的方式，将会议中非重点部分略去，在避免了因争议内容过于庞杂造成记录不清晰的同时，提升了***的工作效率，从而进一步提升了视频会议记录的便捷性。

进一步地，利用将数字信息设为会议标记点的方式，分拣出视频会议讨论的重点内容，在提升了会议讨论结果的显著性的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用设立关键词的方式，将会议的主旨进行提炼，在提升了视频会议记录主题的显著性的同时，有效引导了视频会议结果撰写方向，从而进一步提升了视频会议记录的便捷性。

进一步地，利用设定公共主持人的方式，将主持人发言中的干扰信息从会议中剔除，在降低了会议记录的重复性的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用将重点内容和关键词结合的方式输出会议纪要，在提升了记录视频会议主要内容的显著性的同时，进一步提升了视频会议记录的便捷性。

进一步地，利用输出模块将会议纪要按时间顺序进行排列，在避免了因时间先后顺序混乱造成会议纪要的因果关系不准确的同时，进一步提升了视频会议记录的便捷性。

附图说明

图1为本发明所述***的结构示意图；

图2为本发明实施例所述本地视频会议终端的场地示意图；

图3为本发明所述***的结构原理图；

图4为本发明所述实施例会议纪要的输出示意图；

图5为本发明所述实施例A会议的会议纪要输出示意图；

图6为本发明所述实施例B会议的会议纪要输出示意图；

其中：1：***台；2：参会者座位；3：参会者座位编号。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1所示，其为本发明所述***的结构示意图，包括：

请参阅图2所示，其为本发明所述本地视频会议终端的场地示意图。

所述会议终端包括单个本地视频会议终端和若干远程会议终端，其中，单个本地视频会议终端采集到的视频信息和音频信息对应若干参会者，单个远程视频会议终端对应单个参会者；

利用对将视频会议终端分类为本地视频会议终端和远程视频会议终端，并对本地视频会议的会场进行分割编号的方式，在避免了因视频会议过程中发言者同时发言造成记录混乱的同时，进一步提升了视频会议记录的便捷性。

请参阅图3所示，其为本发明所述***的结构原理图。

当所述***台无参会者时，所述分析处理模块中针对无主持人时间记为

，以确定会议的连续性，设有第一预设时间

和第二预设时间

，其中0＜

＜

，

若

≤

若

＜

≤

若

＜

利用将本地视频会议的场地进行分割和标记并设立***台的方式，将主持人的编号作为视频会议的一个特征进行记录，在避免了因本地视频会议的场地中有多人同时发言造成记录不清晰的同时，进一步提升了视频会议记录的便捷性。

具体而言，所述分析处理模块中设有第一音量预设值

、第二音量预设值

以及预设记录时间

，其中0＜

＜

；

，

若

≤

若

≤

或

＜

≤

若

＜

或

＜

所述分析处理模块判定该音量下的内容为重点内容，并设定

＜

的时间节点记为重点时间开始时刻

，

＜

的持续时间记为重点时间，随后出现

＜

的时间节点记为重点时间结束时刻

，分析处理模块将以

-

时间节点开始至

+

时间节点结束的时间记为会议重点内容，并将其转化为文字进行记录，设定该文字内容为高音量重点文字内容

。

利用设置音量预设值的方式，将高于一定音量的发言记为重要发言，将低于一定音量的发言记为杂音，在避免了因外部干扰造成会议记录不清晰的同时，进一步提升了视频会议记录的便捷性。

具体而言，对于第j个所述远程会议终端，其与单个参会者对应，同时将该参会者记为j，其中j=1,2,3，…，m；当第j个所述远程会议终端记录可被识别为文字的音频信息时，所述分析处理模块将该音频信息记为第j个参会者进行发言；

与结束时间点

，分析处理模块将以

时间点开始至

时间点结束的时间记为会议争议内容，并将第i个主持人与第j个参会者的发言内容转化为文字进行记录，设定该文字内容为争议重点文字内容

；

利用设置争议内容的方式，将会议中非重点部分略去，在避免了因争议内容过于庞杂造成记录不清晰的同时，提升了***的工作效率，从而进一步提升了视频会议记录的便捷性。

具体而言，所述分析处理模块设有预设记录时间

，并将处于

至

。

利用将数字信息设为会议标记点的方式，分拣出视频会议讨论的重点内容，在提升了会议讨论结果的显著性的同时，进一步提升了视频会议记录的便捷性。

具体而言，所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较，并将出现频次最多的名词记为第i个主持人的发言关键词，设定该关键词为

。

利用设立关键词的方式，将会议的主旨进行提炼，在提升了视频会议记录主题的显著性的同时，有效引导了视频会议结果撰写方向，从而进一步提升了视频会议记录的便捷性。

具体而言，所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时，将该主持人标记为公共主持人，并将该主持人的发言信息记为引导信息，同时不记录该主持人的主持时间内的音频信息。

利用设定公共主持人的方式，将主持人发言中的干扰信息从会议中剔除，在降低了会议记录的重复性的同时，进一步提升了视频会议记录的便捷性。

具体而言，所述分析处理模块将所述高音量重点文字内容

、争议重点文字内容

、数字重点文字内容

以及对应的关键词

请参阅图4所示，其为本发明所述会议纪要的输出示意图。

利用将重点内容和关键词结合的方式输出会议纪要，在提升了记录视频会议主要内容的显著性的同时，进一步提升了视频会议记录的便捷性。

具体而言，所述输出模块按时间顺序将所述会议纪要按时间顺次排列，并作为该次会议的会议纪要进行输出。

利用输出模块将会议纪要按时间顺序进行排列，在避免了因时间先后顺序混乱造成会议纪要的因果关系不准确的同时，进一步提升了视频会议记录的便捷性。

下面结合附图对本***进行说明，在使用本***时，输出的会议纪要能够达到以下效果：

当会议的流程根据发言者的音量和数字提取出的重点文字内容如下表1：

表1 A会议时间顺序及重点文字内容

输出的会议纪要请参阅附图5，其为本发明所述A会议输出的会议纪要示意图。

当会议的流程根据发言者的音量提取出的重点文字内容如下表2：

表2B会议的时间顺序及重点文字内容

输出的会议纪要请参阅附图6，其为本发明实施例所述B会议输出的会议纪要示意图。

在获得上述会议纪要后，参会者可以从其中提炼出主持人发言的重要信息，该会议纪中蕴含的信息可以满足发言者发言的主要精神和对会议主旨的主要意见，该会议纪要可以进行进一步的文字加工，以满足正式的记录和行文要求。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用户远程视频会议的语音分析***，其特征在于，包括：

利用采集模块以及记录模块记录会议内容，并利用分析处理模块分析会议中的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词，同时经由输出模块将对应的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词输出的方式，为会议编制会议纪要；

当所述***台出现参会者时，所述分析处理模块自出现该参会者时间点起将该参会者标记为主持人，直至该参会者离开***台回到座位i，此时分析处理模块将该时间段记为主持人i的主持时间Ti；

，以确定会议的连续性，设有第一预设时间

和第二预设时间

，其中0＜

＜

，

若

≤

若

＜

≤

若

＜

2.根据权利要求1所述的用户远程视频会议的语音分析***，其特征在于，所述分析处理模块中设有第一音量预设值

、第二音量预设值

以及预设记录时间

，其中0＜

＜

；

，

若

≤

若

≤

或

＜

≤

若

＜

或

＜

所述分析处理模块判定该音量下的内容为重点内容，并设定

＜

的时间节点记为重点时间开始时刻

，

＜

的持续时间记为重点时间，随后出现

＜

的时间节点记为重点时间结束时刻

，分析处理模块将以

-

时间节点开始至

+

。

3.根据权利要求2所述的用户远程视频会议的语音分析***，其特征在于，对于第j个所述远程会议终端，其与单个参会者对应，同时将该参会者记为j，其中j=1,2,3，…，m；当第j个所述远程会议终端记录可被识别为文字的音频信息时，所述分析处理模块将该音频信息记为第j个参会者进行发言；

与结束时间点

，分析处理模块将以

时间点开始至

；

4.根据权利要求3所述的用户远程视频会议的语音分析***，其特征在于，所述分析处理模块设有预设记录时间

，并将处于

至

时间段内的发言内容转化为文字进行记录，设定该文字内容为所述数字重点文字内容

。

5.根据权利要求4所述的用户远程视频会议的语音分析***，其特征在于，所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较，并将出现频次最多的名词记为第i个主持人的发言关键词，设定该关键词为

。

6.根据权利要求5所述的用户远程视频会议的语音分析***，其特征在于，所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时，将该主持人标记为公共主持人，并将该主持人的发言信息记为引导信息，同时不记录该主持人的主持时间内的音频信息。

7.根据权利要求6所述的用户远程视频会议的语音分析***，其特征在于，所述分析处理模块将所述高音量重点文字内容

、争议重点文字内容

、数字重点文字内容

以及对应的关键词

8.根据权利要求7所述的用户远程视频会议的语音分析***，其特征在于，所述输出模块按时间顺序将所述会议纪要按时间顺次排列，并作为该次会议的会议纪要进行输出。