CN114928713B - 一种用户远程视频会议的语音分析*** - Google Patents

一种用户远程视频会议的语音分析*** Download PDF

Info

Publication number
CN114928713B
CN114928713B CN202210838837.8A CN202210838837A CN114928713B CN 114928713 B CN114928713 B CN 114928713B CN 202210838837 A CN202210838837 A CN 202210838837A CN 114928713 B CN114928713 B CN 114928713B
Authority
CN
China
Prior art keywords
conference
time
content
processing module
analysis processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210838837.8A
Other languages
English (en)
Other versions
CN114928713A (zh
Inventor
朱正辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Baolun Electronics Co ltd
Original Assignee
Guangzhou Baolun Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baolun Electronics Co Ltd filed Critical Guangzhou Baolun Electronics Co Ltd
Priority to CN202210838837.8A priority Critical patent/CN114928713B/zh
Publication of CN114928713A publication Critical patent/CN114928713A/zh
Application granted granted Critical
Publication of CN114928713B publication Critical patent/CN114928713B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及语音识别技术领域,尤其涉及一种用户远程视频会议的语音分析***,包括:采集模块,其包括若干会议终端,用以采集各对应参会者的视频信息以及音频信息;记录模块,用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息;分析处理模块,用以分析所述音频信息,获取重要会议信息,并根据重要会议信息对应的时间轴剪辑视频信息和音频信息;输出模块,用以将所述分析处理模块剪辑的视频信息和音频信息输出,并根据音频信息编写会议纪要。利用构建采集模块、记录模块、分析处理模块以及输出模块的方式,将视频会议的重点内容标记并分拣出,获得会议纪要,从而提升视频会议记录的便捷性。

Description

一种用户远程视频会议的语音分析***
技术领域
本发明涉及语音识别技术领域,尤其涉及一种用户远程视频会议的语音分析***。
背景技术
远程会议因其特殊的形式,其时间长度和会议容量与传统会议相比都有大幅度的提升,对其内容的记录和过滤是极为浪费人力的工作,如何快速分拣出视频会议的有效内容,是对会议进行总结的重中之重。中国专利公开号CN114175148A公开了一种“语音分析***”,通过利用多台分析设备互相分析待测语音,从而提高语音识别的精度。中国专利公开号CN112715389A公开了“一种母猪产床用教槽料饲喂槽”,通过检测猪仔发出的声音判断其是否饥饿,并自动喂食。中国专利公开号CN109274922A公开了一种“一种基于语音识别的视频会议控制***”。
由此可见上述***和装置存在以下问题:无法快速识别会议的重点与有效内容,从而辅助参会人员提炼出会议的结论和精神的问题。
发明内容
为此,本发明提供一种用户远程视频会议的语音分析***,用以克服现有技术中无法快速识别会议的重点与有效内容,从而辅助参会人员提炼出会议的结论和精神的问题。
为实现上述目的,本发明提供一种用户远程视频会议的语音分析***,包括:
采集模块,其包括若干会议终端,用以采集各对应参会者的视频信息以及音频信息;
记录模块,用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息;
分析处理模块,用以分析所述音频信息,获取重要会议信息,并根据重要会议信息对应的时间轴剪辑视频信息和音频信息;
输出模块,用以将所述分析处理模块剪辑的视频信息和音频信息输出,并根据音频信息编写会议纪要;
利用采集模块以及记录模块记录会议内容,并利用分析处理模块分析会议中的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词,同时经由输出模块将对应的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词输出的方式,为会议编制会议纪要。
进一步地,所述会议终端包括单个本地视频会议终端和若干远程会议终端,其中,单个本地视频会议终端采集到的视频信息和音频信息对应若干参会者,单个远程视频会议终端对应单个参会者;
所述分析处理模块分析本地视频会议终端的视频信息时,将视频内会场分为若干大小均匀的区域,设定其中的一个区域为***台,其它区域均对应一个座位i,其中,位于座位i上的单个参会者记为第i位参会者,***台对应的区域为0号区域,i=1,2,3,…,n;
当所述***台出现参会者时,所述分析处理模块自出现该参会者时间点起将该参会者标记为主持人,直至该参会者离开***台回到座位i,此时分析处理模块将该时间段记为主持人i的主持时间Ti。
进一步地,当所述***台无参会者时,所述分析处理模块中针对无主持人时间记为
Figure 47285DEST_PATH_IMAGE001
,以确定会议的连续性,设有第一预设时间
Figure 622623DEST_PATH_IMAGE002
和第二预设时间
Figure 693347DEST_PATH_IMAGE003
,其中0<
Figure 12333DEST_PATH_IMAGE004
Figure 117692DEST_PATH_IMAGE005
Figure 614663DEST_PATH_IMAGE006
Figure 438263DEST_PATH_IMAGE002
,所述分析处理模块判定该时间段为间歇时间,并将该时间段计入前一主持人i的主持时间内,并将该时间段内产生的视频信息以及音频信息记入前一主持人i的会议内容中;
Figure 560940DEST_PATH_IMAGE007
Figure 786385DEST_PATH_IMAGE008
Figure 703525DEST_PATH_IMAGE009
,所述分析处理模块判定该时间段为自由讨论时间,并不对该时间段内产生的视频信息以及音频信息进行记录,同时将主持人i离开***台的时间点作为该主持人i的主持时间Ti的结束时刻;
Figure 748842DEST_PATH_IMAGE010
Figure 409630DEST_PATH_IMAGE001
,所述分析处理模块判定该时间段为休息时间,并中止记录会议的视频信息以及音频信息,并将前一主持人i主持会议时产生的视频信息以及音频信息记录。
进一步地,所述分析处理模块中设有第一音量预设值
Figure 224002DEST_PATH_IMAGE011
、第二音量预设值
Figure 561312DEST_PATH_IMAGE012
以及预设记录时间
Figure 93924DEST_PATH_IMAGE013
,其中0<
Figure 558403DEST_PATH_IMAGE014
Figure 492861DEST_PATH_IMAGE015
当所述记录模块记录的本地视频会议音频信息中仅有单个参会者发言时,分析处理模块将该发言内容记为有效发言内容,并进行记录,若该参会者为当前主持人,其发言音量为
Figure 751804DEST_PATH_IMAGE016
,若该参会者为第j个所述远程会议终端的持有者,其发言音量为
Figure 771713DEST_PATH_IMAGE017
Figure 39883DEST_PATH_IMAGE018
Figure 828848DEST_PATH_IMAGE019
,所述分析处理模块判定该音量下的发言内容为会议无关内容,并不进行任何处理;
Figure 9425DEST_PATH_IMAGE020
Figure 516629DEST_PATH_IMAGE021
Figure 57332DEST_PATH_IMAGE014
Figure 700803DEST_PATH_IMAGE017
Figure 567128DEST_PATH_IMAGE022
,所述分析处理模块判定该音量下的发言内容为非重点内容,在将其记录为文字信息后不再进行处理;
Figure 296049DEST_PATH_IMAGE022
Figure 906022DEST_PATH_IMAGE023
Figure 138421DEST_PATH_IMAGE015
Figure 175647DEST_PATH_IMAGE024
所述分析处理模块判定该音量下的内容为重点内容,并设定
Figure 391864DEST_PATH_IMAGE025
Figure 789217DEST_PATH_IMAGE026
的时间节点记为重点时间开始时刻
Figure 407280DEST_PATH_IMAGE027
Figure 615407DEST_PATH_IMAGE021
Figure 318921DEST_PATH_IMAGE028
的持续时间记为重点时间,随后出现
Figure 270696DEST_PATH_IMAGE029
Figure 743266DEST_PATH_IMAGE030
的时间节点记为重点时间结束时刻
Figure 122295DEST_PATH_IMAGE031
,分析处理模块将以
Figure 313105DEST_PATH_IMAGE032
-
Figure 553724DEST_PATH_IMAGE033
时间节点开始至
Figure 146380DEST_PATH_IMAGE034
+
Figure 165151DEST_PATH_IMAGE035
时间节点结束的时间记为会议重点内容,并将其转化为文字进行记录,设定该文字内容为所述高音量重点文字内容
Figure 843257DEST_PATH_IMAGE036
进一步地,对于第j个所述远程会议终端,其与单个参会者对应,同时将该参会者记为j,其中j=1,2,3,…,m;当第j个所述远程会议终端记录可被识别为文字的音频信息时,所述分析处理模块将该音频信息记为第j个参会者进行发言;
所述分析处理模块在识别到在第i个主持人进行发言时,第j个远程会议终端同时进行发言,分析处理模块将该发言内容记为争议重点内容,并分别标记同时发言的开始时间点
Figure 136835DEST_PATH_IMAGE037
与结束时间点
Figure 583997DEST_PATH_IMAGE038
,分析处理模块将以
Figure 304829DEST_PATH_IMAGE039
时间点开始至
Figure 204651DEST_PATH_IMAGE040
时间点结束的时间记为会议争议内容,并将第i个主持人与第j个参会者的发言内容转化为文字进行记录,设定该文字内容为所述争议重点文字内容
Figure 36341DEST_PATH_IMAGE041
若在第i个主持人进行发言时,有数个远程会议终端同时进行发言,所述分析处理模块将该发言内容记为无效内容,并不进行任何处理。
进一步地,所述分析处理模块设有预设记录时间
Figure 338010DEST_PATH_IMAGE042
,当分析处理模块在所述有效发言内容中获取到数字信息后,将该数字信息出现的时间节点记为
Figure 479010DEST_PATH_IMAGE043
,并将处于
Figure 866129DEST_PATH_IMAGE044
Figure 501509DEST_PATH_IMAGE045
时间段内的发言内容转化为文字进行记录,设定该文字内容为数字重点文字内容
Figure 923263DEST_PATH_IMAGE046
进一步地,所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较,并将出现频次最多的名词记为第i个主持人的发言关键词,设定该关键词为
Figure 720318DEST_PATH_IMAGE047
进一步地,所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时,将该主持人标记为公共主持人,并将该主持人的发言信息记为引导信息,同时不记录该主持人的主持时间内的音频信息。
进一步地,所述分析处理模块将所述高音量重点文字内容
Figure 594733DEST_PATH_IMAGE048
、争议重点文字内容
Figure 768226DEST_PATH_IMAGE049
、数字重点文字内容
Figure 44486DEST_PATH_IMAGE050
以及对应的关键词
Figure 294333DEST_PATH_IMAGE051
共同构成第i个主持人主持视频会议时的会议纪要,并按时间顺序发送至所述输出模块。
进一步地,所述输出模块按时间顺序将所述会议纪要按时间顺次排列,并作为该次会议的会议纪要进行输出。
与现有技术相比,本发明的有益效果在于,利用构建采集模块、记录模块、分析处理模块以及输出模块的方式,将视频会议的重点内容标记并分拣出,获得会议纪要,从而提升视频会议记录的便捷性。
进一步地,利用对将视频会议终端分类为本地视频会议终端和远程视频会议终端,并对本地视频会议的会场进行分割编号的方式,在避免了因视频会议过程中发言者同时发言造成记录混乱的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用将本地视频会议的场地进行分割和标记并设立***台的方式,将主持人的编号作为视频会议的一个特征进行记录,在避免了因本地视频会议的场地中有多人同时发言造成记录不清晰的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用设置音量预设值的方式,将高于一定音量的发言记为重要发言,将低于一定音量的发言记为杂音,在避免了因外部干扰造成会议记录不清晰的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用设置争议内容的方式,将会议中非重点部分略去,在避免了因争议内容过于庞杂造成记录不清晰的同时,提升了***的工作效率,从而进一步提升了视频会议记录的便捷性。
进一步地,利用将数字信息设为会议标记点的方式,分拣出视频会议讨论的重点内容,在提升了会议讨论结果的显著性的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用设立关键词的方式,将会议的主旨进行提炼,在提升了视频会议记录主题的显著性的同时,有效引导了视频会议结果撰写方向,从而进一步提升了视频会议记录的便捷性。
进一步地,利用设定公共主持人的方式,将主持人发言中的干扰信息从会议中剔除,在降低了会议记录的重复性的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用将重点内容和关键词结合的方式输出会议纪要,在提升了记录视频会议主要内容的显著性的同时,进一步提升了视频会议记录的便捷性。
进一步地,利用输出模块将会议纪要按时间顺序进行排列,在避免了因时间先后顺序混乱造成会议纪要的因果关系不准确的同时,进一步提升了视频会议记录的便捷性。
附图说明
图1为本发明所述***的结构示意图;
图2为本发明实施例所述本地视频会议终端的场地示意图;
图3为本发明所述***的结构原理图;
图4为本发明所述实施例会议纪要的输出示意图;
图5为本发明所述实施例A会议的会议纪要输出示意图;
图6为本发明所述实施例B会议的会议纪要输出示意图;
其中:1:***台;2:参会者座位;3:参会者座位编号。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明所述***的结构示意图,包括:
采集模块,其包括若干会议终端,用以采集各对应参会者的视频信息以及音频信息;
记录模块,用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息;
分析处理模块,用以分析所述音频信息,获取重要会议信息,并根据重要会议信息对应的时间轴剪辑视频信息和音频信息;
输出模块,用以将所述分析处理模块剪辑的视频信息和音频信息输出,并根据音频信息编写会议纪要;
利用采集模块以及记录模块记录会议内容,并利用分析处理模块分析会议中的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词,同时经由输出模块将对应的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词输出的方式,为会议编制会议纪要。
与现有技术相比,本发明的有益效果在于,利用构建采集模块、记录模块、分析处理模块以及输出模块的方式,将视频会议的重点内容标记并分拣出,获得会议纪要,从而提升视频会议记录的便捷性。
请参阅图2所示,其为本发明所述本地视频会议终端的场地示意图。
所述会议终端包括单个本地视频会议终端和若干远程会议终端,其中,单个本地视频会议终端采集到的视频信息和音频信息对应若干参会者,单个远程视频会议终端对应单个参会者;
所述分析处理模块分析本地视频会议终端的视频信息时,将视频内会场分为若干大小均匀的区域,设定其中的一个区域为***台,其它区域均对应一个座位i,其中,位于座位i上的单个参会者记为第i位参会者,***台对应的区域为0号区域,i=1,2,3,…,n;
当所述***台出现参会者时,所述分析处理模块自出现该参会者时间点起将该参会者标记为主持人,直至该参会者离开***台回到座位i,此时分析处理模块将该时间段记为主持人i的主持时间Ti。
利用对将视频会议终端分类为本地视频会议终端和远程视频会议终端,并对本地视频会议的会场进行分割编号的方式,在避免了因视频会议过程中发言者同时发言造成记录混乱的同时,进一步提升了视频会议记录的便捷性。
请参阅图3所示,其为本发明所述***的结构原理图。
当所述***台无参会者时,所述分析处理模块中针对无主持人时间记为
Figure 390465DEST_PATH_IMAGE052
,以确定会议的连续性,设有第一预设时间
Figure 367648DEST_PATH_IMAGE053
和第二预设时间
Figure 498415DEST_PATH_IMAGE010
,其中0<
Figure 902852DEST_PATH_IMAGE053
Figure 751859DEST_PATH_IMAGE010
Figure 267154DEST_PATH_IMAGE054
Figure 252428DEST_PATH_IMAGE055
,所述分析处理模块判定该时间段为间歇时间,并将该时间段计入前一主持人i的主持时间内,并将该时间段内产生的视频信息以及音频信息记入前一主持人i的会议内容中;
Figure 827766DEST_PATH_IMAGE056
Figure 164069DEST_PATH_IMAGE006
Figure 738182DEST_PATH_IMAGE057
,所述分析处理模块判定该时间段为自由讨论时间,并不对该时间段内产生的视频信息以及音频信息进行记录,同时将主持人i离开***台的时间点作为该主持人i的主持时间Ti的结束时刻;
Figure 843541DEST_PATH_IMAGE009
Figure 589780DEST_PATH_IMAGE006
,所述分析处理模块判定该时间段为休息时间,并中止记录会议的视频信息以及音频信息,并将前一主持人i主持会议时产生的视频信息以及音频信息记录。
利用将本地视频会议的场地进行分割和标记并设立***台的方式,将主持人的编号作为视频会议的一个特征进行记录,在避免了因本地视频会议的场地中有多人同时发言造成记录不清晰的同时,进一步提升了视频会议记录的便捷性。
具体而言,所述分析处理模块中设有第一音量预设值
Figure 413380DEST_PATH_IMAGE011
、第二音量预设值
Figure 270477DEST_PATH_IMAGE012
以及预设记录时间
Figure 964764DEST_PATH_IMAGE058
,其中0<
Figure 147483DEST_PATH_IMAGE059
Figure 192800DEST_PATH_IMAGE060
当所述记录模块记录的本地视频会议音频信息中仅有单个参会者发言时,分析处理模块将该发言内容记为有效发言内容,并进行记录,若该参会者为当前主持人,其发言音量为
Figure 853588DEST_PATH_IMAGE028
,若该参会者为第j个所述远程会议终端的持有者,其发言音量为
Figure 684272DEST_PATH_IMAGE061
Figure 506735DEST_PATH_IMAGE062
Figure 39347DEST_PATH_IMAGE011
,所述分析处理模块判定该音量下的发言内容为会议无关内容,并不进行任何处理;
Figure 503827DEST_PATH_IMAGE063
Figure 703864DEST_PATH_IMAGE015
Figure 962807DEST_PATH_IMAGE014
Figure 982715DEST_PATH_IMAGE064
Figure 985307DEST_PATH_IMAGE060
,所述分析处理模块判定该音量下的发言内容为非重点内容,在将其记录为文字信息后不再进行处理;
Figure 23539DEST_PATH_IMAGE022
Figure 718962DEST_PATH_IMAGE029
Figure 226167DEST_PATH_IMAGE022
Figure 766870DEST_PATH_IMAGE062
所述分析处理模块判定该音量下的内容为重点内容,并设定
Figure 675920DEST_PATH_IMAGE015
Figure 276665DEST_PATH_IMAGE065
的时间节点记为重点时间开始时刻
Figure 271166DEST_PATH_IMAGE066
Figure 615560DEST_PATH_IMAGE030
Figure 129849DEST_PATH_IMAGE067
的持续时间记为重点时间,随后出现
Figure 167075DEST_PATH_IMAGE067
Figure 383293DEST_PATH_IMAGE022
的时间节点记为重点时间结束时刻
Figure 265798DEST_PATH_IMAGE068
,分析处理模块将以
Figure 883861DEST_PATH_IMAGE069
-
Figure 91989DEST_PATH_IMAGE070
时间节点开始至
Figure 795502DEST_PATH_IMAGE068
+
Figure 481699DEST_PATH_IMAGE071
时间节点结束的时间记为会议重点内容,并将其转化为文字进行记录,设定该文字内容为高音量重点文字内容
Figure 219848DEST_PATH_IMAGE072
利用设置音量预设值的方式,将高于一定音量的发言记为重要发言,将低于一定音量的发言记为杂音,在避免了因外部干扰造成会议记录不清晰的同时,进一步提升了视频会议记录的便捷性。
具体而言,对于第j个所述远程会议终端,其与单个参会者对应,同时将该参会者记为j,其中j=1,2,3,…,m;当第j个所述远程会议终端记录可被识别为文字的音频信息时,所述分析处理模块将该音频信息记为第j个参会者进行发言;
所述分析处理模块在识别到在第i个主持人进行发言时,第j个远程会议终端同时进行发言,分析处理模块将该发言内容记为争议重点内容,并分别标记同时发言的开始时间点
Figure 333297DEST_PATH_IMAGE037
与结束时间点
Figure 38954DEST_PATH_IMAGE073
,分析处理模块将以
Figure 263262DEST_PATH_IMAGE074
时间点开始至
Figure 590338DEST_PATH_IMAGE040
时间点结束的时间记为会议争议内容,并将第i个主持人与第j个参会者的发言内容转化为文字进行记录,设定该文字内容为争议重点文字内容
Figure 140268DEST_PATH_IMAGE075
若在第i个主持人进行发言时,有数个远程会议终端同时进行发言,所述分析处理模块将该发言内容记为无效内容,并不进行任何处理。
利用设置争议内容的方式,将会议中非重点部分略去,在避免了因争议内容过于庞杂造成记录不清晰的同时,提升了***的工作效率,从而进一步提升了视频会议记录的便捷性。
具体而言,所述分析处理模块设有预设记录时间
Figure 818374DEST_PATH_IMAGE076
,当分析处理模块在所述有效发言内容中获取到数字信息后,将该数字信息出现的时间节点记为
Figure 111952DEST_PATH_IMAGE077
,并将处于
Figure 559114DEST_PATH_IMAGE044
Figure 14366DEST_PATH_IMAGE078
时间段内的发言内容转化为文字进行记录,设定该文字内容为数字重点文字内容
Figure 930501DEST_PATH_IMAGE079
利用将数字信息设为会议标记点的方式,分拣出视频会议讨论的重点内容,在提升了会议讨论结果的显著性的同时,进一步提升了视频会议记录的便捷性。
具体而言,所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较,并将出现频次最多的名词记为第i个主持人的发言关键词,设定该关键词为
Figure 496611DEST_PATH_IMAGE080
利用设立关键词的方式,将会议的主旨进行提炼,在提升了视频会议记录主题的显著性的同时,有效引导了视频会议结果撰写方向,从而进一步提升了视频会议记录的便捷性。
具体而言,所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时,将该主持人标记为公共主持人,并将该主持人的发言信息记为引导信息,同时不记录该主持人的主持时间内的音频信息。
利用设定公共主持人的方式,将主持人发言中的干扰信息从会议中剔除,在降低了会议记录的重复性的同时,进一步提升了视频会议记录的便捷性。
具体而言,所述分析处理模块将所述高音量重点文字内容
Figure 63859DEST_PATH_IMAGE081
、争议重点文字内容
Figure 690012DEST_PATH_IMAGE082
、数字重点文字内容
Figure 342710DEST_PATH_IMAGE083
以及对应的关键词
Figure 978091DEST_PATH_IMAGE084
共同构成第i个主持人主持视频会议时的会议纪要,并按时间顺序发送至所述输出模块。
请参阅图4所示,其为本发明所述会议纪要的输出示意图。
利用将重点内容和关键词结合的方式输出会议纪要,在提升了记录视频会议主要内容的显著性的同时,进一步提升了视频会议记录的便捷性。
具体而言,所述输出模块按时间顺序将所述会议纪要按时间顺次排列,并作为该次会议的会议纪要进行输出。
利用输出模块将会议纪要按时间顺序进行排列,在避免了因时间先后顺序混乱造成会议纪要的因果关系不准确的同时,进一步提升了视频会议记录的便捷性。
下面结合附图对本***进行说明,在使用本***时,输出的会议纪要能够达到以下效果:
当会议的流程根据发言者的音量和数字提取出的重点文字内容如下表1:
表1 A会议时间顺序及重点文字内容
Figure 134266DEST_PATH_IMAGE085
输出的会议纪要请参阅附图5,其为本发明所述A会议输出的会议纪要示意图。
当会议的流程根据发言者的音量提取出的重点文字内容如下表2:
表2B会议的时间顺序及重点文字内容
Figure 196900DEST_PATH_IMAGE086
输出的会议纪要请参阅附图6,其为本发明实施例所述B会议输出的会议纪要示意图。
在获得上述会议纪要后,参会者可以从其中提炼出主持人发言的重要信息,该会议纪中蕴含的信息可以满足发言者发言的主要精神和对会议主旨的主要意见,该会议纪要可以进行进一步的文字加工,以满足正式的记录和行文要求。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种用户远程视频会议的语音分析***,其特征在于,包括:
采集模块,其包括若干会议终端,用以采集各对应参会者的视频信息以及音频信息;
记录模块,用以记录并存储所述采集模块采集到的视频会议的视频信息和音频信息;
分析处理模块,用以分析所述音频信息,获取重要会议信息,并根据重要会议信息对应的时间轴剪辑视频信息和音频信息;
输出模块,用以将所述分析处理模块剪辑的视频信息和音频信息输出,并根据音频信息编写会议纪要;
利用采集模块以及记录模块记录会议内容,并利用分析处理模块分析会议中的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词,同时经由输出模块将对应的高音量重点文字内容、争议重点文字内容、数字重点文字内容以及关键词输出的方式,为会议编制会议纪要;
所述会议终端包括单个本地视频会议终端和若干远程会议终端,其中,单个本地视频会议终端采集到的视频信息和音频信息对应若干参会者,单个远程视频会议终端对应单个参会者;
所述分析处理模块分析本地视频会议终端的视频信息时,将视频内会场分为若干大小均匀的区域,设定其中的一个区域为***台,其它区域均对应一个座位i,其中,位于座位i上的单个参会者记为第i位参会者,***台对应的区域为0号区域,i=1,2,3,…,n;
当所述***台出现参会者时,所述分析处理模块自出现该参会者时间点起将该参会者标记为主持人,直至该参会者离开***台回到座位i,此时分析处理模块将该时间段记为主持人i的主持时间Ti;
当所述***台无参会者时,所述分析处理模块中针对无主持人时间记为
Figure 988201DEST_PATH_IMAGE001
,以确定会议的连续性,设有第一预设时间
Figure 110878DEST_PATH_IMAGE002
和第二预设时间
Figure 70744DEST_PATH_IMAGE003
,其中0<
Figure 722305DEST_PATH_IMAGE004
Figure 33201DEST_PATH_IMAGE005
Figure 693989DEST_PATH_IMAGE006
Figure 508361DEST_PATH_IMAGE007
,所述分析处理模块判定该时间段为间歇时间,并将该时间段计入前一主持人i的主持时间内,并将该时间段内产生的视频信息以及音频信息记入前一主持人i的会议内容中;
Figure 861982DEST_PATH_IMAGE002
Figure 145327DEST_PATH_IMAGE008
Figure 78648DEST_PATH_IMAGE009
,所述分析处理模块判定该时间段为自由讨论时间,并不对该时间段内产生的视频信息以及音频信息进行记录,同时将主持人i离开***台的时间点作为该主持人i的主持时间Ti的结束时刻;
Figure 13106DEST_PATH_IMAGE010
Figure 537628DEST_PATH_IMAGE011
,所述分析处理模块判定该时间段为休息时间,并中止记录会议的视频信息以及音频信息,并将前一主持人i主持会议时产生的视频信息以及音频信息记录。
2.根据权利要求1所述的用户远程视频会议的语音分析***,其特征在于,所述分析处理模块中设有第一音量预设值
Figure 291958DEST_PATH_IMAGE012
、第二音量预设值
Figure 560128DEST_PATH_IMAGE013
以及预设记录时间
Figure 614672DEST_PATH_IMAGE014
,其中0<
Figure 778937DEST_PATH_IMAGE015
Figure 286141DEST_PATH_IMAGE016
当所述记录模块记录的本地视频会议音频信息中仅有单个参会者发言时,分析处理模块将该发言内容记为有效发言内容,并进行记录,若该参会者为当前主持人,其发言音量为
Figure 341691DEST_PATH_IMAGE017
,若该参会者为第j个所述远程会议终端的持有者,其发言音量为
Figure 985162DEST_PATH_IMAGE018
Figure 585908DEST_PATH_IMAGE018
Figure 314829DEST_PATH_IMAGE015
,所述分析处理模块判定该音量下的发言内容为会议无关内容,并不进行任何处理;
Figure 924802DEST_PATH_IMAGE019
Figure 688359DEST_PATH_IMAGE020
Figure 460006DEST_PATH_IMAGE021
Figure 941803DEST_PATH_IMAGE022
Figure 89887DEST_PATH_IMAGE023
,所述分析处理模块判定该音量下的发言内容为非重点内容,在将其记录为文字信息后不再进行处理;
Figure 458683DEST_PATH_IMAGE013
Figure 135652DEST_PATH_IMAGE024
Figure 839166DEST_PATH_IMAGE013
Figure 790941DEST_PATH_IMAGE025
所述分析处理模块判定该音量下的内容为重点内容,并设定
Figure 263511DEST_PATH_IMAGE026
Figure 642539DEST_PATH_IMAGE027
的时间节点记为重点时间开始时刻
Figure 833349DEST_PATH_IMAGE028
Figure 57657DEST_PATH_IMAGE029
Figure 650313DEST_PATH_IMAGE027
的持续时间记为重点时间,随后出现
Figure 200243DEST_PATH_IMAGE030
Figure 856178DEST_PATH_IMAGE026
的时间节点记为重点时间结束时刻
Figure 149756DEST_PATH_IMAGE031
,分析处理模块将以
Figure 596918DEST_PATH_IMAGE032
-
Figure 317749DEST_PATH_IMAGE014
时间节点开始至
Figure 483151DEST_PATH_IMAGE033
+
Figure 49262DEST_PATH_IMAGE034
时间节点结束的时间记为会议重点内容,并将其转化为文字进行记录,设定该文字内容为所述高音量重点文字内容
Figure 350930DEST_PATH_IMAGE035
3.根据权利要求2所述的用户远程视频会议的语音分析***,其特征在于,对于第j个所述远程会议终端,其与单个参会者对应,同时将该参会者记为j,其中j=1,2,3,…,m;当第j个所述远程会议终端记录可被识别为文字的音频信息时,所述分析处理模块将该音频信息记为第j个参会者进行发言;
所述分析处理模块在识别到在第i个主持人进行发言时,第j个远程会议终端同时进行发言,分析处理模块将该发言内容记为争议重点内容,并分别标记同时发言的开始时间点
Figure 242663DEST_PATH_IMAGE036
与结束时间点
Figure 629782DEST_PATH_IMAGE037
,分析处理模块将以
Figure 15895DEST_PATH_IMAGE038
时间点开始至
Figure 437649DEST_PATH_IMAGE039
时间点结束的时间记为会议争议内容,并将第i个主持人与第j个参会者的发言内容转化为文字进行记录,设定该文字内容为所述争议重点文字内容
Figure 500283DEST_PATH_IMAGE040
若在第i个主持人进行发言时,有数个远程会议终端同时进行发言,所述分析处理模块将该发言内容记为无效内容,并不进行任何处理。
4.根据权利要求3所述的用户远程视频会议的语音分析***,其特征在于,所述分析处理模块设有预设记录时间
Figure 109119DEST_PATH_IMAGE041
,当分析处理模块在所述有效发言内容中获取到数字信息后,将该数字信息出现的时间节点记为
Figure 282611DEST_PATH_IMAGE042
,并将处于
Figure 558871DEST_PATH_IMAGE043
Figure 792407DEST_PATH_IMAGE044
时间段内的发言内容转化为文字进行记录,设定该文字内容为所述数字重点文字内容
Figure 154118DEST_PATH_IMAGE045
5.根据权利要求4所述的用户远程视频会议的语音分析***,其特征在于,所述分析处理模块在所述第i个主持人主持视频会议时的有效发言内容中将各名词出现的频次进行比较,并将出现频次最多的名词记为第i个主持人的发言关键词,设定该关键词为
Figure 131301DEST_PATH_IMAGE046
6.根据权利要求5所述的用户远程视频会议的语音分析***,其特征在于,所述分析处理模块在检测到第i个主持人在全部会议中出现次数高于3次时,将该主持人标记为公共主持人,并将该主持人的发言信息记为引导信息,同时不记录该主持人的主持时间内的音频信息。
7.根据权利要求6所述的用户远程视频会议的语音分析***,其特征在于,所述分析处理模块将所述高音量重点文字内容
Figure 776915DEST_PATH_IMAGE047
、争议重点文字内容
Figure 915772DEST_PATH_IMAGE048
、数字重点文字内容
Figure 499200DEST_PATH_IMAGE049
以及对应的关键词
Figure 280075DEST_PATH_IMAGE050
共同构成第i个主持人主持视频会议时的会议纪要,并按时间顺序发送至所述输出模块。
8.根据权利要求7所述的用户远程视频会议的语音分析***,其特征在于,所述输出模块按时间顺序将所述会议纪要按时间顺次排列,并作为该次会议的会议纪要进行输出。
CN202210838837.8A 2022-07-18 2022-07-18 一种用户远程视频会议的语音分析*** Active CN114928713B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210838837.8A CN114928713B (zh) 2022-07-18 2022-07-18 一种用户远程视频会议的语音分析***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210838837.8A CN114928713B (zh) 2022-07-18 2022-07-18 一种用户远程视频会议的语音分析***

Publications (2)

Publication Number Publication Date
CN114928713A CN114928713A (zh) 2022-08-19
CN114928713B true CN114928713B (zh) 2022-10-21

Family

ID=82816238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210838837.8A Active CN114928713B (zh) 2022-07-18 2022-07-18 一种用户远程视频会议的语音分析***

Country Status (1)

Country Link
CN (1) CN114928713B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341015A (ja) * 2004-05-25 2005-12-08 Hitachi Hybrid Network Co Ltd 議事録作成支援機能を有するテレビ会議システム
US9356977B2 (en) * 2013-08-30 2016-05-31 Citrix Systems, Inc. Acquiring online meeting data relating to an online meeting
TWI616868B (zh) * 2014-12-30 2018-03-01 鴻海精密工業股份有限公司 會議記錄裝置及其自動生成會議記錄的方法
JP7046546B2 (ja) * 2017-09-28 2022-04-04 株式会社野村総合研究所 会議支援システムおよび会議支援プログラム
CN110365933A (zh) * 2019-05-21 2019-10-22 武汉兴图新科电子股份有限公司 一种基于ai的视频会议会议纪要在线生成装置及方法
JP6795668B1 (ja) * 2019-10-24 2020-12-02 日本金銭機械株式会社 議事録作成システム
CN112468761A (zh) * 2020-10-31 2021-03-09 浙江云优家智能科技有限公司 一种智能会议记录***
CN114422745A (zh) * 2022-01-24 2022-04-29 游密科技(深圳)有限公司 音视频会议的会议纪要快速整理方法、装置和计算机设备

Also Published As

Publication number Publication date
CN114928713A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
CN108346034B (zh) 一种会议智能管理方法及***
JP4466564B2 (ja) 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
CN106782545B (zh) 一种将音视频数据转化成文字记录的***和方法
CN106657865B (zh) 会议纪要的生成方法、装置及视频会议***
WO2020232865A1 (zh) 会议分角色语音合成方法、装置、计算机设备和存储介质
TWI616868B (zh) 會議記錄裝置及其自動生成會議記錄的方法
CN1841498B (zh) 使用口头话语验证语音输入的方法
DE60207742T2 (de) Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes
JP4558308B2 (ja) 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
JP4085924B2 (ja) 音声処理装置
TWI590240B (zh) 會議記錄裝置及其自動生成會議記錄的方法
TWI619115B (zh) 會議記錄裝置及其自動生成會議記錄的方法
CN107689225A (zh) 一种自动生成会议记录的方法
CN111415128B (zh) 控制会议的方法、***、装置、设备和介质
CN111883168A (zh) 一种语音处理方法及装置
CN110460798B (zh) 视频访谈服务处理方法、装置、终端与存储介质
EP2763136A1 (en) Method and system for obtaining relevant information from a voice communication
CN114928713B (zh) 一种用户远程视频会议的语音分析***
Lebourdais et al. Overlaps and gender analysis in the context of broadcast media
CN106911832B (zh) 一种语音记录的方法及装置
CN114762039A (zh) 一种会议数据处理方法及相关设备
CN111835529A (zh) 一种语音处理方法及装置
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN109635151A (zh) 建立音频检索索引的方法、装置及计算机设备
TWM608957U (zh) 一種具有發言自動書記之智慧型會議室系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: No. 56 Nanli East Road, Shiqi Town, Panyu District, Guangzhou City, Guangdong Province, 510000

Patentee after: Guangdong Baolun Electronics Co.,Ltd.

Address before: No.19 Chuangyuan Road, Zhongcun street, Panyu District, Guangzhou, Guangdong 510000

Patentee before: GUANGZHOU ITC ELECTRONIC TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address