CN117312612B - 一种基于多模态的远程会议数据记录方法、***和介质 - Google Patents

一种基于多模态的远程会议数据记录方法、***和介质 Download PDF

Info

Publication number
CN117312612B
CN117312612B CN202311282824.8A CN202311282824A CN117312612B CN 117312612 B CN117312612 B CN 117312612B CN 202311282824 A CN202311282824 A CN 202311282824A CN 117312612 B CN117312612 B CN 117312612B
Authority
CN
China
Prior art keywords
sub
data information
keyword
value
teleconference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311282824.8A
Other languages
English (en)
Other versions
CN117312612A (zh
Inventor
林颜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Dingyao Technology Co ltd
Original Assignee
Guangdong Dingyao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Dingyao Technology Co ltd filed Critical Guangdong Dingyao Technology Co ltd
Priority to CN202311282824.8A priority Critical patent/CN117312612B/zh
Publication of CN117312612A publication Critical patent/CN117312612A/zh
Application granted granted Critical
Publication of CN117312612B publication Critical patent/CN117312612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开的一种基于多模态的远程会议数据记录方法、***和介质,其中方法包括:获取远程会议数据信息;将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;提取远程会议子数据信息中关键词的特征值;判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。本发明将远程会议数据进行多模态的分类存储,并对多模态的远程会议子数据进行关键词标识,为远程会议之后的数据整理、总结和检索工作提供便利。

Description

一种基于多模态的远程会议数据记录方法、***和介质
技术领域
本发明涉及数据处理技术领域,更具体的,涉及一种基于多模态的远程会议数据记录方法、***和介质。
背景技术
在社会生活中,由于外界的不可抵抗因素,会造成用户不能及时到达会议现场,因此,远程会议成了补救的有效方式;另外,当参加会议人员距离相隔很远,但是时间紧急的情况下,也适合远程会议。然而,远程会议在记录数据方面缺少明显标签,在远程会议之后,参加会议人员无法根据远程会议视频、语音等资料进行有效归类和检索回顾。
因此,现有技术存在缺陷,亟待改进。
发明内容
鉴于上述问题,本发明的目的是提供一种基于多模态的远程会议数据记录方法、***和介质,能够为远程会议之后的数据整理、总结和检索工作提供便利。
本发明第一方面提供了一种基于多模态的远程会议数据记录方法,包括:
获取远程会议数据信息;
将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
提取远程会议子数据信息中关键词的特征值;
判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。
本方案中,所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
获取远程会议子数据信息中的关键词;
根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
根据关键词的位置因子,得到对应关键词的位置因子数值;
根据关键词的数量因子,得到对应关键词的数量因子数值;
将位置因子数值乘以预设第一系数,得到位置特征值;
将数量因子数值乘以预设第二系数,得到数量特征值;
将位置特征值和数量特征值进行累加,得到第一数值;
将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值。
本方案中,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
本方案中,所述根据关键词的数量因子,得到对应关键词的数量因子数值的步骤,具体包括:
获取关键词在对应远程会议子数据信息中出现的次数值,设为n,将关键词的数量因子数值设为N,其公式为其中m为大于零的系数。
本方案中,所述预设用户影响系数的获取步骤,具体包括:
获取关键词所属的远程会议子数据信息对应的用户信息;
将用户信息进行划分,得到对应用户等级信息;
根据用户等级在预设用户影响系数表格中查询,得到对应用户影响系数;
将所述用户影响系数设为对应远程会议子数据信息中关键词对应的预设用户影响系数。
本方案中,所述预设用户影响系数的获取步骤,具体包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
本发明第二方面提供了一种基于多模态的远程会议数据记录***,包括存储器和处理器,所述存储器中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被所述处理器执行时实现如下步骤:
获取远程会议数据信息;
将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
提取远程会议子数据信息中关键词的特征值;
判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。
本方案中,所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
获取远程会议子数据信息中的关键词;
根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
根据关键词的位置因子,得到对应关键词的位置因子数值;
根据关键词的数量因子,得到对应关键词的数量因子数值;
将位置因子数值乘以预设第一系数,得到位置特征值;
将数量因子数值乘以预设第二系数,得到数量特征值;
将位置特征值和数量特征值进行累加,得到第一数值;
将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值。
本方案中,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
本方案中,所述根据关键词的数量因子,得到对应关键词的数量因子数值的步骤,具体包括:
获取关键词在对应远程会议子数据信息中出现的次数值,设为n,将关键词的数量因子数值设为N,其公式为其中m为大于零的系数。
本方案中,所述预设用户影响系数的获取步骤,具体包括:
获取关键词所属的远程会议子数据信息对应的用户信息;
将用户信息进行划分,得到对应用户等级信息;
根据用户等级在预设用户影响系数表格中查询,得到对应用户影响系数;
将所述用户影响系数设为对应远程会议子数据信息中关键词对应的预设用户影响系数。
本方案中,所述预设用户影响系数的获取步骤,具体包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被处理器执行时,实现如上述任一项所述的一种基于多模态的远程会议数据记录方法的步骤。
本发明公开的一种基于多模态的远程会议数据记录方法、***和介质,将远程会议数据进行多模态的分类存储,并对多模态的远程会议子数据进行关键词标识,为远程会议之后的数据整理、总结和检索工作提供便利。
附图说明
图1示出了本发明一种基于多模态的远程会议数据记录方法的流程图;
图2示出了本发明关键词的特征值计算的流程图;
图3示出了本发明一种基于多模态的远程会议数据记录***的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于多模态的远程会议数据记录方法的流程图。
S101,获取远程会议数据信息;
S102,将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
S103,提取远程会议子数据信息中关键词的特征值;
S104,判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
S105,根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。
根据本发明实施例,所述远程会议数据信息根据不同的划分规则,得到不同模态的远程会议子数据信息,比如按照参会人进行划分,得到不同的参会人发言片段;按照数据格式划分,得到不同格式的远程会议子数据信息,例如音频格式的远程会议子数据、视频格式的远程会议子数据、文本格式的远程会议子数据等;将所述不同模态的远程会议子数据信息进行分类存储,并根据特征值对应的关键词进行标识,以方便用户根据对应关键词进行检索,为用户查询提供了方便。
图2示出了本发明关键词的特征值计算的流程图。
如图2所示,根据本发明实施例,所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
S201,获取远程会议子数据信息中的关键词;
S202,根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
S203,根据关键词的位置因子,得到对应关键词的位置因子数值;
S204,根据关键词的数量因子,得到对应关键词的数量因子数值;
S205,将位置因子数值乘以预设第一系数,得到位置特征值;
S206,将数量因子数值乘以预设第二系数,得到数量特征值;
S207,将位置特征值和数量特征值进行累加,得到第一数值;
S208,将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值。
需要说明的是,将远程会议子数据信息中关键词的特征值设为Pi,其公式为Pi=(Ai*k1+Ni*k2)*k3,其中i表示关键词的编号,Ai表示关键词i的位置因子数值,Ni表示关键词i的数量特征值,k1表示预设第一系数,k2表示预设第二系数,k3表示预设用户影响系数。
根据本发明实施例,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
需要说明的是,根据关键词在远程会议子数据信息中的位置,确定对应关键词的位置因子数值,将远程会议子数据信息划分为多个数据段,若所述远程会议子数据信息为语音或视频子数据信息,则根据参会人说话的间隔进行划分;若所述远程会议子数据信息为文本子数据信息,则根据文本子数据信息中的标点符号进行划分,所述预设位置因子数值表中存储有各种关键词落入的编号值对应的位置特征值,比如将关键词落入的编号值为1时对应的位置特征值设为2,关键词落入的编号值不是1时对应的位置特征值设为1。
根据本发明实施例,所述根据关键词的数量因子,得到对应关键词的数量因子数值的步骤,具体包括:
获取关键词在对应远程会议子数据信息中出现的次数值,设为n,将关键词的数量因子数值设为N,其公式为其中m为大于零的系数。
需要说明的是,关键词的数量因子数值和对应关键词在远程会议子数据信息中出现的次数值成正比。
根据本发明实施例,所述预设用户影响系数的获取步骤,具体包括:
获取关键词所属的远程会议子数据信息对应的用户信息;
将用户信息进行划分,得到对应用户等级信息;
根据用户等级在预设用户影响系数表格中查询,得到对应用户影响系数;
将所述用户影响系数设为对应远程会议子数据信息中关键词对应的预设用户影响系数。
需要说明的是,预设用户影响系数和对应用户等级成正比,即对应用户等级越高,对应预设用户影响系数越大,所述用户等级可以根据用户在企业的职称进行划分,比如将普通员工设为第一等级、组长设为第二等级、部门经理设为第三等级等,所述预设用户影响系数表格中存储有各种等级的用户以及对应的用户影响系数,比如将第二等级的用户对应的用户影响系数设为0.4,第三等级的用户对应的用户影响系数设为0.6,所述预设用户影响系数表格由本领域技术人员进行设置。
所述预设用户影响系数表格中存储有
根据本发明实施例,所述预设用户影响系数的获取步骤,具体包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
需要说明的是,当远程会议子数据信息中存在两个关键词的关联度大于预设关联度阈值时,说明对应两个关键词互为对应关键词的关联词,比如将预设关联度阈值设为70%,其中关联度越高,对应关联词的关联系数越大,所述预设关联系数表中存储有各种关联度对应的关联系数,比如将关联度为90%对应的关联系数设为0.45,关联度为80%对应的关联系数设为0.4,所述预设关联度阈值、预设关联系数表均由本领域技术人员进行设置。
根据本发明实施例,还包括:
获取远程会议子数据的初始时间值和结束时间值;
将远程会议子数据按照初始时间值的先后顺序进行排列;
将所述远程会议子数据的初始时间和结束时间值对该远程会议子数据进行标识,并在对应远程会议子数据之上进行显示。
需要说明的是,所述远程会议子数据的初始时间值为对应远程会议子数据出现的开始时间点,所述远程会议子数据的结束时间值为对应远程会议子数据的结束终止时间点,比如对应远程会议子数据从九点到九点半,则对应远程会议子数据的初始时间值为九点,结束时间值为九点半,并所述初始时间值和结束时间值在对应远程会议子数据上进行标识且显示,以供远程会议结束之后方便查询。
根据本发明实施例,还包括:
将远程会议子数据信息中的关键词和预设敏感词进行对比分析,得到相似值;
判断所述相似值是否大于预设相似阈值,若是,将相似值对应的关键词设为敏感关键词;
根据敏感关键词对该远程会议子数据信息进行标识并显示。
需要说明的是,所述预设敏感词包括不同意、另一个、不好等持反对意见的词语或言语片段,当相似值大于预设相似阈值时,说明关键词对应的远程会议子数据和其他的远程会议子数据为相反意见,比如预设相似阈值为80%,则当相似值大于80%时,相似值对应的关键词为敏感关键词,并将对应远程会议子数据根据敏感关键词进行标识并显示,以方便查询检索。
图3示出了本发明一种基于多模态的远程会议数据记录***的框图。
如图3所示,本发明第二方面提供了一种基于多模态的远程会议数据记录***3,包括存储器31和处理器32,所述存储器中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被所述处理器执行时实现如下步骤:
获取远程会议数据信息;
将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
提取远程会议子数据信息中关键词的特征值;
判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。
根据本发明实施例,所述远程会议数据信息根据不同的划分规则,得到不同模态的远程会议子数据信息,比如按照参会人进行划分,得到不同的参会人发言片段;按照数据格式划分,得到不同格式的远程会议子数据信息,例如音频格式的远程会议子数据、视频格式的远程会议子数据、文本格式的远程会议子数据等;将所述不同模态的远程会议子数据信息进行分类存储,并根据特征值对应的关键词进行标识,以方便用户根据对应关键词进行检索,为用户查询提供了方便。
根据本发明实施例,所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
获取远程会议子数据信息中的关键词;
根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
根据关键词的位置因子,得到对应关键词的位置因子数值;
根据关键词的数量因子,得到对应关键词的数量因子数值;
将位置因子数值乘以预设第一系数,得到位置特征值;
将数量因子数值乘以预设第二系数,得到数量特征值;
将位置特征值和数量特征值进行累加,得到第一数值;
将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值。
需要说明的是,将远程会议子数据信息中关键词的特征值设为Pi,其公式为Pi=(Ai*k1+Ni*k2)*k3,其中i表示关键词的编号,Ai表示关键词i的位置因子数值,Ni表示关键词i的数量特征值,k1表示预设第一系数,k2表示预设第二系数,k3表示预设用户影响系数。
根据本发明实施例,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
需要说明的是,根据关键词在远程会议子数据信息中的位置,确定对应关键词的位置因子数值,将远程会议子数据信息划分为多个数据段,若所述远程会议子数据信息为语音或视频子数据信息,则根据参会人说话的间隔进行划分;若所述远程会议子数据信息为文本子数据信息,则根据文本子数据信息中的标点符号进行划分,所述预设位置因子数值表中存储有各种关键词落入的编号值对应的位置特征值,比如将关键词落入的编号值为1时对应的位置特征值设为2,关键词落入的编号值不是1时对应的位置特征值设为1。
根据本发明实施例,所述根据关键词的数量因子,得到对应关键词的数量因子数值的步骤,具体包括:
获取关键词在对应远程会议子数据信息中出现的次数值,设为n,将关键词的数量因子数值设为N,其公式为其中m为大于零的系数。
需要说明的是,关键词的数量因子数值和对应关键词在远程会议子数据信息中出现的次数值成正比。
根据本发明实施例,所述预设用户影响系数的获取步骤,具体包括:
获取关键词所属的远程会议子数据信息对应的用户信息;
将用户信息进行划分,得到对应用户等级信息;
根据用户等级在预设用户影响系数表格中查询,得到对应用户影响系数;
将所述用户影响系数设为对应远程会议子数据信息中关键词对应的预设用户影响系数。
需要说明的是,预设用户影响系数和对应用户等级成正比,即对应用户等级越高,对应预设用户影响系数越大,所述用户等级可以根据用户在企业的职称进行划分,比如将普通员工设为第一等级、组长设为第二等级、部门经理设为第三等级等,所述预设用户影响系数表格中存储有各种等级的用户以及对应的用户影响系数,比如将第二等级的用户对应的用户影响系数设为0.4,第三等级的用户对应的用户影响系数设为0.6,所述预设用户影响系数表格由本领域技术人员进行设置。
所述预设用户影响系数表格中存储有
根据本发明实施例,所述预设用户影响系数的获取步骤,具体包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
需要说明的是,当远程会议子数据信息中存在两个关键词的关联度大于预设关联度阈值时,说明对应两个关键词互为对应关键词的关联词,比如将预设关联度阈值设为70%,其中关联度越高,对应关联词的关联系数越大,所述预设关联系数表中存储有各种关联度对应的关联系数,比如将关联度为90%对应的关联系数设为0.45,关联度为80%对应的关联系数设为0.4,所述预设关联度阈值、预设关联系数表均由本领域技术人员进行设置。
根据本发明实施例,还包括:
获取远程会议子数据的初始时间值和结束时间值;
将远程会议子数据按照初始时间值的先后顺序进行排列;
将所述远程会议子数据的初始时间和结束时间值对该远程会议子数据进行标识,并在对应远程会议子数据之上进行显示。
需要说明的是,所述远程会议子数据的初始时间值为对应远程会议子数据出现的开始时间点,所述远程会议子数据的结束时间值为对应远程会议子数据的结束终止时间点,比如对应远程会议子数据从九点到九点半,则对应远程会议子数据的初始时间值为九点,结束时间值为九点半,并所述初始时间值和结束时间值在对应远程会议子数据上进行标识且显示,以供远程会议结束之后方便查询。
根据本发明实施例,还包括:
将远程会议子数据信息中的关键词和预设敏感词进行对比分析,得到相似值;
判断所述相似值是否大于预设相似阈值,若是,将相似值对应的关键词设为敏感关键词;
根据敏感关键词对该远程会议子数据信息进行标识并显示。
需要说明的是,所述预设敏感词包括不同意、另一个、不好等持反对意见的词语或言语片段,当相似值大于预设相似阈值时,说明关键词对应的远程会议子数据和其他的远程会议子数据为相反意见,比如预设相似阈值为80%,则当相似值大于80%时,相似值对应的关键词为敏感关键词,并将对应远程会议子数据根据敏感关键词进行标识并显示,以方便查询检索。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被处理器执行时,实现如上述任一项所述的一种基于多模态的远程会议数据记录方法的步骤。
本发明公开的一种基于多模态的远程会议数据记录方法、***和介质,其中方法包括:获取远程会议数据信息;将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;提取远程会议子数据信息中关键词的特征值;判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询。本发明将远程会议数据进行多模态的分类存储,并对多模态的远程会议子数据进行关键词标识,为远程会议之后的数据整理、总结和检索工作提供便利。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-On ly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (7)

1.一种基于多模态的远程会议数据记录方法,其特征在于,包括:
获取远程会议数据信息;
将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
提取远程会议子数据信息中关键词的特征值;
判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询;
所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
获取远程会议子数据信息中的关键词;
根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
根据关键词的位置因子,得到对应关键词的位置因子数值;
根据关键词的数量因子,得到对应关键词的数量因子数值;
将位置因子数值乘以预设第一系数,得到位置特征值;
将数量因子数值乘以预设第二系数,得到数量特征值;
将位置特征值和数量特征值进行累加,得到第一数值;
将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值;
还包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
2.根据权利要求1所述的一种基于多模态的远程会议数据记录方法,其特征在于,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
3.根据权利要求1所述的一种基于多模态的远程会议数据记录方法,其特征在于,所述根据关键词的数量因子,得到对应关键词的数量因子数值的步骤,具体包括:
获取关键词在对应远程会议子数据信息中出现的次数值,设为,将关键词的数量因子数值设为/>,其公式为/>,其中/>为大于零的系数。
4.根据权利要求1所述的一种基于多模态的远程会议数据记录方法,其特征在于,所述预设用户影响系数的获取步骤,具体包括:
获取关键词所属的远程会议子数据信息对应的用户信息;
将用户信息进行划分,得到对应用户等级信息;
根据用户等级在预设用户影响系数表格中查询,得到对应用户影响系数;
将所述用户影响系数设为对应远程会议子数据信息中关键词对应的预设用户影响系数。
5.一种基于多模态的远程会议数据记录***,其特征在于,包括存储器和处理器,所述存储器中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被所述处理器执行时实现如下步骤:
获取远程会议数据信息;
将远程会议数据信息进行划分,得到不同模态的远程会议子数据信息,并将所述不同模态的远程会议子数据信息进行分类存储;
提取远程会议子数据信息中关键词的特征值;
判断所述远程会议子数据信息中关键词的特征值是否大于预设特征阈值,若是,提取特征值对应的关键词;
根据特征值对应的关键词对远程会议子数据信息进行标识以方便查询;
所述提取远程会议子数据信息中关键词的特征值的步骤,具体包括:
获取远程会议子数据信息中的关键词;
根据远程会议子数据信息中的关键词,得到对应关键词的位置因子和数量因子;
根据关键词的位置因子,得到对应关键词的位置因子数值;
根据关键词的数量因子,得到对应关键词的数量因子数值;
将位置因子数值乘以预设第一系数,得到位置特征值;
将数量因子数值乘以预设第二系数,得到数量特征值;
将位置特征值和数量特征值进行累加,得到第一数值;
将第一数值乘以预设用户影响系数,得到对应远程会议子数据信息中关键词的特征值;
还包括:
将远程会议子数据信息中的任意两个关键词进行对比分析,得到关联度;
判断所述关联度是否大于预设关联度阈值,若是,将对应两个关键词设为关联词;
根据关联词对应的关联度在预设关联系数表中查询,得到对应关联词的关联系数;
获取远程会议子数据信息中关键词对应的关联词;
根据取远程会议子数据信息中的关键词对应的关联词,得到对应关联词的特征值;
将所述关联词的特征值乘以对应关联词的关联系数,得到远程会议子数据信息中关键词的特征修订值;
将所述远程会议子数据信息中关键词的特征修订值加上对应远程会议子数据信息中关键词的特征值,得到修订之后的远程会议子数据信息中关键词的特征值。
6.根据权利要求5所述的一种基于多模态的远程会议数据记录***,其特征在于,所述根据关键词的位置因子,得到对应关键词的位置因子数值的步骤,具体包括:
将远程会议子数据信息划分为多个数据段,并按照时间先后顺序进行排列;
将数据段按照排列进行编号,得到数据段的编号值;
根据远程会议子数据信息中的关键词,得到对应关键词落入的编号值;
根据关键词落入的编号值在预设位置因子数值表中查询,得到对应关键词的位置特征值。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有一种基于多模态的远程会议数据记录方法程序,所述一种基于多模态的远程会议数据记录方法程序被处理器执行时,实现如权利要求1至4中任一项所述的一种基于多模态的远程会议数据记录方法的步骤。
CN202311282824.8A 2023-10-07 2023-10-07 一种基于多模态的远程会议数据记录方法、***和介质 Active CN117312612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311282824.8A CN117312612B (zh) 2023-10-07 2023-10-07 一种基于多模态的远程会议数据记录方法、***和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311282824.8A CN117312612B (zh) 2023-10-07 2023-10-07 一种基于多模态的远程会议数据记录方法、***和介质

Publications (2)

Publication Number Publication Date
CN117312612A CN117312612A (zh) 2023-12-29
CN117312612B true CN117312612B (zh) 2024-04-02

Family

ID=89284471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311282824.8A Active CN117312612B (zh) 2023-10-07 2023-10-07 一种基于多模态的远程会议数据记录方法、***和介质

Country Status (1)

Country Link
CN (1) CN117312612B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019032805A (ja) * 2018-02-09 2019-02-28 株式会社Space2020 会議システム
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及***
CN111986677A (zh) * 2020-09-02 2020-11-24 深圳壹账通智能科技有限公司 会议纪要生成方法、装置、计算机设备及存储介质
CN112559834A (zh) * 2020-12-21 2021-03-26 浙江合张量科技有限公司 一种用于智能机器人***的多模态输出方法
CN114298170A (zh) * 2021-12-08 2022-04-08 上海交通大学 一种多模态会议数据结构化方法、装置及计算机设备
CN114387505A (zh) * 2021-12-10 2022-04-22 山东师范大学 一种高光谱与激光雷达多模态遥感数据分类方法及***
WO2022142014A1 (zh) * 2020-12-29 2022-07-07 平安科技(深圳)有限公司 基于多模态信息融合的文本分类方法、及其相关设备
CN114881019A (zh) * 2022-06-08 2022-08-09 钱塘科技创新中心 面向多模态网络的数据混合存储方法及装置
CN115174285A (zh) * 2022-07-26 2022-10-11 中国工商银行股份有限公司 会议记录生成方法、装置及电子设备
CN116246610A (zh) * 2022-12-30 2023-06-09 山东大学 基于多模态识别的会议记录生成方法及***
CN116634093A (zh) * 2023-06-06 2023-08-22 湖南马兰数字教育科技有限公司 一种多功能在线交流和会议的方法、***和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7761505B2 (en) * 2002-11-18 2010-07-20 Openpeak Inc. System, method and computer program product for concurrent performance of video teleconference and delivery of multimedia presentation and archiving of same
US8797380B2 (en) * 2010-04-30 2014-08-05 Microsoft Corporation Accelerated instant replay for co-present and distributed meetings
US10282462B2 (en) * 2016-10-31 2019-05-07 Walmart Apollo, Llc Systems, method, and non-transitory computer-readable storage media for multi-modal product classification
US11955026B2 (en) * 2019-09-26 2024-04-09 International Business Machines Corporation Multimodal neural network for public speaking guidance
US20210209289A1 (en) * 2020-01-07 2021-07-08 Samsung Electronics Co., Ltd. Method and apparatus for generating customized content based on user intent
US11574145B2 (en) * 2020-06-30 2023-02-07 Google Llc Cross-modal weak supervision for media classification

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019148583A1 (zh) * 2018-02-02 2019-08-08 深圳市鹰硕技术有限公司 一种会议智能管理方法及***
JP2019032805A (ja) * 2018-02-09 2019-02-28 株式会社Space2020 会議システム
CN111986677A (zh) * 2020-09-02 2020-11-24 深圳壹账通智能科技有限公司 会议纪要生成方法、装置、计算机设备及存储介质
CN112559834A (zh) * 2020-12-21 2021-03-26 浙江合张量科技有限公司 一种用于智能机器人***的多模态输出方法
WO2022142014A1 (zh) * 2020-12-29 2022-07-07 平安科技(深圳)有限公司 基于多模态信息融合的文本分类方法、及其相关设备
CN114298170A (zh) * 2021-12-08 2022-04-08 上海交通大学 一种多模态会议数据结构化方法、装置及计算机设备
CN114387505A (zh) * 2021-12-10 2022-04-22 山东师范大学 一种高光谱与激光雷达多模态遥感数据分类方法及***
CN114881019A (zh) * 2022-06-08 2022-08-09 钱塘科技创新中心 面向多模态网络的数据混合存储方法及装置
CN115174285A (zh) * 2022-07-26 2022-10-11 中国工商银行股份有限公司 会议记录生成方法、装置及电子设备
CN116246610A (zh) * 2022-12-30 2023-06-09 山东大学 基于多模态识别的会议记录生成方法及***
CN116634093A (zh) * 2023-06-06 2023-08-22 湖南马兰数字教育科技有限公司 一种多功能在线交流和会议的方法、***和存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Hierarchical Attention Learning for Multimodal Classification;Xin Zou et al.;IEEE;20230825;第936-941页 *
Multimodal query expansion for web video search;FENG Bailan et al.;ACM;20100731;第721–722页 *
Xin Zou et al..Hierarchical Attention Learning for Multimodal Classification.IEEE.2023,第936-941页. *
一种基于多模态模型的随机子空间分类集成算法;叶云龙等;南京师范大学学报(工程技术版);20091220;第9卷(第4期);第57-62页 *
一种多模态融合的网络视频相关性度量方法;温有福等;智能***学报;20160513;第11卷(第3期);第359-365页 *

Also Published As

Publication number Publication date
CN117312612A (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
US7707204B2 (en) Factoid-based searching
US11455301B1 (en) Method and system for identifying entities
US6507838B1 (en) Method for combining multi-modal queries for search of multimedia data using time overlap or co-occurrence and relevance scores
US8315997B1 (en) Automatic identification of document versions
CN107862070B (zh) 基于文本聚类的线上课堂讨论短文本即时分组方法及***
US7761437B2 (en) Named entity extracting apparatus, method, and program
US7849066B2 (en) Apparatus and method for determining adequacy of information retrieving process
CN111831804B (zh) 一种关键短语的提取方法、装置、终端设备及存储介质
CN111353014B (zh) 职位关键词提取、岗位需求更新的方法和装置
US7739743B2 (en) Information presentation apparatus, and information presentation method and program for use therein
CN109918678B (zh) 一种字段含义识别方法和装置
CN112507176A (zh) 域名侵权的自动化判定方法、装置、电子设备和存储介质
CN113660541A (zh) 新闻视频的摘要生成方法及装置
CN107169003B (zh) 一种数据关联方法及装置
CN110245357B (zh) 主实体识别方法和装置
EP3301603A1 (en) Improved search for data loss prevention
CN111191046A (zh) 一种实现信息搜索的方法、装置、计算机存储介质及终端
CN114722199A (zh) 基于通话录音的风险识别方法、装置、计算机设备及介质
US6070169A (en) Method and system for the determination of a particular data object utilizing attributes associated with the object
WO2021103594A1 (zh) 一种默契度检测方法、设备、服务器及可读存储介质
CN117312612B (zh) 一种基于多模态的远程会议数据记录方法、***和介质
CN115374793B (zh) 基于服务场景识别的语音数据处理方法及相关装置
US8341161B2 (en) Index database creating apparatus and index database retrieving apparatus
CN116450664A (zh) 数据处理方法、装置、设备和存储介质
CN114491232B (zh) 信息查询方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant