CN117193391A - 一种智慧控制台角度调整*** - Google Patents

一种智慧控制台角度调整*** Download PDF

Info

Publication number
CN117193391A
CN117193391A CN202311467757.7A CN202311467757A CN117193391A CN 117193391 A CN117193391 A CN 117193391A CN 202311467757 A CN202311467757 A CN 202311467757A CN 117193391 A CN117193391 A CN 117193391A
Authority
CN
China
Prior art keywords
sound source
angle
sound
mode
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311467757.7A
Other languages
English (en)
Other versions
CN117193391B (zh
Inventor
石文标
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tielishan Technology Co ltd
Original Assignee
Beijing Tielishan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tielishan Technology Co ltd filed Critical Beijing Tielishan Technology Co ltd
Priority to CN202311467757.7A priority Critical patent/CN117193391B/zh
Publication of CN117193391A publication Critical patent/CN117193391A/zh
Application granted granted Critical
Publication of CN117193391B publication Critical patent/CN117193391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种智慧控制台角度调整***,涉及影响设备技术领域,本发明采用声音识别和定位技术,基于音源定位单元和音源识别单元对音源进行识别,采用极坐标表示音源位置,更直观地描述声音源在球坐标系中的位置,针对角度调整的方式,包括指定用户调节模式、单声源模式、多声源协同模式和静音模式,可以按照用户实际使用场景需求进行调整,同时在指定用户调节模式下,根据授权用户的声音识别限制进行音源定位和角度调整,通过分析声音识别模块的输出来确定是否需要进行智慧控制台角度的转动,进行多层次的判定,结合声音源的相对位置、声音的方向信息和持续输出时间,多层次更贴合使用场景的决定何时触发角度调整,提供更精细的用户体验。

Description

一种智慧控制台角度调整***
技术领域
本发明涉及影响设备技术领域,具体为一种智慧控制台角度调整***。
背景技术
智慧控制台(display, screen)是电脑的I/O设备,即输出设备。它是一种将一定的电子文件通过特定的传输设备显示到屏幕上的显示工具。它可以分为阴极射线管智慧控制台(CRT),等离子智慧控制台PDP,液晶智慧控制台LCD 。
但是在现有技术中,对于智慧控制台角度的调节一般需要通过接触性调节进行操控,例如中国专利公开了一种托管架角度调节***,CN105952968A,包括如下步骤:该角度调节***包括第一、第二托管架,角度调节***还包括主推油缸和连杆箱体。其中主推油缸的两侧铰接第一、第二托管架;连杆箱体包括外箱体和套设在外箱体内的内箱体,外箱体和内箱体的一侧分别铰接第一、第二托管架,连杆箱体还包括一锁定装置,锁定装置能够在解锁和锁定状态中切换,在解锁状态下,主推油缸能调整第一、第二托管架之间的角度,以使外箱体和内箱体能相对轴向滑动;在锁定状态下,外箱体和内箱体被相互固定。本发明提供的一种托管架角度调节***能方便调节托管架之间的相对角度,减少人工操作,提高安全性。
虽然上述方案具有如上的优势,但是传统的智慧控制台角度调整***通常需要物理控制器,如遥控器或激光笔,对智慧控制台角度进行调整,便捷性相对较低,同时需要额外的硬件设备,尤其应用在培训、演讲场景上,智慧控制台需要投影到大屏幕,而工作人员需要往复在讲台和显示设备往返,使用体验不佳,因此亟须一种可以无接触对智慧控制台角度进行调节的智慧控制台角度调整***来解决此类问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种智慧控制台角度调整***,解决现有技术中存在的接触型角度调节,使用体验不佳的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现,本发明提供了一种智慧控制台角度调整***,其特征在于,包括:
声音识别模块,内置音频输入设备用于采集音频信号,声音识别模块用于识别授权用户的声音,声音识别模块包括AI语音识别单元、音源定位单元和音源识别单元;
所述音源定位单元,对指定用户的音源进行角度定位;
所述音源识别单元,对指定用户的音源进行识别;
角度识别判断模块,根据所述声音识别模块识别的音源信息进行二次分析,基于定位模式进行角度转动判定;
智慧控制台调整模块,用于调整智慧控制台角度和高度,基于角度识别判断模块输出进行判定。
本发明进一步地设置为:所述声音识别模块中,声音识别方式具体为:
从音频输入设备中采集音频信号,设音频信号为离散时间信号x(n),n代表采样时间;
对音频信号进行预处理增强语音信息,从预处理的语音信号中提取梅尔频率倒谱系数MFCC和声音基本频率;
则MFCC提取计算方式为:
其中,X(n,k)为音频信号的频谱信息,N是频谱点数,m是MFCC系数索引;
然后基于卷积神经网络和长短时记忆网络建立AI语音识别模型,并用标记语音数据集训练AI语音识别模型;
本发明进一步地设置为:所述音源定位单元中,具体音源定位方式为:
对音源定位信息进行声音标签预定义,设有N个麦克风即音频输入设备,每个麦克风的位置为,声源位置为/>,声音传播速度为c,则声源到第i个麦克风的距离为/>,则声源方向计算公式为:
再选用高斯混合模型GMM和隐马尔可夫模型HMM将识别出的声源信息与预定义的声音标签进行匹配;
本发明进一步地设置为:所述角度识别判断模块中,定位模式包括音源定位判定和AI指令判定;
所述角度识别判断模块中,对声音识别模块识别的音源信息进行二次分析,并基于定位模式来确定需要进行的智慧控制台角度转动;
本发明进一步地设置为:所述定位模式包括:
指定用户调节模式,对授权用户进行语音识别限制,仅对限制范围内的单一用户进行音源识别,基于声音识别模块识别信息进行角度调整;
单声源模式,如果只有一个声源,则根据声音的方向来判断是否需要调整智慧控制台的角度,根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过这个阈值时,触发调整;
多声源协同模式,如果有多个声源,对音源角度以及持续输出时间进行分析,根据声源相对位置触发调整;
静音模式,如果没有检测到声音时,智慧控制台保持在当前位置;
本发明进一步地设置为:切换指定用户调节模式时:
所述声音识别模块对授权用户进行语音识别限制,只有授权用户的声音指令才会被识别;
使用声音识别模块进行音源识别,获得声音的方向信息;
基于声音识别模块识别的信息,计算需要进行的角度调整;
切换所述单声源模式时:
使用声音识别模块获得声音的方向信息;
根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过阈值时,触发调整;
切换所述多声源协同模式时:
使用声音识别模块获得多个声源的方向信息;
根据声源的相对位置和持续输出时间进行分析,根据声源相对位置触发调整;
本发明进一步地设置为:所述根据声源相对位置触发调整时:
根据声源的相对位置和持续输出时间进行分析,使用声音识别模块检测和追踪多个声源的方向;
针对每个声源,均记录极坐标以及声源的持续输出时间;
如果一个声源位于用户前方,并且另一个声源位于用户侧面,则触发调整智慧控制台角度的调整;
如果两个声源之间的水平夹角大于45°,则触发调整智慧控制台角度的调整;
根据声音识别模块对用户声源进行定位,对角度差进行计算;
确定调整角度差,并触发智慧控制台角度的调整;
本发明进一步地设置为:所述角度识别判断模块中,对声音识别模块所获取的音源信息以极坐标进行表示;
基于定位模式分析的输出结果,确定智慧控制台角度是否转动以及转动角度;
如果定位模式指示需要调整,则计算需要转动的角度,并进行判定;
本发明进一步地设置为:所述极坐标表示方式具体为:
从声音识别模块获取音源的水平角度和垂直角度;
将直角坐标形式的音源位置信息x、y、z坐标转换为极坐标形式r、θ、φ,其中r表示极径即声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
直角坐标到极坐标的转换公式为:
其中,x、y、z是声音源的直角坐标,r是声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置,参考点通常是声音识别***的麦克风位。
(三)有益效果
本发明提供了一种智慧控制台角度调整***。具备以下有益效果:
本申请所提供的智慧控制台角度调整***采用声音识别和定位技术,基于音源定位单元和音源识别单元对音源进行识别,采用极坐标表示音源位置,更直观地描述声音源在球坐标系中的位置,针对角度调整的方式,包括指定用户调节模式、单声源模式、多声源协同模式和静音模式,可以按照用户实际使用场景需求进行调整,灵活地适应不同的使用情境,同时在指定用户调节模式下,根据授权用户的声音识别限制进行音源定位和角度调整,增强了***的安全性和用户个性化。
角度识别判断模块中,通过分析声音识别模块的输出来确定是否需要进行智慧控制台角度的转动,进行多层次的判定,结合声音源的相对位置、声音的方向信息和持续输出时间,使***能够多层次更贴合使用场景的,决定何时触发角度调整,提供更精细的用户体验。
此外智慧控制台调整模块进行智能化,基于角度识别判断模块的输出,该模块进行自动的智慧控制台角度和高度调整,无需用户干预。
解决了现有技术中存在的接触型角度调节,使用体验不佳的问题。
附图说明
图1为本发明的智慧控制台角度调整***框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
请参阅图1,本发明提供一种智慧控制台角度调整***,包括:
声音识别模块,内置音频输入设备用于采集音频信号,声音识别模块用于识别授权用户的声音,声音识别模块包括AI语音识别单元、音源定位单元和音源识别单元;
音源定位单元,对指定用户的音源进行角度定位;
音源识别单元,对指定用户的音源进行识别;
声音识别模块中,声音识别方式具体为:
从音频输入设备中采集音频信号,设音频信号为离散时间信号x(n),n代表采样时间;
对音频信号进行预处理增强语音信息,从预处理的语音信号中提取梅尔频率倒谱系数MFCC和声音基本频率;
则MFCC提取计算方式为:
其中,X(n,k)为音频信号的频谱信息,N是频谱点数,m是MFCC系数索引;
然后基于卷积神经网络和长短时记忆网络建立AI语音识别模型,并用标记语音数据集训练AI语音识别模型;
音源定位单元中,具体音源定位方式为:
对音源定位信息进行声音标签预定义,设有N个麦克风即音频输入设备,每个麦克风的位置为,声源位置为/>,声音传播速度为c,则声源到第i个麦克风的距离为/>,则声源方向计算公式为:
再选用高斯混合模型GMM和隐马尔可夫模型HMM将识别出的声源信息与预定义的声音标签进行匹配;
角度识别判断模块,根据声音识别模块识别的音源信息进行二次分析,基于定位模式进行角度转动判定;
角度识别判断模块中,定位模式包括音源定位判定和AI指令判定;
角度识别判断模块中,对声音识别模块识别的音源信息进行二次分析,并基于定位模式来确定需要进行的智慧控制台角度转动;
定位模式包括:
指定用户调节模式,对授权用户进行语音识别限制,仅对限制范围内的单一用户进行音源识别,基于声音识别模块识别信息进行角度调整;
单声源模式,如果只有一个声源,则根据声音的方向来判断是否需要调整智慧控制台的角度,根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过这个阈值时,触发调整;
多声源协同模式,如果有多个声源,对音源角度以及持续输出时间进行分析,根据声源相对位置触发调整;
静音模式,如果没有检测到声音时,智慧控制台保持在当前位置;
切换指定用户调节模式时:
声音识别模块对授权用户进行语音识别限制,只有授权用户的声音指令才会被识别;
使用声音识别模块进行音源识别,获得声音的方向信息;
基于声音识别模块识别的信息,计算需要进行的角度调整;
切换单声源模式时:
使用声音识别模块获得声音的方向信息;
根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过阈值时,触发调整;
切换多声源协同模式时:
使用声音识别模块获得多个声源的方向信息;
根据声源的相对位置和持续输出时间进行分析,根据声源相对位置触发调整;
根据声源相对位置触发调整时:
根据声源的相对位置和持续输出时间进行分析,使用声音识别模块检测和追踪多个声源的方向;
针对每个声源,均记录极坐标以及声源的持续输出时间;
如果一个声源位于用户前方,并且另一个声源位于用户侧面,则触发调整智慧控制台角度的调整;
如果两个声源之间的水平夹角大于45°,则触发调整智慧控制台角度的调整;
根据声音识别模块对用户声源进行定位,对角度差进行计算;
确定调整角度差,并触发智慧控制台角度的调整;
角度识别判断模块中,对声音识别模块所获取的音源信息以极坐标进行表示;
基于定位模式分析的输出结果,确定智慧控制台角度是否转动以及转动角度;
如果定位模式指示需要调整,则计算需要转动的角度,并进行判定,判定具体为:
极坐标表示方式具体为:
从声音识别模块获取音源的水平角度和垂直角度;
将直角坐标形式的音源位置信息x、y、z坐标转换为极坐标形式r、θ、φ,其中r表示极径即声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
直角坐标到极坐标的转换公式为:
其中,x、y、z是声音源的直角坐标,r是声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置,参考点通常是声音识别***的麦克风位置;
智慧控制台调整模块,用于调整智慧控制台角度和高度,基于角度识别判断模块输出进行判定。
综合以上内容,在本申请中:
本申请所提供的智慧控制台角度调整***采用声音识别和定位技术,基于音源定位单元和音源识别单元对音源进行识别,采用极坐标表示音源位置,更直观地描述声音源在球坐标系中的位置,针对角度调整的方式,包括指定用户调节模式、单声源模式、多声源协同模式和静音模式,可以按照用户实际使用场景需求进行调整,灵活地适应不同的使用情境,同时在指定用户调节模式下,根据授权用户的声音识别限制进行音源定位和角度调整,增强了***的安全性和用户个性化。
角度识别判断模块中,通过分析声音识别模块的输出来确定是否需要进行智慧控制台角度的转动,进行多层次的判定,结合声音源的相对位置、声音的方向信息和持续输出时间,使***能够多层次更贴合使用场景的,决定何时触发角度调整,提供更精细的用户体验。
此外智慧控制台调整模块进行智能化,基于角度识别判断模块的输出,该模块进行自动的智慧控制台角度和高度调整,无需用户干预。
解决了现有技术中存在的接触型角度调节,使用体验不佳的问题。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种智慧控制台角度调整***,其特征在于,包括:
声音识别模块,内置音频输入设备用于采集音频信号,声音识别模块用于识别授权用户的声音,声音识别模块包括AI语音识别单元、音源定位单元和音源识别单元;
所述音源定位单元,对指定用户的音源进行角度定位;
所述音源识别单元,对指定用户的音源进行识别;
角度识别判断模块,根据所述声音识别模块识别的音源信息进行二次分析,基于定位模式进行角度转动判定;
智慧控制台调整模块,用于调整智慧控制台角度和高度,基于角度识别判断模块输出进行判定。
2.根据权利要求1所述的一种智慧控制台角度调整***,其特征在于,所述声音识别模块中,声音识别方式具体为:
从音频输入设备中采集音频信号,设音频信号为离散时间信号x(n),n代表采样时间;
对音频信号进行预处理增强语音信息,从预处理的语音信号中提取梅尔频率倒谱系数MFCC和声音基本频率;
则MFCC提取计算方式为:
其中,X(n,k)为音频信号的频谱信息,N是频谱点数,m是MFCC系数索引;
然后基于卷积神经网络和长短时记忆网络建立AI语音识别模型,并用标记语音数据集训练AI语音识别模型。
3.根据权利要求1所述的一种智慧控制台角度调整***,其特征在于,所述音源定位单元中,具体音源定位方式为:
对音源定位信息进行声音标签预定义,设有N个麦克风即音频输入设备,每个麦克风的位置为,声源位置为/>,声音传播速度为c,则声源到第i个麦克风的距离为/>,则声源方向计算公式为:
再选用高斯混合模型GMM和隐马尔可夫模型HMM将识别出的声源信息与预定义的声音标签进行匹配。
4.根据权利要求1所述的一种智慧控制台角度调整***,其特征在于,所述角度识别判断模块中,定位模式包括音源定位判定和AI指令判定;
所述角度识别判断模块中,对声音识别模块识别的音源信息进行二次分析,并基于定位模式来确定需要进行的智慧控制台角度转动。
5.根据权利要求4所述的一种智慧控制台角度调整***,其特征在于,所述定位模式包括:
指定用户调节模式,对授权用户进行语音识别限制,仅对限制范围内的单一用户进行音源识别,基于声音识别模块识别信息进行角度调整;
单声源模式,如果只有一个声源,则根据声音的方向来判断是否需要调整智慧控制台的角度,根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过这个阈值时,触发调整;
多声源协同模式,如果有多个声源,对音源角度以及持续输出时间进行分析,根据声源相对位置触发调整;
静音模式,如果没有检测到声音时,智慧控制台保持在当前位置。
6.根据权利要求5所述的一种智慧控制台角度调整***,其特征在于,切换指定用户调节模式时:
所述声音识别模块对授权用户进行语音识别限制,只有授权用户的声音指令才会被识别;
使用声音识别模块进行音源识别,获得声音的方向信息;
基于声音识别模块识别的信息,计算需要进行的角度调整;
切换所述单声源模式时:
使用声音识别模块获得声音的方向信息;
根据预设阈值进行判定,当声源方向偏离当前智慧控制台角度超过阈值时,触发调整;
切换所述多声源协同模式时:
使用声音识别模块获得多个声源的方向信息;
根据声源的相对位置和持续输出时间进行分析,根据声源相对位置触发调整。
7.根据权利要求6所述的一种智慧控制台角度调整***,其特征在于,所述根据声源相对位置触发调整时:
根据声源的相对位置和持续输出时间进行分析,使用声音识别模块检测和追踪多个声源的方向;
针对每个声源,均记录极坐标以及声源的持续输出时间;
如果一个声源位于用户前方,并且另一个声源位于用户侧面,则触发调整智慧控制台角度的调整;
如果两个声源之间的水平夹角大于45°,则触发调整智慧控制台角度的调整;
根据声音识别模块对用户声源进行定位,对角度差进行计算;
确定调整角度差,并触发智慧控制台角度的调整。
8.根据权利要求1所述的一种智慧控制台角度调整***,其特征在于,所述角度识别判断模块中,对声音识别模块所获取的音源信息以极坐标进行表示;
基于定位模式分析的输出结果,确定智慧控制台角度是否转动以及转动角度;
如果定位模式指示需要调整,则计算需要转动的角度,并进行判定。
9.根据权利要求8所述的一种智慧控制台角度调整***,其特征在于,所述极坐标表示方式具体为:
从声音识别模块获取音源的水平角度和垂直角度;
将直角坐标形式的音源位置信息x、y、z坐标转换为极坐标形式r、θ、φ,其中r表示极径即声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
直角坐标到极坐标的转换公式为:
其中,x、y、z是声音源的直角坐标,r是声音源到参考点的距离,θ表示水平角度,φ表示垂直角度;
然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置,参考点通常是声音识别***的麦克风位置。
CN202311467757.7A 2023-11-07 2023-11-07 一种智慧控制台角度调整*** Active CN117193391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311467757.7A CN117193391B (zh) 2023-11-07 2023-11-07 一种智慧控制台角度调整***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311467757.7A CN117193391B (zh) 2023-11-07 2023-11-07 一种智慧控制台角度调整***

Publications (2)

Publication Number Publication Date
CN117193391A true CN117193391A (zh) 2023-12-08
CN117193391B CN117193391B (zh) 2024-01-23

Family

ID=89003836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311467757.7A Active CN117193391B (zh) 2023-11-07 2023-11-07 一种智慧控制台角度调整***

Country Status (1)

Country Link
CN (1) CN117193391B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105704451A (zh) * 2016-02-04 2016-06-22 武克易 一种物联网智能设备的摄像方法
CN106901758A (zh) * 2017-02-23 2017-06-30 南京工程学院 一种基于卷积神经网络的言语置信度评测方法
CN111103807A (zh) * 2019-12-17 2020-05-05 青岛海信智慧家居***股份有限公司 一种家用终端设备的控制方法及装置
CN111142836A (zh) * 2019-12-28 2020-05-12 深圳创维-Rgb电子有限公司 屏幕朝向角度的调整方法、装置、电子产品及存储介质
CN111179923A (zh) * 2019-11-22 2020-05-19 广东小天才科技有限公司 一种基于可穿戴设备的音频播放方法及可穿戴设备
US20210097995A1 (en) * 2019-09-27 2021-04-01 Tata Consultancy Services Limited Attention shifting of a robot in a group conversation using audio-visual perception based speaker localization
CN112735456A (zh) * 2020-11-23 2021-04-30 西安邮电大学 一种基于dnn-clstm网络的语音增强方法
CN115309357A (zh) * 2022-10-11 2022-11-08 北京铁力山科技股份有限公司 智慧控制台及其信息处理***和方法以及监控大厅
CN116778964A (zh) * 2023-07-21 2023-09-19 东北大学 一种基于声纹识别的变电设备故障监测***及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105704451A (zh) * 2016-02-04 2016-06-22 武克易 一种物联网智能设备的摄像方法
CN106901758A (zh) * 2017-02-23 2017-06-30 南京工程学院 一种基于卷积神经网络的言语置信度评测方法
US20210097995A1 (en) * 2019-09-27 2021-04-01 Tata Consultancy Services Limited Attention shifting of a robot in a group conversation using audio-visual perception based speaker localization
CN111179923A (zh) * 2019-11-22 2020-05-19 广东小天才科技有限公司 一种基于可穿戴设备的音频播放方法及可穿戴设备
CN111103807A (zh) * 2019-12-17 2020-05-05 青岛海信智慧家居***股份有限公司 一种家用终端设备的控制方法及装置
CN111142836A (zh) * 2019-12-28 2020-05-12 深圳创维-Rgb电子有限公司 屏幕朝向角度的调整方法、装置、电子产品及存储介质
CN112735456A (zh) * 2020-11-23 2021-04-30 西安邮电大学 一种基于dnn-clstm网络的语音增强方法
CN115309357A (zh) * 2022-10-11 2022-11-08 北京铁力山科技股份有限公司 智慧控制台及其信息处理***和方法以及监控大厅
CN116778964A (zh) * 2023-07-21 2023-09-19 东北大学 一种基于声纹识别的变电设备故障监测***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张奇, 苏鸿根: "基于高斯混合模型的乐器识别方法", 计算机工程, vol. 30, no. 18, pages 133 - 134 *

Also Published As

Publication number Publication date
CN117193391B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
US20190341058A1 (en) Joint neural network for speaker recognition
EP3614377A1 (en) Object identifying method, computer device and computer readable storage medium
CN102298443B (zh) 结合视频通道的智能家居语音控制***及其控制方法
US11854550B2 (en) Determining input for speech processing engine
EP0702355B1 (en) Speech recognition method and apparatus
US11854566B2 (en) Wearable system speech processing
US20180182375A1 (en) Method, system, and apparatus for voice and video digital travel companion
CN105700682A (zh) 基于视觉和语音的智能性别、情绪识别检测***及方法
US20140372122A1 (en) Determining Word Sequence Constraints for Low Cognitive Speech Recognition
US20140306811A1 (en) System and method for integrating gesture and sound for controlling device
EP3136211A1 (en) Information-processing device, information-processing method, and computer program
CN108877787A (zh) 语音识别方法、装置、服务器及存储介质
CN104778230B (zh) 一种视频数据切分模型的训练、视频数据切分方法和装置
CN103105924B (zh) 人机交互方法和装置
CN111127699A (zh) 汽车缺陷数据自动录入方法、***、设备及介质
CN113129867A (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
KR20230134613A (ko) 멀티 채널 보이스 활동 검출
CN117193391B (zh) 一种智慧控制台角度调整***
CN104598138A (zh) 电子地图控制方法及装置
CN112764530A (zh) 一种基于触控手柄和增强现实眼镜的弹药识别方法
EP4138355A1 (en) In-vehicle voice interaction method and device
KR102291740B1 (ko) 영상처리 시스템
Cabañas-Molero et al. Multimodal speaker diarization for meetings using volume-evaluated SRP-PHAT and video analysis
Gomez et al. Mouth gesture and voice command based robot command interface
KR20210063698A (ko) 전자장치와 그의 제어방법, 및 기록매체

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant