CN117193391A

CN117193391A - 一种智慧控制台角度调整***

Info

Publication number: CN117193391A
Application number: CN202311467757.7A
Authority: CN
Inventors: 石文标
Original assignee: Beijing Tielishan Technology Co ltd
Current assignee: Beijing Tielishan Technology Co ltd
Priority date: 2023-11-07
Filing date: 2023-11-07
Publication date: 2023-12-08
Anticipated expiration: 2043-11-07
Also published as: CN117193391B

Abstract

本发明公开了一种智慧控制台角度调整***，涉及影响设备技术领域，本发明采用声音识别和定位技术，基于音源定位单元和音源识别单元对音源进行识别，采用极坐标表示音源位置，更直观地描述声音源在球坐标系中的位置，针对角度调整的方式，包括指定用户调节模式、单声源模式、多声源协同模式和静音模式，可以按照用户实际使用场景需求进行调整，同时在指定用户调节模式下，根据授权用户的声音识别限制进行音源定位和角度调整，通过分析声音识别模块的输出来确定是否需要进行智慧控制台角度的转动，进行多层次的判定，结合声音源的相对位置、声音的方向信息和持续输出时间，多层次更贴合使用场景的决定何时触发角度调整，提供更精细的用户体验。

Description

一种智慧控制台角度调整***

技术领域

本发明涉及影响设备技术领域，具体为一种智慧控制台角度调整***。

背景技术

智慧控制台（display, screen）是电脑的I/O设备，即输出设备。它是一种将一定的电子文件通过特定的传输设备显示到屏幕上的显示工具。它可以分为阴极射线管智慧控制台（CRT），等离子智慧控制台PDP，液晶智慧控制台LCD 。

但是在现有技术中，对于智慧控制台角度的调节一般需要通过接触性调节进行操控，例如中国专利公开了一种托管架角度调节***，CN105952968A，包括如下步骤：该角度调节***包括第一、第二托管架，角度调节***还包括主推油缸和连杆箱体。其中主推油缸的两侧铰接第一、第二托管架；连杆箱体包括外箱体和套设在外箱体内的内箱体，外箱体和内箱体的一侧分别铰接第一、第二托管架，连杆箱体还包括一锁定装置，锁定装置能够在解锁和锁定状态中切换，在解锁状态下，主推油缸能调整第一、第二托管架之间的角度，以使外箱体和内箱体能相对轴向滑动；在锁定状态下，外箱体和内箱体被相互固定。本发明提供的一种托管架角度调节***能方便调节托管架之间的相对角度，减少人工操作，提高安全性。

虽然上述方案具有如上的优势，但是传统的智慧控制台角度调整***通常需要物理控制器，如遥控器或激光笔，对智慧控制台角度进行调整，便捷性相对较低，同时需要额外的硬件设备，尤其应用在培训、演讲场景上，智慧控制台需要投影到大屏幕，而工作人员需要往复在讲台和显示设备往返，使用体验不佳，因此亟须一种可以无接触对智慧控制台角度进行调节的智慧控制台角度调整***来解决此类问题。

发明内容

（一）解决的技术问题

针对现有技术的不足，本发明提供了一种智慧控制台角度调整***，解决现有技术中存在的接触型角度调节，使用体验不佳的问题。

（二）技术方案

为实现以上目的，本发明通过以下技术方案予以实现，本发明提供了一种智慧控制台角度调整***，其特征在于，包括：

声音识别模块，内置音频输入设备用于采集音频信号，声音识别模块用于识别授权用户的声音，声音识别模块包括AI语音识别单元、音源定位单元和音源识别单元；

所述音源定位单元，对指定用户的音源进行角度定位；

所述音源识别单元，对指定用户的音源进行识别；

角度识别判断模块，根据所述声音识别模块识别的音源信息进行二次分析，基于定位模式进行角度转动判定；

智慧控制台调整模块，用于调整智慧控制台角度和高度，基于角度识别判断模块输出进行判定。

本发明进一步地设置为：所述声音识别模块中，声音识别方式具体为：

从音频输入设备中采集音频信号，设音频信号为离散时间信号x(n)，n代表采样时间；

对音频信号进行预处理增强语音信息，从预处理的语音信号中提取梅尔频率倒谱系数MFCC和声音基本频率；

则MFCC提取计算方式为：

，

其中，X(n,k)为音频信号的频谱信息，N是频谱点数，m是MFCC系数索引；

然后基于卷积神经网络和长短时记忆网络建立AI语音识别模型，并用标记语音数据集训练AI语音识别模型；

本发明进一步地设置为：所述音源定位单元中，具体音源定位方式为：

对音源定位信息进行声音标签预定义，设有N个麦克风即音频输入设备，每个麦克风的位置为，声源位置为/>，声音传播速度为c，则声源到第i个麦克风的距离为/>，则声源方向计算公式为：

；

再选用高斯混合模型GMM和隐马尔可夫模型HMM将识别出的声源信息与预定义的声音标签进行匹配；

本发明进一步地设置为：所述角度识别判断模块中，定位模式包括音源定位判定和AI指令判定；

所述角度识别判断模块中，对声音识别模块识别的音源信息进行二次分析，并基于定位模式来确定需要进行的智慧控制台角度转动；

本发明进一步地设置为：所述定位模式包括：

指定用户调节模式，对授权用户进行语音识别限制，仅对限制范围内的单一用户进行音源识别，基于声音识别模块识别信息进行角度调整；

单声源模式，如果只有一个声源，则根据声音的方向来判断是否需要调整智慧控制台的角度，根据预设阈值进行判定，当声源方向偏离当前智慧控制台角度超过这个阈值时，触发调整；

多声源协同模式，如果有多个声源，对音源角度以及持续输出时间进行分析，根据声源相对位置触发调整；

静音模式，如果没有检测到声音时，智慧控制台保持在当前位置；

本发明进一步地设置为：切换指定用户调节模式时：

所述声音识别模块对授权用户进行语音识别限制，只有授权用户的声音指令才会被识别；

使用声音识别模块进行音源识别，获得声音的方向信息；

基于声音识别模块识别的信息，计算需要进行的角度调整；

切换所述单声源模式时：

使用声音识别模块获得声音的方向信息；

根据预设阈值进行判定，当声源方向偏离当前智慧控制台角度超过阈值时，触发调整；

切换所述多声源协同模式时：

使用声音识别模块获得多个声源的方向信息；

根据声源的相对位置和持续输出时间进行分析，根据声源相对位置触发调整；

本发明进一步地设置为：所述根据声源相对位置触发调整时：

根据声源的相对位置和持续输出时间进行分析，使用声音识别模块检测和追踪多个声源的方向；

针对每个声源，均记录极坐标以及声源的持续输出时间；

如果一个声源位于用户前方，并且另一个声源位于用户侧面，则触发调整智慧控制台角度的调整；

如果两个声源之间的水平夹角大于45°，则触发调整智慧控制台角度的调整；

根据声音识别模块对用户声源进行定位，对角度差进行计算；

确定调整角度差，并触发智慧控制台角度的调整；

本发明进一步地设置为：所述角度识别判断模块中，对声音识别模块所获取的音源信息以极坐标进行表示；

基于定位模式分析的输出结果，确定智慧控制台角度是否转动以及转动角度；

如果定位模式指示需要调整，则计算需要转动的角度，并进行判定；

本发明进一步地设置为：所述极坐标表示方式具体为：

从声音识别模块获取音源的水平角度和垂直角度；

将直角坐标形式的音源位置信息x、y、z坐标转换为极坐标形式r、θ、φ，其中r表示极径即声音源到参考点的距离，θ表示水平角度，φ表示垂直角度；

直角坐标到极坐标的转换公式为：

；

，

其中，x、y、z是声音源的直角坐标，r是声音源到参考点的距离，θ表示水平角度，φ表示垂直角度；

然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置，参考点通常是声音识别***的麦克风位。

（三）有益效果

本发明提供了一种智慧控制台角度调整***。具备以下有益效果：

本申请所提供的智慧控制台角度调整***采用声音识别和定位技术，基于音源定位单元和音源识别单元对音源进行识别，采用极坐标表示音源位置，更直观地描述声音源在球坐标系中的位置，针对角度调整的方式，包括指定用户调节模式、单声源模式、多声源协同模式和静音模式，可以按照用户实际使用场景需求进行调整，灵活地适应不同的使用情境，同时在指定用户调节模式下，根据授权用户的声音识别限制进行音源定位和角度调整，增强了***的安全性和用户个性化。

角度识别判断模块中，通过分析声音识别模块的输出来确定是否需要进行智慧控制台角度的转动，进行多层次的判定，结合声音源的相对位置、声音的方向信息和持续输出时间，使***能够多层次更贴合使用场景的，决定何时触发角度调整，提供更精细的用户体验。

此外智慧控制台调整模块进行智能化，基于角度识别判断模块的输出，该模块进行自动的智慧控制台角度和高度调整，无需用户干预。

解决了现有技术中存在的接触型角度调节，使用体验不佳的问题。

附图说明

图1为本发明的智慧控制台角度调整***框架图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

请参阅图1，本发明提供一种智慧控制台角度调整***，包括：

音源定位单元，对指定用户的音源进行角度定位；

音源识别单元，对指定用户的音源进行识别；

声音识别模块中，声音识别方式具体为：

则MFCC提取计算方式为：

，

音源定位单元中，具体音源定位方式为：

；

角度识别判断模块，根据声音识别模块识别的音源信息进行二次分析，基于定位模式进行角度转动判定；

角度识别判断模块中，定位模式包括音源定位判定和AI指令判定；

角度识别判断模块中，对声音识别模块识别的音源信息进行二次分析，并基于定位模式来确定需要进行的智慧控制台角度转动；

定位模式包括：

切换指定用户调节模式时：

声音识别模块对授权用户进行语音识别限制，只有授权用户的声音指令才会被识别；

使用声音识别模块进行音源识别，获得声音的方向信息；

基于声音识别模块识别的信息，计算需要进行的角度调整；

切换单声源模式时：

使用声音识别模块获得声音的方向信息；

切换多声源协同模式时：

使用声音识别模块获得多个声源的方向信息；

根据声源相对位置触发调整时：

针对每个声源，均记录极坐标以及声源的持续输出时间；

确定调整角度差，并触发智慧控制台角度的调整；

角度识别判断模块中，对声音识别模块所获取的音源信息以极坐标进行表示；

如果定位模式指示需要调整，则计算需要转动的角度，并进行判定，判定具体为：

极坐标表示方式具体为：

从声音识别模块获取音源的水平角度和垂直角度；

直角坐标到极坐标的转换公式为：

；

，

然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置，参考点通常是声音识别***的麦克风位置；

综合以上内容，在本申请中：

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种智慧控制台角度调整***，其特征在于，包括：

所述音源定位单元，对指定用户的音源进行角度定位；

所述音源识别单元，对指定用户的音源进行识别；

2.根据权利要求1所述的一种智慧控制台角度调整***，其特征在于，所述声音识别模块中，声音识别方式具体为：

则MFCC提取计算方式为：

，

然后基于卷积神经网络和长短时记忆网络建立AI语音识别模型，并用标记语音数据集训练AI语音识别模型。

3.根据权利要求1所述的一种智慧控制台角度调整***，其特征在于，所述音源定位单元中，具体音源定位方式为：

；

再选用高斯混合模型GMM和隐马尔可夫模型HMM将识别出的声源信息与预定义的声音标签进行匹配。

4.根据权利要求1所述的一种智慧控制台角度调整***，其特征在于，所述角度识别判断模块中，定位模式包括音源定位判定和AI指令判定；

所述角度识别判断模块中，对声音识别模块识别的音源信息进行二次分析，并基于定位模式来确定需要进行的智慧控制台角度转动。

5.根据权利要求4所述的一种智慧控制台角度调整***，其特征在于，所述定位模式包括：

静音模式，如果没有检测到声音时，智慧控制台保持在当前位置。

6.根据权利要求5所述的一种智慧控制台角度调整***，其特征在于，切换指定用户调节模式时：

使用声音识别模块进行音源识别，获得声音的方向信息；

基于声音识别模块识别的信息，计算需要进行的角度调整；

切换所述单声源模式时：

使用声音识别模块获得声音的方向信息；

切换所述多声源协同模式时：

使用声音识别模块获得多个声源的方向信息；

根据声源的相对位置和持续输出时间进行分析，根据声源相对位置触发调整。

7.根据权利要求6所述的一种智慧控制台角度调整***，其特征在于，所述根据声源相对位置触发调整时：

针对每个声源，均记录极坐标以及声源的持续输出时间；

确定调整角度差，并触发智慧控制台角度的调整。

8.根据权利要求1所述的一种智慧控制台角度调整***，其特征在于，所述角度识别判断模块中，对声音识别模块所获取的音源信息以极坐标进行表示；

如果定位模式指示需要调整，则计算需要转动的角度，并进行判定。

9.根据权利要求8所述的一种智慧控制台角度调整***，其特征在于，所述极坐标表示方式具体为：

从声音识别模块获取音源的水平角度和垂直角度；

直角坐标到极坐标的转换公式为：

；

，

然后基于音源位置信息的极坐标描述声音源在球坐标系中的位置，参考点通常是声音识别***的麦克风位置。