CN116473521B

CN116473521B - 疑似环杓关节脱位声音频谱识别方法及***

Info

Publication number: CN116473521B
Application number: CN202310736117.5A
Authority: CN
Inventors: 钱永军; 蒋雯; 李宁; 王政捷; 童琪; 孙伊人; 杨子淇; 徐琦玥
Original assignee: West China Hospital of Sichuan University
Current assignee: West China Hospital of Sichuan University
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-08-18
Anticipated expiration: 2043-06-21
Also published as: CN116473521A

Abstract

本发明公开了疑似环杓关节脱位声音频谱识别方法及***，包括：采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据；对正常声音数据进行音频分析获取正常声音参量；将正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据；采集目标病人在取出置入物体后的声音数据作为异常声音数据；将异常声音数据和脱位拟真数据进行比对，并将比对结果作为识别结果。本发明提供了一种不依赖于卷积神经网络的声音识别方案，其所需要的算力较小，非常适用于移动终端使用；同时由于进行识别的方式是通过同一个患者正常声音进行参数提取，可以有效提高最终识别的准确度。

Description

疑似环杓关节脱位声音频谱识别方法及***

技术领域

本发明涉及声音识别技术，具体涉及疑似环杓关节脱位声音频谱识别方法及***。

背景技术

环杓关节由环状软骨的环杓关节面、杓状软骨底面及环杓侧肌、环杓后肌、环杓韧带组成。杓状软骨沿着关节的垂直轴做内、外旋转运动，同时伴向内、外的滑动，共同使两侧的声带突相互靠近或分开，因此使声门开大或缩小。环杓关节脱位会引起不同程度的声音嘶哑甚或失声。声音嘶哑为环杓关节脱位的典型症状，发声以气息声为主，不能大声说话，高音不能，发声费力，易疲劳，说话时甚至可出现气短胸闷。

现有技术中，论文《单侧环杓关节脱位患者嗓音声学分析与VHI_10的相关性研究》公开了对于环杓关节脱位嗓音分析的内容，其研究了环杓关节脱位与Jitter 和 shimmer以及VHI-10之间的相应关系，但是由于不同的患者声带特征都存在差异，所以难以通过常用的卷积神经网络进行训练和识别，同时这种方式也不利于患者在移动端进行自查使用。

发明内容

为了至少克服现有技术中的上述不足，本申请的目的在于提供疑似环杓关节脱位声音频谱识别方法及***。

第一方面，本申请实施例提供了疑似环杓关节脱位声音频谱识别方法，包括：

采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据；

对所述正常声音数据进行音频分析获取正常声音参量；

将所述正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据；

采集目标病人在取出置入物体后的声音数据作为异常声音数据；

将所述异常声音数据和所述脱位拟真数据进行比对，并将比对结果作为识别结果。

本申请实施例实施时，需要采集目标病人在未发生环杓关节脱位前的声音，即在麻醉气管插管、胃管***等操作前进行声音的采集，该声音数据需要作为后续脱位后声音的识别的参考。对正常声音数据进行音频分析后可以得出多种参数，如共振峰、基音频率、声音噪声数据等等，这些均可以作为正常声音参量。

在本申请实施例中，技术方案主要应用在移动端上，为了减少常用的卷积神经网络模型带来的算力压力，采用了一种基于正常声音参量进行脱位模拟的方案。即通过脱位拟真模型，将正常声音参量转换为不同的脱位情况下可能的脱位拟真数据。应当理解的是，这里的脱位拟真数据是基于正常声音参量生成的脱位后可能的相关参数，如基音频率和声音噪声数据等等。

在本申请实施中，需要后续在病人取出置入物体后，即可能发生环杓关节脱位时采集相应的声音数据。通过对异常声音数据和脱位拟真数据的比对，即可实现对异常声音数据和脱位拟真数据之间差异的识别，以供后续使用。本申请实施例通过上述技术方案，提供了一种不依赖于卷积神经网络的声音识别方案，其所需要的算力较小，非常适用于移动终端使用；同时由于进行识别的方式是通过同一个患者正常声音进行参数提取，可以有效提高最终识别的准确度。

在一种可能的实现方式中，采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据包括：

采集目标病人在发出第一元音的声音作为第一正常数据，并采集目标病人在发出第二元音的声音作为第二正常数据；所述第一元音采用a，所述第二元音采用u。

在一种可能的实现方式中，对所述正常声音数据进行音频分析获取正常声音参量包括：

对所述第一正常数据进行音频分析，获取对应所述第一正常数据的第一基音频率；并对所述第二正常数据进行音频分析，获取对应所述第二正常数据的第二基音频率。

在一种可能的实现方式中，所述脱位拟真模型包括正常模型和脱位模型；

所述正常模型的生成包括：

建立声韧带流体力学模型；所述声韧带流体力学模型包括左侧韧带和右侧韧带，且所述左侧韧带和所述右侧韧带的振动参数可调；

调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动参数，并计算在气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为计算基音频率；

根据所述计算基音频率和对应的所述振动参数之间的对应关系建立第一拟真发声函数作为所述正常模型。

在一种可能的实现方式中，所述脱位模型的生成包括：

调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动约束条件，并计算在不同气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为脱位基音频率；

根据所述脱位基音频率、对应的所述振动参数和对应的振动约束条件之间的对应关系建立第二拟真发声函数作为所述脱位模型。

在一种可能的实现方式中，将所述正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据包括：

根据所述第一基音频率和所述第二基音频率从所述第一拟真发声函数中选出对应所述第一基音频率和所述第二基音频率之间区间的振动参数区间；

根据所述振动参数区间从所述第二拟真发声函数中选出对应所述振动参数区间的所述脱位基音频率和对应的振动约束条件之间的多组对应关系作为所述脱位拟真数据；每组对应关系对应不同的穿过所述左侧韧带和所述右侧韧带的气流。

在一种可能的实现方式中，所述异常声音数据包括对应第一元音的第一异常数据和对应第二元音的第二异常数据；

将所述异常声音数据和所述脱位拟真数据进行比对，并将比对结果作为识别结果包括：

将所述第一异常数据和所述第二异常数据输入所述脱位拟真数据中的多组对应关系，获取多个对应所述第一异常数据的第一输出结果以及多个对应所述第二异常数据的第二输出结果；

选出第一输出结果和第二输出结果中最接近的输出结果作为所述识别结果。

第二方面，本申请实施例提供了疑似环杓关节脱位声音频谱识别***，包括：

第一采集模块，被配置为采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据；

分析模块，被配置为对所述正常声音数据进行音频分析获取正常声音参量；

脱位拟真模块，被配置为将所述正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据；

第二采集模块，被配置为采集目标病人在取出置入物体后的声音数据作为异常声音数据；

比对模块，被配置为将所述异常声音数据和所述脱位拟真数据进行比对，并将比对结果作为识别结果。

在一种可能的实现方式中，所述第一采集模块还被配置为：

在一种可能的实现方式中，所述分析模块还被配置为：

本发明与现有技术相比，具有如下的优点和有益效果：

本发明疑似环杓关节脱位声音频谱识别方法及***，提供了一种不依赖于卷积神经网络的声音识别方案，其所需要的算力较小，非常适用于移动终端使用；同时由于进行识别的方式是通过同一个患者正常声音进行参数提取，可以有效提高最终识别的准确度。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为本申请实施例方法步骤示意图；

图2为本申请实施例***架构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请实施例的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其它操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例，都属于本申请保护的范围。

请结合参阅图1，为本发明实施例所提供的疑似环杓关节脱位声音频谱识别方法的流程示意图，所述疑似环杓关节脱位声音频谱识别方法可以应用于图2中的疑似环杓关节脱位声音频谱识别***，进一步地，所述疑似环杓关节脱位声音频谱识别方法具体可以包括以下步骤S1-步骤S5所描述的内容。

S1：采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据；

S2：对所述正常声音数据进行音频分析获取正常声音参量；

S3：将所述正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据；

S4：采集目标病人在取出置入物体后的声音数据作为异常声音数据；

S5：将所述异常声音数据和所述脱位拟真数据进行比对，并将比对结果作为识别结果。

本申请实施例实施时，为了准确的采集目标病人的声音数据，需要采集两个元音的发音；这两个元音优选为a和u，在发音时，这两个元音对应的声带状态差异较大，可以给予后续识别中更好的差异化识别，提供识别的准确度。

本申请实施例实施时，可以采用现有技术中的音频分析技术对正常声音数据进行数据分析，进而计算出基音频率，本申请实施例不多做复述。

所述正常模型的生成包括：

本申请实施例实施时，为了更为数据化的进行拟真分析，将声音数据的分析转换成为了流体分析，即通过声韧带流体力学模型对两侧的声韧带进行模拟。其中声韧带的振动参数可以通过调节声韧带开闭角度和声韧带自身参数进行调节。通过调整该振动参数并进行气流穿过声韧带的仿真计算，可以计算出声韧带的振动频率，从而进一步计算基音频率，生成第一拟真发声函数。

在一种可能的实现方式中，所述脱位模型的生成包括：

本申请实施例实施时，由于不同的人在进行发音时发音习惯不同，并且声带也有比较大的差异，所以本申请实施例将发声的问题转换为了流体振动的问题进行解决。在脱位模型的仿真计算中，通过调整声韧带的振动约束，即放宽约束的方式进行脱位模拟。应当理解的是，放宽约束的可以是一侧声韧带，也可以是两侧声韧带都放宽了约束。在放宽了约束的情况下，声韧带的振动条件会变的较为复杂，除了声韧带自身的振动以外，还可能会存在声韧带伴随约束的振动，此时气流的变化会对基音频率本身产生影响，所以需要使用不同的气流进行仿真实验获取脱位基音频率。应当理解的是，第二拟真发声函数是一个四参量函数，即气流参数、脱位基音频率、对应的所述振动参数和对应的振动约束条件，这一点是和第一拟真发声函数存在区别的；其中第二拟真发声函数可以是一个函数组，即函数组中每一个函数对应一个气流参数。

本申请实施例实施时，由于元音a和u对应的发声方式差异较大，所以可以根据第一基音频率和所述第二基音频率在第一拟真发声函数中筛选出可能存在的振动参数区间。再通过筛选出的振动参数区间从第二拟真发声函数中选取出不同的气流参数对应的振动约束条件和脱位基音频率直接的关系形成新的函数组作为脱位拟真数据。

本申请实施例实施时，在具体进行比对的过程中，第一异常数据和第二异常数据同样为基音频率，将这两个异常数据分别输入到脱位拟真数据的函数组中，可以计算出不同气流对应的振动约束条件作为输出结果，即对应第一异常数据的第一输出结果和对应第二异常数据的第二输出结果；由于对于同一个目标病人来说，其环杓关节脱位情况应当是一致的，所以可以选出第一输出结果和第二输出结果中最接近的输出结果作为最终的识别结果。应当理解的是，对于不同的人群，其声带和说话的方式是不同的，哪怕在发同一个音节的时候，其出气量也是有很大差异的，所以在本申请实施例中，通过将声音识别转换为流体计算的方式，可以有效的提高识别准确率。同时，对于人声来说，发声的过程是通过声道和鼻腔联合振动所产生的，声道的变化也会带来声音噪音的变化，所以这个问题是难以通过一般的神经网络学习克服的，即无法规避掉声道变化所产生的振动。而本申请实施例将这个问题转换为流体问题后，可以从基音频率入手进行声带构造的基础分析，进而确定出最终的识别数据。该识别数据会被表征为振动约束条件，可供后续使用。

为了便于对上述的疑似环杓关节脱位声音频谱识别***进行阐述，请结合参考图2，提供了本发明实施例所公开的疑似环杓关节脱位声音频谱识别***的通信架构示意图。其中，疑似环杓关节脱位声音频谱识别***包括：

本申请实施例实施时，第一采集模块和第二采集模块可以使用相同的采集模块，具体的，可以使用同一个手机或平板电脑的声音采集模块，而分析模块、脱位拟真模块和比对模块可以采用手机或平板电脑的CPU，也可以采用远程的服务器。

在一种可能的实现方式中，所述第一采集模块还被配置为：

在一种可能的实现方式中，所述分析模块还被配置为：

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显然本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网格设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.疑似环杓关节脱位声音频谱识别方法，其特征在于，包括：

对所述正常声音数据进行音频分析获取正常声音参量；

2.根据权利要求1所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据包括：

3.根据权利要求2所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，对所述正常声音数据进行音频分析获取正常声音参量包括：

4.根据权利要求3所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，所述脱位拟真模型包括正常模型和脱位模型；

所述正常模型的生成包括：

调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动参数，并计算气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为计算基音频率；

5.根据权利要求4所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，所述脱位模型的生成包括：

6.根据权利要求5所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，将所述正常声音参量输入脱位拟真模型，生成多个不同脱位情况对应的脱位拟真数据包括：

7.根据权利要求6所述的疑似环杓关节脱位声音频谱识别方法，其特征在于，所述异常声音数据包括对应第一元音的第一异常数据和对应第二元音的第二异常数据；

8.使用权利要求1~7任意一项所述方法的疑似环杓关节脱位声音频谱识别***，其特征在于，包括：

9.根据权利要求8所述的疑似环杓关节脱位声音频谱识别***，其特征在于，所述第一采集模块还被配置为：

10.根据权利要求9所述的疑似环杓关节脱位声音频谱识别***，其特征在于，所述分析模块还被配置为：