CN116473521B - 疑似环杓关节脱位声音频谱识别方法及*** - Google Patents

疑似环杓关节脱位声音频谱识别方法及*** Download PDF

Info

Publication number
CN116473521B
CN116473521B CN202310736117.5A CN202310736117A CN116473521B CN 116473521 B CN116473521 B CN 116473521B CN 202310736117 A CN202310736117 A CN 202310736117A CN 116473521 B CN116473521 B CN 116473521B
Authority
CN
China
Prior art keywords
dislocation
data
normal
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310736117.5A
Other languages
English (en)
Other versions
CN116473521A (zh
Inventor
钱永军
蒋雯
李宁
王政捷
童琪
孙伊人
杨子淇
徐琦玥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202310736117.5A priority Critical patent/CN116473521B/zh
Publication of CN116473521A publication Critical patent/CN116473521A/zh
Application granted granted Critical
Publication of CN116473521B publication Critical patent/CN116473521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Instructional Devices (AREA)

Abstract

本发明公开了疑似环杓关节脱位声音频谱识别方法及***,包括:采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;对正常声音数据进行音频分析获取正常声音参量;将正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;采集目标病人在取出置入物体后的声音数据作为异常声音数据;将异常声音数据和脱位拟真数据进行比对,并将比对结果作为识别结果。本发明提供了一种不依赖于卷积神经网络的声音识别方案,其所需要的算力较小,非常适用于移动终端使用;同时由于进行识别的方式是通过同一个患者正常声音进行参数提取,可以有效提高最终识别的准确度。

Description

疑似环杓关节脱位声音频谱识别方法及***
技术领域
本发明涉及声音识别技术,具体涉及疑似环杓关节脱位声音频谱识别方法及***。
背景技术
环杓关节由环状软骨的环杓关节面、杓状软骨底面及环杓侧肌、环杓后肌、环杓韧带组成。杓状软骨沿着关节的垂直轴做内、外旋转运动,同时伴向内、外的滑动,共同使两侧的声带突相互靠近或分开,因此使声门开大或缩小。环杓关节脱位会引起不同程度的声音嘶哑甚或失声。声音嘶哑为环杓关节脱位的典型症状,发声以气息声为主,不能大声说话,高音不能,发声费力,易疲劳,说话时甚至可出现气短胸闷。
现有技术中,论文《单侧环杓关节脱位患者嗓音声学分析与VHI_10的相关性研究》公开了对于环杓关节脱位嗓音分析的内容,其研究了环杓关节脱位与Jitter 和 shimmer以及VHI-10之间的相应关系,但是由于不同的患者声带特征都存在差异,所以难以通过常用的卷积神经网络进行训练和识别,同时这种方式也不利于患者在移动端进行自查使用。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供疑似环杓关节脱位声音频谱识别方法及***。
第一方面,本申请实施例提供了疑似环杓关节脱位声音频谱识别方法,包括:
采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
对所述正常声音数据进行音频分析获取正常声音参量;
将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
采集目标病人在取出置入物体后的声音数据作为异常声音数据;
将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
本申请实施例实施时,需要采集目标病人在未发生环杓关节脱位前的声音,即在麻醉气管插管、胃管***等操作前进行声音的采集,该声音数据需要作为后续脱位后声音的识别的参考。对正常声音数据进行音频分析后可以得出多种参数,如共振峰、基音频率、声音噪声数据等等,这些均可以作为正常声音参量。
在本申请实施例中,技术方案主要应用在移动端上,为了减少常用的卷积神经网络模型带来的算力压力,采用了一种基于正常声音参量进行脱位模拟的方案。即通过脱位拟真模型,将正常声音参量转换为不同的脱位情况下可能的脱位拟真数据。应当理解的是,这里的脱位拟真数据是基于正常声音参量生成的脱位后可能的相关参数,如基音频率和声音噪声数据等等。
在本申请实施中,需要后续在病人取出置入物体后,即可能发生环杓关节脱位时采集相应的声音数据。通过对异常声音数据和脱位拟真数据的比对,即可实现对异常声音数据和脱位拟真数据之间差异的识别,以供后续使用。本申请实施例通过上述技术方案,提供了一种不依赖于卷积神经网络的声音识别方案,其所需要的算力较小,非常适用于移动终端使用;同时由于进行识别的方式是通过同一个患者正常声音进行参数提取,可以有效提高最终识别的准确度。
在一种可能的实现方式中,采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据包括:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
在一种可能的实现方式中,对所述正常声音数据进行音频分析获取正常声音参量包括:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
在一种可能的实现方式中,所述脱位拟真模型包括正常模型和脱位模型;
所述正常模型的生成包括:
建立声韧带流体力学模型;所述声韧带流体力学模型包括左侧韧带和右侧韧带,且所述左侧韧带和所述右侧韧带的振动参数可调;
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动参数,并计算在气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为计算基音频率;
根据所述计算基音频率和对应的所述振动参数之间的对应关系建立第一拟真发声函数作为所述正常模型。
在一种可能的实现方式中,所述脱位模型的生成包括:
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动约束条件,并计算在不同气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为脱位基音频率;
根据所述脱位基音频率、对应的所述振动参数和对应的振动约束条件之间的对应关系建立第二拟真发声函数作为所述脱位模型。
在一种可能的实现方式中,将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据包括:
根据所述第一基音频率和所述第二基音频率从所述第一拟真发声函数中选出对应所述第一基音频率和所述第二基音频率之间区间的振动参数区间;
根据所述振动参数区间从所述第二拟真发声函数中选出对应所述振动参数区间的所述脱位基音频率和对应的振动约束条件之间的多组对应关系作为所述脱位拟真数据;每组对应关系对应不同的穿过所述左侧韧带和所述右侧韧带的气流。
在一种可能的实现方式中,所述异常声音数据包括对应第一元音的第一异常数据和对应第二元音的第二异常数据;
将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果包括:
将所述第一异常数据和所述第二异常数据输入所述脱位拟真数据中的多组对应关系,获取多个对应所述第一异常数据的第一输出结果以及多个对应所述第二异常数据的第二输出结果;
选出第一输出结果和第二输出结果中最接近的输出结果作为所述识别结果。
第二方面,本申请实施例提供了疑似环杓关节脱位声音频谱识别***,包括:
第一采集模块,被配置为采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
分析模块,被配置为对所述正常声音数据进行音频分析获取正常声音参量;
脱位拟真模块,被配置为将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
第二采集模块,被配置为采集目标病人在取出置入物体后的声音数据作为异常声音数据;
比对模块,被配置为将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
在一种可能的实现方式中,所述第一采集模块还被配置为:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
在一种可能的实现方式中,所述分析模块还被配置为:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明疑似环杓关节脱位声音频谱识别方法及***,提供了一种不依赖于卷积神经网络的声音识别方案,其所需要的算力较小,非常适用于移动终端使用;同时由于进行识别的方式是通过同一个患者正常声音进行参数提取,可以有效提高最终识别的准确度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本申请实施例方法步骤示意图;
图2为本申请实施例***架构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请实施例的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其它操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本申请保护的范围。
请结合参阅图1,为本发明实施例所提供的疑似环杓关节脱位声音频谱识别方法的流程示意图,所述疑似环杓关节脱位声音频谱识别方法可以应用于图2中的疑似环杓关节脱位声音频谱识别***,进一步地,所述疑似环杓关节脱位声音频谱识别方法具体可以包括以下步骤S1-步骤S5所描述的内容。
S1:采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
S2:对所述正常声音数据进行音频分析获取正常声音参量;
S3:将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
S4:采集目标病人在取出置入物体后的声音数据作为异常声音数据;
S5:将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
本申请实施例实施时,需要采集目标病人在未发生环杓关节脱位前的声音,即在麻醉气管插管、胃管***等操作前进行声音的采集,该声音数据需要作为后续脱位后声音的识别的参考。对正常声音数据进行音频分析后可以得出多种参数,如共振峰、基音频率、声音噪声数据等等,这些均可以作为正常声音参量。
在本申请实施例中,技术方案主要应用在移动端上,为了减少常用的卷积神经网络模型带来的算力压力,采用了一种基于正常声音参量进行脱位模拟的方案。即通过脱位拟真模型,将正常声音参量转换为不同的脱位情况下可能的脱位拟真数据。应当理解的是,这里的脱位拟真数据是基于正常声音参量生成的脱位后可能的相关参数,如基音频率和声音噪声数据等等。
在本申请实施中,需要后续在病人取出置入物体后,即可能发生环杓关节脱位时采集相应的声音数据。通过对异常声音数据和脱位拟真数据的比对,即可实现对异常声音数据和脱位拟真数据之间差异的识别,以供后续使用。本申请实施例通过上述技术方案,提供了一种不依赖于卷积神经网络的声音识别方案,其所需要的算力较小,非常适用于移动终端使用;同时由于进行识别的方式是通过同一个患者正常声音进行参数提取,可以有效提高最终识别的准确度。
在一种可能的实现方式中,采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据包括:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
本申请实施例实施时,为了准确的采集目标病人的声音数据,需要采集两个元音的发音;这两个元音优选为a和u,在发音时,这两个元音对应的声带状态差异较大,可以给予后续识别中更好的差异化识别,提供识别的准确度。
在一种可能的实现方式中,对所述正常声音数据进行音频分析获取正常声音参量包括:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
本申请实施例实施时,可以采用现有技术中的音频分析技术对正常声音数据进行数据分析,进而计算出基音频率,本申请实施例不多做复述。
在一种可能的实现方式中,所述脱位拟真模型包括正常模型和脱位模型;
所述正常模型的生成包括:
建立声韧带流体力学模型;所述声韧带流体力学模型包括左侧韧带和右侧韧带,且所述左侧韧带和所述右侧韧带的振动参数可调;
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动参数,并计算在气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为计算基音频率;
根据所述计算基音频率和对应的所述振动参数之间的对应关系建立第一拟真发声函数作为所述正常模型。
本申请实施例实施时,为了更为数据化的进行拟真分析,将声音数据的分析转换成为了流体分析,即通过声韧带流体力学模型对两侧的声韧带进行模拟。其中声韧带的振动参数可以通过调节声韧带开闭角度和声韧带自身参数进行调节。通过调整该振动参数并进行气流穿过声韧带的仿真计算,可以计算出声韧带的振动频率,从而进一步计算基音频率,生成第一拟真发声函数。
在一种可能的实现方式中,所述脱位模型的生成包括:
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动约束条件,并计算在不同气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为脱位基音频率;
根据所述脱位基音频率、对应的所述振动参数和对应的振动约束条件之间的对应关系建立第二拟真发声函数作为所述脱位模型。
本申请实施例实施时,由于不同的人在进行发音时发音习惯不同,并且声带也有比较大的差异,所以本申请实施例将发声的问题转换为了流体振动的问题进行解决。在脱位模型的仿真计算中,通过调整声韧带的振动约束,即放宽约束的方式进行脱位模拟。应当理解的是,放宽约束的可以是一侧声韧带,也可以是两侧声韧带都放宽了约束。在放宽了约束的情况下,声韧带的振动条件会变的较为复杂,除了声韧带自身的振动以外,还可能会存在声韧带伴随约束的振动,此时气流的变化会对基音频率本身产生影响,所以需要使用不同的气流进行仿真实验获取脱位基音频率。应当理解的是,第二拟真发声函数是一个四参量函数,即气流参数、脱位基音频率、对应的所述振动参数和对应的振动约束条件,这一点是和第一拟真发声函数存在区别的;其中第二拟真发声函数可以是一个函数组,即函数组中每一个函数对应一个气流参数。
在一种可能的实现方式中,将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据包括:
根据所述第一基音频率和所述第二基音频率从所述第一拟真发声函数中选出对应所述第一基音频率和所述第二基音频率之间区间的振动参数区间;
根据所述振动参数区间从所述第二拟真发声函数中选出对应所述振动参数区间的所述脱位基音频率和对应的振动约束条件之间的多组对应关系作为所述脱位拟真数据;每组对应关系对应不同的穿过所述左侧韧带和所述右侧韧带的气流。
本申请实施例实施时,由于元音a和u对应的发声方式差异较大,所以可以根据第一基音频率和所述第二基音频率在第一拟真发声函数中筛选出可能存在的振动参数区间。再通过筛选出的振动参数区间从第二拟真发声函数中选取出不同的气流参数对应的振动约束条件和脱位基音频率直接的关系形成新的函数组作为脱位拟真数据。
在一种可能的实现方式中,所述异常声音数据包括对应第一元音的第一异常数据和对应第二元音的第二异常数据;
将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果包括:
将所述第一异常数据和所述第二异常数据输入所述脱位拟真数据中的多组对应关系,获取多个对应所述第一异常数据的第一输出结果以及多个对应所述第二异常数据的第二输出结果;
选出第一输出结果和第二输出结果中最接近的输出结果作为所述识别结果。
本申请实施例实施时,在具体进行比对的过程中,第一异常数据和第二异常数据同样为基音频率,将这两个异常数据分别输入到脱位拟真数据的函数组中,可以计算出不同气流对应的振动约束条件作为输出结果,即对应第一异常数据的第一输出结果和对应第二异常数据的第二输出结果;由于对于同一个目标病人来说,其环杓关节脱位情况应当是一致的,所以可以选出第一输出结果和第二输出结果中最接近的输出结果作为最终的识别结果。应当理解的是,对于不同的人群,其声带和说话的方式是不同的,哪怕在发同一个音节的时候,其出气量也是有很大差异的,所以在本申请实施例中,通过将声音识别转换为流体计算的方式,可以有效的提高识别准确率。同时,对于人声来说,发声的过程是通过声道和鼻腔联合振动所产生的,声道的变化也会带来声音噪音的变化,所以这个问题是难以通过一般的神经网络学习克服的,即无法规避掉声道变化所产生的振动。而本申请实施例将这个问题转换为流体问题后,可以从基音频率入手进行声带构造的基础分析,进而确定出最终的识别数据。该识别数据会被表征为振动约束条件,可供后续使用。
为了便于对上述的疑似环杓关节脱位声音频谱识别***进行阐述,请结合参考图2,提供了本发明实施例所公开的疑似环杓关节脱位声音频谱识别***的通信架构示意图。其中,疑似环杓关节脱位声音频谱识别***包括:
第一采集模块,被配置为采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
分析模块,被配置为对所述正常声音数据进行音频分析获取正常声音参量;
脱位拟真模块,被配置为将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
第二采集模块,被配置为采集目标病人在取出置入物体后的声音数据作为异常声音数据;
比对模块,被配置为将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
本申请实施例实施时,第一采集模块和第二采集模块可以使用相同的采集模块,具体的,可以使用同一个手机或平板电脑的声音采集模块,而分析模块、脱位拟真模块和比对模块可以采用手机或平板电脑的CPU,也可以采用远程的服务器。
在一种可能的实现方式中,所述第一采集模块还被配置为:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
在一种可能的实现方式中,所述分析模块还被配置为:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显然本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网格设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.疑似环杓关节脱位声音频谱识别方法,其特征在于,包括:
采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
对所述正常声音数据进行音频分析获取正常声音参量;
将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
采集目标病人在取出置入物体后的声音数据作为异常声音数据;
将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
2.根据权利要求1所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据包括:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
3.根据权利要求2所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,对所述正常声音数据进行音频分析获取正常声音参量包括:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
4.根据权利要求3所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,所述脱位拟真模型包括正常模型和脱位模型;
所述正常模型的生成包括:
建立声韧带流体力学模型;所述声韧带流体力学模型包括左侧韧带和右侧韧带,且所述左侧韧带和所述右侧韧带的振动参数可调;
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动参数,并计算气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为计算基音频率;
根据所述计算基音频率和对应的所述振动参数之间的对应关系建立第一拟真发声函数作为所述正常模型。
5.根据权利要求4所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,所述脱位模型的生成包括:
调整所述声韧带流体力学模型中所述左侧韧带和所述右侧韧带的振动约束条件,并计算在不同气流穿过所述左侧韧带和所述右侧韧带时产生的基音频率作为脱位基音频率;
根据所述脱位基音频率、对应的所述振动参数和对应的振动约束条件之间的对应关系建立第二拟真发声函数作为所述脱位模型。
6.根据权利要求5所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据包括:
根据所述第一基音频率和所述第二基音频率从所述第一拟真发声函数中选出对应所述第一基音频率和所述第二基音频率之间区间的振动参数区间;
根据所述振动参数区间从所述第二拟真发声函数中选出对应所述振动参数区间的所述脱位基音频率和对应的振动约束条件之间的多组对应关系作为所述脱位拟真数据;每组对应关系对应不同的穿过所述左侧韧带和所述右侧韧带的气流。
7.根据权利要求6所述的疑似环杓关节脱位声音频谱识别方法,其特征在于,所述异常声音数据包括对应第一元音的第一异常数据和对应第二元音的第二异常数据;
将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果包括:
将所述第一异常数据和所述第二异常数据输入所述脱位拟真数据中的多组对应关系,获取多个对应所述第一异常数据的第一输出结果以及多个对应所述第二异常数据的第二输出结果;
选出第一输出结果和第二输出结果中最接近的输出结果作为所述识别结果。
8.使用权利要求1~7任意一项所述方法的疑似环杓关节脱位声音频谱识别***,其特征在于,包括:
第一采集模块,被配置为采集目标病人在未置入可能产生环杓关节脱位的物体前的声音数据作为正常声音数据;
分析模块,被配置为对所述正常声音数据进行音频分析获取正常声音参量;
脱位拟真模块,被配置为将所述正常声音参量输入脱位拟真模型,生成多个不同脱位情况对应的脱位拟真数据;
第二采集模块,被配置为采集目标病人在取出置入物体后的声音数据作为异常声音数据;
比对模块,被配置为将所述异常声音数据和所述脱位拟真数据进行比对,并将比对结果作为识别结果。
9.根据权利要求8所述的疑似环杓关节脱位声音频谱识别***,其特征在于,所述第一采集模块还被配置为:
采集目标病人在发出第一元音的声音作为第一正常数据,并采集目标病人在发出第二元音的声音作为第二正常数据;所述第一元音采用a,所述第二元音采用u。
10.根据权利要求9所述的疑似环杓关节脱位声音频谱识别***,其特征在于,所述分析模块还被配置为:
对所述第一正常数据进行音频分析,获取对应所述第一正常数据的第一基音频率;并对所述第二正常数据进行音频分析,获取对应所述第二正常数据的第二基音频率。
CN202310736117.5A 2023-06-21 2023-06-21 疑似环杓关节脱位声音频谱识别方法及*** Active CN116473521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310736117.5A CN116473521B (zh) 2023-06-21 2023-06-21 疑似环杓关节脱位声音频谱识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310736117.5A CN116473521B (zh) 2023-06-21 2023-06-21 疑似环杓关节脱位声音频谱识别方法及***

Publications (2)

Publication Number Publication Date
CN116473521A CN116473521A (zh) 2023-07-25
CN116473521B true CN116473521B (zh) 2023-08-18

Family

ID=87227205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310736117.5A Active CN116473521B (zh) 2023-06-21 2023-06-21 疑似环杓关节脱位声音频谱识别方法及***

Country Status (1)

Country Link
CN (1) CN116473521B (zh)

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841800A2 (en) * 1996-11-11 1998-05-13 Instromedix, Inc. Concurrent medical patient data and voice communication method and apparatus
JP2005091727A (ja) * 2003-09-17 2005-04-07 Advanced Telecommunication Research Institute International 音声合成プログラム、音声合成装置および音声合成方法
CN1875877A (zh) * 2006-05-15 2006-12-13 西安交通大学 一种获得声门下压力值及计算发声效率的方法
RU2010114985A (ru) * 2010-04-14 2011-10-20 Государственное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный медицинский Способ эндоскопической медиализации парализованной голосовой складки
CN202198940U (zh) * 2010-04-21 2012-04-25 邱春元 气管插管装置和***
WO2013057637A1 (en) * 2011-10-20 2013-04-25 Koninklijke Philips Electronics N.V. A system and method for characterizing an upper airway using speech characteristics
CN103093759A (zh) * 2013-01-16 2013-05-08 东北大学 一种基于移动终端的嗓音检测评估装置及方法
CN103519785A (zh) * 2013-09-24 2014-01-22 泰亿格电子(上海)有限公司 基于实时语音多维建模的语音障碍多维测量***及其方法
JP2014130227A (ja) * 2012-12-28 2014-07-10 Mie Univ 発声評価装置、発声評価方法、及びプログラム
WO2014178749A1 (ru) * 2013-04-29 2014-11-06 Общество С Ограниченной Ответственностью "Эм Ди Войс" Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа
CA2931662A1 (en) * 2015-11-03 2017-05-03 University Health Network Acoustic upper airway assessment system and method, and sleep apnea assessment system and method relying thereon
CN106999143A (zh) * 2014-12-12 2017-08-01 皇家飞利浦有限公司 声学监测***、监测方法和监测计算机程序
CN108053470A (zh) * 2017-12-28 2018-05-18 昆明医科大学第附属医院 一种基于mri困难气道三维重建方法及应用
CN110074759A (zh) * 2019-04-23 2019-08-02 平安科技(深圳)有限公司 语音数据辅助诊断方法、装置、计算机设备及存储介质
CN110831497A (zh) * 2017-05-05 2020-02-21 瑞思迈私人有限公司 呼吸障碍的筛查、诊断及监测
CN111420208A (zh) * 2009-04-02 2020-07-17 呼吸科技公司 使用外管内的气体传输管嘴进行无创开放式通气的方法、***和装置
CN111816278A (zh) * 2020-06-17 2020-10-23 成都慢乐科技有限公司 一种通过增强现实模拟治疗过程并分析依从性的***及方法
CN112294253A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 一种基于用户语音变化的疾病诊断***及家庭智能机器人
CN212729838U (zh) * 2020-04-13 2021-03-19 中国人民解放军海军特色医学中心 一种监护仪以及监护仪***
CN112562650A (zh) * 2020-10-31 2021-03-26 苏州大学 一种基于声带特征参数的语音识别分类方法
CN213283303U (zh) * 2020-09-04 2021-05-28 四川大学华西医院 环杓关节复位钳
EP3875034A1 (en) * 2020-03-03 2021-09-08 Cordio Medical Ltd. Diagnosis of medical conditions using voice recordings and auscultation
CN114664325A (zh) * 2020-12-24 2022-06-24 沈阳新松机器人自动化股份有限公司 一种异常声音识别方法、***、终端设备及计算机可读存储介质
CN115211873A (zh) * 2022-07-18 2022-10-21 首都医科大学附属北京同仁医院 一种基于喉肌电信号的杓状软骨运动调节***及方法
WO2023047391A1 (en) * 2022-10-19 2023-03-30 Rezaee Mehdi Endotracheal tube with interior multi-layered sputum-collecting sheath

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8394031B2 (en) * 2000-10-06 2013-03-12 Biomedical Acoustic Research, Corp. Acoustic detection of endotracheal tube location
US20080300867A1 (en) * 2007-06-03 2008-12-04 Yan Yuling System and method of analyzing voice via visual and acoustic data
US9589107B2 (en) * 2014-11-17 2017-03-07 Elwha Llc Monitoring treatment compliance using speech patterns passively captured from a patient environment
US20220346725A1 (en) * 2021-04-30 2022-11-03 Medtronic, Inc. Voice-assisted acute health event monitoring

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0841800A2 (en) * 1996-11-11 1998-05-13 Instromedix, Inc. Concurrent medical patient data and voice communication method and apparatus
JP2005091727A (ja) * 2003-09-17 2005-04-07 Advanced Telecommunication Research Institute International 音声合成プログラム、音声合成装置および音声合成方法
CN1875877A (zh) * 2006-05-15 2006-12-13 西安交通大学 一种获得声门下压力值及计算发声效率的方法
CN111420208A (zh) * 2009-04-02 2020-07-17 呼吸科技公司 使用外管内的气体传输管嘴进行无创开放式通气的方法、***和装置
RU2010114985A (ru) * 2010-04-14 2011-10-20 Государственное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный медицинский Способ эндоскопической медиализации парализованной голосовой складки
CN202198940U (zh) * 2010-04-21 2012-04-25 邱春元 气管插管装置和***
WO2013057637A1 (en) * 2011-10-20 2013-04-25 Koninklijke Philips Electronics N.V. A system and method for characterizing an upper airway using speech characteristics
JP2014130227A (ja) * 2012-12-28 2014-07-10 Mie Univ 発声評価装置、発声評価方法、及びプログラム
CN103093759A (zh) * 2013-01-16 2013-05-08 东北大学 一种基于移动终端的嗓音检测评估装置及方法
WO2014178749A1 (ru) * 2013-04-29 2014-11-06 Общество С Ограниченной Ответственностью "Эм Ди Войс" Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа
CN103519785A (zh) * 2013-09-24 2014-01-22 泰亿格电子(上海)有限公司 基于实时语音多维建模的语音障碍多维测量***及其方法
CN106999143A (zh) * 2014-12-12 2017-08-01 皇家飞利浦有限公司 声学监测***、监测方法和监测计算机程序
CA2931662A1 (en) * 2015-11-03 2017-05-03 University Health Network Acoustic upper airway assessment system and method, and sleep apnea assessment system and method relying thereon
CN110831497A (zh) * 2017-05-05 2020-02-21 瑞思迈私人有限公司 呼吸障碍的筛查、诊断及监测
CN108053470A (zh) * 2017-12-28 2018-05-18 昆明医科大学第附属医院 一种基于mri困难气道三维重建方法及应用
CN110074759A (zh) * 2019-04-23 2019-08-02 平安科技(深圳)有限公司 语音数据辅助诊断方法、装置、计算机设备及存储介质
CN112294253A (zh) * 2019-07-26 2021-02-02 深圳百诺明医说科技有限公司 一种基于用户语音变化的疾病诊断***及家庭智能机器人
EP3875034A1 (en) * 2020-03-03 2021-09-08 Cordio Medical Ltd. Diagnosis of medical conditions using voice recordings and auscultation
CN212729838U (zh) * 2020-04-13 2021-03-19 中国人民解放军海军特色医学中心 一种监护仪以及监护仪***
CN111816278A (zh) * 2020-06-17 2020-10-23 成都慢乐科技有限公司 一种通过增强现实模拟治疗过程并分析依从性的***及方法
CN213283303U (zh) * 2020-09-04 2021-05-28 四川大学华西医院 环杓关节复位钳
CN112562650A (zh) * 2020-10-31 2021-03-26 苏州大学 一种基于声带特征参数的语音识别分类方法
CN114664325A (zh) * 2020-12-24 2022-06-24 沈阳新松机器人自动化股份有限公司 一种异常声音识别方法、***、终端设备及计算机可读存储介质
CN115211873A (zh) * 2022-07-18 2022-10-21 首都医科大学附属北京同仁医院 一种基于喉肌电信号的杓状软骨运动调节***及方法
WO2023047391A1 (en) * 2022-10-19 2023-03-30 Rezaee Mehdi Endotracheal tube with interior multi-layered sputum-collecting sheath

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
声谱图在喉科的临床应用;***, 常捷燕, 李宁;《中国医疗前沿》(第12期);6-7 *

Also Published As

Publication number Publication date
CN116473521A (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
Flanagan Speech analysis synthesis and perception
Cernak et al. Characterisation of voice quality of Parkinson’s disease using differential phonological posterior features
Patel et al. Speech recognition and verification using MFCC & VQ
Tran et al. Improvement to a NAM-captured whisper-to-speech system
Baghai-Ravary et al. Automatic speech signal analysis for clinical diagnosis and assessment of speech disorders
US20160314781A1 (en) Computer-implemented method, computer system and computer program product for automatic transformation of myoelectric signals into audible speech
JP2000504849A (ja) 音響学および電磁波を用いた音声の符号化、再構成および認識
CN109727608A (zh) 一种基于中文语音的病态嗓音评估方法
Lulich et al. Subglottal resonances of adult male and female native speakers of American English
Borsky et al. Modal and nonmodal voice quality classification using acoustic and electroglottographic features
Wand et al. The EMG-UKA corpus for electromyographic speech processing.
Kadiri et al. Analysis and Detection of Phonation Modes in Singing Voice using Excitation Source Features and Single Frequency Filtering Cepstral Coefficients (SFFCC).
EP2862169A2 (en) Cepstral separation difference
El Emary et al. Towards developing a voice pathologies detection system
Vijayan et al. Throat microphone speech recognition using mfcc
KR20230017135A (ko) 기계학습 음성기술에 기반한 어려운 기도 평가 방법 및 장치
CN113496696A (zh) 一种基于语音识别的言语功能自动评估***和方法
Usman On the performance degradation of speaker recognition system due to variation in speech characteristics caused by physiological changes
Liao An acoustic study of vowels produced by alaryngeal speakers in Taiwan
Polur et al. Effect of high-frequency spectral components in computer recognition of dysarthric speech based on a Mel-cepstral stochastic model.
CN116473521B (zh) 疑似环杓关节脱位声音频谱识别方法及***
Rodriguez et al. A fuzzy information space approach to speech signal non‐linear analysis
Salas Acoustic coupling in phonation and its effect on inverse filtering of oral airflow and neck surface acceleration
Sharifzadeh Reconstruction of natural sounding speech from whispers
CN114550701A (zh) 一种基于深度神经网络的汉语电子喉语音转换装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Qian Yongjun

Inventor after: Jiang Wen

Inventor after: Li Ning

Inventor after: Wang Zhengjie

Inventor after: Tong Qi

Inventor after: Sun Yiren

Inventor after: Yang Ziqi

Inventor after: Xu Qiyue

Inventor before: Qian Yongjun

Inventor before: Jiang Wen

Inventor before: Li Ning

Inventor before: Wang Zhengjie

Inventor before: Tong Qi

Inventor before: Sun Yiren

Inventor before: Yang Ziqi

Inventor before: Xu Qiyue