CN115223587A - 一种异响检测方法、装置、存储介质及设备 - Google Patents

一种异响检测方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN115223587A
CN115223587A CN202110581768.2A CN202110581768A CN115223587A CN 115223587 A CN115223587 A CN 115223587A CN 202110581768 A CN202110581768 A CN 202110581768A CN 115223587 A CN115223587 A CN 115223587A
Authority
CN
China
Prior art keywords
abnormal sound
initial
category
sound
chinese pinyin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110581768.2A
Other languages
English (en)
Other versions
CN115223587B (zh
Inventor
钱琛
杨权
林尤滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Automobile Group Co Ltd
Original Assignee
Guangzhou Automobile Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Automobile Group Co Ltd filed Critical Guangzhou Automobile Group Co Ltd
Priority to CN202110581768.2A priority Critical patent/CN115223587B/zh
Priority claimed from CN202110581768.2A external-priority patent/CN115223587B/zh
Publication of CN115223587A publication Critical patent/CN115223587A/zh
Application granted granted Critical
Publication of CN115223587B publication Critical patent/CN115223587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种异响检测方法,包括:采集异响声音信息;将所述异响声音信息转换为汉语拼音序列;根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;根据所述声音编码向量获取异响声音检测结果。相应的,本发明还公开了一种异响检测装置、计算机可读存储介质及设备。采用本发明的技术方案克服了人工检测具有偶然性和主观性的缺点,能够解决人工检测引起的易漏检、易误检问题,从而提高异响检测的准确性。

Description

一种异响检测方法、装置、存储介质及设备
技术领域
本发明涉及车辆检测技术领域,尤其涉及一种异响检测方法、装置、计算机可读存储介质及设备。
背景技术
汽车底盘异响是指由底盘零件的自身结构、底盘内部零件之间或底盘内部零件与底盘外部其它零件之间相互作用而产生的引起驾乘人员不舒适的异常声响,其往往是车辆发生进一步损坏的前兆,是汽车开发过程中开发人员经常面对的质量问题,也是汽车售后市场受到投诉的主要问题之一。
底盘异响产生机理多样,传递路径复杂,现有技术对底盘异响进行检测时,一般是将汽车放置在检测场地,检测场地中设有一定深度的检修通道,由检测人员在检修通道内根据人耳及经验判断底盘是否存在异响、存在何种异响,由于异响声音仅能通过人工听诊的方式,并且采用文字如“咔吱咔吱”、“呼隆呼隆”等粗略描述异响声音,而检测人员的个人水平、实际经验的差异势必会给检测结果带来一定的偶然性和主观性,很有可能导致漏检、误检的发生,导致检测结果的准确性较低。
发明内容
本发明实施例所要解决的技术问题在于,提供一种异响检测方法、装置、计算机可读存储介质及设备,克服了人工检测具有偶然性和主观性的缺点,能够解决人工检测引起的易漏检、易误检问题,从而提高异响检测的准确性。
为了解决上述技术问题,本发明实施例提供了一种异响检测方法,包括:
采集异响声音信息;
将所述异响声音信息转换为汉语拼音序列;
根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;
根据所述声音编码向量获取异响声音检测结果。
进一步地,所述将所述异响声音信息转换为汉语拼音序列,具体包括:
将所述异响声音信息转换为汉语拼音描述;
根据声母、韵母对所述汉语拼音描述进行分词,获得所述汉语拼音序列。
进一步地,所述方法通过以下步骤预先获取所述音元分类零矩阵:
根据声母发音位置对汉语拼音中的所有声母进行分类,获得M个声母类别;
根据韵母发音位置对汉语拼音中的所有韵母进行分类,获得N个韵母类别;
根据所述M个声母类别和所述N个韵母类别生成所述音元分类零矩阵OM×N;其中,位于所述音元分类零矩阵OM×N的第i行、第j列的元素所对应的类别为第i个声母类别、第j个韵母类别,i=1,2,…,M,j=1,2,…,N,M>1,N>1。
进一步地,所述M个声母类别包括第1个声母类别~第9个声母类别;其中,
第1个声母类别包括声母y和空声母,
第2个声母类别包括声母b、p和m,
第3个声母类别包括声母f,
第4个声母类别包括声母d和t,
第5个声母类别包括声母z、c和s,
第6个声母类别包括声母n和l,
第7个声母类别包括声母j、q和x,
第8个声母类别包括声母zh、ch、sh和r,
第9个声母类别包括声母g、k、h和w。
进一步地,所述N个韵母类别包括第1个韵母类别~第6个韵母类别;其中,
第1个韵母类别包括单韵母a、o、e、i、u和ü,
第2个韵母类别包括韵母ai、ei、ao和ou,
第3个韵母类别包括韵母ia、ie、ua、uo、ue和er,
第4个韵母类别包括韵母iao、iu、uai和ui,
第5个韵母类别包括韵母an、en、in、un、ian和uan,
第6个韵母类别包括韵母ang、eng、ing、ong、iang、uang、ueng和iong。
进一步地,所述根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,具体包括:
获取所述汉语拼音序列中的每个音元所属的声母类别或韵母类别;
将同一个汉字对应的声母类别和韵母类别作为一组类别索引,根据所述汉语拼音序列对应的每一组类别索引分别查询所述音元分类零矩阵;
对每一组类别索引所对应的所述音元分类零矩阵的元素进行加1处理,获得所述汉语拼音序列对应的音元分类矩阵;
根据所述音元分类矩阵获得所述声音编码向量。
为了解决上述技术问题,本发明实施例还提供了一种异响检测装置,包括:
异响声音信息采集模块,用于采集异响声音信息;
异响拼音序列获取模块,用于将所述异响声音信息转换为汉语拼音序列;
异响声音编码获取模块,用于根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;
异响声音检测模块,用于根据所述声音编码向量获取异响声音检测结果。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一项所述的异响检测方法。
本发明实施例还提供了一种异响检测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一项所述的异响检测方法。
与现有技术相比,本发明实施例提供了一种异响检测方法、装置、计算机可读存储介质及设备,通过采集异响声音信息,并将所述异响声音信息转换为汉语拼音序列,再根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,以及根据所述声音编码向量获取所述异响声音检测结果,克服了人工检测具有偶然性和主观性的缺点,能够解决人工检测引起的易漏检、易误检问题,从而提高异响检测的准确性。
附图说明
图1是本发明提供的一种异响检测方法的一个优选实施例的流程图;
图2是本发明提供的一种异响检测装置的一个优选实施例的结构框图;
图3是本发明提供的一种异响检测设备的一个优选实施例的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本技术领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种异响检测方法,尤其适用于汽车底盘的异响检测,参见图1所示,是本发明提供的一种异响检测方法的一个优选实施例的流程图,所述方法包括步骤S11至步骤S14:
步骤S11、采集的异响声音信息;
步骤S12、将所述异响声音信息转换为汉语拼音序列;
步骤S13、根据所述汉语拼音序列以及预设的音元分类零矩阵,获取异响声音信息对应的声音编码向量;
步骤S14、根据所述声音编码向量获取异响声音检测结果。
在具体实施时,以汽车底盘的异响检测为例,首先,采集汽车底盘产生的异响声音信息,接着,将采集到的异响声音信息转换为相应的汉语拼音序列,并根据转换后的汉语拼音序列以及预先设置的音元分类零矩阵,获得转换后的汉语拼音序列所对应的音元分类矩阵,以将转换后的汉语拼音序列所对应的音元分类矩阵转换为采集到的异响声音信息所对应的声音编码向量,即获得汽车底盘的异响声音描述的编码,相应的,根据转换后的声音编码向量可以获得汽车底盘的异响声音检测结果。
作为上述方案的改进,所述将所述异响声音信息转换为汉语拼音序列,具体包括:
将所述异响声音信息转换为汉语拼音描述;
根据声母、韵母对所述汉语拼音描述进行分词,获得所述汉语拼音序列。
具体的,结合上述实施例,在将采集到的异响声音信息转换为相应的汉语拼音序列时,可以先将采集到的异响声音信息转换为相应的汉语拼音描述,再采用分词技术,根据汉语拼音中的声母和韵母将转换后的汉语拼音描述中的声音和韵母进行拆分处理,获得相应的汉语拼音序列。
需要说明的是,在采集汽车底盘产生的异响声音信息时,可以直接将异响声音信息识别为汉语拼音描述,即采集到的异响声音信息即为汉语拼音描述,无需再次进行汉语拼音转换;例如,可以根据检测人员对底盘异响声音的听感,将异响声音记录为汉语拼音描述,例如,“嗡嗡”记录为“wengweng”。
可以理解的,汉语拼音序列中的音元为汉语拼音描述拆分后的声母和韵母,例如,当采集到的异响声音信息为“嗡嗡”时,对应的汉语拼音描述为“wengweng”,对“wengweng”进行声母、韵母分离,相应获得四个音元,分别为“w”、“eng”、“w”和“eng”,则对应的汉语拼音序列为{w,eng,w,eng}。
在另一个优选实施例中,所述方法通过以下步骤预先获取所述音元分类零矩阵:
根据声母发音位置对汉语拼音中的所有声母进行分类,获得M个声母类别;
根据韵母发音位置对汉语拼音中的所有韵母进行分类,获得N个韵母类别;
根据所述M个声母类别和所述N个韵母类别生成所述音元分类零矩阵OM×N;其中,位于所述音元分类零矩阵OM×N的第i行、第j列的元素所对应的类别为第i个声母类别、第j个韵母类别,i=1,2,…,M,j=1,2,…,N,M>1。
结合上述实施例,本发明实施例预先获取了汉语拼音所对应的音元分类零矩阵以供后续使用,具体的获取步骤如下:由于汉语拼音中的不同的声母、不同的韵母所对应的发音均不相同,而其中有些音元所对应的发音位置比较相似,容易混淆,因此,可以根据声母发音位置将汉语拼音中的所有声母对应划分为M个声母类别,并根据韵母发音位置将汉语拼音中的所有韵母对应划分为N个韵母类别,从而根据划分后的M个声母类别和N个韵母类别生成相应的音元分类零矩阵OM×N
需要说明的是,音元分类零矩阵OM×N即表示汉语拼音的声母、韵母分类情况,音元分类零矩阵OM×N中共有M×N个元素,且这M×N个元素均为0,位于音元分类零矩阵OM×N的第i行、第j列的元素所对应的声母、韵母类别为第i个声母类别、第j个韵母类别,i=1,2,…,M,j=1,2,…,N,M>1。
作为上述方案的改进,所述M个声母类别包括第1个声母类别~第9个声母类别;其中,
第1个声母类别包括声母y和空声母,
第2个声母类别包括声母b、p和m,
第3个声母类别包括声母f,
第4个声母类别包括声母d和t,
第5个声母类别包括声母z、c和s,
第6个声母类别包括声母n和l,
第7个声母类别包括声母j、q和x,
第8个声母类别包括声母zh、ch、sh和r,
第9个声母类别包括声母g、k、h和w。
具体的,结合上述实施例,在根据声母发音位置对声母进行分类时,可以将声母y和空声母对应划分为第1个声母类别(记为编号0);将双唇音声母,包括“b”、“p”、“m”,对应划分为第2个声母类别(记为编号1);将唇齿音声母,包括“f”,对应划分为第3个声母类别(记为编号2);将齿龈音1声母,包括“d”、“t”,对应划分为第4个声母类别(记为编号3);将齿龈音2声母,包括“z”、“c”、“s”,对应划分为第5个声母类别(记为编号4);将齿龈音3声母,包括“n”、“l”,对应划分为第6个声母类别(记为编号5);将龈腭音声母,包括“j”、“q”、“x”,对应划分为第7个声母类别(记为编号6),将卷舌音声母,包括“zh”、“ch”、“sh”、“r”,对应划分为第8个声母类别(记为编号7);将软腭音声母,包括“g”、“k”、“h”、“w”,对应划分为第9个声母类别(记为编号8)。
需要说明的是,第1个声母类别中的空声母即表示对应的汉字没有声母。
作为上述方案的改进,所述N个韵母类别包括第1个韵母类别~第6个韵母类别;其中,
第1个韵母类别包括单韵母a、o、e、i、u和ü,
第2个韵母类别包括韵母ai、ei、ao和ou,
第3个韵母类别包括韵母ia、ie、ua、uo、ue和er,
第4个韵母类别包括韵母iao、iu、uai和ui,
第5个韵母类别包括韵母an、en、in、un、ian和uan,
第6个韵母类别包括韵母ang、eng、ing、ong、iang、uang、ueng和iong。
具体的,结合上述实施例,在根据韵母发音位置对声母进行分类时,可以将单韵母,包括“a”、“o”、“e”、“i”、“u”、“ü”,对应划分为第1个韵母类(记为编号0);将前响复韵母,包括“ai”、“ei”、“ao”、“ou”,对应划分为第2个韵母类别(记为编号1);将后响复韵母,包括“ia”、“ie”、“ua”、“uo”、“ue”、“er”,对应划分为第3个韵母类别(记为编号2);将中响复韵母,包括“iao”、“iu”、“uai”、“ui”,对应划分为第4个韵母类别(记为编号3);将前鼻韵母,包括“an”、“en”、“in”、“un”、“ian”、“uan”,对应划分为第5个韵母类别(记为编号4);将后鼻韵母,包括“ang”、“eng”、“ing”、“ong”、“iang”、“uang”、“ueng”、“iong”,对应划分为第6个韵母类别(记为编号5)。
在又一个优选实施例中,所述根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,具体包括:
获取所述汉语拼音序列中的每个音元所属的声母类别或韵母类别;
将同一个汉字对应的声母类别和韵母类别作为一组类别索引,根据所述汉语拼音序列对应的每一组类别索引分别查询所述音元分类零矩阵;
对每一组类别索引所对应的所述音元分类零矩阵的元素进行加1处理,获得所述汉语拼音序列对应的音元分类矩阵;
根据所述音元分类矩阵获得所述声音编码向量。
具体的,结合上述实施例,在转换获得相应的汉语拼音序列之后,可以结合上述实施例中声母、韵母的分类情况,查询获得汉语拼音序列中的每个音元所属的声母类别或韵母类别,并将同一个汉字所对应的声母类别和韵母类别作为一组类别索引,相应的,汉语拼音序列包括至少一组类别索引,根据汉语拼音序列所对应的每一组类别索引分别查询上述音元分类零矩阵,对每一组类别索引所对应的索引位置指出的上述音元分类零矩阵中的元素进行加1处理,相应获得汉语拼音序列所对应的音元分类矩阵,将获得的音元分类矩阵展开为一维向量,即获得汽车的异响声音信息所对应的声音编码向量。
例如,当采集到的异响声音信息为“嗡嗡”时,对应的汉语拼音描述为“wengweng”,对“wengweng”进行声母、韵母分离,相应获得四个音元,分别为“w”、“eng”、“w”和“eng”,则对应的汉语拼音序列为{w,eng,w,eng},结合上述声母、韵母分类情况,音元“w”对应的类别为第9个声母类别,音元“eng”对应的类别为第6个韵母类别,音元“w”对应的类别为第9个声母类别,音元“eng”对应的类别为第6个韵母类别,将同一个汉字“嗡”所对应的声母类别和韵母类别作为一组类别索引,则汉语拼音序列为{w,eng,w,eng}构成的类别索引共有两组,分别为[第9个声母类别,第6个韵母类别]、[第9个声母类别,第6个韵母类别],对应于上述实施例中的声母类别编号和韵母类别编号,两组类别索引具体为[8,5]和[8,5],查询上述音元分类零矩阵,对第一组类别索引[8,5]所对应的索引位置指出的上述音元分类零矩阵中的第9行、第6列位置处的元素进行加1处理,对第二组类别索引[8,5]所对应的索引位置指出的上述音元分类零矩阵中的第9行、第6列位置处的元素进行加1处理,则相应获得的汉语拼音序列所对应的音元分类矩阵具体为:索引位置为[8,5]的元素的值为2,其余所有元素的值仍为0。
本发明实施例所提供的一种异响检测方法,通过采集汽车底盘的异响声音信息,并将所述异响声音信息转换为汉语拼音序列,再根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,以及根据所述声音编码向量获取所述汽车底盘的异响声音检测结果,克服了人工检测具有偶然性和主观性的缺点,能够解决人工检测引起的易漏检、易误检问题,从而提高汽车底盘异响检测的准确性。
另外,本发明实施例通过采用拼音来描述汽车底盘的异响声音信息,避免了采用汉字描述时多音字导致同一种异响声音对应多种描述的现象;通过将异响声音拼音描述的声母与韵母分离,分别进行分类处理,减少了声音描述的分类情况,有利于提高小样本情况下人工智能模型的精度;通过将容易混淆的声母、韵母分别归为一类,在一定程度上克服了异响声音描述的随机性和主观性,最大限度的提升了异响声音描述信息的有效性;通过声母、韵母类别所对应的音元分类零矩阵以及异响拼音描述中的音元出现的频次,将异响声音描述抽象为人工智能技术所需的编码向量,有效的利用了异响声音描述信息。
本发明实施例还提供了一种异响检测装置,参见图2所示,是本发明提供的一种异响检测装置的一个优选实施例的结构框图,所述装置包括:
异响声音信息采集模块11,用于采集异响声音信息;
异响拼音序列获取模块12,用于将所述异响声音信息转换为汉语拼音序列;
异响声音编码获取模块13,用于根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;
异响声音检测模块14,用于根据所述声音编码向量获取异响声音检测结果。
优选地,所述异响拼音序列获取模块12具体包括:
异响拼音转换单元,用于将所述异响声音信息转换为汉语拼音描述;
异响拼音分词单元,用于根据声母、韵母对所述汉语拼音描述进行分词,获得所述汉语拼音序列。
优选地,所述装置还包括音元分类零矩阵获取模块,用于:
根据声母发音位置对汉语拼音中的所有声母进行分类,获得M个声母类别;
根据韵母发音位置对汉语拼音中的所有韵母进行分类,获得N个韵母类别;
根据所述M个声母类别和所述N个韵母类别生成所述音元分类零矩阵OM×N;其中,位于所述音元分类零矩阵OM×N的第i行、第j列的元素所对应的类别为第i个声母类别、第j个韵母类别,i=1,2,…,M,j=1,2,…,N,M>1,N>1。
优选地,所述M个声母类别包括第1个声母类别~第9个声母类别;其中,
第1个声母类别包括声母y和空声母,
第2个声母类别包括声母b、p和m,
第3个声母类别包括声母f,
第4个声母类别包括声母d和t,
第5个声母类别包括声母z、c和s,
第6个声母类别包括声母n和l,
第7个声母类别包括声母j、q和x,
第8个声母类别包括声母zh、ch、sh和r,
第9个声母类别包括声母g、k、h和w。
优选地,所述N个韵母类别包括第1个韵母类别~第6个韵母类别;其中,
第1个韵母类别包括单韵母a、o、e、i、u和ü,
第2个韵母类别包括韵母ai、ei、ao和ou,
第3个韵母类别包括韵母ia、ie、ua、uo、ue和er,
第4个韵母类别包括韵母iao、iu、uai和ui,
第5个韵母类别包括韵母an、en、in、un、ian和uan,
第6个韵母类别包括韵母ang、eng、ing、ong、iang、uang、ueng和iong。
优选地,所述异响声音编码获取模块13具体包括:
音元类别获取单元,用于获取所述汉语拼音序列中的每个音元所属的声母类别或韵母类别;
类别索引查询单元,用于将同一个汉字对应的声母类别和韵母类别作为一组类别索引,根据所述汉语拼音序列对应的每一组类别索引分别查询所述音元分类零矩阵;
音元分类矩阵获取单元,用于对每一组类别索引所对应的所述音元分类零矩阵的元素进行加1处理,获得所述汉语拼音序列对应的音元分类矩阵;
异响声音编码获取单元,用于根据所述音元分类矩阵获得所述声音编码向量。
需要说明的是,本发明实施例所提供的一种异响检测装置,能够实现上述任一实施例所述的异响检测方法的所有流程,装置中的各个模块、单元的作用以及实现的技术效果分别与上述实施例所述的异响检测方法的作用以及实现的技术效果对应相同,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一实施例所述的异响检测方法。
本发明实施例还提供了一种异响检测设备,参见图3所示,是本发明提供的一种异响检测设备的一个优选实施例的结构框图,所述设备包括处理器10、存储器20以及存储在所述存储器20中且被配置为由所述处理器10执行的计算机程序,所述处理器10在执行所述计算机程序时实现上述任一实施例所述的异响检测方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序1、计算机程序2、······),所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器10执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述设备中的执行过程。
所述处理器10可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器10也可以是任何常规的处理器,所述处理器10是所述设备的控制中心,利用各种接口和线路连接所述设备的各个部分。
所述存储器20主要包括程序存储区和数据存储区,其中,程序存储区可存储操作***、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器20可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器20也可以是其他易失性固态存储器件。
需要说明的是,上述设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,图3结构框图仅仅是上述设备的示例,并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
综上,本发明实施例所提供的一种异响检测方法、装置、计算机可读存储介质及设备,通过采集汽车底盘的异响声音信息,并将所述异响声音信息转换为汉语拼音序列,再根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,以及根据所述声音编码向量获取所述汽车底盘的异响声音检测结果,克服了人工检测具有偶然性和主观性的缺点,能够解决人工检测引起的易漏检、易误检问题,从而提高汽车底盘异响检测的准确性。
另外,还具有以下有益效果:通过采用拼音来描述汽车底盘的异响声音信息,避免了采用汉字描述时多音字导致同一种异响声音对应多种描述的现象;通过将异响声音拼音描述的声母与韵母分离,分别进行分类处理,减少了声音描述的分类情况,有利于提高小样本情况下人工智能模型的精度;通过将容易混淆的声母、韵母分别归为一类,在一定程度上克服了异响声音描述的随机性和主观性,最大限度的提升了异响声音描述信息的有效性;通过声母、韵母类别所对应的音元分类零矩阵以及异响拼音描述中的音元出现的频次,将异响声音描述抽象为人工智能技术所需的编码向量,有效的利用了异响声音描述信息。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (9)

1.一种异响检测方法,其特征在于,包括:
采集异响声音信息;
将所述异响声音信息转换为汉语拼音序列;
根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;
根据所述声音编码向量获取异响声音检测结果。
2.如权利要求1所述的异响检测方法,其特征在于,所述将所述异响声音信息转换为汉语拼音序列,具体包括:
将所述异响声音信息转换为汉语拼音描述;
根据声母、韵母对所述汉语拼音描述进行分词,获得所述汉语拼音序列。
3.如权利要求1所述的异响检测方法,其特征在于,所述方法通过以下步骤预先获取所述音元分类零矩阵:
根据声母发音位置对汉语拼音中的所有声母进行分类,获得M个声母类别;
根据韵母发音位置对汉语拼音中的所有韵母进行分类,获得N个韵母类别;
根据所述M个声母类别和所述N个韵母类别生成所述音元分类零矩阵OM×N;其中,位于所述音元分类零矩阵OM×N的第i行、第j列的元素所对应的类别为第i个声母类别、第j个韵母类别,i=1,2,…,M,j=1,2,…,N,M>1,N>1。
4.如权利要求3所述的异响检测方法,其特征在于,所述M个声母类别包括第1个声母类别~第9个声母类别;其中,
第1个声母类别包括声母y和空声母,
第2个声母类别包括声母b、p和m,
第3个声母类别包括声母f,
第4个声母类别包括声母d和t,
第5个声母类别包括声母z、c和s,
第6个声母类别包括声母n和l,
第7个声母类别包括声母j、q和x,
第8个声母类别包括声母zh、ch、sh和r,
第9个声母类别包括声母g、k、h和w。
5.如权利要求3所述的异响检测方法,其特征在于,所述N个韵母类别包括第1个韵母类别~第6个韵母类别;其中,
第1个韵母类别包括单韵母a、o、e、i、u和ü,
第2个韵母类别包括韵母ai、ei、ao和ou,
第3个韵母类别包括韵母ia、ie、ua、uo、ue和er,
第4个韵母类别包括韵母iao、iu、uai和ui,
第5个韵母类别包括韵母an、en、in、un、ian和uan,
第6个韵母类别包括韵母ang、eng、ing、ong、iang、uang、ueng和iong。
6.如权利要求1~5任一项所述的异响检测方法,其特征在于,所述根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量,具体包括:
获取所述汉语拼音序列中的每个音元所属的声母类别或韵母类别;
将同一个汉字对应的声母类别和韵母类别作为一组类别索引,根据所述汉语拼音序列对应的每一组类别索引分别查询所述音元分类零矩阵;
对每一组类别索引所对应的所述音元分类零矩阵的元素进行加1处理,获得所述汉语拼音序列对应的音元分类矩阵;
根据所述音元分类矩阵获得所述声音编码向量。
7.一种异响检测装置,其特征在于,包括:
异响声音信息采集模块,用于采集异响声音信息;
异响拼音序列获取模块,用于将所述异响声音信息转换为汉语拼音序列;
异响声音编码获取模块,用于根据所述汉语拼音序列以及预设的音元分类零矩阵,获取所述异响声音信息对应的声音编码向量;
异响声音检测模块,用于根据所述声音编码向量获取异响声音检测结果。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1~6任一项所述的异响检测方法。
9.一种异响检测设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1~6任一项所述的异响检测方法。
CN202110581768.2A 2021-05-26 一种异响检测方法、装置、存储介质及设备 Active CN115223587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110581768.2A CN115223587B (zh) 2021-05-26 一种异响检测方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110581768.2A CN115223587B (zh) 2021-05-26 一种异响检测方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN115223587A true CN115223587A (zh) 2022-10-21
CN115223587B CN115223587B (zh) 2024-07-26

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228459A (ja) * 2006-02-27 2007-09-06 Ikegami Tsushinki Co Ltd 監視システム
JP2012048689A (ja) * 2010-08-30 2012-03-08 Secom Co Ltd 異常検知装置
WO2017212645A1 (ja) * 2016-06-10 2017-12-14 株式会社日立製作所 軸受診断装置および軸受診断方法、並びに回転機器およびその保守方法
CN108648760A (zh) * 2018-04-17 2018-10-12 四川长虹电器股份有限公司 实时声纹辨识***与方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228459A (ja) * 2006-02-27 2007-09-06 Ikegami Tsushinki Co Ltd 監視システム
JP2012048689A (ja) * 2010-08-30 2012-03-08 Secom Co Ltd 異常検知装置
WO2017212645A1 (ja) * 2016-06-10 2017-12-14 株式会社日立製作所 軸受診断装置および軸受診断方法、並びに回転機器およびその保守方法
CN108648760A (zh) * 2018-04-17 2018-10-12 四川长虹电器股份有限公司 实时声纹辨识***与方法

Similar Documents

Publication Publication Date Title
CN109243491B (zh) 在频谱上对语音进行情绪识别的方法、***及存储介质
CN109087670B (zh) 情绪分析方法、***、服务器及存储介质
US10522136B2 (en) Method and device for training acoustic model, computer device and storage medium
JP6198872B2 (ja) 聴覚注意手がかりを用いた音声の音節/母音/音素の境界の検出
US11037553B2 (en) Learning-type interactive device
CN110457432B (zh) 面试评分方法、装置、设备及存储介质
CN109192194A (zh) 语音数据标注方法、装置、计算机设备及存储介质
CN110909613A (zh) 视频人物识别方法、装置、存储介质与电子设备
CN109686383B (zh) 一种语音分析方法、装置及存储介质
CN107688790B (zh) 人体行为识别方法、装置、存储介质及电子设备
CN110853648B (zh) 一种不良语音检测方法、装置、电子设备及存储介质
CN103680493A (zh) 区分地域性口音的语音数据识别方法和装置
CN113053410B (zh) 声音识别方法、装置、计算机设备和存储介质
CN112015874A (zh) 学生心理健康陪伴对话***
CN117636872A (zh) 音频处理方法、装置、电子设备和可读存储介质
CN112397073A (zh) 一种音频数据处理方法及装置
CN115223587A (zh) 一种异响检测方法、装置、存储介质及设备
CN116884648A (zh) 基于中医问诊的语音交互优化方法、装置、设备及介质
Sharma et al. Comparative analysis of various feature extraction techniques for classification of speech disfluencies
CN115223587B (zh) 一种异响检测方法、装置、存储介质及设备
AU2021104203A4 (en) Intelligent system & method for recognizing fake speech using artificial intelligence & blockchain technology
US20180268844A1 (en) Syntactic system for sound recognition
CN104217715B (zh) 一种实时语音样本检测方法及***
CN110196981B (zh) 文本表示方法、装置、设备和存储介质
CN113257284B (zh) 语音活动检测模型训练、语音活动检测方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant