CN111599463A - 基于声音认知模型的智能辅助诊断*** - Google Patents
基于声音认知模型的智能辅助诊断*** Download PDFInfo
- Publication number
- CN111599463A CN111599463A CN202010386208.7A CN202010386208A CN111599463A CN 111599463 A CN111599463 A CN 111599463A CN 202010386208 A CN202010386208 A CN 202010386208A CN 111599463 A CN111599463 A CN 111599463A
- Authority
- CN
- China
- Prior art keywords
- voice
- text
- model
- disease
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 67
- 230000019771 cognition Effects 0.000 title claims abstract description 15
- 201000010099 disease Diseases 0.000 claims abstract description 88
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 88
- 239000013598 vector Substances 0.000 claims abstract description 49
- 230000011218 segmentation Effects 0.000 claims abstract description 44
- 230000001149 cognitive effect Effects 0.000 claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 206010011224 Cough Diseases 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 7
- 241000282472 Canis lupus familiaris Species 0.000 claims description 5
- 206010011469 Crying Diseases 0.000 claims description 5
- 208000031361 Hiccup Diseases 0.000 claims description 5
- 208000037656 Respiratory Sounds Diseases 0.000 claims description 5
- 206010041235 Snoring Diseases 0.000 claims description 5
- 208000009205 Tinnitus Diseases 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 5
- 231100000886 tinnitus Toxicity 0.000 claims description 5
- 210000004072 lung Anatomy 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 10
- 238000012216 screening Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 206010016766 flatulence Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 1
- 208000010473 Hoarseness Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明提出了一种基于声音认知模型的智能辅助诊断***。包括:文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。本发明通过空间向量模型结合词向量的方法,来建立语义认知模型,以此开展疾病智能筛查和智能辅助诊断,提高诊断的准确度。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于声音认知模型的智能辅助诊断***。
背景技术
人如其声,声音不仅可以帮助辨别身份,还可以协助检查身体健康状态,提前洞悉身体所患的疾病,声音的变化已经成为其他器官的疾病报警信号。例如,说话时常出现声音沙哑的现象,并且这种现象正在不断严重化,同时还会伴随着间歇性呼吸困难。这一系列的问题说明我们的咽喉部位出现了问题,吸烟严重者可能是喉癌的前兆。
数年来,人们对异常声音事件检测进行了一定的研究,国内外研究人员也在异常声音识别研究领域做了许多尝试,例如,为了同时识别短暂音频和较长音频事件,有人提出了一种用于监控应用的音频事件检测的新方法,有人通过分析音频流来识别车辆在道路行驶过程中的危险情况,比如轮胎打滑或者车祸,从而达到检测道路交通事故的目的,他们的音频事件检测方法主要分为两个部分:首先提取一组能够表征异常声音事件的判别性特征向量,然后利用这些特征表示采用词袋方法来检测短暂异常声音事件和较长异常声音事件。目前来看,这些都是基于声音音频或者音频流来进行监测或者筛查,智能认知的效果有限。所以亟需一种基于声音认知模型的智能辅助诊断***能够精确对声音进行识别,实现对疾病的辅助诊断功能。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于声音认知模型的智能辅助诊断***,旨在解决现有技术无法利用空间向量模型结合分词向量来对声音进行精确认知的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于声音认知模型的智能辅助诊断***,所述基于声音认知模型的智能辅助诊断***包括:
文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
在以上技术方案的基础上,优选的,文本特征提取模块包括自然语言预处理模块,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热。
在以上技术方案的基础上,优选的,文本特征提取模块还包括分词模块,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词。
在以上技术方案的基础上,优选的,声音认知模型建立模块包括相似度计算模块,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型。
在以上技术方案的基础上,优选的,相似度计算模块包括相似度算法单元,所述相似度算法为:
其中,Wik表示相似度,ik表示反向运动,Ci,i=1,2,...m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数。
在以上技术方案的基础上,优选的,辅助诊断模块包括报告生成模块,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
更进一步优选的,所述基于认知云***的血压监护设备包括:
文本特征提取单元,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立单元,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断单元,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
本发明的一种基于声音认知模型的智能辅助诊断***相对于现有技术具有以下有益效果:
(1)通过利用分词加权算法,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性;
(2)通过利用空间向量模型,结合分词向量的方法来建立声音与疾病关系语义相似度认知模型即声音认知模型,能够精确对待诊断声音的文本特征描述进行诊断,及时给出相对应建议,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于声音认知模型的智能辅助诊断***第一实施例的结构框图;
图2为本发明基于声音认知模型的智能辅助诊断***的第二实施例结构框图;
图3为本发明基于声音认知模型的智能辅助诊断***的第三实施例结构框图;
图4为本发明基于声音认知模型的智能辅助诊断***的第四实施例结构框图;
图5为本发明基于声音认知模型的智能辅助诊断***结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于声音认知模型的智能辅助诊断***第一实施例的结构框图。其中,所述基于声音认知模型的智能辅助诊断***包括:文本特征提取模块10、声音认知模型建立模块20、辅助诊断模块30。
文本特征提取模块10,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立模块20,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断模块30,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
进一步地,如图2所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断***的第二实施例结构框图,在本实施例中,文本特征提取模块10还包括:
自然语言预处理模块101,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热;
分词模块102,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词;
需要说明的是,***首先对人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)进行自然语言预处理,提取出能够反映出该类声音特征的文本分词或者短语(例如咳嗽声音类特征有:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作,咳声连续等),提取该特征分词或者短语对应的疾病以及该疾病的征兆描述分词或者短语(比如,咳嗽声音如狗叫,且喉间有白膜,不易剥去,一般可以判定为白喉病等)。
应当理解的是,然后***通过分词或者短句的加权算法,分别在频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上进行权重标注,并对频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上提取到的信息进行融合,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性。
进一步地,如图3所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断***的第三实施例结构框图,在本实施例中,声音认知模型建立模块20还包括:
相似度计算模块201,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型。
相似度计算模块201包括相似度算法单元201',所述相似度算法为:
其中,Wik表示相似度,ik表示反向运动,Ci,i=1,2,…m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数。
应当理解的是,***会利用空间向量模型,结合分词向量的方法来建立声音与疾病关系语义相似度(两个概念之间的特征相似度计算)认知模型,并进行分类,从而完成声音特征的文本认知(包括正常声音和异常声音特征文本以及与之对应疾病的特征文本)建模。
应当理解的是,用类别词描述的方法,对声音和与之对应疾病文本数据进行预处理,提取相应的特征。具体来说,两个概念之间的相似度大小,与两者之间的相同属性的数量有关。相同属性,拥有共同连接的节点多的概念相似度大。人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)以及与每一类别声音对应的疾病特征,可以利用特征项在类别中出现的总频数权重替代以特征项在全部文本中出现的次数权重,为使其更好地区分类别信息,公式如下:
其中,Wik表示相似度,ik表示反向运动即求解结果,Ci,i=1,2,…m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数,nk是包含特征项tk的文本数。
应当理解的是,经预处理后的特征文本数据集(主要是分词或者短句),运用词袋模型表示。将所有分词和短语装进一个袋子里,不考虑其词法和语序的问题,即每个分词和短语都是独立的。例句:Jane wants to go to Shenzhen;Bob wants to go to Shanghai。上面2个例句,就可以构成一个词袋,袋子里包括Jane、wants、to、go、Shenzhen、Bob、Shanghai。假设建立一个数组(或词典)用于映射匹配:[Jane,wants,to,go,Shenzhen,Bob,Shanghai],那么上面两个例句就可以用以下两个向量表示,对应的下标与映射数组的下标相匹配,其值为该词语出现的次数:
[1,1,2,1,1,0,0]和[0,1,2,1,0,1,1]。这两个词频向量就是词袋模型,可以很明显的看到语序关系已经完全丢失;
应当理解的是,通过分词或者短句的加权算法,分别在频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上进行权重标注,并对频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上提取到的信息进行融合,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性。
应当理解的是,根据得到的分词或者短句向量的相似性修改得到的词袋模型的特征词的权重,得到新的文本表示模型。
应当理解的是,对于得到空间向量模型的TFIDF权重矩阵,在该特征词矩阵中,每个特征对应特征空间中的一维,矩阵的行数表示所有待分类的文本数,将每个文本表示成矩阵中的一行,每一列代表一个特征词。这个矩阵中会有很多特征词的TFIDF权重值为零,这些为零的特征权重影响分类的效果。本实施例中考虑使用词向量,提出了对于TFIDF权重为零的特征词,运用词向量查找它的相似词,用这些TFIDF值不为零的相似词的权重值来近似表示这个TFIDF值为零的特征词。具体的实施如下:对于得到的空间向量模型,其对应的TFIDF权重矩阵,其某一行中的某个特征词t,如果它的特征权重Wt为零,可采用:
特征权重Wt用特征词t的相近词t1,t2,t3,...tn的权重Wt1,Wt2,Wt3,...,Wtn来近似表示Wt,至于相似词n的数量可通过控制特征词的相似性阈值m的大小来控制,公式如下:其中,S(t,tn)为特征词t和tn的相似度。
特征权重Wt用特征词t的相近词t1,t2,t3,...tn中最相近词的权重Wi来近似表示Wt,公式如下:Wt=WiS(t,i);其中,S(t,i)为特征词t和特征词i的相似度。
应当理解的是,一类声音***下以及与之对应疾病的具体特征分词文本描述可能很多。就算是一个具体声音下以及与之对应疾病的特征也可能很多。所以,在声音分类或声音特征分词概率设计上,还可以采取特征权重在不同声音类型特征分词或者短语上与疾病文本特征分词或者短语进行加权和建模的方式进行,这样效果会更好一些。具体讲:根据各个疾病权重,计算患病概率。举例:假设:用户自诉声音文本特征分词或者短语符合疾病征兆文本特征分词或者短语:“共同标签1”,“甲标签1”,”丙标签5”,计算患病概率的步骤如下所示:首先计算各个疾病权重。疾病甲权重为1+5=6;疾病乙权重为1;疾病丙权重为1+50=51;总权重:6+1+50=58;然后根据各个疾病权重,计算患病概率。疾病甲概率:6/58=10.3%;疾病乙概率:1/58=1.7%;疾病丙概率:51/58=87.9%。
进一步地,如图4所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断***的第四实施例结构框图,在本实施例中,辅助诊断模块30还包括:
报告生成模块301,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
本地数据更新模块302,用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中,对本地数据库中数据进行更新。
应当理解的是,***会根据用户自诉声音文本描述,***选择符合该描述特征的声音类别特征,并启动认知模型,通过分析用户的声音特征,计算与之对应的疾病分词或者短句的特征相关度和相似度,进行疾病智能辅助诊断,或者智能评估和预测。
应当理解的是,***最后对新的声音认知辅助诊断过程进行考察,将当前声音及辅助诊断的解决结果补充为新知识,并将其存入数据库中,为数据挖掘库增加新的记录,并根据评估和预测结果进一步调整声音特征文本的认知模型和策略,从而实现机器自主学习和增量学习。
应当理解的是,当这种基于声音认知模型辅助诊断用户越来越多时,***积累的经验和案例也就会越多,这样基于声音特征文本的认知能力的策略和模型就更接近完美。认知***越学智能性就越好,就会越接近声音特征文本的认知特点,效果就会越好。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于声音认知模型的智能辅助诊断***,包括:文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。本实施例通过空间向量模型结合词向量的方法,来建立语义认知模型,以此开展疾病智能筛查和智能辅助诊断,提高诊断的准确度。
此外,本发明实施例还提出一种基于声音认知模型的智能辅助诊断设备。如图5所示,该基于声音认知模型的智能辅助诊断设备包括:文本特征提取单元10、声音认知模型建立单元20、辅助诊断单元30。
文本特征提取单元10,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立单元20,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断单元30,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于声音认知模型的智能辅助诊断***,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于声音认知模型的智能辅助诊断***,其特征在于,所述基于声音认知模型的智能辅助诊断***包括:
文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
2.如权利要求1所述的基于声音认知模型的智能辅助诊断***,其特征在于:文本特征提取模块包括自然语言预处理模块,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热。
3.如权利要求2所述的基于声音认知模型的智能辅助诊断***,其特征在于:文本特征提取模块还包括分词模块,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词。
4.如权利要求3所述的基于声音认知模型的智能辅助诊断***,其特征在于:声音认知模型建立模块包括相似度计算模块,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型。
6.如权利要求4所述的基于声音认知模型的智能辅助诊断***,其特征在于:辅助诊断模块包括报告生成模块,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
7.如权利要求6所述的基于声音认知模型的智能辅助诊断***,其特征在于:辅助诊断模块还包括本地数据更新模块,用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中,对本地数据库中数据进行更新。
8.一种基于声音认知模型的智能辅助诊断设备,其特征在于,所述基于声音认知模型的智能辅助诊断设备包括:
文本特征提取单元,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立单元,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断单元,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010386208.7A CN111599463B (zh) | 2020-05-09 | 2020-05-09 | 基于声音认知模型的智能辅助诊断*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010386208.7A CN111599463B (zh) | 2020-05-09 | 2020-05-09 | 基于声音认知模型的智能辅助诊断*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111599463A true CN111599463A (zh) | 2020-08-28 |
CN111599463B CN111599463B (zh) | 2023-07-14 |
Family
ID=72182638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010386208.7A Active CN111599463B (zh) | 2020-05-09 | 2020-05-09 | 基于声音认知模型的智能辅助诊断*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111599463B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112017774A (zh) * | 2020-08-31 | 2020-12-01 | 吾征智能技术(北京)有限公司 | 一种基于口臭伴随症状的疾病预测模型的构建方法及*** |
CN112037818A (zh) * | 2020-08-30 | 2020-12-04 | 北京嘀嘀无限科技发展有限公司 | 异常情况确定方法和正向匹配式生成方法 |
CN112133390A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于电子病历的肝病认知*** |
CN112133391A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知*** |
CN112364070A (zh) * | 2020-09-30 | 2021-02-12 | 北京仿真中心 | 一种工业领域人的数字孪生服务方法和*** |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009065715A (ja) * | 2008-12-10 | 2009-03-26 | Victor Co Of Japan Ltd | 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法 |
JP2010039997A (ja) * | 2008-08-08 | 2010-02-18 | Ricoh Co Ltd | 情報検索装置、情報検索方法、プログラム、および記録媒体 |
WO2011100480A1 (en) * | 2010-02-10 | 2011-08-18 | Brian Lamb | Automatic motion tracking, event detection and video image capture and tagging |
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐***及相应的方法 |
CN107622797A (zh) * | 2017-09-26 | 2018-01-23 | 李涵之 | 一种基于声音的身体状况确定***及方法 |
CN107863147A (zh) * | 2017-10-24 | 2018-03-30 | 清华大学 | 基于深度卷积神经网络的医疗诊断的方法 |
CN108766581A (zh) * | 2018-05-07 | 2018-11-06 | 上海市公共卫生临床中心 | 健康医疗数据的关键信息挖掘方法及辅助诊断*** |
CN109344250A (zh) * | 2018-09-07 | 2019-02-15 | 北京大学 | 基于医保数据的单病种诊断信息快速结构化方法 |
CN109471950A (zh) * | 2018-11-19 | 2019-03-15 | 北京交通大学 | 腹部超声文本数据的结构化知识网络的构建方法 |
CN109697286A (zh) * | 2018-12-18 | 2019-04-30 | 众安信息技术服务有限公司 | 一种基于词向量的诊断标准化方法及装置 |
US20190164283A1 (en) * | 2016-04-13 | 2019-05-30 | Canon Kabushiki Kaisha | Medical diagnosis support apparatus, information processing method, medical diagnosis support system, and program |
CN110619036A (zh) * | 2019-08-25 | 2019-12-27 | 南京理工大学 | 基于改进if-idf算法的全文检索*** |
US20200057807A1 (en) * | 2018-08-20 | 2020-02-20 | Nirveda Cognition, Inc. | Systems and methods providing a cognitive augmented memory network |
-
2020
- 2020-05-09 CN CN202010386208.7A patent/CN111599463B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039997A (ja) * | 2008-08-08 | 2010-02-18 | Ricoh Co Ltd | 情報検索装置、情報検索方法、プログラム、および記録媒体 |
JP2009065715A (ja) * | 2008-12-10 | 2009-03-26 | Victor Co Of Japan Ltd | 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法 |
WO2011100480A1 (en) * | 2010-02-10 | 2011-08-18 | Brian Lamb | Automatic motion tracking, event detection and video image capture and tagging |
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐***及相应的方法 |
US20190164283A1 (en) * | 2016-04-13 | 2019-05-30 | Canon Kabushiki Kaisha | Medical diagnosis support apparatus, information processing method, medical diagnosis support system, and program |
CN107622797A (zh) * | 2017-09-26 | 2018-01-23 | 李涵之 | 一种基于声音的身体状况确定***及方法 |
CN107863147A (zh) * | 2017-10-24 | 2018-03-30 | 清华大学 | 基于深度卷积神经网络的医疗诊断的方法 |
CN108766581A (zh) * | 2018-05-07 | 2018-11-06 | 上海市公共卫生临床中心 | 健康医疗数据的关键信息挖掘方法及辅助诊断*** |
US20200057807A1 (en) * | 2018-08-20 | 2020-02-20 | Nirveda Cognition, Inc. | Systems and methods providing a cognitive augmented memory network |
CN109344250A (zh) * | 2018-09-07 | 2019-02-15 | 北京大学 | 基于医保数据的单病种诊断信息快速结构化方法 |
CN109471950A (zh) * | 2018-11-19 | 2019-03-15 | 北京交通大学 | 腹部超声文本数据的结构化知识网络的构建方法 |
CN109697286A (zh) * | 2018-12-18 | 2019-04-30 | 众安信息技术服务有限公司 | 一种基于词向量的诊断标准化方法及装置 |
CN110619036A (zh) * | 2019-08-25 | 2019-12-27 | 南京理工大学 | 基于改进if-idf算法的全文检索*** |
Non-Patent Citations (2)
Title |
---|
刘端阳;王良芳;: "结合语义扩展度和词汇链的关键词提取算法", 计算机科学, no. 12 * |
李弼程等: "《模式识别原理与应用》", 29 February 2008, 西安电子科技大学出版社, pages: 211 - 213 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112037818A (zh) * | 2020-08-30 | 2020-12-04 | 北京嘀嘀无限科技发展有限公司 | 异常情况确定方法和正向匹配式生成方法 |
CN112017774A (zh) * | 2020-08-31 | 2020-12-01 | 吾征智能技术(北京)有限公司 | 一种基于口臭伴随症状的疾病预测模型的构建方法及*** |
CN112017774B (zh) * | 2020-08-31 | 2023-10-03 | 吾征智能技术(北京)有限公司 | 一种基于口臭伴随症状的疾病预测模型的构建方法及*** |
CN112133390A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于电子病历的肝病认知*** |
CN112133391A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知*** |
CN112133391B (zh) * | 2020-09-17 | 2024-01-26 | 吾征智能技术(北京)有限公司 | 一种基于人体异常眉毛的疾病认知*** |
CN112133390B (zh) * | 2020-09-17 | 2024-03-22 | 吾征智能技术(北京)有限公司 | 一种基于电子病历的肝病认知*** |
CN112364070A (zh) * | 2020-09-30 | 2021-02-12 | 北京仿真中心 | 一种工业领域人的数字孪生服务方法和*** |
CN112364070B (zh) * | 2020-09-30 | 2024-03-22 | 北京仿真中心 | 一种工业领域人的数字孪生服务方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN111599463B (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111599463A (zh) | 基于声音认知模型的智能辅助诊断*** | |
Räsänen | Computational modeling of phonetic and lexical learning in early language acquisition: Existing models and future directions | |
US11862145B2 (en) | Deep hierarchical fusion for machine intelligence applications | |
CN110297908A (zh) | 诊疗方案预测方法及装置 | |
Weber et al. | Models of spoken‐word recognition | |
Yates | The content of awareness is a model of the world. | |
Plunkett | Connectionist approaches to language acquisition | |
Rosen et al. | Automatic speech recognition and a review of its functioning with dysarthric speech | |
Krajewski et al. | Applying multiple classifiers and non-linear dynamics features for detecting sleepiness from speech | |
Moulin-Frier et al. | COSMO (“Communicating about Objects using Sensory–Motor Operations”): A Bayesian modeling framework for studying speech communication and the emergence of phonological systems | |
CN110825881A (zh) | 一种建立电力知识图谱的方法 | |
Räsänen | A computational model of word segmentation from continuous speech using transitional probabilities of atomic acoustic events | |
CN110991190B (zh) | 一种文档主题增强***、文本情绪预测***和方法 | |
CN110110059A (zh) | 一种基于深度学习的医疗对话***意图识别分类方法 | |
KR102174189B1 (ko) | 브이에이이 모델 기반의 반지도 학습을 이용한 음향 정보 인식 방법 및 시스템 | |
Battaglia et al. | Structured cognition and neural systems: from rats to language | |
Metsala et al. | Normal and dyslexic reading development: The role of formal models | |
Zhang et al. | Interaction and Transition Model for Speech Emotion Recognition in Dialogue. | |
Nabé et al. | Cosmo-onset: A neurally-inspired computational model of spoken word recognition, combining top-down prediction and bottom-up detection of syllabic onsets | |
Sarma et al. | Phoneme-based speech segmentation using hybrid soft computing framework | |
Fellenz et al. | On emotion recognition of faces and of speech using neural networks, fuzzy logic and the ASSESS system | |
Srivastava et al. | Hierarchical capsule based neural network architecture for sequence labeling | |
Brannigan | Language processing and the mental representation of syntactic structure | |
Hsieh et al. | A segmentation method for continuous speech utilizing hybrid neuro-fuzzy network | |
Nematzadeh et al. | Interaction of word learning and semantic category formation in late talking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |