CN111816303A - 一种基于机器学习的难治性精神***症风险的预测方法 - Google Patents
一种基于机器学习的难治性精神***症风险的预测方法 Download PDFInfo
- Publication number
- CN111816303A CN111816303A CN202010652270.6A CN202010652270A CN111816303A CN 111816303 A CN111816303 A CN 111816303A CN 202010652270 A CN202010652270 A CN 202010652270A CN 111816303 A CN111816303 A CN 111816303A
- Authority
- CN
- China
- Prior art keywords
- person
- schizophrenia
- refractory
- refractory schizophrenia
- tested
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000031555 Treatment-Resistant Schizophrenia Diseases 0.000 title claims abstract description 110
- 208000029252 treatment-refractory schizophrenia Diseases 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000010801 machine learning Methods 0.000 title claims abstract description 15
- 238000013136 deep learning model Methods 0.000 claims abstract description 26
- 238000007477 logistic regression Methods 0.000 claims abstract description 18
- 230000001575 pathological effect Effects 0.000 claims abstract description 17
- 230000036541 health Effects 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 6
- 238000013210 evaluation model Methods 0.000 claims abstract description 3
- 201000000980 schizophrenia Diseases 0.000 claims description 23
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 14
- 201000010099 disease Diseases 0.000 claims description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 230000003862 health status Effects 0.000 claims description 2
- 238000012502 risk assessment Methods 0.000 abstract description 16
- 230000002068 genetic effect Effects 0.000 abstract description 14
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 abstract description 11
- 238000003745 diagnosis Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- QZUDBNBUXVUHMW-UHFFFAOYSA-N clozapine Chemical compound C1CN(C)CCN1C1=NC2=CC(Cl)=CC=C2NC2=CC=CC=C12 QZUDBNBUXVUHMW-UHFFFAOYSA-N 0.000 description 2
- 229960004170 clozapine Drugs 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 208000028017 Psychotic disease Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 239000000164 antipsychotic agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000003920 cognitive function Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000698 schizophrenic effect Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种基于机器学习的难治性精神***症风险的预测方法,包括获取非难治性和难治性精神***症患者的病理特征指标数据,所述的病理特征指标数据包括SNPs位点分型结果;根据非难治性和难治性精神***症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;获取待测人员的病理特征指标数据,输入到待测人员健康状况的特征评估模型
Description
技术领域
本发明属于难治性精神***症临床诊疗领域,具体涉及一种基于机器学习的难治性精神***症风险的预测方法。
背景技术
难治性精神***症是一种慢性复杂性精神***症,约占精神分类症患者的30%左右。目前难治性精神***症定义不明确,国内外临床实践多依据病程、疗效等指标诊断。排除用药依从性差、治疗方案不当等假性发病因素,难治性精神***症的病因及发病机制复杂,多与遗传因素相关。
传统的诊疗思路会使难治性精神***症患者延误治疗时机,造成患者及家属的心理困扰,亦增加社会负担。因此,早期识别诊断难治性精神***症,及时使用合适方案治疗,控制病情,可获得较大的临床收益和社会收益。有效识别诊断难治性精神***症亦可推动合理选择氯氮平治疗,减少相关临床诊疗不良事件的发生率。随着个体化医疗工作的推进,精神***症的治疗急需一种精准的预测体系,对患者进行遗传风险分层,辅助诊断识别难治性人群,及早有效应用氯氮平,提高治疗有效率,减少不良反应/事件发生。
因此,有必要提供改进的技术方案以克服现有技术中存在的技术问题。
发明内容
为解决现有技术存在的问题,本发明提供一种基于机器学习的难治性精神***症风险的预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
本发明第一方面提供一种基于机器学习的难治性精神***症风险的预测方法,包括以下步骤:
步骤S1、取非难治性和难治性精神***症患者的病理特征指标数据,所述的病理特征指标数据包括SNPs位点分型结果;
步骤S2、根据非难治性和难治性精神***症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;
步骤S3、获取待测人员的病理特征指标数据,所述待测人员的病理特征指标数据包括SNPs位点分型结果,输入到待测人员健康状况的特征评估模型 得到难治性难治性精神***症风险的预测结果;其中,B为待测人员的深度学习模型的评估值、C为待测人员的SNPs位点分型特征的量化值,J为待测人员的逻辑回归模型的量化值,b、c、d取值为-3~3之间,ln()为以e为底数的对数函数;获取待测人员的难治性精神***症风险预测结果;其中,所述的待测人员的病理特征指标数据包括待测人员的深度学习模型的评估值、待测人员的SNPs位点分型特征的量化值和待测人员的逻辑回归模型的量化值。
通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神***症的客观及时的辅助手段,通过基于机器学习的难治性精神***症风险预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
优选地,所述的难治性精神***症风险的预测方法,步骤S2所述的深度学习模型包括卷积神经网络模型和循环神经网络中的一种或两种。通过上述技术方案,通过深度学习模型中卷积神经网络和循环神经网络的优势,构建中国人群的难治性精神***症遗传风险评估体系,可综合评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
优选地,所述的难治性精神***症风险的预测方法,所述的的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、和/或池化层、和/或全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。通过上述技术方案,通过卷积神经网络的参数,构建中国人群的难治性精神***症遗传风险评估体系,快速地输出受检者难治性精神***症的遗传易感风险的有关信息,减少人工计算的时间和成本。
优选地,所述的难治性精神***症风险的预测方法,步骤S2所述的循环神经网络模型包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数。通过上述技术方案,通过设置调整循环神经网络的参数,构建中国人群的难治性精神***症遗传风险评估体系,快速地输出受检者难治性精神***症的遗传易感风险的有关信息,减少人工计算的时间和成本。
优选地,所述的难治性精神***症风险的预测方法,所述的待测人员的SNPs位点分型特征的量化值,是通过对待测人员的SNPs位点分型数据进行RBF神经网络的模型构建后获得。通过上述技术方案,通过设置RBF神经网络模型的搭建,放大待测人员的SNPs位点分型的数据特征,充分有效地输出受检者难治性精神***症的遗传易感风险的有关信息,减少人工计算的时间和成本。
本发明第二方面提供一种人体疾病的检测产品,所述检测产品使用了前述的难治性精神***症风险预测方法。通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神***症的客观及时的辅助手段,通过基于机器学习的难治性精神***症风险预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
本发明第三方面提供一种存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现如前述的难治性精神***症风险预测方法。通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神***症的客观及时的辅助手段,通过基于机器学习的难治性精神***症风险预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
本发明第四方面提供一种电子设备,包括:处理器、及存储器;其中,所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如前所述的难治性精神***症风险的预测方法。
本发明第五方面提供一种基于机器学习的人体健康状况检测装置,所述装置包括:
信号采集模块,用于采集用户的SNPs位点分型结果;
第一确定模块,用于确定所述信号采集模块采集SNPs位点分型结果对应的特征向量;
第二确定模块,用通过所述第一确定模块确定的所述的SNPs位点分型结果对应的特征向量与权利要求1至5中任一权项所述的预测方法确定所述SNPs位点分型结果对应的健康状况信息。
通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神***症的客观及时的辅助手段,通过基于机器学习的难治性精神***症风险预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
本发明创造的有益效果:
目前临床实践中缺少诊断难治性精神***症的客观及时的辅助手段,本申请通过一种基于机器学习的难治性精神***症风险的预测方法,构建中国人群的难治性精神***症遗传风险评估体系,评估受检者难治性精神***症的遗传易感风险,辅助临床及时有效诊疗难治性精神***症。
具体实施方式
下列实施例中未注明具体条件的实验方法,通常按照国家标准测定。若没有相应的国家标准,则按照通用的国际标准、常规条件、或按照制造厂商所建议的条件进行。
可对本发明提到的特征或实施例提到的特征进行组合。本说明书所揭示的所有特征可与任何组合物形式并用,说明书中所揭示的各个特征,可以任何可提供相同、均等或相似目的的替代性特征取代。因此除有特别说明,所揭示的特征仅为均等或相似特征的一般性例子。
在本发明中,如果没有特别的说明,本文所提到的所有技术特征以及优选特征可以相互组合形成新的技术方案。
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明,但本发明包括但不限于这些实施例。
精神***症患者的SNPs(Single nucleotide polymorphism)位点数据的获取方法为:根据Schizophrenia Working Group of the Psychiatric Genomics Consortium(Nature.2014Jul 24;511(7510):421-7.doi:10.1038/nature13595.Epub 2014Jul 22.)等的研究数据,建立候选SNPs位点数据库(位点信息见表1所示),用于评估受检者的精神***症遗传特征,得到SNPs位点分型结果。
表1.位点信息
入组研究对象:本专利以难治性精神***症患者的模拟数据和非难治性精神***症患者对照模拟数据为研究对象。所有研究对象自愿签订伦理委员会批准的知情同意书。精神***症诊断标准:①国际疾病分类标准第10版:精神***诊断标准(ICD-10);②《中国精神病分类与诊断标准》(第2版)修订本精神***症标准(CCMD-2-R);③所有病例均符合上述两个诊断标准,才能入组;④精神病状态量表PANSS评分≥60分。难治性精神***症诊断标准:①符合精神***症诊断保准;②过去5年经过至少2种抗精神病药足量(300~600mg/dCPZ等效剂量)治疗4~6周后,未获临床改善(BPRS总分≥45分,CGI-S≥4分,或者4项阳性症状中,至少2项≥4分)的患者。
样本和临床资料采集:取外周静脉血5ml,-20度保存。收集精神***症患者年龄、性别、家族史等一般资料、首次入院和确诊时间、临床症状、认知功能等和用药史相关的资料。
所收集样本全部使用全外显子测序技术(illumina测序平台)进行基因分型检测,根据结果整理数据库位点的基因分型及其得分数据,作为受检者的遗传特诊指标数据。
实施例1.一种难治性精神***症的深度学习模型的构建方法
本实施例主要描述一种难治性精神***症的深度学习模型的构建方法。所述的的深度学习模型的构建方法包括SNPs位点分型结果的卷积神经网络模型和循环神经网络的构建两个部分。
SNPs位点分型结果的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、和/或池化层、和/或全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。
SNPs位点分型结果的深度卷积神经网络识别模型的具体设置参数如下:
a.输入卷积层:输入数据为SNPs位点分型结果,卷积层有3个,第一卷积层的卷积核有3个,卷积核的尺寸是2,卷积层的步长是1。池化层采用的是最大池化法,池化层的步长是2。第二卷积层的卷积核12个,卷积核的尺寸是2。池化层采用的是最大池化法,卷积层的步长是1。第三卷积层的卷积核有3个,卷积核的尺寸是2,卷积层的步长是1。池化层采用的是最大池化法,池化层的步长是2。
b.激活层:设置激活函数为Relu激活函数。
c.Dropout:在每次训练时都断开一定百分比数值的神经元用于防止数据过拟合,提高泛化能力。
d.全连接层:全连接层有1个。
SNPs位点分型结果的循环神经网络的构建
SNPs位点分型结果的循环神经网络包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数;其它的参数和通用的LSTM模型的参数相同。循环神经网络的输出结果采用softmax函数得到预测结果。softmax函数的预测结果和实际的SNPs位点分型结果的难治性精神***症标签进行分析,用交叉熵函数得到损失函数。用优化器不断地减小损失,得到最终的预测模型。
为了综合评价深度学习分类模型的性能,本实施例采用难治性精神***症检测的准确度、灵敏度和特异度指标来衡量获取的训练优化后的深度学习模型,在训练优化后的深度学习模型中,输入大量已知标签的样本数据,输出相关的判定结果。根据深度学习模型输出的判定结果,来检测深度学习模型的准确度、灵敏度和特异度的情况;对难治性精神***症的深度学习模型的应用性能和不足进行综合评判和优化,完成对难治性精神***症的深度学习模型的建立。
深度学习模型的检测结果的准确度、灵敏度和特异度的定义具体如下:
准确度=(真阳性样本数+真阴性样本数)/(真阳性样本数+假阳性样本数+真阴性样本数+假阴性样本数);
灵敏度=真阳性样本数/(真阳性样本数+假阴性样本数);
特异度=真阴性样本数/(真阴性样本数+假阳性样本数);
其中,真阳性样本数表示实际患难治性精神***症并被检测为患难治性精神***症的样本数;假阳性样本数表示实际未患难治性精神***症而被检测为患难治性精神***症的样本数;真阴性样本数表示实际未患难治性精神***症并被检测为未患难治性精神***症的样本数;假阴性样本数表示实际患难治性精神***症而被检测为未患难治性精神***症的样本数;对于难治性精神***症深度学习模型,三个指标越高,代表该模型对于难治性精神***症预测性能越好,模型效果越优。
通过以上方式,获得优化后的深度学习分类模型,发明人选用了1000个样本模拟数据,对构建的难治性精神***症深度学习模型进行评价,获得SNPs位点分型结果的难治性精神***症深度学习模型的实验数据,具体如表1所示;实验结果表明,SNPs位点分型结果的难治性精神***症深度学习模型的准确度为93.1%,敏感度为98.4%,特异度为97.8%;是性能出色的深度学习判定模型。
表2.难治性精神***症深度学习模型的性能评价
分别采集非难治性和难治性精神***症病人的深度学习判定模型的输出结果,获取特定人体疾病检测阈值。对不同的深度学习判定模型的输出结果赋以不同的量化值0~10,用以反映疾病的严重程度:0为非难治性精神***症患者,10为难治性精神***症患者。
实施例2.一种人体脑电动力学数据的功率谱特征的提取方法
本实施例主要构建一种人体脑电动力学数据的功率谱特征的提取方法,所述的提取方法为:
通过功率谱分析方法提取人体脑电动力学数据的功率谱特征,具体通过以下步骤进行:
步骤0:获取样本人群的脑电数据[ei(t),t=1,2,…T],并将脑电数据[ei(t),t=1,2,…T]转化为脑电向量数据[vi(t),vi∈R3,t=1,2,…T]。然后,将脑电向量数据进行RBF神经网络的模型构建:采用动态RBF神经网络辨识器对脑电向量数据的内在***动态进行局部准确神经网络逼近;得到脑电动力学数据[xi(t),xi∈R3,t=1,2,…T],具体为:其中,S(X(t))、S(Y(t))和S(Z(t))都是高斯径向基函数;和是通过常值神经网络的权重向量。
步骤1:通过既定的公认有效的快速傅里叶变换方法分别将每一维度的人体脑电动力学数据xi(t),xi(t)∈R1,t=1,2,…,T,i=1,2,3转化成频域信息fi(n),f∈R3,n=1,2,…,N,i=1,2,3,N为采样频率;
步骤2:将步骤1获取的fi(n)进行功率谱分析:
步骤3:分别采集非难治性和难治性精神***症病人的功率谱特征获取特定人体疾病检测阈值。
步骤4:对不同的功率谱图赋以不同的量化值0~10,用以反映疾病的严重程度:0为健康人,10为特定疾病重度患者。
实施例3.一种难治性精神***症风险评估逻辑回归模型的构建方法
本实施例提供一种难治性精神***症风险评估逻辑回归模型的构建方法,具体为:获取非难治性和难治性精神***症人的数据特征的临界诊断值,通过以下方法获得:纳入N个临床已知健康个体(N>5000)以及M个临床已知难治性精神***症个体(M>5000)作为测试样本人群,采集测试样本人群的脑电数据,获得脑电动力学数据。通过实施例3所述的的功率谱特征的提取方法提取脑电动力学数据的数据特征;然后获取所有个体的脑电动力学数据的数据特征值,进行基于概率的统计学分类(何贤英,赵志,温兴煊,等.Logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定.中国卫生统计,2015,32(2):275-277.),得到预设的难治性精神***症风险评估逻辑回归模型。对逻辑回归模型的输出结果,以不同的量化值0~10,用以反映疾病的严重程度:0为健康人,10为特定疾病重度患者。
实施例4.一种难治性精神***症风险评估逻辑回归模型的构建方法
本实施例提供一种难治性精神***症风险评估逻辑回归模型的构建方法,具体为:获取非难治性和难治性精神***症人的SNPs位点分型结果的临界诊断值,通过以下方法获得:纳入N个临床已知健康个体(N>5000)以及M个临床已知难治性精神***症个体(M>5000)作为测试样本人群,采集测试样本人群的SNPs位点分型结果,获得测试样本的数据特征,进行基于概率的统计学分类(何贤英,赵志,温兴煊,等.Logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定.中国卫生统计,2015,32(2):275-277.),得到预设的难治性精神***症风险评估逻辑回归模型。
实施例5.一种难治性精神***症风险的判别方法
本实施例主要解决如何对难治性精神***症风险进行判定识别的问题。本实施例提供一种难治性精神***症风险的判别方法,具体为:
采集200例待测人员(100例难治性精神***症患者和100例非难治性精神***症患者)的健康状况数据,计算待测人员健康状况的特征评估值H=(B+c×C)÷(d×ln(j)),B为深度学习模型的评估值(通过实施例1计算获得)、C为脑电动力学特征的量化值(通过实施例2计算获得),J为逻辑回归模型的量化值(通过实施例3、和/或实施例4计算获得),b、c、d取值为-3~3之间,ln()为以e为底数的对数函数;最终,经实验将参数进行赋值:b赋值为1,c赋值为-1,d赋值为0.5,得到100例难治性精神***症患者的健康状况的特征评估值接近1.18,100例健康人的健康状况的特征评估值接近7.09,将待测人员的健康状况的特征评估值输入到预设的难治性精神***症风险评估逻辑回归模型中进行阈值判定,得到100例难治性精神***症患者的评估结果为难治性精神***症,100例健康人的评估结果为非难治性精神***症患者。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (9)
1.一种基于机器学习的难治性精神***症风险的预测方法,其特征在于,包括以下步骤:
步骤S1、获取非难治性和难治性精神***症患者的病理特征指标数据,所述病理特征指标数据包括SNPs位点分型结果;
步骤S2、根据非难治性和难治性精神***症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;
2.根据权利要求1所述预测方法,其特征在于,步骤S2所述深度学习模型为卷积神经网络模型和循环神经网络。
3.根据权利要求2所述预测方法,其特征在于所述的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、池化层和全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。
4.根据权利要求2所述预测方法,其特征在于,步骤S2所述循环神经网络模型包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数。
5.根据权利要求2所述预测方法,其特征在于,所述待测人员的SNPs位点分型特征的量化值,是通过对待测人员的脑电向量数据进行RBF神经网络的模型构建后获得。
6.一种人体疾病的检测产品,其特征在于,所述检测产品使用了权利要求1-5任一权项所述预测方法。
7.一种存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,执行如权利要求1至5中任一权项所述预测方法。
8.一种电子设备,其特征在于,包括:处理器、及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如权利要求1至5中任一权项所述预测方法。
其中,所述处理器用于通过传感器采集用户的SNPs位点分型结果,接着通过权利要求1至5中任一权项所述预测方法确定采集用户的健康状况。
9.一种基于机器学习的人体健康状况检测装置,其特征在于,所述装置包括:
信号采集模块,用于采集用户的SNPs位点分型结果;
第一确定模块,用于确定所述信号采集模块采集SNPs位点分型结果对应的特征向量;
第二确定模块,用通过所述第一模块确定的所述SNPs位点分型结果对应的特征向量与权利要求1至5中任一权项所述预测方法确定所述SNPs位点分型结果对应的健康状况信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010652270.6A CN111816303B (zh) | 2020-07-08 | 2020-07-08 | 一种基于机器学习的难治性精神***症风险的预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010652270.6A CN111816303B (zh) | 2020-07-08 | 2020-07-08 | 一种基于机器学习的难治性精神***症风险的预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111816303A true CN111816303A (zh) | 2020-10-23 |
CN111816303B CN111816303B (zh) | 2024-03-29 |
Family
ID=72842957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010652270.6A Active CN111816303B (zh) | 2020-07-08 | 2020-07-08 | 一种基于机器学习的难治性精神***症风险的预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111816303B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113930538A (zh) * | 2021-11-02 | 2022-01-14 | 华南农业大学 | 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建 |
CN114708965A (zh) * | 2022-06-06 | 2022-07-05 | 安徽讯飞医疗股份有限公司 | 诊断推荐方法及装置、电子设备和存储介质 |
RU2819816C1 (ru) * | 2022-12-29 | 2024-05-24 | Федеральное государственное бюджетное научное учреждение "Томский национальный исследовательский медицинский центр Российской академии наук" | Мультиплексный набор маркеров как инструмент для разработки генетического тестирования подверженности к шизофрении, алкоголизму и связи с особенностями личности в молодом и умственными способностями в пожилом возрасте |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020077756A1 (en) * | 1999-11-29 | 2002-06-20 | Scott Arouh | Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation |
US20100285455A1 (en) * | 2007-06-15 | 2010-11-11 | The Feinstein Institute Medical Research | Prediction of schizophrenia risk using homozygous genetic markers |
WO2011076783A2 (en) * | 2009-12-22 | 2011-06-30 | Integragen | A method for evaluating a risk for a transmissible neuropsychiatric disorder |
CN102137938A (zh) * | 2008-07-04 | 2011-07-27 | 解码遗传学私营有限责任公司 | 预测精神***症的风险的拷贝数变异 |
CN104866732A (zh) * | 2014-02-21 | 2015-08-26 | 北京协力润华科技有限责任公司 | 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用 |
CN105279369A (zh) * | 2015-09-06 | 2016-01-27 | 苏州协云和创生物科技有限公司 | 一种基于二代测序的冠心病遗传风险评估方法 |
CN108172296A (zh) * | 2018-01-23 | 2018-06-15 | 上海其明信息技术有限公司 | 一种数据库的建立方法和遗传疾病的风险预测方法 |
CN110111848A (zh) * | 2019-05-08 | 2019-08-09 | 南京鼓楼医院 | 一种基于rnn-cnn神经网络融合算法的人体周期表达基因识别方法 |
CN110363177A (zh) * | 2019-07-23 | 2019-10-22 | 上海图灵医疗科技有限公司 | 一种人体生物电信号混沌特征的提取方法 |
CN110444270A (zh) * | 2019-08-01 | 2019-11-12 | 重庆邮电大学 | 一种基于rbf神经网络的闭环dbs控制方法 |
CN111128298A (zh) * | 2019-12-24 | 2020-05-08 | 大连海事大学 | 一种基于深度学习模型获取多基因风险评分的方法及*** |
-
2020
- 2020-07-08 CN CN202010652270.6A patent/CN111816303B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020077756A1 (en) * | 1999-11-29 | 2002-06-20 | Scott Arouh | Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation |
US20100285455A1 (en) * | 2007-06-15 | 2010-11-11 | The Feinstein Institute Medical Research | Prediction of schizophrenia risk using homozygous genetic markers |
CN102137938A (zh) * | 2008-07-04 | 2011-07-27 | 解码遗传学私营有限责任公司 | 预测精神***症的风险的拷贝数变异 |
WO2011076783A2 (en) * | 2009-12-22 | 2011-06-30 | Integragen | A method for evaluating a risk for a transmissible neuropsychiatric disorder |
CN104866732A (zh) * | 2014-02-21 | 2015-08-26 | 北京协力润华科技有限责任公司 | 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用 |
CN105279369A (zh) * | 2015-09-06 | 2016-01-27 | 苏州协云和创生物科技有限公司 | 一种基于二代测序的冠心病遗传风险评估方法 |
CN108172296A (zh) * | 2018-01-23 | 2018-06-15 | 上海其明信息技术有限公司 | 一种数据库的建立方法和遗传疾病的风险预测方法 |
CN110111848A (zh) * | 2019-05-08 | 2019-08-09 | 南京鼓楼医院 | 一种基于rnn-cnn神经网络融合算法的人体周期表达基因识别方法 |
CN110363177A (zh) * | 2019-07-23 | 2019-10-22 | 上海图灵医疗科技有限公司 | 一种人体生物电信号混沌特征的提取方法 |
CN110444270A (zh) * | 2019-08-01 | 2019-11-12 | 重庆邮电大学 | 一种基于rbf神经网络的闭环dbs控制方法 |
CN111128298A (zh) * | 2019-12-24 | 2020-05-08 | 大连海事大学 | 一种基于深度学习模型获取多基因风险评分的方法及*** |
Non-Patent Citations (1)
Title |
---|
岳伟华;康国莲;张瀚迪;汤富磊;曲梅;韩永华;闫俊;阮燕;卢天兰;张岱;: "精神***症与神经调节素1、G72及G-蛋白信号转导调节子4基因的关联研究", 中国行为医学科学, no. 05, pages 39 - 41 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113930538A (zh) * | 2021-11-02 | 2022-01-14 | 华南农业大学 | 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建 |
CN113930538B (zh) * | 2021-11-02 | 2024-01-23 | 华南农业大学 | 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建 |
CN114708965A (zh) * | 2022-06-06 | 2022-07-05 | 安徽讯飞医疗股份有限公司 | 诊断推荐方法及装置、电子设备和存储介质 |
CN114708965B (zh) * | 2022-06-06 | 2023-03-28 | 安徽讯飞医疗股份有限公司 | 诊断推荐方法及装置、电子设备和存储介质 |
RU2819816C1 (ru) * | 2022-12-29 | 2024-05-24 | Федеральное государственное бюджетное научное учреждение "Томский национальный исследовательский медицинский центр Российской академии наук" | Мультиплексный набор маркеров как инструмент для разработки генетического тестирования подверженности к шизофрении, алкоголизму и связи с особенностями личности в молодом и умственными способностями в пожилом возрасте |
Also Published As
Publication number | Publication date |
---|---|
CN111816303B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Dual channel LSTM based multi-feature extraction in gait for diagnosis of Neurodegenerative diseases | |
CN111524602A (zh) | 一种老年人记忆及认知功能评估筛查预警*** | |
TWI701681B (zh) | 心房顫動預測模型及其預測系統 | |
CN111816303B (zh) | 一种基于机器学习的难治性精神***症风险的预测方法 | |
CN114023441A (zh) | 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法 | |
CN112331340B (zh) | 育龄夫妇妊娠概率的智能预测方法及*** | |
CN112967803A (zh) | 基于集成模型的急诊患者早期死亡率预测方法及*** | |
EP3764904A1 (en) | Systems and methods for neuro-behavioral relationships in dimensional geometric embedding (n-bridge) | |
CN116864104A (zh) | 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级*** | |
Maulana et al. | Performance analysis and feature extraction for classifying the severity of atopic dermatitis diseases | |
Shahmoradi et al. | Predicting risk of acute appendicitis: A comparison of artificial neural network and logistic regression models | |
Piñeros-Fernández | Artificial intelligence applications in the diagnosis of neuromuscular diseases: a narrative review | |
Alotaibi et al. | Early prediction of gestational diabetes using machine learning techniques | |
Deepa et al. | Experimental evaluation of artificial intelligence assisted heart disease prediction using deep learning principle | |
CN114864086A (zh) | 一种基于肺功能报告模板的疾病预测方法 | |
US20220262516A1 (en) | Atrial Fibrillation Prediction Model And Prediction System Thereof | |
TWI641963B (zh) | Method for screening coronary heart disease by cardiovascular marker and mechanical learning algorithm | |
WO2021256784A1 (ko) | 환자의 성별에 따른 치매 위험 인자를 이용한 치매 예측 방법 및 장치 | |
Jusman et al. | Comparison Performance of Prostate Cell Images Classification using Pretrained Convolutional Neural Network Models | |
JP7333549B2 (ja) | 疾病リスク評価方法、疾病リスク評価システム、及び健康情報処理装置 | |
CN114250288B (zh) | Dna甲基化特征和前脉冲抑制特征在精神***症诊断中的应用 | |
Zhang et al. | Sequential representation of clinical data for full-fitting survival prediction | |
WO2022250143A1 (ja) | 疾病リスク評価方法、疾病リスク評価システム、及び健康情報処理装置 | |
CN109841279A (zh) | 一种预测失能者日常生活功能的方法 | |
KR20240075102A (ko) | 골다공증 위험도 예측 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |