CN112489769B - 基于深度神经网络的慢性病智慧中医诊断与药物推荐*** - Google Patents
基于深度神经网络的慢性病智慧中医诊断与药物推荐*** Download PDFInfo
- Publication number
- CN112489769B CN112489769B CN201910776695.5A CN201910776695A CN112489769B CN 112489769 B CN112489769 B CN 112489769B CN 201910776695 A CN201910776695 A CN 201910776695A CN 112489769 B CN112489769 B CN 112489769B
- Authority
- CN
- China
- Prior art keywords
- neural network
- module
- deep neural
- chinese medicine
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 145
- 238000003745 diagnosis Methods 0.000 title claims abstract description 38
- 208000017667 Chronic Disease Diseases 0.000 title claims abstract description 29
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 25
- 208000024891 symptom Diseases 0.000 claims abstract description 38
- 229940079593 drug Drugs 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000003062 neural network model Methods 0.000 claims abstract description 32
- 239000013610 patient sample Substances 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 39
- 238000007781 pre-processing Methods 0.000 claims description 36
- 230000011218 segmentation Effects 0.000 claims description 35
- 238000011176 pooling Methods 0.000 claims description 28
- 239000000523 sample Substances 0.000 claims description 26
- 238000013527 convolutional neural network Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 15
- 238000013079 data visualisation Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000011282 treatment Methods 0.000 abstract description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 9
- 230000036541 health Effects 0.000 abstract description 9
- 201000010099 disease Diseases 0.000 abstract description 8
- 238000004092 self-diagnosis Methods 0.000 abstract description 7
- 230000001684 chronic effect Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000032683 aging Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011369 optimal treatment Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Alternative & Traditional Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,包括中医病症读取模块,用于读取获得患者样本的症状信息;本发明通过构建存储患者样本的症状信息和得到的药物信息的数据库模块;利用中医病症读取模块,用于读取获得患者样本的症状信息,并通过深度神经网络模型,对输入信息进行预测并得到相关药物的分类结果形成预测信息;进而通过药物推荐模块推荐药物,实现慢性病的智慧中医诊断与药物推荐,辅助医生进行诊疗,尤其是辅助医师为病人提供最佳处置方法,节约费用成本;能够提升病情诊断精确率、减少死亡率,缓解医院压力等;帮助慢性病患者实现一定程度上的自我诊疗,节省国家医疗资源,提升全民健康水平。
Description
技术领域
本发明属于智慧医疗技术领域,具体为一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。
背景技术
我国人口老龄化形势严峻,庞大的老龄人口导致养老保障负担严重、医疗卫生费用支出增大,社会养老服务需求膨胀,给社会发展带来深远影响。老年人群健康问题突出。另一方面,老年慢性病患者的病情也给其照顾者带来了一定的负担。有研究表明,“大部分照顾者存在不同程度的经济、社会、生理和心理负担”。因此,数量庞大且不断增长的老年慢性病群体的医疗问题是老龄化难题中不可忽视的问题之一,给我国的医疗卫生服务体系带来了巨大的难题,探索出符合中国国情需要的老年慢性病服务内容和模式迫在眉睫。
中医对于慢性疾病其并发症的防治具有独特的优势和丰富的实践经验,其整体观念、辨证论治的理念对治疗和预后以及防治并发症、改善生活质量等方面意义重大。但是,我国中医的发展主要面临三个问题:中医的学习成本高,传承难度远远高于西医;中医缺乏像西医一样科学的理论体系;中医医疗机构数量少,医师资源匮乏。人工智能技术通过研究或制造具有人类智能的***或者机器,使其更好地帮助人类工作,从而创造社会价值。随着计算机计算能力的提升以及人工智能科学理论的完善,人工智能技术取得了长足的进步,基于人工智能的医疗诊断方法也成为全世界学者的研究热点。智能诊疗通过量化重要的临床指标的诊断可以帮助医生在广泛的医疗专业提高诊断的准确性,有助于提高医疗服务质量。越来越多不同领域的学者们开始运用信息化的技术手段来研究中医这一门知识含量极为丰富和复杂的学科,使得中医在不同学科中能够更好地互相交流与推广,为中医智能辩证问题提供了新的解决方案,对中医辩证辨病分析、中西医关联关系挖掘以及构建中医智能医疗***具有十分重要的意义。
为此,发明人基于深度神经网络构建深度智慧机器学习模型以解决慢性病诊断和药物推荐的技术性问题,创造性地提出一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。
发明内容
本发明的目的在于:为了解决背景技术涉及的技术问题,提供一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。
本发明采用的技术方案如下:
一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,包括中医病症读取模块,用于读取获得患者样本的症状信息;
数据预处理模块,用于读取到的症状信息进行数据预处理;
数据库模块,用于存储患者样本的症状信息和得到的药物信息;
深度神经网络模型,用于对输入信息进行预测并得到相关药物的分类结果形成预测信息;
药物推荐模块,用于结合深度神经网络模型的预测信息以及数据库模块存储的患者样本的症状信息和得到的药物信息分析计算得出推荐药物;
数据可视化模块,用于可视化显示推荐药物。
作为本发明进一步技术方案,所述中医病症读取模块支持多种数据储存形式。
作为本发明再进一步技术方案,所述数据预处理模块对读取到的症状信息进行数据预处理,数据预处理过程包括文本分词、去停用词和文本向量化,其中,文本分词利用分词工具分词后,再加入词典库进行扩充;并利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合;
其中去停用词,利用库剔除掉分词结果中包含的停用词获得利用停用词表的结果;
其中,文本向量化利用训练的word2vec训练的模型生成。
作为本发明再进一步技术方案,所述数据库模块选用MySQL数据库,存储数据预处理模块预处理后的症状信息和分类信息数据,同时存储不同药物的信息。
作为本发明再进一步技术方案,深度神经网络模型为VGGNet卷积神经网络结构模型;其中VGGNet卷积神经网络中采用三个Inception模块代替了卷积层来进行特征的提取,最后一个池化层由原来的最大值池化变为空间金字塔池化,模型总共23层;其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。
作为本发明再进一步技术方案,深度神经网络模型中采用批量梯度下降算法,其表达式如下:
式中,batch代表批次的大小,采用矩阵的方式进行运算,每次利用一个batchsize数据样本的损失函数之和对权重进行更新;
每次输入的数量即batch size设为8,初始模型的学习率learning rage为0.001,模型完成一次对练集所有图像的训练后称为完成的一个epoch训练,一共训练了30个epoch,学习率的调整策略为multistp,stepvalue为20个epochs,即在完成第20个epochs的时候学习率下降一次;
深度神经网络模型中目标函数选择改进的交叉熵损失函数:
J(θ;Is,ys)=Lc+ω*LR
其中Lc为分类项损失函数,通过交叉熵实现;LR为区域项损失函数,通过Dice损失函数实现;Is,ys分别为训练数据中输入变量;xv表示概率特征向量的位置;表示概率特征向量输出;p1表示对应输出的概率;ω用来调节两个损失之间的比例,优选的,ω为3。
深度神经网络模型中从第二卷积层开始添加了一个dropout层,神经网络在训练过程中每次迭代以一定概率随机抛弃不同部分的神经元,dropout率p=0.2;
深度神经网络模型中激活函数为sig_ReLU函数,该激活函数将sigmoid激活函数和ReLU激活函数相结合;其表达式如下:
作为本发明再进一步技术方案,深度神经网络模型还包括训练***,训练***通过训练集进行训练,模型训练完成后在验证集上测试模型的识别精度,并通过模型的Tanimoto系数精度进行评价,多次逻辑判断循环训练,满足精度要求。
作为本发明再进一步技术方案,所述药物推荐模块是多接口的模块,推荐的药物发送给数据可视化模块。
作为本发明再进一步技术方案,所述数据可视化模块将预测结果以数据表格的结果呈现。
作为本发明再进一步技术方案,所述数据表格的第一行为推荐的药物名称,第一列为样本名称,数字1是为该样本推荐该药物,数字0则是该样本不需要对应药物。
本发明的基于深度学习智能中医药物推荐方法,包括以下步骤:
步骤1:对数据集中患者病症数据进行预处理;
步骤2:用训练样本训练卷积神经网络;
步骤3:利用训练好的卷积神经网络模型对测试样本进行预测得到最终预测结果。
具体地,步骤1中对数据集中的患者病症数据进行预处理,先将数据集中的患者病症数据分成训练样本和测试样本,然后进行文本分词、去停用词和文本向量化。针对非结构化的文本时,预处理过程中需要添加一步非结构化文本文本的解析过程。文本分词利用分词工具分词后,再加入一些典型的词典库进行扩充。利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合。去停用词步骤利用库剔除掉分词结果中包含的停用词便是利用停用词表的结果。文本向量化利用训练的word2vec训练的模型生成。
具体地,步骤2中,用训练样本训练卷积神经网络,卷积神经网络结构如图4所示,在VGGNet的基础上用三个Inception模块代替了卷积层来进行特征的提取,最后一个池化层由原来的最大值池化变为空间金字塔池化,模型总共23层。其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。用步骤1预处理后的训练集对卷积神经网络进行训练,网络对底层的向量进行多次卷积、最大值池化和inception后,经过金字塔池化和3个全连接层后得到了包含病症特征的feature map,每个卷积层对与编码网络中的卷积层相对应,用sig_ReLU作为激活函数进行输出。最后将卷积输出特征用softmax转换成预测结果。
在完成前2个步骤的模型训练后,就可以进行步骤3,对需要测试的慢性病患者进行预测。对病症数据进行预处理,然后先使用卷积神经网络进行预测,整个过程不仅完全自动化,而且速度快。
本发明提出的慢性病智能中医辩证与药物推荐***,主要包括:中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块、数据可视化模块和数据库模块。
中医病症中医病症读取模块获得患者样本的症状信息;数据预处理模块对读取到的症状信息进行数据预处理,包括:文本分词、去停用词和文本向量化;深度神经网络模型模块,对输入信息进行预测,得到每个药物的分类结果,进而得到推荐药物;这三个模块都与数据库相连,数据库模块存储患者样本的症状信息和得到的药物信息,通过融合症状信息和药物的信息,能够通过药物推荐模块为需要诊疗的患者提供智能药物推荐,帮助患者实现一定程度上的自我诊疗,提高国民的普遍健康水平,节省国家医疗资源。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明提供一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,本发明通过构建存储患者样本的症状信息和得到的药物信息的数据库模块;利用中医病症读取模块,用于读取获得患者样本的症状信息,并通过深度神经网络模型,对输入信息进行预测并得到相关药物的分类结果形成预测信息;进而通过药物推荐模块,结合深度神经网络模型的预测信息以及数据库模块存储的患者样本的症状信息和得到的药物信息分析计算得出推荐药物,实现慢性病的智慧中医诊断与药物推荐,辅助医生进行诊疗,尤其是辅助医师为病人提供最佳处置方法,节约费用成本;能够提升病情诊断精确率、减少死亡率,缓解医院压力等;帮助慢性病患者实现一定程度上的自我诊疗,节省国家医疗资源,提升全民健康水平。
2、本发明中深度神经网络模型构建全面,智能化程度高,模型处理效率高,预测结果准确度高。
3、本发明进一步所述数据可视化模块将预测结果以数据表格的结果呈现;所述数据表格的第一行为推荐的药物名称,第一列为样本名称,数字1是为该样本推荐该药物,数字0则是该样本不需要对应药物,直观清楚显示预测结果。
4、本发明进一步设置数据预处理模块,对读取到的症状信息进行数据预处理,数据预处理过程包括文本分词、去停用词和文本向量化,文本分词利用分词工具分词后,再加入词典库进行扩充;并利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合;去停用词,利用库剔除掉分词结果中包含的停用词获得利用停用词表的结果;文本向量化利用训练的word2vec训练的模型生成;预处理效果好,便于后续预测分析。
附图说明
图1为本发明的***架构框图;
图2为本发明中训练***的模型设计图;
图3为本发明中sig-ReLU激活函数图;
图4为本发明中深度神经网络模型的网络结构图;
图5为本发明中可视化预测结果数据图表。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明提出的慢性病智能中医辩证与药物推荐***,主要包括:中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块、数据可视化模块和数据库模块。
上述数据中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块和数据可视化模块依次相连,上述数据预处理模块、深度神经网络模块、药物推荐模块分别与数据库模块相连。
中医病症中医病症读取模块获得患者样本的症状信息;数据预处理模块对读取到的症状信息进行数据预处理,包括:文本分词、去停用词和文本向量化;深度神经网络模型模块,对输入信息进行预测,得到每个药物的分类结果,进而得到推荐药物;这三个模块都与数据库相连,数据库模块存储患者样本的症状信息和得到的药物信息,通过融合症状信息和药物的信息,能够通过药物推荐模块为需要诊疗的患者提供智能药物推荐,帮助患者实现一定程度上的自我诊疗,提高国民的普遍健康水平,节省国家医疗资源。
进一步描述,所述深度神经网络为TensorFlow框架下的神经网络模型,该框架具有灵活的移植性,极快的编译速度,具有功能强大的可视化组件,能可视化网络结构和训练过程,可以实现应用机器的全流程;
进一步描述,所述数据库模块是MySQL数据库。
本***能够该***能够辅助医师为病人提供最佳处置方法,节约费用成本;能够提升病情诊断精确率、减少死亡率,缓解医院压力等;帮助患者实现一定程度上的自我诊疗,提高国民健康水平。
本发明针对现有的问题提出一种结合深度神经网络模型的智慧中医辨证诊断与药物推荐平台,在发挥传统中医优势的基础上,作出有效辅助诊疗决策。
本发明提出的***中,上述中医病症读取模块支持多种数据储存形式,方便用户操作。
上述数据预处理模块,对于读取的患者症状信息,需要进行症状信息的预处理。预处理过程主要包括三个步骤,分别是文本分词、去停用词、文本向量化。针对非结构化的文本时,预处理过程中需要添加一步非结构化文本的解析过程。文本分词利用分词工具分词后,再加入一些典型的词典库进行扩充。利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合。去停用词步骤利用库剔除掉分词结果中包含的停用词便是利用停用词表的结果。文本向量化利用训练的word2vec训练的模型生成。
上述深度神经网络模块主要有卷积层、池化层、Inception、全连接层和激活函数构成。卷积神经网络模型在计算机语言中的应用较于传统的算法有着巨大的优势。相对于浅层人工神经网络,深度学习模型学习得到的特征数据更能本质的代表原始数据,这将方便分类和可视化的实现,可以采用逐层训练方法解决对于深度神经网络很难训练达到最优的问题,因此使用深度神经网络模型进行处理。模型的设计如图2所示,主要包括网络层结构设计和训练参数设计两部分,设计完成后首先对划分出的训练集进行训练,模型训练完成后在验证集上测试模型的识别精度,评价手段主要是模型的Tanimoto系数精度,如果模型不满足精度要求,进一步调整训练参数重新进行训练,如果模型满足精度要求再用测试集对模型进行检测,如果模型不满足精度要求,则调整网络结构再次循环训练,如果满足精度要求即训练完成。
本发明在比较AlexNet,GoogLeNet,VGGNet,ResNet和DenseNet五种卷积神经网络后,选择VGGNet作为本发明的基础模型。为了加速训练过程,本发明使用批量梯度下降算法,其表达似乎如下:
式中,batch代表批次的大小,采用矩阵的方式进行运算,每次利用一个batchsize数据样本的损失函数之和对权重进行更新,可以减少网络模型收敛所需的迭代次数,保证网络识别效果的同时提高训练效率。
本发明批量梯度下降算法时每次输入的数量即batch size设为8,初始模型的学习率learning rage为0.001,模型完成一次对练集所有图像的训练后称为完成的一个epoch训练,一共训练了30个epoch,学习率的调整策略为multistp,stepvalue为20个epochs,即在完成第20个epochs的时候学习率下降一次。
本发明目标函数选择改进的交叉熵损失函数:
J(θ;Is,ys)=Lc+ω*LR
其中Lc为分类项损失函数,通过交叉熵实现;LR为区域项损失函数,通过Dice损失函数实现;Is,ys分别为训练数据中输入变量;xv表示概率特征向量的位置;表示概率特征向量输出;p1表示对应输出的概率;ω用来调节两个损失之间的比例,本发明中选择ω=3。
为了进一步避免过拟合,我们在每个卷积模块中(第一个除外)添加了一个dropout层,神经网络在训练过程中每次迭代以一定概率随机抛弃不同部分的神经元,可以增强了模型样本数据集的多样性,也增强了层与层之间的稀疏性,使得模型对未知数据的抗扰动能力变得更强,更具有鲁棒性,采用的dropout率p=0.2。
本发明采用的激活函数为如图3所示sig_ReLU函数,该激活函数将sigmoid激活函数和ReLU激活函数相结合。其表达式如下:
改进后的函数在的x<0范围为Sigmoid函数,可以避免ReLU梯度***或者梯度消失的情况,并且保留了ReLU函数快速收敛和稀疏性的特点。
本发明所采用的池化方法为空间金字塔池化,该方法利用了池化区域的多尺度信息,能够将不同大小的特征向量映射到相同维度,避免了对原始向量进行的缩放操作,一定程度上减少了特征向量信息的丢失,提高了网络对的特征表达能力。
请参阅图4,本发明在VGGNet的基础上用三个Inception模块代替了卷积层来进行特征的提取,最后一个池化层由原来的最大值池化变为空间金字塔池化,模型总共23层。其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。
上述数据库模块使用MySQL数据库,MySQL数据库是目前广泛应用的关系数据库***,本***中数据库模块存储预处理后的症状信息和分类信息等数据,同时存储不同药物的信息,为慢性病智能中医辩证与药物推荐提供信息。
上述药物推荐模块是多接口的模块,将输入的症状信息进行预测后,将推荐的药物发送给数据可视化模块。
上述数据可视化模块将预测结果以数据表格的结果呈现,如图5所示,图中第一行为推荐的药物名称,第一列为样本名称,数字1是为该样本推荐该药物,数字0则是该样本不需要对应药物。
通过中医病症读取模块、数据预处理模块、深度神经网络模型模块、药物推荐模块和数据可视化模块,实现了一个完整的慢性病智能中医辩证与药物推荐***,为慢性病患者提供智能中医辩证与药物推荐,辅助医生进行诊疗,帮助慢性病患者实现一定程度上的自我诊疗,节省国家医疗资源,提升全民健康水平。
本发明的基于深度学习智能中医药物推荐方法,包括以下步骤:
步骤1:对数据集中患者病症数据进行预处理;
步骤2:用训练样本训练卷积神经网络;
步骤3:利用训练好的卷积神经网络模型对测试样本进行预测得到最终预测结果。
具体地,步骤1中对数据集中的患者病症数据进行预处理,先将数据集中的患者病症数据分成训练样本和测试样本,然后进行文本分词、去停用词和文本向量化。针对非结构化的文本时,预处理过程中需要添加一步非结构化文本文本的解析过程。文本分词利用分词工具分词后,再加入一些典型的词典库进行扩充。利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合。去停用词步骤利用库剔除掉分词结果中包含的停用词便是利用停用词表的结果。文本向量化利用训练的word2vec训练的模型生成。
具体地,步骤2中,用训练样本训练卷积神经网络,卷积神经网络结构如图4所示,在VGGNet的基础上用三个Inception模块代替了卷积层来进行特征的提取,最后一个池化层由原来的最大值池化变为空间金字塔池化,模型总共23层。其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。用步骤1预处理后的训练集对卷积神经网络进行训练,网络对底层的向量进行多次卷积、最大值池化和inception后,经过金字塔池化和3个全连接层后得到了包含病症特征的feature map,每个卷积层对与编码网络中的卷积层相对应,用sig_ReLU作为激活函数进行输出。最后将卷积输出特征用softmax转换成预测结果。
在完成前2个步骤的模型训练后,就可以进行步骤3,对需要测试的慢性病患者进行预测。对病症数据进行预处理,然后先使用卷积神经网络进行预测,整个过程不仅完全自动化,而且速度快。
本发明提出的慢性病智能中医辩证与药物推荐***,主要包括:中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块、数据可视化模块和数据库模块。
中医病症中医病症读取模块获得患者样本的症状信息;数据预处理模块对读取到的症状信息进行数据预处理,包括:文本分词、去停用词和文本向量化;深度神经网络模型模块,对输入信息进行预测,得到每个药物的分类结果,进而得到推荐药物;这三个模块都与数据库相连,数据库模块存储患者样本的症状信息和得到的药物信息,通过融合症状信息和药物的信息,能够通过药物推荐模块为需要诊疗的患者提供智能药物推荐,帮助患者实现一定程度上的自我诊疗,提高国民的普遍健康水平,节省国家医疗资源。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:
包括中医病症读取模块,用于读取获得患者样本的症状信息;
数据预处理模块,用于读取到的症状信息进行数据预处理;
数据库模块,用于存储患者样本的症状信息和得到的药物信息;
深度神经网络模型,用于对输入信息进行预测并得到相关药物的分类结果形成预测信息;
所述深度神经网络模型为VGGNet卷积神经网络结构模型;其中VGGNet卷积神经网络中采用三个Inception模块代替了卷积层来进行特征的提取,最后一个池化层由原来的最大值池化变为空间金字塔池化,模型总共23层;其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层,深度神经网络模型中采用批量梯度下降算法,其表达式如下:
式中,batch代表批次的大小,采用矩阵的方式进行运算,每次利用一个batch size数据样本的损失函数之和对权重进行更新;
每次输入的数量即batch size设为8,初始模型的学习率learning rage为0.001,模型完成一次对练集所有图像的训练后称为完成的一个epoch训练,一共训练了30个epoch,学习率的调整策略为multistp,stepvalue为20个epochs,即在完成第20个epochs的时候学习率下降一次;
深度神经网络模型中目标函数选择改进的交叉熵损失函数:
J(θ;Is,ys)=Lc+ω*LR
其中Lc为分类项损失函数,通过交叉熵实现;LR为区域项损失函数,通过Dice损失函数实现;Is,ys分别为训练数据中输入变量;xv表示概率特征向量的位置;表示概率特征向量输出;p1表示对应输出的概率;ω用来调节两个损失之间的比例,ω为3;
深度神经网络模型中从第二卷积层开始添加了一个dropout层,神经网络在训练过程中每次迭代以一定概率随机抛弃不同部分的神经元,dropout率p=0.2;
深度神经网络模型中激活函数为sig_ReLU函数,该激活函数将sigmoid激活函数和ReLU激活函数相结合;其表达式如下:
药物推荐模块,用于结合深度神经网络模型的预测信息以及数据库模块存储的患者样本的症状信息和得到的药物信息分析计算得出推荐药物;
数据可视化模块,用于可视化显示推荐药物。
2.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述中医病症读取模块支持多种数据储存形式。
3.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述数据预处理模块对读取到的症状信息进行数据预处理,数据预处理过程包括文本分词、去停用词和文本向量化,其中,文本分词利用分词工具分词后,再加入词典库进行扩充;并利用所有可能生成词的情况构成有项无环图,查找最大概率路径时采用动态规划算法,找出基于词频的最大切分组合;
其中去停用词,利用库剔除掉分词结果中包含的停用词获得利用停用词表的结果;
其中,文本向量化利用训练的word2vec训练的模型生成。
4.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述数据库模块选用MySQL数据库,存储数据预处理模块预处理后的症状信息和分类信息数据,同时存储不同药物的信息。
5.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述深度神经网络模型还包括训练***,训练***通过训练集进行训练,模型训练完成后在验证集上测试模型的识别精度,并通过模型的Tanimoto系数精度进行评价,多次逻辑判断循环训练,满足精度要求。
6.如权利要求1-5任一所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述药物推荐模块是多接口的模块,推荐的药物发送给数据可视化模块。
7.如权利要求6所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述数据可视化模块将预测结果以数据表格的结果呈现。
8.如权利要求7所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***,其特征在于:所述数据表格的第一行为推荐的药物名称,第一列为样本名称,数字1是为该样本推荐该药物,数字0则是该样本不需要对应药物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910776695.5A CN112489769B (zh) | 2019-08-22 | 2019-08-22 | 基于深度神经网络的慢性病智慧中医诊断与药物推荐*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910776695.5A CN112489769B (zh) | 2019-08-22 | 2019-08-22 | 基于深度神经网络的慢性病智慧中医诊断与药物推荐*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112489769A CN112489769A (zh) | 2021-03-12 |
CN112489769B true CN112489769B (zh) | 2024-05-17 |
Family
ID=74920206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910776695.5A Active CN112489769B (zh) | 2019-08-22 | 2019-08-22 | 基于深度神经网络的慢性病智慧中医诊断与药物推荐*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112489769B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112988953B (zh) * | 2021-04-26 | 2021-09-03 | 成都索贝数码科技股份有限公司 | 自适应广播电视新闻关键词标准化方法 |
CN113284577B (zh) * | 2021-05-24 | 2023-08-11 | 康键信息技术(深圳)有限公司 | 药品预测方法、装置、设备及存储介质 |
CN113628716A (zh) * | 2021-08-05 | 2021-11-09 | 翼健(上海)信息科技有限公司 | 一种处方推荐*** |
CN113782142B (zh) * | 2021-08-20 | 2024-04-16 | 中国中医科学院中医药信息研究所 | 一种基于集成神经网络的中药饮片配方推荐*** |
CN114969557B (zh) * | 2022-07-29 | 2022-11-08 | 之江实验室 | 一种基于多来源信息融合的宣教推送方法和*** |
CN116092627B (zh) * | 2023-04-04 | 2023-06-27 | 南京大经中医药信息技术有限公司 | 中医病机辨证智慧开方*** |
CN117275660B (zh) * | 2023-10-19 | 2024-05-07 | 广州市莲田医药科技有限公司 | 一种问诊到开方的全链路ai辅助方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853325A (zh) * | 2009-03-31 | 2010-10-06 | 江启煜 | 一种中医临床信息的计算机辅助分析方法 |
WO2015158017A1 (zh) * | 2014-04-16 | 2015-10-22 | 深圳市易特科信息技术有限公司 | 智能交互及心理慰藉机器人服务*** |
CN106203432A (zh) * | 2016-07-14 | 2016-12-07 | 杭州健培科技有限公司 | 一种基于卷积神经网显著性图谱的感兴趣区域的定位方法 |
WO2017113232A1 (zh) * | 2015-12-30 | 2017-07-06 | 中国科学院深圳先进技术研究院 | 一种基于深度学习的产品分类方法及装置 |
CN106933994A (zh) * | 2017-02-27 | 2017-07-07 | 广东省中医院 | 一种基于中医药知识图谱的核心症证关系构建方法 |
CN107330876A (zh) * | 2017-06-12 | 2017-11-07 | 济南浪潮高新科技投资发展有限公司 | 一种基于卷积神经网络的图像自动诊断方法 |
CN108182967A (zh) * | 2017-12-14 | 2018-06-19 | 华南理工大学 | 一种基于深度神经网络的中医药材推荐方法 |
CN109344921A (zh) * | 2019-01-03 | 2019-02-15 | 湖南极点智能科技有限公司 | 一种基于深度神经网络模型的图像识别方法、装置及设备 |
CN110070119A (zh) * | 2019-04-11 | 2019-07-30 | 北京工业大学 | 一种基于二值化深度神经网络的手写数字图像识别分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3306617A1 (en) * | 2016-10-06 | 2018-04-11 | Fujitsu Limited | Method and apparatus of context-based patient similarity |
-
2019
- 2019-08-22 CN CN201910776695.5A patent/CN112489769B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853325A (zh) * | 2009-03-31 | 2010-10-06 | 江启煜 | 一种中医临床信息的计算机辅助分析方法 |
WO2015158017A1 (zh) * | 2014-04-16 | 2015-10-22 | 深圳市易特科信息技术有限公司 | 智能交互及心理慰藉机器人服务*** |
WO2017113232A1 (zh) * | 2015-12-30 | 2017-07-06 | 中国科学院深圳先进技术研究院 | 一种基于深度学习的产品分类方法及装置 |
CN106203432A (zh) * | 2016-07-14 | 2016-12-07 | 杭州健培科技有限公司 | 一种基于卷积神经网显著性图谱的感兴趣区域的定位方法 |
CN106933994A (zh) * | 2017-02-27 | 2017-07-07 | 广东省中医院 | 一种基于中医药知识图谱的核心症证关系构建方法 |
CN107330876A (zh) * | 2017-06-12 | 2017-11-07 | 济南浪潮高新科技投资发展有限公司 | 一种基于卷积神经网络的图像自动诊断方法 |
CN108182967A (zh) * | 2017-12-14 | 2018-06-19 | 华南理工大学 | 一种基于深度神经网络的中医药材推荐方法 |
CN109344921A (zh) * | 2019-01-03 | 2019-02-15 | 湖南极点智能科技有限公司 | 一种基于深度神经网络模型的图像识别方法、装置及设备 |
CN110070119A (zh) * | 2019-04-11 | 2019-07-30 | 北京工业大学 | 一种基于二值化深度神经网络的手写数字图像识别分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112489769A (zh) | 2021-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489769B (zh) | 基于深度神经网络的慢性病智慧中医诊断与药物推荐*** | |
Ambekar et al. | Disease risk prediction by using convolutional neural network | |
RU2703679C2 (ru) | Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов | |
JP6522161B2 (ja) | ディープラーニングに基づく医療データ分析方法及びそのインテリジェントアナライザー | |
CN106778014A (zh) | 一种基于循环神经网络的患病风险预测方法 | |
Dabowsa et al. | A hybrid intelligent system for skin disease diagnosis | |
CN111180068A (zh) | 一种基于多任务学习模型的慢病预测*** | |
Mall et al. | Heart diagnosis using deep neural network | |
Bishnoi et al. | Artificial intelligence techniques used in medical sciences: a review | |
RU2720363C2 (ru) | Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта | |
Kamada et al. | Knowledge extraction of adaptive structural learning of deep belief network for medical examination data | |
CN113673434A (zh) | 一种基于高效卷积神经网络和对比学习的脑电情绪识别方法 | |
El Hamdaoui et al. | Improving heart disease prediction using random forest and adaboost algorithms | |
Ma et al. | Construction and evaluation of intelligent medical diagnosis model based on integrated deep neural network | |
Makram et al. | Machine learning approach for diagnosis of heart diseases | |
Thilakarathne et al. | Artificial Intelligence-Enabled IoT for Health and Wellbeing Monitoring | |
Deb et al. | An outcome based analysis on heart disease prediction using machine learning algorithms and data mining approaches | |
Yousif | Classification of mental disorders figures based on soft computing methods | |
Mehrankia et al. | Prediction of heart attacks using biological signals based on recurrent GMDH neural network | |
Ambrews et al. | Ensemble based machine learning model for heart disease prediction | |
CN114496231A (zh) | 基于知识图谱的体质识别方法、装置、设备和存储介质 | |
Abbas et al. | An Efficient Stacked Ensemble Model for Heart Disease Detection and Classification. | |
Nagarajan et al. | An optimized sub group partition based healthcare data mining in big data | |
Komalavalli et al. | An Effective Heart Disease Prediction Using Machine Learning | |
Dai et al. | Exploring body constitution in traditional Chinese medicine with k-means clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: Building 5, 1st Floor, No. 2 Xiyuanba Road, Xihu District, Hangzhou City, Zhejiang Province, 310030 Applicant after: Zhejiang Yuantu Technology Co.,Ltd. Address before: 310030 west side, 4th floor, building 1, No. 10, xiyuansan Road, Sandun Town, Hangzhou City, Zhejiang Province Applicant before: ZHEJIANG YUANTU INTERCONNECTION TECHNOLOGY CO.,LTD. Country or region before: China |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |