CN112489769B

CN112489769B - 基于深度神经网络的慢性病智慧中医诊断与药物推荐***

Info

Publication number: CN112489769B
Application number: CN201910776695.5A
Authority: CN
Inventors: 吴俊宏; 姚志江
Original assignee: Zhejiang Yuantu Technology Co ltd
Current assignee: Zhejiang Yuantu Technology Co ltd
Priority date: 2019-08-22
Filing date: 2019-08-22
Publication date: 2024-05-17
Anticipated expiration: 2039-08-22
Also published as: CN112489769A

Abstract

本发明公开了一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，包括中医病症读取模块，用于读取获得患者样本的症状信息；本发明通过构建存储患者样本的症状信息和得到的药物信息的数据库模块；利用中医病症读取模块，用于读取获得患者样本的症状信息，并通过深度神经网络模型，对输入信息进行预测并得到相关药物的分类结果形成预测信息；进而通过药物推荐模块推荐药物，实现慢性病的智慧中医诊断与药物推荐，辅助医生进行诊疗，尤其是辅助医师为病人提供最佳处置方法，节约费用成本；能够提升病情诊断精确率、减少死亡率，缓解医院压力等；帮助慢性病患者实现一定程度上的自我诊疗，节省国家医疗资源，提升全民健康水平。

Description

基于深度神经网络的慢性病智慧中医诊断与药物推荐***

技术领域

本发明属于智慧医疗技术领域，具体为一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。

背景技术

我国人口老龄化形势严峻，庞大的老龄人口导致养老保障负担严重、医疗卫生费用支出增大，社会养老服务需求膨胀，给社会发展带来深远影响。老年人群健康问题突出。另一方面，老年慢性病患者的病情也给其照顾者带来了一定的负担。有研究表明，“大部分照顾者存在不同程度的经济、社会、生理和心理负担”。因此，数量庞大且不断增长的老年慢性病群体的医疗问题是老龄化难题中不可忽视的问题之一，给我国的医疗卫生服务体系带来了巨大的难题，探索出符合中国国情需要的老年慢性病服务内容和模式迫在眉睫。

中医对于慢性疾病其并发症的防治具有独特的优势和丰富的实践经验，其整体观念、辨证论治的理念对治疗和预后以及防治并发症、改善生活质量等方面意义重大。但是，我国中医的发展主要面临三个问题：中医的学习成本高，传承难度远远高于西医；中医缺乏像西医一样科学的理论体系；中医医疗机构数量少，医师资源匮乏。人工智能技术通过研究或制造具有人类智能的***或者机器，使其更好地帮助人类工作，从而创造社会价值。随着计算机计算能力的提升以及人工智能科学理论的完善，人工智能技术取得了长足的进步，基于人工智能的医疗诊断方法也成为全世界学者的研究热点。智能诊疗通过量化重要的临床指标的诊断可以帮助医生在广泛的医疗专业提高诊断的准确性，有助于提高医疗服务质量。越来越多不同领域的学者们开始运用信息化的技术手段来研究中医这一门知识含量极为丰富和复杂的学科，使得中医在不同学科中能够更好地互相交流与推广，为中医智能辩证问题提供了新的解决方案，对中医辩证辨病分析、中西医关联关系挖掘以及构建中医智能医疗***具有十分重要的意义。

为此，发明人基于深度神经网络构建深度智慧机器学习模型以解决慢性病诊断和药物推荐的技术性问题，创造性地提出一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。

发明内容

本发明的目的在于：为了解决背景技术涉及的技术问题，提供一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***。

本发明采用的技术方案如下：

一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，包括中医病症读取模块，用于读取获得患者样本的症状信息；

数据预处理模块，用于读取到的症状信息进行数据预处理；

数据库模块，用于存储患者样本的症状信息和得到的药物信息；

深度神经网络模型，用于对输入信息进行预测并得到相关药物的分类结果形成预测信息；

药物推荐模块，用于结合深度神经网络模型的预测信息以及数据库模块存储的患者样本的症状信息和得到的药物信息分析计算得出推荐药物；

数据可视化模块，用于可视化显示推荐药物。

作为本发明进一步技术方案，所述中医病症读取模块支持多种数据储存形式。

作为本发明再进一步技术方案，所述数据预处理模块对读取到的症状信息进行数据预处理，数据预处理过程包括文本分词、去停用词和文本向量化，其中，文本分词利用分词工具分词后，再加入词典库进行扩充；并利用所有可能生成词的情况构成有项无环图，查找最大概率路径时采用动态规划算法，找出基于词频的最大切分组合；

其中去停用词，利用库剔除掉分词结果中包含的停用词获得利用停用词表的结果；

其中，文本向量化利用训练的word2vec训练的模型生成。

作为本发明再进一步技术方案，所述数据库模块选用MySQL数据库，存储数据预处理模块预处理后的症状信息和分类信息数据，同时存储不同药物的信息。

作为本发明再进一步技术方案，深度神经网络模型为VGGNet卷积神经网络结构模型；其中VGGNet卷积神经网络中采用三个Inception模块代替了卷积层来进行特征的提取，最后一个池化层由原来的最大值池化变为空间金字塔池化，模型总共23层；其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。

作为本发明再进一步技术方案，深度神经网络模型中采用批量梯度下降算法，其表达式如下：

式中，batch代表批次的大小，采用矩阵的方式进行运算，每次利用一个batchsize数据样本的损失函数之和对权重进行更新；

每次输入的数量即batch size设为8，初始模型的学习率learning rage为0.001，模型完成一次对练集所有图像的训练后称为完成的一个epoch训练，一共训练了30个epoch，学习率的调整策略为multistp，stepvalue为20个epochs，即在完成第20个epochs的时候学习率下降一次；

深度神经网络模型中目标函数选择改进的交叉熵损失函数：

J(θ；I_s，y_s)＝L_c+ω*L_R

其中L_c为分类项损失函数，通过交叉熵实现；L_R为区域项损失函数，通过Dice损失函数实现；I_s，y_s分别为训练数据中输入变量；x^v表示概率特征向量的位置；表示概率特征向量输出；p₁表示对应输出的概率；ω用来调节两个损失之间的比例，优选的，ω为3。

深度神经网络模型中从第二卷积层开始添加了一个dropout层，神经网络在训练过程中每次迭代以一定概率随机抛弃不同部分的神经元，dropout率p＝0.2；

深度神经网络模型中激活函数为sig_ReLU函数，该激活函数将sigmoid激活函数和ReLU激活函数相结合；其表达式如下：

作为本发明再进一步技术方案，深度神经网络模型还包括训练***，训练***通过训练集进行训练，模型训练完成后在验证集上测试模型的识别精度，并通过模型的Tanimoto系数精度进行评价，多次逻辑判断循环训练，满足精度要求。

作为本发明再进一步技术方案，所述药物推荐模块是多接口的模块，推荐的药物发送给数据可视化模块。

作为本发明再进一步技术方案，所述数据可视化模块将预测结果以数据表格的结果呈现。

作为本发明再进一步技术方案，所述数据表格的第一行为推荐的药物名称，第一列为样本名称，数字1是为该样本推荐该药物，数字0则是该样本不需要对应药物。

本发明的基于深度学习智能中医药物推荐方法，包括以下步骤：

步骤1：对数据集中患者病症数据进行预处理；

步骤2：用训练样本训练卷积神经网络；

步骤3：利用训练好的卷积神经网络模型对测试样本进行预测得到最终预测结果。

具体地，步骤1中对数据集中的患者病症数据进行预处理，先将数据集中的患者病症数据分成训练样本和测试样本，然后进行文本分词、去停用词和文本向量化。针对非结构化的文本时，预处理过程中需要添加一步非结构化文本文本的解析过程。文本分词利用分词工具分词后，再加入一些典型的词典库进行扩充。利用所有可能生成词的情况构成有项无环图，查找最大概率路径时采用动态规划算法，找出基于词频的最大切分组合。去停用词步骤利用库剔除掉分词结果中包含的停用词便是利用停用词表的结果。文本向量化利用训练的word2vec训练的模型生成。

具体地，步骤2中，用训练样本训练卷积神经网络，卷积神经网络结构如图4所示，在VGGNet的基础上用三个Inception模块代替了卷积层来进行特征的提取，最后一个池化层由原来的最大值池化变为空间金字塔池化，模型总共23层。其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。用步骤1预处理后的训练集对卷积神经网络进行训练，网络对底层的向量进行多次卷积、最大值池化和inception后，经过金字塔池化和3个全连接层后得到了包含病症特征的feature map，每个卷积层对与编码网络中的卷积层相对应，用sig_ReLU作为激活函数进行输出。最后将卷积输出特征用softmax转换成预测结果。

在完成前2个步骤的模型训练后，就可以进行步骤3，对需要测试的慢性病患者进行预测。对病症数据进行预处理，然后先使用卷积神经网络进行预测，整个过程不仅完全自动化，而且速度快。

本发明提出的慢性病智能中医辩证与药物推荐***，主要包括：中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块、数据可视化模块和数据库模块。

中医病症中医病症读取模块获得患者样本的症状信息；数据预处理模块对读取到的症状信息进行数据预处理，包括：文本分词、去停用词和文本向量化；深度神经网络模型模块，对输入信息进行预测，得到每个药物的分类结果，进而得到推荐药物；这三个模块都与数据库相连，数据库模块存储患者样本的症状信息和得到的药物信息，通过融合症状信息和药物的信息，能够通过药物推荐模块为需要诊疗的患者提供智能药物推荐，帮助患者实现一定程度上的自我诊疗，提高国民的普遍健康水平，节省国家医疗资源。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明提供一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，本发明通过构建存储患者样本的症状信息和得到的药物信息的数据库模块；利用中医病症读取模块，用于读取获得患者样本的症状信息，并通过深度神经网络模型，对输入信息进行预测并得到相关药物的分类结果形成预测信息；进而通过药物推荐模块，结合深度神经网络模型的预测信息以及数据库模块存储的患者样本的症状信息和得到的药物信息分析计算得出推荐药物，实现慢性病的智慧中医诊断与药物推荐，辅助医生进行诊疗，尤其是辅助医师为病人提供最佳处置方法，节约费用成本；能够提升病情诊断精确率、减少死亡率，缓解医院压力等；帮助慢性病患者实现一定程度上的自我诊疗，节省国家医疗资源，提升全民健康水平。

2、本发明中深度神经网络模型构建全面，智能化程度高，模型处理效率高，预测结果准确度高。

3、本发明进一步所述数据可视化模块将预测结果以数据表格的结果呈现；所述数据表格的第一行为推荐的药物名称，第一列为样本名称，数字1是为该样本推荐该药物，数字0则是该样本不需要对应药物，直观清楚显示预测结果。

4、本发明进一步设置数据预处理模块，对读取到的症状信息进行数据预处理，数据预处理过程包括文本分词、去停用词和文本向量化，文本分词利用分词工具分词后，再加入词典库进行扩充；并利用所有可能生成词的情况构成有项无环图，查找最大概率路径时采用动态规划算法，找出基于词频的最大切分组合；去停用词，利用库剔除掉分词结果中包含的停用词获得利用停用词表的结果；文本向量化利用训练的word2vec训练的模型生成；预处理效果好，便于后续预测分析。

附图说明

图1为本发明的***架构框图；

图2为本发明中训练***的模型设计图；

图3为本发明中sig-ReLU激活函数图；

图4为本发明中深度神经网络模型的网络结构图；

图5为本发明中可视化预测结果数据图表。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请参阅图1，本发明提出的慢性病智能中医辩证与药物推荐***，主要包括：中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块、数据可视化模块和数据库模块。

上述数据中医病症读取模块、数据预处理模块、深度神经网络模型、药物推荐模块和数据可视化模块依次相连，上述数据预处理模块、深度神经网络模块、药物推荐模块分别与数据库模块相连。

进一步描述，所述深度神经网络为TensorFlow框架下的神经网络模型，该框架具有灵活的移植性，极快的编译速度，具有功能强大的可视化组件，能可视化网络结构和训练过程，可以实现应用机器的全流程；

进一步描述，所述数据库模块是MySQL数据库。

本***能够该***能够辅助医师为病人提供最佳处置方法，节约费用成本；能够提升病情诊断精确率、减少死亡率，缓解医院压力等；帮助患者实现一定程度上的自我诊疗，提高国民健康水平。

本发明针对现有的问题提出一种结合深度神经网络模型的智慧中医辨证诊断与药物推荐平台，在发挥传统中医优势的基础上，作出有效辅助诊疗决策。

本发明提出的***中，上述中医病症读取模块支持多种数据储存形式，方便用户操作。

上述数据预处理模块，对于读取的患者症状信息，需要进行症状信息的预处理。预处理过程主要包括三个步骤，分别是文本分词、去停用词、文本向量化。针对非结构化的文本时，预处理过程中需要添加一步非结构化文本的解析过程。文本分词利用分词工具分词后，再加入一些典型的词典库进行扩充。利用所有可能生成词的情况构成有项无环图，查找最大概率路径时采用动态规划算法，找出基于词频的最大切分组合。去停用词步骤利用库剔除掉分词结果中包含的停用词便是利用停用词表的结果。文本向量化利用训练的word2vec训练的模型生成。

上述深度神经网络模块主要有卷积层、池化层、Inception、全连接层和激活函数构成。卷积神经网络模型在计算机语言中的应用较于传统的算法有着巨大的优势。相对于浅层人工神经网络，深度学习模型学习得到的特征数据更能本质的代表原始数据，这将方便分类和可视化的实现，可以采用逐层训练方法解决对于深度神经网络很难训练达到最优的问题，因此使用深度神经网络模型进行处理。模型的设计如图2所示，主要包括网络层结构设计和训练参数设计两部分，设计完成后首先对划分出的训练集进行训练，模型训练完成后在验证集上测试模型的识别精度，评价手段主要是模型的Tanimoto系数精度，如果模型不满足精度要求，进一步调整训练参数重新进行训练，如果模型满足精度要求再用测试集对模型进行检测，如果模型不满足精度要求，则调整网络结构再次循环训练，如果满足精度要求即训练完成。

本发明在比较AlexNet，GoogLeNet，VGGNet，ResNet和DenseNet五种卷积神经网络后，选择VGGNet作为本发明的基础模型。为了加速训练过程，本发明使用批量梯度下降算法，其表达似乎如下：

式中，batch代表批次的大小，采用矩阵的方式进行运算，每次利用一个batchsize数据样本的损失函数之和对权重进行更新，可以减少网络模型收敛所需的迭代次数，保证网络识别效果的同时提高训练效率。

本发明批量梯度下降算法时每次输入的数量即batch size设为8，初始模型的学习率learning rage为0.001，模型完成一次对练集所有图像的训练后称为完成的一个epoch训练，一共训练了30个epoch，学习率的调整策略为multistp，stepvalue为20个epochs，即在完成第20个epochs的时候学习率下降一次。

本发明目标函数选择改进的交叉熵损失函数：

J(θ；I_s，y_s)＝L_c+ω*L_R

其中L_c为分类项损失函数，通过交叉熵实现；L_R为区域项损失函数，通过Dice损失函数实现；I_s，y_s分别为训练数据中输入变量；x^v表示概率特征向量的位置；表示概率特征向量输出；p₁表示对应输出的概率；ω用来调节两个损失之间的比例，本发明中选择ω＝3。

为了进一步避免过拟合，我们在每个卷积模块中(第一个除外)添加了一个dropout层，神经网络在训练过程中每次迭代以一定概率随机抛弃不同部分的神经元，可以增强了模型样本数据集的多样性，也增强了层与层之间的稀疏性，使得模型对未知数据的抗扰动能力变得更强，更具有鲁棒性，采用的dropout率p＝0.2。

本发明采用的激活函数为如图3所示sig_ReLU函数，该激活函数将sigmoid激活函数和ReLU激活函数相结合。其表达式如下：

改进后的函数在的x＜0范围为Sigmoid函数，可以避免ReLU梯度***或者梯度消失的情况，并且保留了ReLU函数快速收敛和稀疏性的特点。

本发明所采用的池化方法为空间金字塔池化，该方法利用了池化区域的多尺度信息，能够将不同大小的特征向量映射到相同维度，避免了对原始向量进行的缩放操作，一定程度上减少了特征向量信息的丢失，提高了网络对的特征表达能力。

请参阅图4，本发明在VGGNet的基础上用三个Inception模块代替了卷积层来进行特征的提取，最后一个池化层由原来的最大值池化变为空间金字塔池化，模型总共23层。其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层。

上述数据库模块使用MySQL数据库，MySQL数据库是目前广泛应用的关系数据库***，本***中数据库模块存储预处理后的症状信息和分类信息等数据，同时存储不同药物的信息，为慢性病智能中医辩证与药物推荐提供信息。

上述药物推荐模块是多接口的模块，将输入的症状信息进行预测后，将推荐的药物发送给数据可视化模块。

上述数据可视化模块将预测结果以数据表格的结果呈现，如图5所示，图中第一行为推荐的药物名称，第一列为样本名称，数字1是为该样本推荐该药物，数字0则是该样本不需要对应药物。

通过中医病症读取模块、数据预处理模块、深度神经网络模型模块、药物推荐模块和数据可视化模块，实现了一个完整的慢性病智能中医辩证与药物推荐***，为慢性病患者提供智能中医辩证与药物推荐，辅助医生进行诊疗，帮助慢性病患者实现一定程度上的自我诊疗，节省国家医疗资源，提升全民健康水平。

步骤1：对数据集中患者病症数据进行预处理；

步骤2：用训练样本训练卷积神经网络；

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围中。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：

包括中医病症读取模块，用于读取获得患者样本的症状信息；

数据预处理模块，用于读取到的症状信息进行数据预处理；

所述深度神经网络模型为VGGNet卷积神经网络结构模型；其中VGGNet卷积神经网络中采用三个Inception模块代替了卷积层来进行特征的提取，最后一个池化层由原来的最大值池化变为空间金字塔池化，模型总共23层；其中包含10个卷积层、5个池化层、3个inception模块、3个全连接层、1个输入层和和1个输出层，深度神经网络模型中采用批量梯度下降算法，其表达式如下：

式中，batch代表批次的大小，采用矩阵的方式进行运算，每次利用一个batch size数据样本的损失函数之和对权重进行更新；

深度神经网络模型中目标函数选择改进的交叉熵损失函数：

J(θ；I_s，y_s)＝L_c+ω*L_R

其中L_c为分类项损失函数，通过交叉熵实现；L_R为区域项损失函数，通过Dice损失函数实现；I_s，y_s分别为训练数据中输入变量；x^v表示概率特征向量的位置；表示概率特征向量输出；p₁表示对应输出的概率；ω用来调节两个损失之间的比例，ω为3；

数据可视化模块，用于可视化显示推荐药物。

2.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述中医病症读取模块支持多种数据储存形式。

3.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述数据预处理模块对读取到的症状信息进行数据预处理，数据预处理过程包括文本分词、去停用词和文本向量化，其中，文本分词利用分词工具分词后，再加入词典库进行扩充；并利用所有可能生成词的情况构成有项无环图，查找最大概率路径时采用动态规划算法，找出基于词频的最大切分组合；

其中，文本向量化利用训练的word2vec训练的模型生成。

4.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述数据库模块选用MySQL数据库，存储数据预处理模块预处理后的症状信息和分类信息数据，同时存储不同药物的信息。

5.如权利要求1所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述深度神经网络模型还包括训练***，训练***通过训练集进行训练，模型训练完成后在验证集上测试模型的识别精度，并通过模型的Tanimoto系数精度进行评价，多次逻辑判断循环训练，满足精度要求。

6.如权利要求1-5任一所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述药物推荐模块是多接口的模块，推荐的药物发送给数据可视化模块。

7.如权利要求6所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述数据可视化模块将预测结果以数据表格的结果呈现。

8.如权利要求7所述的一种基于深度神经网络的慢性病智慧中医诊断与药物推荐***，其特征在于：所述数据表格的第一行为推荐的药物名称，第一列为样本名称，数字1是为该样本推荐该药物，数字0则是该样本不需要对应药物。