CN110633368A - 早期结直肠癌非结构化数据的深度学习分类方法 - Google Patents

早期结直肠癌非结构化数据的深度学习分类方法 Download PDF

Info

Publication number
CN110633368A
CN110633368A CN201910862508.5A CN201910862508A CN110633368A CN 110633368 A CN110633368 A CN 110633368A CN 201910862508 A CN201910862508 A CN 201910862508A CN 110633368 A CN110633368 A CN 110633368A
Authority
CN
China
Prior art keywords
matrix
sample
data
classification
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910862508.5A
Other languages
English (en)
Inventor
万晶晶
陈伯伦
于永涛
马兴刚
沈怡芸
陈泰岳
马甲林
顾建祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaian Second People's Hospital (huaian Mercy Hospital)
Huaiyin Institute of Technology
Original Assignee
Huaian Second People's Hospital (huaian Mercy Hospital)
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaian Second People's Hospital (huaian Mercy Hospital), Huaiyin Institute of Technology filed Critical Huaian Second People's Hospital (huaian Mercy Hospital)
Priority to CN201910862508.5A priority Critical patent/CN110633368A/zh
Publication of CN110633368A publication Critical patent/CN110633368A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种早期结直肠癌非结构化数据的深度学习分类方法,包括:(1)提取样本的属性数据集X;(2)标准化处理得样本数据矩阵X’;(3)X’降维得矩阵X1;(4)对矩阵X1进行数据集的划分;(5)深度置信网络DBN;(6)支持向量机(SVM)算法;(7)评价分类结果。本发明的分类方法利用矩阵分解技术中非负矩阵分解(NMF)的方法来对样本数据集进行降维,通过分解后的基矩阵和权重矩阵来近似代替原始矩阵,以降低算法的时空复杂度。利用深度置信网络(DBN)通过采用逐层训练的方式,解决了深层次神经网络的优化问题,通过逐层训练为整个网络赋予了较好的初始权值,使得网络只要经过微调就可以达到最优解。

Description

早期结直肠癌非结构化数据的深度学习分类方法
技术领域
本发明涉及数据的深度学习与分类,具体涉及一种早期结直肠癌非结构化数据的深度学习分类方法。
背景技术
目前医疗行业已融入更多人工智慧、传感技术等高科技,使医疗服务走向真正意义的智能化,推动医疗事业的繁荣发展。在中国新医改的大背景下,智慧医疗正在走进寻常百姓的生活。智慧健康医疗旨在医疗领域中应用人工智能技术实现智慧医疗,包括疾病风险预测、智能问诊、医疗影像分析、电子病历信息抽取、医疗健康数据分析、医疗保险评估、用药推荐等。
结直肠癌(colorectal cancer,CRC)的发病率呈逐年上升趋势,已经跃居肿瘤死亡率的前3-5位,这越来越影响着人们的健康和生活质量。根据最新的数据,目前中国结直肠癌每年新发近40万例,死亡近20万人,死亡率达到了50%。必须要提的是,结直肠癌是近些年发病率逐年上升,在过去10年间新发病数和死亡数均翻了一番,且还在以年均4%-5%的速度递增。
现有技术中对早期结直肠癌数据的分类是基于统计学进行分析,或针对特定样本进行特定分析,缺乏***的预测机制。近年来使用机器学习的方法将癌症患者进行高或低风险的分类已经成为目前好多研究团队的研究方向,这些技术可以对癌症病情的进展和治疗都起着重要的作用。机器学习方法的目的是从复杂的样本数据中检测出关键特征并用于揭示它们所起作用,其中人工神经网络、贝叶斯网络、支持向量机和决策树等机器学习的方法在健康数据分类研究中都得到了广泛的应用,这为预测模型的开发提供了有效和准确的决策依据。
随着病人在早癌诊断之前的检查项目越来越多,样本数据的维度也不断的增加,有些病人并未进行所有项目的检查,导致构建的样本数据集存在着数据稀疏性的情况,并且数据中的噪音也随之增加,这都将对结肠癌早期数据分类算法的性能造成很大的影响。并且由于样本数据的高维度问题,使得预测***的响应时间也随之增加。
发明内容
发明目的:本发明目的是提供一种早期结直肠癌非结构化数据的深度学习分类方法,能够有效地解决数据分类中存在的数据稀疏性、高维度及噪音信息,学习到在早期结直肠癌的预测中起到了关键的作用的样本特征并对数据进行准确分类。
技术方案:本发明提供了一种早期结直肠癌非结构化数据的深度学习分类方法,包括以下步骤:
(1)对样本数据进行预处理,提取样本的属性数据集X和样本对应的标签数据集Y;
(2)对属性数据集X进行标准化处理,得到样本数据矩阵X’;
(3)使用非负矩阵分解(NMF)对样本数据矩阵X’进行降维,得到降维矩阵X1
(4)对降维矩阵X1进行数据集的划分,得到初始训练集和测试集;
(5)基于深度置信网络DBN构建分类模型,利用训练集进行模型训练,提取样本隐藏的属性特征构建SVM输入训练集;
(6)使用支持向量机(SVM)算法得出测试集对应的分类结果;
(7)使用评价指标对分类结果进行评价。
进一步地,在步骤(2)中,标准化处理采用的的标准化函数为:
Figure BDA0002200236280000021
其中,μ为样本每一列属性数据的均值,σ为样本每一列属性数据的标准差;X为样本的属性数据集,X’为对样本数据X进行标准化处理得到的样本数据矩阵。
进一步地,步骤(3)中,将样本数据矩阵X’当成是一个非负的特征矩阵,其中每行表示一个样本的特征向量;
非负矩阵分解的目标是求解两个非负矩阵因子W∈Pn×k,H∈Pk×m,(n+m)*k<nm,其中n为样本数据的数量,m为所有样本属性的个数;使得两者的乘积近似于原始矩阵,即样本的属性数据集X,即:
X≈WH
其中,k表示低维空间的维度,W表示低维空间向量,称为基矩阵;H表示重构原矩阵的向量乘积的系数,称为权重矩阵;
将此分解问题建模为Frobenius范数最优化问题:
Figure BDA0002200236280000022
其中,约束条件W≥0,H≥0表示矩阵H,V的所有元素均非负;
用系数矩阵W代替原始矩阵X,由原始矩阵X的维度降低到k维,得到降维矩阵X1
进一步地,步骤(5)中,将降维后的样本的属性向量V作为DBN的输入;
在训练阶段,将可视层输入向量V传递到隐含层;否则,可视层的输入V会被随机的选择,以尝试去重构原始的输入数据;
新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得隐含层的特征h1和h2
在训练过程中,执行吉布斯采样(Gibbs)重复以上过程;
其中,将隐含层激活单元和可视层输入之间的相关性差别作为权值W1和W2更新的主要依据;
在输入数据和隐含层下的条件概率如下:
Figure BDA0002200236280000032
Figure BDA0002200236280000034
其中g为Sigmoid函数,其定义如下:
Figure BDA0002200236280000033
bi输入层的偏移(bias),ai隐含层的偏移;
得出样本数据的输出特征矩阵X2,将其作为下一步分类模型SVM的输入训练集。
进一步地,在步骤(6)中,将样本数据的输出特征矩阵X2作为分类算法的训练集,
即XTrain=X2={xi|i∈{1,..,n},其中,xi为训练集中的各样本数据,n为训练集中样本数据的个数;对应的类别yi∈{0,1},
那么线性SVM通过学***面为:
w·x+b=0
以及相应的分类决策函数:
f(x)=sign(w·x+b)
其中,参数w,b分别为超平面的法向量和截距;
将距离分离超平面最近的两个不同类别的样本点称为支持向量,构成了两条平行于分离超平面的长带,二者之间的距离称之为margin;margin越大,则分类正确的确信度越高(与超平面的距离表示分类的确信度,距离越远则分类正确的确信度越高);
Figure BDA0002200236280000041
SVM分类问题即在全部分类正确的前提下,在满足yi(w·xi+b)≥1情况下最大化
Figure BDA0002200236280000042
即在满足最小化如下函数:
Figure BDA0002200236280000045
通过构造拉格朗日函数并求解偏导,得到等价的对偶问题:
Figure BDA0002200236280000043
Figure BDA0002200236280000044
其中λi≥0为拉格朗日乘子(Lagrange multiplier)。
进一步地,在步骤(7)中,采用评价指标准确率、精确度、召回率以及F1分数对分类结果进行评价。
有益效果:与现有技术相比,本发明的有益效果在于:
(1)利用矩阵分解技术中非负矩阵分解(NMF)的方法来对样本数据集进行降维,通过分解后的基矩阵和权重矩阵来近似代替原始矩阵,以降低算法的时空复杂度。
(2)利用深度置信网络(DBN)通过采用逐层训练的方式,解决了深层次神经网络的优化问题,通过逐层训练为整个网络赋予了较好的初始权值,使得网络只要经过微调就可以达到最优解。
本发明的数据分类方法可以降低计算开销和存储开销,有效提高早癌数据分类的精确率。
附图说明
图1为本发明分类方法的总体流程图;
图2为本发明分类方法的步骤分解图;
图3为非负矩阵分解(NMF)示意图;
图4为深度置信网路示意图;
图5为本支持向量机示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步描述:
本申请公开了一种早期结直肠癌非结构化数据的深度学习分类方法,如图1、图2所示,该方法包括以下步骤:
(1)对样本数据进行预处理,提取样本的属性数据集X和样本对应的标签数据集Y,Y={0,1}。
(2)对属性数据集X进行标准化处理,得到样本数据矩阵X’。
在早期结直肠癌非结构化数据的深度学***移的操作。数据标准化不但不会改变原始数据的数值排序,反而能提高数据的表现。具体采用的标准化函数如下所示:
其中μ为样本每一列属性数据的均值,σ为样本每一列属性数据的标准差。
(3)使用非负矩阵分解(NMF)对样本数据矩阵X’进行降维,得到降维矩阵X1
针对样本数据网络中存在的高维、冗余等问题,需要对原始网路的样本矩阵进行有效的降维,去除冗余的属性。例如,数据集中存在性别,年龄等因素,为确定这些特征是否对分类算法的模型的设计有反向作用,需使用一种方法来去除这些冗余的属性,以至提高最终分类算法的准确率。
虽然目前在医学数据分类中存在一些矩阵的降维方法,但并没有考虑到医学中的实际情况,比如在样本检测的过程中,血项数据都是非负的,而普通的降维方法在降维后样本的数据矩阵中则会出现一些负值,缺乏一些实际的意义。并且由于每个特征都是独立评估的,这种特征提取方法可能无法捕获所有高度区分的特征子集,而这些特征子集由单独的差别较小的特征组成。
本申请的分类方法采用矩阵分解技术中非负矩阵分解(NMF)的方法来对样本数据集进行降维,通过分解后的基矩阵和权重矩阵来近似代替原始矩阵,以降低算法的时空复杂度。本申请将非负矩阵分解应用于早癌数据分类中,通过高维向量空间向低维向量空间的投影,重构不同类型矩阵之间的相关性。该算法在保持低时间复杂度的同时,减少了数据的存储空间,而且能够有效地提高后期分类的性能。
如图3所示,X矩阵的每一行ui,表示每一个样本;每一列ei表示样本包含的每个属性。NMF能达到表示信息的局部之间相关关系的效果,从而获得更好的处理结果。对于样本矩阵,可以将其当成是一个非负的特征矩阵,其中每行表示一个样本的特征向量。非负矩阵分解的目标是求解两个非负矩阵因子W∈Pn×k,H∈Pk×m,(n+m)*k<nm,其中n为样本数据的数量,m为所有样本属性的个数;使得两者的乘积近似于原始矩阵,即样本的属性数据集X,即:
X≈WH
其中k表示低维空间的维度,W表示低维空间向量,称为基矩阵。H表示重构原矩阵的向量乘积的系数,称为权重矩阵。通常将此分解问题建模为Frobenius范数最优化问题:
Figure BDA0002200236280000061
其中约束条件W≥0,H≥0表示矩阵H,V的所有元素均是非负的。
在本申请中,用系数矩阵代替原始矩阵X1=W,由原始矩阵X的维度降低到了k维,得到降维矩阵X1。不但减少存储空间,而且在降维之后能够最大化保持数据的内在信息。
(4)对降维矩阵X1进行数据集的划分,得到初始训练集和测试集。
(5)基于深度置信网络DBN构建分类模型,利用训练集进行模型训练,提取样本隐藏的属性特征构建SVM输入训练集。
由于数据样本量不足,因此常规的一些机器学习的方法在特定样本集中不能取得较好的效果。例如传统的神经网络一般都是单隐层,最多两个隐层,因为一旦神经元个数太多、隐含层太多,模型的参数数量迅速增长,模型训练的时间非常之久,并且传统的神经网络,随着层数的增加,采用随机梯度下降的话一般很难找到最优解,容易陷入局部最优解。在反向传播过程中也容易出现梯度弥散或梯度饱和的情况,导致模型结果不理想。随着神经网络层数的增加,深度神经网络的模型参数很多,就要求在训练时需要有很大的标签数据,因为训练数据少的时候很难找到最优解,也就是说深度神经网络不具备解决小样本问题的能力。
而深度置信网络(DBN)通过采用逐层训练的方式,解决了深层次神经网络的优化问题,通过逐层训练为整个网络赋予了较好的初始权值,使得网络只要经过微调就可以达到最优解。在训练过程中起到重要作用的“受限玻尔兹曼机”(Restricted BoltzmannMachines,简称RBM)是由可见层、隐层组成,显元用于接受输入,隐元用于提取特征。也就是说,通过RBM训练之后,可以得到输入数据的特征,即提取了输入数据的隐形特征。
正是由于RBM的以上特点,使得DBN逐层进行训练变得有效,通过隐层提取特征使后面层次的训练数据更加有代表性,通过可生成新数据能解决样本量不足的问题。
如图4所示,在本申请的分类方法中,将降维后的每一样本的属性向量V作为DBN的输入。在该训练阶段,将可视层输入向量V传递到隐含层;反之,可视层的输入V会被随机的选择,以尝试去重构原始的输入数据。最后,这些新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得隐含层特征h1和h2。在训练过程中,执行吉布斯采样(Gibbs)重复以上过程。其中,隐含层激活单元和可视层输入之间的相关性差别就作为权值W1和W2更新的主要依据。
在输入数据和隐含层下的条件概率如下:
Figure BDA0002200236280000071
Figure BDA0002200236280000072
Figure BDA0002200236280000073
其中g为Sigmoid函数,其定义如下:
Figure BDA0002200236280000074
bi输入层的偏移(bias),ai隐含层的偏移。通过该步骤,得出样本数据的输出特征矩阵X2,将其作为下一步分类模型SVM的输入训练集。
(6)使用支持向量机(SVM)算法得出测试集对应的分类结果。
如图5所示,本发明分类方法的基本思想就是基于训练集Xtrain在特征空间中找到一个最佳划分超平面将正负样本分开。即将原来不可分的数据映射到一个新的空间,转换在新的空间中可分的数据来进行分类别。
将DBN的输出特征矩阵X2作为分类算法的训练集,即
XTrain=X2={xi|i∈{1,..,n}
对应的类别yi∈{0,1},那么线性SVM通过学***面如下所示:
w·x+b=0
以及相应的分类决策函数:
f(x)=sign(w·x+b)
其中参数w,b分别为超平面的法向量和截距。
将距离分离超平面最近的两个不同类别的样本点称为支持向量,构成了两条平行于分离超平面的长带,二者之间的距离称之为margin。显然,margin更大,则分类正确的确信度更高(与超平面的距离表示分类的确信度,距离越远则分类正确的确信度越高)。通过计算可得:
SVM分类问题可描述为在全部分类正确的情况下,在满足yi(w·xi+b)≥1情况下最大化
Figure BDA0002200236280000082
即在满足最小化如下函数:
接下来通过构造拉格朗日函数并求解偏导,可得到等价的对偶问题:
Figure BDA0002200236280000085
其中λi≥0为拉格朗日乘子(Lagrange multiplier)。
在早癌数据的分类问题中,将DBN输出的结果X2作为分类算法SVM的输入部分,得出训练模型,最后得出测试集对应的分类结果。
(7)使用评价指标对分类结果进行评价。
分类算法设计好之后,需要对其进行效果的评价,目前衡量算法精确度的常用指标有准确率、精确度、召回率以及F1分数。本发明使用一个2x2混淆矩阵来对其进行解释,该矩阵描述了分类可能出现的四种结果:
a.真正例(TP)是指分类模型将正类别样本正确地预测为正类别。
b.真负例(TN)是指分类模型将负类别样本正确地预测为负类别。
c.假正例(FP)是指分类模型将负类别样本错误地预测为正类别。
d.假负例(FN)是指分类模型将正类别样本正确地预测为负类别。
(1)准确率Accuracy是指我们的模型预测正确的结果所占的比,定义如下:
Figure BDA0002200236280000091
(2)精确度Precision是在被识别为正类别的样本中,确实为正类别所占的比例,定义如下:
Figure BDA0002200236280000092
(3)召回率Recall为在所有正类别样本中,被正确识别为正类别的样本所占的比例,定义如下:
Figure BDA0002200236280000093
(4)F1_Score综合了Precision和Recall的结果,是Precision和Recall加权调和平均。当F1_Score较高时则能说明试验方法比较有效。定义如下:
Figure BDA0002200236280000094
通过上述四个指标的评价,能够直观了解分类方法的分类效果和精确度。
以上所述仅为本发明的实施例子而已,并不用于限制本发明。凡在本发明的原则之内,所作的等同替换,均应包含在本发明的保护范围之内。本发明未作详细阐述的内容属于本专业领域技术人员公知的已有技术。

Claims (6)

1.一种早期结直肠癌非结构化数据的深度学习分类方法,其特征在于,包括以下步骤:
(1)对样本数据进行预处理,提取样本的属性数据集X和样本对应的标签数据集Y;
(2)对所述属性数据集X进行标准化处理,得到样本数据矩阵X’;
(3)使用非负矩阵分解(NMF)对所述样本数据矩阵X’进行降维,得到降维矩阵X1
(4)对所述降维矩阵X1进行数据集的划分,得到初始训练集和测试集;
(5)基于深度置信网络DBN构建分类模型,利用所述训练集进行模型训练,提取样本隐藏的属性特征构建SVM输入训练集;
(6)使用支持向量机(SVM)算法得出所述测试集对应的分类结果;
(7)使用评价指标对分类结果进行评价。
2.根据权利要求1所述的深度学习分类方法,其特征在于,在所述步骤(2)中,标准化处理采用的标准化函数为:
Figure FDA0002200236270000011
其中,μ为样本每一列属性数据的均值,σ为样本每一列属性数据的标准差;X为样本的属性数据集,X’为对样本数据X进行标准化处理得到的样本数据矩阵。
3.根据权利要求1所述的深度学习分类方法,其特征在于,所述步骤(3)中,将所述样本数据矩阵X’当成是一个非负的特征矩阵,其中每行表示一个样本的特征向量;
非负矩阵分解的目标是求解两个非负矩阵因子W∈Pn×k,H∈Pk×m,(n+m)*k<nm,其中n为样本数据的数量,m为所有样本属性的个数;使得两者的乘积近似于原始矩阵,即样本的属性数据集X,即:
X≈WH
其中,k表示低维空间的维度,W表示低维空间向量,称为基矩阵;H表示重构原矩阵的向量乘积的系数,称为权重矩阵;
将此分解问题建模为Frobenius范数最优化问题:
其中,约束条件W≥0,H≥0表示矩阵H,V的所有元素均非负;
用系数矩阵W代替原始矩阵X,由原始矩阵X的维度降低到k维,得到降维矩阵X1
4.根据权利要求1所述的深度学习分类方法,其特征在于,所述步骤(5)中,将降维后的样本的属性向量V作为DBN的输入;
在训练阶段,将可视层输入向量V传递到隐含层;否则,可视层的输入V会被随机的选择,以尝试去重构原始的输入数据;
新的可视的神经元激活单元将前向传递重构隐含层激活单元,获得隐含层的特征h1和h2
在训练过程中,执行吉布斯采样(Gibbs)重复以上过程;
其中,将隐含层激活单元和可视层输入之间的相关性差别作为权值W1和W2更新的主要依据;
在输入数据和隐含层下的条件概率如下:
Figure FDA0002200236270000021
Figure FDA0002200236270000022
Figure FDA0002200236270000023
其中g为Sigmoid函数,其定义如下:
Figure FDA0002200236270000024
bi输入层的偏移(bias),ai隐含层的偏移;
得出样本数据的输出特征矩阵X2,将其作为下一步分类模型SVM的输入训练集。
5.根据权利要求1所述的深度学习分类方法,其特征在于,在所述步骤(6)中,将所述样本数据的输出特征矩阵X2作为分类算法的训练集,
即XTrain=X2={xi|i∈{1,..,n},其中,xi为训练集中的各样本数据,n为训练集中样本数据的个数;对应的类别yi∈{0,1},
那么线性SVM通过学***面为:
w·x+b=0
以及相应的分类决策函数:
f(x)=sign(w·x+b)
其中,参数w,b分别为超平面的法向量和截距;
将距离分离超平面最近的两个不同类别的样本点称为支持向量,构成了两条平行于分离超平面的长带,二者之间的距离称之为margin;margin越大,则分类正确的确信度越高(与超平面的距离表示分类的确信度,距离越远则分类正确的确信度越高);
Figure FDA0002200236270000031
SVM分类问题即在全部分类正确的前提下,在满足yi(w·xi+b)≥1情况下最大化即在满足最小化如下函数:
Figure FDA0002200236270000033
通过构造拉格朗日函数并求解偏导,得到等价的对偶问题:
Figure FDA0002200236270000034
Figure FDA0002200236270000035
其中λi≥0为拉格朗日乘子(Lagrange multiplier)。
6.根据权利要求1所述的深度学习分类方法,其特征在于,在所述步骤(7)中,采用评价指标准确率、精确度、召回率以及F1分数对分类结果进行评价。
CN201910862508.5A 2019-09-12 2019-09-12 早期结直肠癌非结构化数据的深度学习分类方法 Pending CN110633368A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910862508.5A CN110633368A (zh) 2019-09-12 2019-09-12 早期结直肠癌非结构化数据的深度学习分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910862508.5A CN110633368A (zh) 2019-09-12 2019-09-12 早期结直肠癌非结构化数据的深度学习分类方法

Publications (1)

Publication Number Publication Date
CN110633368A true CN110633368A (zh) 2019-12-31

Family

ID=68972673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910862508.5A Pending CN110633368A (zh) 2019-09-12 2019-09-12 早期结直肠癌非结构化数据的深度学习分类方法

Country Status (1)

Country Link
CN (1) CN110633368A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484053A (zh) * 2023-06-21 2023-07-25 恒辉信达技术有限公司 智能数据分析平台
CN116612899A (zh) * 2023-07-19 2023-08-18 潍坊医学院附属医院 基于互联网的心血管外科数据处理方法及服务平台

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239638A1 (en) * 2006-03-20 2007-10-11 Microsoft Corporation Text classification by weighted proximal support vector machine
CN103198322A (zh) * 2013-01-18 2013-07-10 江南大学 基于机器视觉的磁瓦表面缺陷特征提取及缺陷分类方法
CN108198576A (zh) * 2018-02-11 2018-06-22 华南理工大学 一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法
CN108829763A (zh) * 2018-05-28 2018-11-16 电子科技大学 一种基于深度神经网络的影评网站用户的属性预测方法
CN109086809A (zh) * 2018-07-18 2018-12-25 安徽安大笃北信息科技有限责任公司 基于改进的监督局部线性嵌入的早期阿尔茨海默病分类方法
US20190005384A1 (en) * 2017-06-29 2019-01-03 General Electric Company Topology aware graph neural nets

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070239638A1 (en) * 2006-03-20 2007-10-11 Microsoft Corporation Text classification by weighted proximal support vector machine
CN103198322A (zh) * 2013-01-18 2013-07-10 江南大学 基于机器视觉的磁瓦表面缺陷特征提取及缺陷分类方法
US20190005384A1 (en) * 2017-06-29 2019-01-03 General Electric Company Topology aware graph neural nets
CN108198576A (zh) * 2018-02-11 2018-06-22 华南理工大学 一种基于语音特征非负矩阵分解的阿尔茨海默症初筛方法
CN108829763A (zh) * 2018-05-28 2018-11-16 电子科技大学 一种基于深度神经网络的影评网站用户的属性预测方法
CN109086809A (zh) * 2018-07-18 2018-12-25 安徽安大笃北信息科技有限责任公司 基于改进的监督局部线性嵌入的早期阿尔茨海默病分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
王亚娟 等: "基于Gabor小波和深度置信网络的肺结节良恶性分类研究", 《北京生物医学工程》 *
申时凯 等: "《基于云计算的大数据处理技术发展与应用》", 31 March 2019, 电子科技大学出版社 *
薛毅 等: "《实用数据分析与matlab软件》", 31 August 2015, 北京工业大学出版社 *
郑志勇 等: "《金融数量分析——基于MATLAB编程(第4版)》", 31 March 2018, 北京航空航天大学出版社 *
陈鹏展: "《个体行为的机器识别与决策协同》", 31 July 2018, 知识产权出版社 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484053A (zh) * 2023-06-21 2023-07-25 恒辉信达技术有限公司 智能数据分析平台
CN116484053B (zh) * 2023-06-21 2023-09-12 恒辉信达技术有限公司 智能数据分析平台
CN116612899A (zh) * 2023-07-19 2023-08-18 潍坊医学院附属医院 基于互联网的心血管外科数据处理方法及服务平台
CN116612899B (zh) * 2023-07-19 2023-10-10 潍坊医学院附属医院 基于互联网的心血管外科数据处理方法及服务平台

Similar Documents

Publication Publication Date Title
CN109036553B (zh) 一种基于自动抽取医疗专家知识的疾病预测方法
US11694123B2 (en) Computer based object detection within a video or image
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
Che et al. Deep computational phenotyping
CN113421652B (zh) 对医疗数据进行分析的方法、训练模型的方法及分析仪
Marlin et al. Unsupervised pattern discovery in electronic health care data using probabilistic clustering models
Sun et al. Intelligent analysis of medical big data based on deep learning
CN109036577B (zh) 糖尿病并发症分析方法及装置
CN111009321A (zh) 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
Biswal et al. EVA: Generating longitudinal electronic health records using conditional variational autoencoders
Nsugbe Toward a self-supervised architecture for semen quality prediction using environmental and lifestyle factors
CN110400610B (zh) 基于多通道随机森林的小样本临床数据分类方法及***
Pillai et al. Prediction of heart disease using rnn algorithm
Das et al. Deep learning techniques dealing with diabetes mellitus: a comprehensive study
Ju et al. 3D-CNN-SPP: A patient risk prediction system from electronic health records via 3D CNN and spatial pyramid pooling
CN110633368A (zh) 早期结直肠癌非结构化数据的深度学习分类方法
Zhang et al. Exploring unsupervised multivariate time series representation learning for chronic disease diagnosis
US20240028831A1 (en) Apparatus and a method for detecting associations among datasets of different types
Li et al. Bone disease prediction and phenotype discovery using feature representation over electronic health records
Subasi Applications of artificial intelligence in medical imaging
CN115035346A (zh) 一种基于协作学习方法增强的阿尔兹海默病的分类方法
Fekihal et al. Self-organizing map approach for identifying mental disorders
Prabhakar et al. HISET: Hybrid interpretable strategies with ensemble techniques for respiratory sound classification
Ema et al. Integration of Fuzzy C-Means and Artificial Neural Network with Principle Component Analysis for Heart Disease Prediction
Mienye Improved Machine Learning Algorithms with Application to Medical Diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination