CN116741393A - 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质 - Google Patents

基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质 Download PDF

Info

Publication number
CN116741393A
CN116741393A CN202310648204.5A CN202310648204A CN116741393A CN 116741393 A CN116741393 A CN 116741393A CN 202310648204 A CN202310648204 A CN 202310648204A CN 116741393 A CN116741393 A CN 116741393A
Authority
CN
China
Prior art keywords
model
classification
feature
medical record
thyroid disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310648204.5A
Other languages
English (en)
Inventor
窦琪翔
朱毅
朱顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou University
Original Assignee
Yangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou University filed Critical Yangzhou University
Priority to CN202310648204.5A priority Critical patent/CN116741393A/zh
Publication of CN116741393A publication Critical patent/CN116741393A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了医疗设备领域一种基于病历的甲状腺疾病数据集分类模型的构建方法,包括以下步骤:1)收集一定数量的甲状腺疾病患者的病历数据;2)从病历内容、现病史和体检结果中提取特征,形成特征向量表示每份病历;3)进行数据预处理,包括数据清洗、缺失值处理、特征归一化;4)将预处理后的特征向量作为输入,采取支持向量机算法、决策树算法、逻辑回归算法和随机森林算法为基分类器,建立集成模型,然后与其构成的单个分类器结果做横向对比;5)分别使用训练集和测试集对每个分类模型进行训练和评估,选择预测结果正确率最高的模型,本发明提高了疾病分类的准确性和可靠性。

Description

基于病历的甲状腺疾病数据集分类模型的构建方法、分类装 置及计算机可读介质
技术领域
本发明涉及医疗设备领域,特别涉及一种疾病数据集分类模型的构建方法。
背景技术
在现代医疗***中,疾病分类一直是医学领域中的重要挑战之一。在医疗过程中,准确地判断病情是治疗患者的前提和关键,而随着现代医疗技术的不断发展,医疗数据量的急剧增加,使得医学上的疾病数据集分类更具挑战性。面对大量的病例和复杂的病情,医生的判断结果可能会存在误差和主观性,从而影响了医疗质量。
近年来,随着人工智能和机器学习技术的发展,医学领域也开始利用这些新技术来提高疾病数据集分类的准确性和效率。信息技术的迅猛发展为医疗行业带来了新的机会。当前,种类繁多的医疗技术已广泛地应用于药物挖掘、医学影像、疾病分类等各个领域。随着科学技术的进步,机器学习在疾病分类领域中的应用将会越来越广泛、越来越重要。机器学习中的集成学习算法则是提高分类器准确率的一种有效途径,已经在很多领域显示出它优于单个分类器的良好性能。机器学习技术可以从数据中学习模式和规律,从而为医生提供更准确的疾病数据集分类结果。同时,随着医疗数据的不断积累和数字化,机器学习技术在医学领域中的应用前景越来越广阔。
而在众多疾病当中,对于甲状腺疾病的研究少之又少,甲状腺疾病相对又有鲜明而规律的疾病特征。因此将异构模式的集成学习应用于甲状腺疾病分类领域是十分合适的。
在现有的机器学习技术中,多标签分类是一种重要的技术手段,可以用于识别多个可能的疾病,并根据病情描述和体检内容等特征进行排序。同时,异构集成学习方法可以有效地将多个不同的分类算法进行组合,提高预测的准确性和可靠性。
虽然现有技术提供了一些基于机器学习的疾病数据集分类方法,但是仍存在一些问题。例如,现有的方法通常只能对单个疾病进行分类,难以应对多疾病的情况;同时,现有的方法通常仅仅基于某一个或某几个分类算法进行预测,难以提高分类的准确性和可靠性。因此,采用机器学习方法对疾病分类进行辅助,可以有效提高诊分类的准确性和可靠性。
目前,对于医学影像的自动分析已经得到了广泛的应用,比如基于深度学习的计算机辅助分类***在图像分类、疾病检测、病变分割等方面取得了显著的成果。但是,在医学疾病分类方面,由于病历的内容涉及到医生的文字叙述,其表达形式存在更大的不确定性和多样性,因此疾病分类的自动化处理相对更为困难。
当前的一些研究主要采用深度学习的方法来解决这个问题,比如将病历中的文字信息转化为向量表示,然后利用深度神经网络对病历进行分类,但这种方法需要大量的标注数据进行训练,而且由于病历的多样性和复杂性,对训练数据的要求很高,而且可能会存在过拟合等问题。
发明内容
本发明的目的是提供一种基于病历的甲状腺疾病数据集分类模型的构建方法,针对背景技术中的问题,将医院的病历作为模型输入的一个样本,通过特征提取和数据预处理,将多标签分类问题转化为多个二分类问题,并采用多种机器学习算法进行训练和融合,最终得到一个可靠的疾病分类模型,从而提高了疾病分类的准确性和可靠性。
本发明的目的是这样实现的:一种基于病历的甲状腺疾病数据集分类模型的构建方法,包括以下步骤:
步骤1)收集一定数量的甲状腺疾病患者的病历数据;
步骤2)从病历内容、现病史和体检结果中提取特征,形成特征向量表示每份病历;
步骤3)进行数据预处理,包括数据清洗、缺失值处理、特征归一化;
步骤4)将预处理后的特征向量作为输入,采取支持向量机算法、决策树算法、逻辑回归算法和随机森林算法为基分类器,建立集成模型,然后与其构成的单个分类器结果做横向对比;
步骤5)分别使用训练集和测试集对每个分类模型进行训练和评估,选择预测结果正确率最高的模型。
作为本发明的进一步限定,步骤2)中特征提取可以具体包括:
步骤2-1)根据病历内容和关键词匹配方法,提取与甲状腺疾病相关的关键特征;
步骤2-2)使用自然语言处理技术,用词袋模型将病历内容转化为数值特征;
步骤2-3)结合现病史和体检结果,提取与甲状腺疾病相关的数值特征。
作为本发明的进一步限定,在步骤3中数据预处理具体包括:
步骤3-1)进行数据清洗,包括处理缺失值、异常值和噪声数据;
步骤3-2)特征归一化,使用标准化方法将不同特征的值缩放到统一的范围;
步骤3-3)特征选择,根据相关性分析、特征重要性评估和基于模型的特征选择方法,选择与甲状腺疾病分类具有显著相关性,特征与甲状腺疾病的分类结果之间存在一定程度的关联并对甲状腺疾病分类具有高贡献度的特征子集。
作为本发明的进一步限定,在步骤4中构建多个分类模型具体包括:
步骤4-1)使用支持向量机算法,通过调整核函数和正则化参数进行模型训练:
步骤4-2)使用决策树算法,通过选择最佳***特征和树的深度进行模型训练;
步骤4-3)使用逻辑回归算法,通过最大似然估计进行模型训练;
步骤4-4)使用随机森林算法,通过构建多个决策树并进行投票决策进行模型训练。
作为本发明的进一步限定,所述步骤4-1)具体包括:
步骤4-1-1)选择高斯核函数以及正则化参数;
步骤4-1-2)基于训练数据集,通过最大间隔分类原则寻找一个超平面,将数据集分为不同的类别;
步骤4-1-3)通过凸优化方法确定超平面的位置和形状,使其能够区分不同的类别;
步骤4-1-4)根据训练数据集的特征向量和类别标签,建立支持向量机分类模型。
作为本发明的进一步限定,所述步骤4-2)具体包括:
步骤4-2-1)基于训练数据集的特征和类别标签,构建决策树模型;
步骤4-2-2)选择一个能够最有效区分不同甲状腺类别的特征作为最佳的***特征,使得在该特征的取值上能够最好地区分不同的类别;
步骤4-2-3)递归地进行***操作,直到达到预定的数据集最大深度;
步骤4-2-4)通过决策树的学习过程,形成一个可以根据输入特征向量进行分类预测的模型。
作为本发明的进一步限定,所述步骤4-3)具体包括:
步骤4-3-1)将特征向量和类别标签之间的关系建模为概率分布;
步骤4-3-2)基于训练数据集,通过最大似然估计方法估计模型参数,使得模型预测的概率与实际观测值的概率最相符;
步骤4-3-3)通过梯度下降法迭代地更新模型参数,直到模型参数的变化或损失函数的变化不再显著;
步骤4-3-4)建立逻辑回归分类模型,能够根据输入特征向量预测对应的类别概率。
作为本发明的进一步限定,所述步骤4-4)具体包括:
步骤4-4-1)基于训练数据集,随机选择特征子集和样本子集构建多个决策树模型;
步骤4-4-2)对于新的输入样本,每个决策树都进行独立的分类预测;
步骤4-4-3)通过平均的方式,将每棵决策树的分类结果组合起来,得到最终的模型预测结果。
一种基于病历的甲状腺疾病数据集分类装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的构建程序,所述构建程序被所述处理器执行时实现上述构建方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有构建程序,所述构建程序被处理器执行时实现上述构建方法的步骤。
与现有技术相比,本发明的有益效果在于:
本发明针对甲状腺相关的138类病症和其对应的35类疾病进行分类,涵盖了更全面、更细致的疾病范围,可以更准确地进行疾病分类;
采用了机器学习中的多标签分类问题模型,能够对每一份病历拥有多类疾病标签,更贴合实际临床情况;
使用了Bagging算法的异构集成学习方法,有效地减少了模型的过拟合问题,并提高了模型的泛化能力;
采用了模型融合策略,通过对不同分类器的预测结果进行误差分析,能够更准确地预测疾病的种类,提高了疾病数据集分类的准确性;
通过对大量的病历数据进行特征提取和数据预处理,能够更好地利用数据进行疾病数据集分类,提高了疾病数据集分类的效率;
综上所述,该发明在分类范围、模型选择、算法优化、模型融合和数据利用等方面均有创新,能够更准确地进行疾病分类,并提高了临床工作的效率和准确性。
附图说明
图1为本发明的流程示意图
图2为本发明中异构集成学习算法的流程示意图
具体实施方式
实施例1
如图1所示的一种基于病历的甲状腺疾病数据集分类模型的构建方法,包括以下步骤:
步骤1,采集1880份病历样本数据并进行预处理;
步骤2,构建算法模型;
步骤3,训练模型并进行预测;
步骤4,对测试集进行预测和模型集成。
进一步的,实施例1中,步骤1中采集数据并进行预处理,具体过程包括:
步骤1-1,采集数据:从医院中采集到1880份甲状腺疾病患者的病历记录,包括现病史、体检内容和医生判断结果。
步骤1-2,特征提取:采用特征提取算法从所有病历样本中提取到138类甲状腺相关症状(如心慌、乏力、发胖、饥饿等)和其对应的35类疾病(如甲状腺功能亢进、甲状腺功能减退、甲状腺结节、甲状腺***状癌等)的序列,作为样本的特征。
步骤1-3,数据预处理:对于每一份病历,针对病症和疾病序列,分别生成138维特征向量和其对应的35维目标向量。其中,如果该病历中存在该病症即为1,否则为0。同样地,如果该病例中存在该疾病即为1,否则为0。
下列为一个实施例中总体中的部分样本分布。
病名 数目 标记标签
炎性甲亢 878 0或1
原发甲亢 567 0或1
甲状腺***状癌 3 0或1
甲状腺滤泡癌 2 0或1
甲状腺髓样癌 1 0或1
甲状腺良性肿瘤术后甲低 5 0或1
非毒性甲状腺肿 121 0或1
甲状腺功能减退症 234 0或1
发胖 145 0或1
进一步的,实施例1中,步骤2中构建算法模型,具体过程包括:
步骤2-1,将采集到的1880份病历样本划分为训练集和测试集。
步骤2-2,采用Bagging算法的异构集成学习方法,对训练集进行多次随机有放回地抽样,构造出N个不同的训练集,并针对每个训练集,训练出一个多标签分类模型,其中N≥2。
步骤2-3,采用模型融合策略,根据样本真实值与各个分类器预测结果的误差,对分类器进行分类,分别得到各个类的可信模型,进而得出预测结果。
步骤2-4,采用多标签分类的SVM、决策树、逻辑回归和随机森林算法,利用One-VS-the-Rest策略训练N个多标签分类模型。
进一步的,实施例1中,步骤3中训练模型并进行预测,具体过程包括:
步骤3-1,对于预先划分的训练集,运用上述模型,分别进行训练。
步骤3-2,针对测试集,对每个多标签分类模型进行预测,得到N个预测结果。对于每个测试样本,将N个预测结果转化为一个多维行向量,并与真实结果作对比,取得包含多个类别的可信模型。
进一步的,实施例1中,步骤4中对测试集进行预测和模型集成,具体过程包括:
步骤4-1,使用训练好的模型对测试集进行预测和模型集成。对于测试集中的每一个病历,首先通过One-VS-the-Rest策略将其预测为多个二元分类问题,每个问题对应一个分类器,得到该病历在每个分类器下的预测结果。
步骤4-2,对于每个分类器,将其预测结果与测试集真实值进行比对,得到该分类器的准确率、召回率和F1值,并计算出该分类器的误差。
步骤4-3,针对每个类别,将误差小于某一阈值的分类器定义为该类别的可信模型。如果测试集中的某个样本能够被某个可信模型所预测,那么就将该类别加入到该样本的最终预测结果中。
步骤4-4,最后,将所有样本的最终预测结果进行汇总,得到整个测试集的预测结果。同时,计算预测结果的准确率、召回率和F1值,评估整个模型的性能表现。
通过以上方法,可以有效地利用医院的大量病历数据,构建出一个可靠的多标签疾病分类模型,并能够对测试集中的病历进行准确的疾病分类预测。
实施例2
结合图2,本发明为实例1中步骤2-3提供一个模型融合算法,其用于构建算法模型,包括:
步骤1,给定包含n个样本的数据集D,对其进行采样产生数据集D′:
步骤2,每次随机从D中挑选一个样本,将其拷贝放入D′中,然后再将该样本重新放回初始数据集D中,使得该样本在下次采样时仍有可能被抽到,这个过程重复执行k次,得到包含n个样本的数据集D′。
D中有一部分样本会在D′中多次重复出现,样本在k次采样过程中始终不被采到的概率为取极限得/>通过自助采样,原始数据集D中可能有36.8%的样本未出现在采样数据集D′中。
可将D′用作训练集,D\D′用作测试集,实际评估的模型与期望评估的模型就都使用n个样本。
步骤3,抽样完成后,通过多轮相异算法训练得到一个预测函数序列,最终的预测函数对分类问题进行融合。这样通过融合多个分类模型错误地预测一个新样本的可能性要低于一个单独的模型。
进一步的,在实施例2中,步骤3首先考虑首先采用“自助采样”的方法,其次利用模型融合的算法,以此对SVM、决策树、逻辑回归和随机森林算法进行分类,使其迭代产生对每个类别的可信模型,随后选取最终的模型结果。
具体过程如下:
步骤4-1,输入样本训练数据集;
步骤4-2,训练N个相异算法的多标签分类模型;
步骤4-3,在所有测试样本中,针对N个模型预测结果的0/1多维行向量,分别与真实结果作对比,取得包含多个类别的可信模型;
步骤4-4,对于测试集,如果能够找到某一类别由其可信模型预测得到,那么就把该类疾病加入到最终的预测结果中,最后分别对比模型的准确率、召回率与F1值。
在该技术方案中,利用One-VS-the-Rest策略训练N个相异算法的多标签分类模型,并对模型进行模型融合以提高预测性能,同时,使用138维特征向量和35维目标向量对数据进行处理,从而更好地反映了样本的特征。这种基于多标签分类的疾病预测方法具有准确率高、召回率高、F1值高的特点,适用于甲状腺疾病等多种疾病的预测。
本发明可以针对甲状腺相关的138类病症和其对应的35类疾病进行分类,涵盖了更全面、更细致的疾病范围,能够更准确地进行疾病分类。该模型采用了机器学习中的多标签分类问题模型,能够对每一份病历拥有多类疾病标签,更贴合实际临床情况。同时,该模型采用了基于异构集成学习方法的算法优化,通过模型融合策略和数据预处理等手段提高了分类准确性和效率。
实施例3
一种基于病历的甲状腺疾病数据集分类装置,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的构建程序,所述构建程序被所述处理器执行时实现实施例1所述的构建方法的步骤。
实施例4
一种计算机可读存储介质,所述计算机可读存储介质上存储有构建程序,所述构建程序被处理器执行时实现实施例1所述的构建方法的步骤。
本发明并不局限于上述实施例,在本发明公开的技术方案的基础上,本领域的技术人员根据所公开的技术内容,不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形,这些替换和变形均在本发明的保护范围内。

Claims (10)

1.一种基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,包括以下步骤:
步骤1)收集一定数量的甲状腺疾病患者的病历数据;
步骤2)从病历内容、现病史和体检结果中提取特征,形成特征向量表示每份病历;
步骤3)进行数据预处理,包括数据清洗、缺失值处理、特征归一化;
步骤4)将预处理后的特征向量作为输入,采取支持向量机算法、决策树算法、逻辑回归算法和随机森林算法为基分类器,建立集成模型,然后与其构成的单个分类器结果做横向对比;
步骤5)分别使用训练集和测试集对每个分类模型进行训练和评估,选择预测结果正确率最高的模型。
2.根据权利要求1所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,步骤2)中特征提取可以具体包括:
步骤2-1)根据病历内容和关键词匹配方法,提取与甲状腺疾病相关的关键特征;
步骤2-2)使用自然语言处理技术,用词袋模型将病历内容转化为数值特征;
步骤2-3)结合现病史和体检结果,提取与甲状腺疾病相关的数值特征。
3.根据权利要求1或2所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,在步骤3中数据预处理具体包括:
步骤3-1)进行数据清洗,包括处理缺失值、异常值和噪声数据;
步骤3-2)特征归一化,使用标准化方法将不同特征的值缩放到统一的范围;
步骤3-3)特征选择,根据相关性分析、特征重要性评估和基于模型的特征选择方法,选择与甲状腺疾病分类具有显著相关性,特征与甲状腺疾病的分类结果之间存在一定程度的关联并对甲状腺疾病分类具有高贡献度的特征子集。
4.根据权利要求1或2所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,在步骤4中构建多个分类模型具体包括:
步骤4-1)使用支持向量机算法,通过调整核函数和正则化参数进行模型训练:
步骤4-2)使用决策树算法,通过选择最佳***特征和树的深度进行模型训练;
步骤4-3)使用逻辑回归算法,通过最大似然估计进行模型训练;
步骤4-4)使用随机森林算法,通过构建多个决策树并进行投票决策进行模型训练。
5.根据权利要求4所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,所述步骤4-1)具体包括:
步骤4-1-1)选择高斯核函数以及正则化参数;
步骤4-1-2)基于训练数据集,通过最大间隔分类原则寻找一个超平面,将数据集分为不同的类别;
步骤4-1-3)通过凸优化方法确定超平面的位置和形状,使其能够区分不同的类别;
步骤4-1-4)根据训练数据集的特征向量和类别标签,建立支持向量机分类模型。
6.根据权利要求4所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,所述步骤4-2)具体包括:
步骤4-2-1)基于训练数据集的特征和类别标签,构建决策树模型;
步骤4-2-2)选择一个能够最有效区分不同甲状腺类别的特征作为最佳的***特征,使得在该特征的取值上能够最好地区分不同的类别;
步骤4-2-3)递归地进行***操作,直到达到预定的数据集最大深度;
步骤4-2-4)通过决策树的学习过程,形成一个可以根据输入特征向量进行分类预测的模型。
7.根据权利要求4所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,所述步骤4-3)具体包括:
步骤4-3-1)将特征向量和类别标签之间的关系建模为概率分布;
步骤4-3-2)基于训练数据集,通过最大似然估计方法估计模型参数,使得模型预测的概率与实际观测值的概率最相符;
步骤4-3-3)通过梯度下降法迭代地更新模型参数,直到模型参数的变化或损失函数的变化不再显著;
步骤4-3-4)建立逻辑回归分类模型,能够根据输入特征向量预测对应的类别概率。
8.根据权利要求4所述的基于病历的甲状腺疾病数据集分类模型的构建方法,其特征在于,所述步骤4-4)具体包括:
步骤4-4-1)基于训练数据集,随机选择特征子集和样本子集构建多个决策树模型;
步骤4-4-2)对于新的输入样本,每个决策树都进行独立的分类预测;
步骤4-4-3)通过平均的方式,将每棵决策树的分类结果组合起来,得到最终的模型预测结果。
9.一种基于病历的甲状腺疾病数据集分类装置,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的构建程序,所述构建程序被所述处理器执行时实现如权利要求1至8中任一项所述的构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有构建程序,所述构建程序被处理器执行时实现如权利要求1至8中任一项所述的构建方法的步骤。
CN202310648204.5A 2023-06-02 2023-06-02 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质 Pending CN116741393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310648204.5A CN116741393A (zh) 2023-06-02 2023-06-02 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310648204.5A CN116741393A (zh) 2023-06-02 2023-06-02 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质

Publications (1)

Publication Number Publication Date
CN116741393A true CN116741393A (zh) 2023-09-12

Family

ID=87914394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310648204.5A Pending CN116741393A (zh) 2023-06-02 2023-06-02 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质

Country Status (1)

Country Link
CN (1) CN116741393A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117743957A (zh) * 2024-02-06 2024-03-22 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的Th2A细胞的数据分选方法及相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117743957A (zh) * 2024-02-06 2024-03-22 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的Th2A细胞的数据分选方法及相关设备
CN117743957B (zh) * 2024-02-06 2024-05-07 北京大学第三医院(北京大学第三临床医学院) 一种基于机器学习的Th2A细胞的数据分选方法及相关设备

Similar Documents

Publication Publication Date Title
Amirgaliyev et al. Analysis of chronic kidney disease dataset by applying machine learning methods
Zheng et al. Breast cancer diagnosis based on feature extraction using a hybrid of K-means and support vector machine algorithms
JP2022538866A (ja) 画像前処理のためのシステム及び方法
Wakili et al. Classification of breast cancer histopathological images using DenseNet and transfer learning
Dong et al. Cervical cell classification based on the CART feature selection algorithm
Thilagaraj et al. [Retracted] Classification of Breast Cancer Images by Implementing Improved DCNN with Artificial Fish School Model
CN116741393A (zh) 基于病历的甲状腺疾病数据集分类模型的构建方法、分类装置及计算机可读介质
Bajcsi et al. Towards feature selection for digital mammogram classification
Salman et al. Gene expression analysis via spatial clustering and evaluation indexing
Roselin et al. Fuzzy-rough feature selection for mammogram classification
Folorunso et al. EfficientNets transfer learning strategies for histopathological breast cancer image analysis
Mohapatra et al. Automated invasive cervical cancer disease detection at early stage through deep learning
Monfared et al. Assessing classical and evolutionary preprocessing approaches for breast cancer diagnosis
Cripsy et al. Lung Cancer Disease Prediction and Classification based on Feature Selection method using Bayesian Network, Logistic Regression, J48, Random Forest, and Naïve Bayes Algorithms
Patel et al. Two-Stage Feature Selection Method Created for 20 Neurons Artificial Neural Networks for Automatic Breast Cancer Detection
Ponraj et al. Deep learning with histogram of oriented gradients-based computer-aided diagnosis for breast cancer detection and classification
Dutta et al. Cross-validated AdaBoost classifier used for brain tumor detection
Kasthuri et al. AI‐Driven Healthcare Analysis
Kaur et al. Prediction of Liver Disorders Using Simple Logistic Technique of Machine Learning
Sumithra et al. Optimizing Brain Tumor Recognition with Ensemble support Vector-based Local Coati Algorithm and CNN Feature Extraction
Latif et al. Improving Thyroid Disorder Diagnosis via Ensemble Stacking and Bidirectional Feature Selection.
Safia Naveed Prediction of breast cancer through Random Forest
Boumaraf et al. Conventional Machine Learning versus Deep Learning for Magnification Dependent Histopathological Breast Cancer Image Classification: A Comparative Study with Visual Explanation. Diagnostics, 2021; 11 (3): 528
Kadhim et al. Ensemble Model for Prostate Cancer Detection Using MRI Images
Madhuri et al. Analysis and Design for the Early Stage Detection of Lung Diseases Using Machine Learning Algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination