CN111696678B - 一种基于深度学习的用药决策方法和*** - Google Patents

一种基于深度学习的用药决策方法和*** Download PDF

Info

Publication number
CN111696678B
CN111696678B CN202010543306.7A CN202010543306A CN111696678B CN 111696678 B CN111696678 B CN 111696678B CN 202010543306 A CN202010543306 A CN 202010543306A CN 111696678 B CN111696678 B CN 111696678B
Authority
CN
China
Prior art keywords
patient
medication
information
vector
potential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010543306.7A
Other languages
English (en)
Other versions
CN111696678A (zh
Inventor
吴嘉
余庚花
张璇
田晓明
常柳
庄庆贺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010543306.7A priority Critical patent/CN111696678B/zh
Publication of CN111696678A publication Critical patent/CN111696678A/zh
Application granted granted Critical
Publication of CN111696678B publication Critical patent/CN111696678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一基于深度学习的用药决策方法和***,通过收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实际疗效评估信息,以获取分析数据集,并通过构建的疗效预测模型来分析处理所述分析数据集,以预测各个所述用药方案对不同的所述患者治疗效果的预测疗效评估信息,并根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用药方案。所述用药决策方法和***在进行用药方案的推荐时具有较高的准确性和稳定性,适用于医学临床应用。

Description

一种基于深度学习的用药决策方法和***
技术领域
本发明属于医疗人工智能辅助诊断技术领域,具体是涉及到一种基于深度学习的用药决 策方法和***。
背景技术
在医疗人工智能研究中,智能化的辅助诊断***可以帮助医生做出病情的分析和诊断, 有助于提高患者就医的效率,缩短病人的诊疗时间和周期,同时有效的减少了医生的工作量, 可缓当前社会医疗资源不足的问题。
药物的多样性和患者不同的病理特点使药物治疗复杂化,多种影响因素都可以对用药剂 量产生影响,单纯依靠医师的个人判断力往往不够,可能由于信息采集不全或者个人知识储 备不足导致用药错误,例如对于非小细胞肺癌患者而言,需要为他们提供合理适用于他们自身个性化的靶向药的用药方案是医生诊断中最关键的环节,这就要求医生具备非常丰富的经 验。智能化的用药决策方法和***可以通过采集患者以及与患者相关的历史用药信息,再通 过用药决策模型进行相应的计算和处理为为患者的用药提供预测性的决策,以供医生参考。 因此,这种智能化的用药决策***可以较好提高医疗质量、节省医疗成本,及时、准确、完整的为医师提供专业的用药决策支持,有助于医师作出正确有效的药物治疗决策,提高药物 治疗的成功率。
现有的用药决策方法一般仅通过患者历史用药记录的分析来给患者推荐下一次的用药方 案,这种方法依赖于医生用药的偏向性,即依赖于隐式反馈给患者提供用药方案的推荐决策。 但是,由于用药记录的稀疏性,仅仅凭着医生用药经验性偏好的隐式反馈的方法限制了疗效预测模型的性能,从而影响了用药决策的准确性。因此,现有的基于机器学习的用药决策系 统并不能在实际临床中得到广泛应用。
发明内容
有鉴于此,本发明提供了一种基于深度学习的用药决策方法和***,以提高用药方案推 荐的准确性。
一种基于深度学习的用药决策方法,包括:
收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实际疗效评 估信息,以获取分析数据集,
构建疗效预测模型,以根据所述分析数据集分析各个所述患者之间的关系、所述用药方 案之间的关系,并结合所述实际疗效评估信息预测各个所述用药方案对不同的所述患者治疗 效果的预测疗效评估信息,
根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用药方案。
优选地,所述预测模型获取所述预测疗效评估信息的步骤包括:
获取表征所述患者和所述用药方案之间关系的关系矩阵,所述关系矩阵中的关系元素表 征所述患者与所述用药方案之间的关系,若所述患者使用过所述用药方案,则对应的所述关 系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则对应的所述关系元素设置为第一固定值,
根据所述关系矩阵获取患者潜在向量和所述药物潜在向量,每一个所述一个患者潜在向 量的表示一个患者和不同的用药方案之间的关系,每一个所述药物潜在向量表示一个用药方 案和不同的患者之间的关系,
根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和用药方案 辅助信息矩阵,所述患者辅助信息矩阵中的元素表示包含所述患者相关的信息,所述用药方 案辅助信息矩阵中的元素表示所述用药方案相关的信息,
通过SDAE自编码器分别从所述患者辅助信息矩阵和用药方案辅助信息矩阵中提取患者 潜在因子向量和用药方案潜在因子向量,所述患者潜在因子向量和用药方案潜在因子向量为 所述自编码器的隐藏层输出信息,
将所述药物潜在向量、所述药物方案潜在向量、所述患者因子向量以及所述用药方案因 子向量通过神经网络进行协同过滤,从以学习各个所述患者之间的相似性和各个所述用药方 案之间的相似性,并结合所述患者和所述患者的历史用药方案之间的关系预测每一个所述用药方案对各个不同的所述患者的治疗效果,以获得所述预测疗效评估信息。
优选地,所述分析数据集包括患者集合和用药方案集合,根据所述关系矩阵获取患者潜 在向量和所述药物潜在向量的步骤包括:
将所述关系矩阵中的非所述第一固定值值均设置为第二固定值,以获得相似关系矩阵,
根据所述相似关系矩阵,获取表征各个所述患者对应的各个患者标签向量和表征各个所 述药物方案对应药物标签向量,所述患者集合中的第i个患者标签向量除第i个元素为所述第二固定值外,其余的元素均设置为所述第一固定值,所述药物方案集合中的第j个药物方案 标签向量除第j个元素为第二固定值外,其余的元素均设置为所述第一固定值,
从所述相似关系矩阵中提取第i个所述患者与所述用药方案集合中的各个用药方案之间 关系的患者-用药方案关系特征向量,
从所述相似关系矩阵中提取第j个所述用药方案与所述患者集合中的各个患者之间关系 的患用药方案-患者关系特征向量,
将所述患者-用药方案关系特征向量与所述第i个患者标签向量相连接,以获得所述第i 个患者对应的所述患者潜在向量,
将所述用药方案-患者关系特征向量与所述第j个患者标签向量相连接,以获得所述第j 个用药方案对应的所述药物潜在向量。
优选地,分别将所述患者辅助信息矩阵和所述药物方案辅助信息矩阵中的元素随机的设 置为所述第一固定值后,再分别通过所述SDAE自编码器提取患者潜在因子向量和用药方案 潜在因子向量。
优选地,通过最小化重构误差训练所述SDAE自编码器来学习所述患者潜在因子向量和 所述药物方案潜在向量。
优选地,所述疗效预测模型的损失函数由所述SDAE自编码器在进行特征提取过程中的 最小化重构误差和所述疗效预测模型进行所述疗效预测的预测误差组成,
所述预测误差根据所述预测疗效评估信息和所述实际疗效评估信息确定。
优选地,根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用 药方案包括:
将所述预测疗效评估信息中的预测疗效评估值按照大小从大到小排序,选择排序中前K 个所述预测疗效评估值对应的药物方案推荐给所述患者。
优选地,通过嵌入层将离散的所述患者潜在向量和所述药物方案潜在向量转换成连续的 向量表示输入至所述神经网络。
一种基于深度学习的用药决策***,包括:数据收集模块、疗效预测模块和决策模块, 被配置为收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实际疗 效评估信息,以获取分析数据集,
所述疗效预测模块,被配置为根据所述分析数据集提取患者特征信息和、用药方案特征, 并根据提取的各个特征信息训练所述疗效预测模型,以获取各个用药方案对不同的患者治疗 效果的预测疗效评估信息,
所述决策模块,被配置为根据所述预测疗效评估信息给所述患者推荐适合所述患者个性 化要求的所述用药方案。
优选地,所述疗效预测模块包括:
输入层,被配置为根据所述分析数据获取获取表征所述患者和所述用药方案之间关系的 关系矩阵,所述关系矩阵中的关系元素表征所述患者与所述用药方案之间的关系,若所述患 者使用过所述用药方案,则对应的所述关系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则对应的所述关系元素设置为第一固定值,并 根据所述关系矩阵获取患者潜在向量和所述药物潜在向量,每一个所述一个患者潜在向量的 表示一个患者和不同的用药方案之间的关系,每一个所述药物潜在向量表示一个用药方案和 不同的患者之间的关系,以及根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和用药方案辅助信息矩阵,所述患者辅助信息矩阵中的元素表示包含所述患者 相关的信息,所述用药方案辅助信息矩阵中的元素表示所述用药方案相关的信息,
嵌入层,被配置为将所述患者潜在向量和所述用药方案向量嵌入从离散的数据转换成连 续的向量表示输入至所述神经网络层,
第一SDAE自编码器,被配置为从所述患者辅助信息矩阵中提取患者潜在因子向量,所 述患者潜在因子向量为所述第一SDAE自编码器的隐藏层输出信息,
第二SDAE自编码器,被配置为从所述用药方案辅助信息矩阵中提取用药方案潜在因子 向量,所述用用药方案潜在因子向量为所述第二SDAE自编码器的隐藏层输出信息,
神经网络层,被配置为对所述药物潜在向量、所述药物方案潜在向量、所述患者因子向 量以及所述用药方案因子向量进行协同过滤处理,从而获取所述预测疗效评估信息。
本发明的有益效果之一:是通过疗效预测模型分析各个所述患者之间的关系、所述用药 方案之间的关系,并结合所述实际疗效评估信息预测各个所述用药方案对不同的所述患者治 疗效果的预测疗效评估信息,以根据所述预测疗效评估信息进行所述用药方案的推荐,不依赖于所述患者和用药方案之间的历史记录关系,从而具有较高推荐准确度。
本发明的有益效果之二:通过患者辅助相关信息和用药方案辅助相关信息的特征提取, 与所述患者和用药方案的历史用药记录的表示进行协同过滤处理,以提高所述疗效预测模型 的稳定性。
附图说明
图1为利用本发明提供的用药决策方法的智能医疗辅助诊断***示意图;
图2为依据本发明提供的基于深度学习的用药决策***的结构框图;
图3为用药方案作为候选项的样例占用药方案分类正确的样例的比例ks随着K值变化的 情况示意图;
图4为疗效评估值的重要性参数和辅助信息重要性参数与评估指标Acc的关系示意图;
图5为疗效评估值的重要性参数和辅助信息重要性参数与评估指标Sen的关系示意图;
图6为疗效评估值的重要性参数和辅助信息重要性参数与评估指标Spec的关系示意图;
图7为腺癌患者在三线治疗情况下采样指标的变化示意图;
图8为鳞癌患者在三线治疗情况下采样指标的变化示意图;
图9为本发明的用药决策***的准确率体现示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描 述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中 的实施例,本领域普通技术人员在没有做出创造性劳动前提下所产生的所有其他实施例,都属于本发明保护的范围。此外需要说明的是,在具体实施方式这一项内容中“所述…”是仅 指本发明的中的技术属于或特征。
为了使用药决策***能够真正应用于临床,以辅助医生做出适合患者的用药方案决策, 本发明提供了一种基于深度学习的用药决策方法。通过所述用药决策方法,可实现对非小细 胞肺癌患者的靶向药物用药方案的决策,从而可以辅助医生给肺癌患者提供最适合的靶向药物,有效的节约了患者和医生的时间成本。图1为利用本发明提供的用药决策方法的智能医 疗辅助诊断***示意图,所述辅助诊断***主要由医生、患者、用药决策模块(运行于图1 中坐着的医生的电脑中)和数据存储分析模块(如云存储服务中心)构成。患者就医时,所 述患者的相关信息会通过所述数据存储分析模块存储以行程患者的电子病历,医生根据所述 电子病历对患者进行检查,以获取患者的检查数据,并把检查数据反馈至数据存储分析模块 存储分析,所述医生在对所述患者出诊断结果前会向所述药决策模块中发出用药决策计划,药决策模块根据所述存储分析模块存储的患者的相关资料给医生反馈一个用药决策结果并将 决策的诊断结果存储在所述数据存储分析模块,医生再根据自身经验和所述用药决策结果给 出患者的诊断结果,并将患者的诊断结果反馈至数据存储分析模块中存储。所述用药决策即 从存储在所述数据存储分析模块中的用药方案集合中筛选出适合患者的个性化用药决策,从而给医生提供***的决策方案,辅助医生做二次诊断。医生给出二次诊断的分析结果并给出 决策意见反馈,形成病历存储数据存储分析模块,以给用药决策模块提供新的样例,帮助完 善训练模型,逐步循环提高预测精确度。
依据本发明实施例提供的所述用药决策***主要包括步骤1至步骤3,但是各个所述步 骤的先后顺序并不限定为本实施例所示的步骤。
步骤1:收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实 际疗效评估信息,以获取分析数据集。
本发明实施例中,患者为非小细胞肺癌患者,用药方案为靶向药物方案。患者之间的关系、患者在使用完靶向药物方案后的反馈情况(靶向药物方案对患者的实际疗效)以及靶向药物方案之间的关系对药物方案的决策都有着重要的影响,因此我们可以通过收集患者 相关信息、靶向药物方案相关信息以及患者使用过靶向药物方案后的实际疗效评估信息来获取用分析数据集以供疗后续的效预测模型根据这些分析数据预测各个所述靶向药物患者对 各个患者的治疗效果的预测疗效评估信息。
我们通过收集患者的历史诊疗记录,以及整理靶向药物对于癌症患者每期的用药记 录,靶向药物的特征记录等建立基于数据和特征分析的靶向用药决策***。
我们通过数据中心收集的患者相关信息包括患者诊断、疾病、手术、护理计划、药物选 择等数据以及患者图像信息,检测信息,诊断记录,用药情况记录等数据,并对这些数据做 了整理和归类,以为用药决策提供全面的分析数据信息。此外,所述患者相关信息除了与所述患者病情主要相关的这些信息外,还包括如用药,家族史,治疗措施,身高,体重,年龄, 性别,生活习惯,症状和副作用等患者辅助相关信息,从而有利于分析不同患者之间的相似 性。例如,若所述患者为非小细胞肺癌患者,所述患者辅助相关信息还包括肿瘤突变基因和 肺癌分期等。而所述用药方案相关信息主为各种对患者的疾病具有一定疗效的各种联合用药组合外,还包药方案辅助相关信息,所述辅助相关信息包含各种不同用药的药物的分子结构, 化学结构,副作用,对应的靶点之间的关系(对应非小细胞肺癌患者而言的)。通过所述用药 方案的辅助相关信息可以获取与所述用药方案相似的用药方案推荐给所述患者。每一个所述 药方案是给患者提供治疗的一套方案,例如对应非小细胞肺癌患者而言,所述用药方案为靶 向药物组合方案,所述靶向药物组合方案中包含了用药的种类和用量等信息。患者和用药方 案的相似性信息可以帮助我们预测患者和用药方案之间的未知关系,如患者A的历史用药记 录中并未记载使用用药方案B,但是与患者A具有高度相似性的患者C使用过用药方案B,且具有很好的实际疗效,则我们可以推荐用药方案B给患者A。因此,根据患者的辅助相关 信息和用药方案的辅助相关信息,可以帮助医生推荐合适的相关用药方案给患者,具体如何 进行用药方案的推荐,后续会详细介绍。本步骤收集的用药分析的数据信息在进行相应处理后获取了各个进行预测分析的数据集合,例如患者集合、用药方案集合以及用药方案对患者 的实际疗效评估值集合。所述患者集合中包括多个患者,而所述用药方案集合中包括了各种 能够治疗所述患者疾病的相关药物方案。
步骤2:构建疗效预测模型,以根据所述分析数据集分析各个所述患者之间的关系、所 述用药方案之间的关系,并结合所述实际疗效评估信息预测各个所述用药方案对不同的所述 患者治疗效果的预测疗效评估信息。
在所述疗效预测模型中,我们先提取患者相关信息、用药方案相关信息以及患者与用药 方案之间的关系相关信息的隐藏特征表示,然后再通过神经网络整合提取的隐藏特征信息训 所述练疗效预测模型,以预测出所述预测疗效评估信息。
具体的,如图2所示,在本实施例中,所述疗效预测模型主要包括输入层、第一SDAE自编码器、第二SDEA自编码器和神经网络层构成。步骤2可进一步包括步骤21至步骤25, 但是所述步骤21至步骤25之间的顺序关系不局限于本实施例所示。
步骤21:获取表征所述患者和所述用药方案之间关系的关系矩阵,所述关系矩阵中的关 系元素表征所述患者与所述用药方案之间的关系,若所述患者使用过所述用药方案,则对应 的所述关系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则对应的所述关系元素设置为第一固定值。
我们假设步骤1中获取的患者集合为pat,用药方案集合为med,所述患者集合中的患者 pati(患者集合中的第i个患者)在使用过所述用药方案集合中的用药方案medj(患者集合中的 第j个患者)后,所述用药方案medj对所述患者Pati的实际疗效评估值为eij。图2中的输入 层根据患者集合为Pat,用药方案集合为med以及实际疗效评估值为eij构建所述关系矩阵E1,。 在本实施例中,所述关系矩阵E1的各个行表示患者集合Pat中各个患者相关信息,而各个列 则表示用药方案集合med中各个用药方案的相关信息,需要说明的是图2中的行名称和列名 称简单用患者和药物来分别示意患者集合和用药方案集合。所述关系矩阵E1中,与患者Pati 和用药方案medj所对应处的的元素则为eij,eij表示患者pati在该期治疗中选择了用药方案 medj治疗之后的实际效果情况评估值。如果患者pati在历史记录中使用过药物组合medj,并 对其疗效有个记录,则eij的值为记录的实际疗效评估值,这意味着患者pati在使用药物方案 medj后的治疗情况有被观察到。如果患者pati在使用用药方案medj后的治疗情况不被观察 到或者患者pati没有使用过用药方案medj的记录,则eij设置为第一固定值,例如所述第一 固定值为0,所述患者pati和用药方案medj之间没有基于疗效的历史对应关系。因此所述关系 矩阵E1是一个稀疏矩阵,在关系矩阵E1中并非所有的患者和各个用药方案之间都有对应的 实际疗效评估值的记录,因此,后续我们的疗效预测模型需要对患者和用药方案之间未有历史记录(未记录实际疗效评估值)的关系预测出来,以获得各个用药方案对各个患者的预测 疗效评估信息。需要说没得是,在其它实施例中,所述关系矩阵的各个行也可以表示各个所 述用药方案的相关信息,而列在表示为各个所述患者的信息。
步骤22:步骤根据所述关系矩阵获取患者潜在向量和所述药物潜在向量,每一个所述一 个患者潜在向量的表示一个患者和不同的用药方案之间的关系,每一个所述药物潜在向量表 示一个用药方案和不同的患者之间的关系。
预测各个所述用药方案对各个所述患者的疗效评估信息,我们需要从关系矩阵E1中提取 出所述患者集合pat中的患者pati与各个所述用药方案之间关系特征信息,以及提取所述用 药方案集合med中的用药方案medj与各个所述患者之间的关系特征信息。具体的,在本实施例中,所述步骤22又可以进一步包括以下步骤:
步骤221:将所述关系矩阵E1中的非所述第一固定值值均设置为第二固定值,以获得相 似关系矩阵E2。
在本实施例中,所述关系矩阵E1中的非第一固定值,即非0值,便于提取患者和用药方 案之间的关系相似性特征,所述第二固定值设置为1。根据所述关系矩阵E1获取相似关系矩 阵E2也是在疗效预测模型的输入层中实现的,我们将所述患者和用药方案之间的关系存在历 史记录的对应的关系矩阵E1的元素全部设置为1,则元素对应的患者和用一把方案之间存在历史记录关系。因此相似矩阵E2表征的为所述患者和用药方案之间的相似关系
步骤222:根据所述相似关系矩阵,获取表征各个所述患者对应的各个患者标签向量和 表征各个所述药物方案对应药物标签向量,所述患者集合中的第i个患者标签向量除第i个元素为所述第二固定值外,其余的元素均设置为所述第一固定值,所述药物方案集合中的第j 个药物方案标签向量除第j个元素为第二固定值外,其余的元素均设置为所述第一固定值。
为了以便提取所述患者潜在特征信息和用药方案的潜在特征信息,我们需要给每一个患 者和每一个用药方案配置一个代表他们自身的标签。我们通过one-hot编码的方式从所述相似 关系矩阵E2中获取所述患者标签向量Opat和用药方案标签向量Omed。将相似关系矩阵E2 中的患者pati对应这一行的元素的第i个设置为1,其余均设置为0,以获得患者pati对应的 患者标签向量Opati。同样,将相似关系矩阵E2中的药物方案medj对应这一列转置成行后, 再该行中的元素的第j个设置为1,其余均设置为0,以获得药物方案medj对应的用药方案 标签向量Omedj。
步骤223:从所述相似关系矩阵中提取所述第i个患者与所述用药方案集合中的各个用药 方案之间关系的患者-用药方案关系特征向量,以及从所述相似关系矩阵中提取第一j个所述 用药方案与所述患者集合中的各个患者之间关系的患用药方案-患者关系特征向量。
在所述相似关系矩阵E2中,与所述患者pati对应的一行表示患者pati与用药方案集合 med中的各个用药方案之间的关系,因此,我们可以根据相似关系矩阵E2中这一行获取患者 pati的患者-用药方案关系特征向量Repati,其提取公式如公式(1)所示:
Repati=[rei*]1′|med| (1)
在所述相似关系矩阵E2中,与所述用药方案medj对应的一列表示患者medj与用药方案 集合pat中的各个患者之间的关系,因此,我们可以根据相似关系矩阵E2中这一列获取用药 方案medj的用药方案-患者关系特征向量Remedj,其提取公式如公式(2)所示:
Remedj=[re*j T]1'|pat| (2)
步骤224:将所述患者-用药方案关系特征向量与所述第i个患者标签向量相连接,以获 得所述第i个患者对应的所述患者潜在向量,以及将所述用药方案-患者关系特征向量与所述 第j个患者标签向量相连接,以获得所述第j个用药方案对应的所述药物潜在向量。
根据所述患者-用药方案关系特征向量和患者标签向量获取的患者潜在向量Spati的计算公 式如公式(3)所示:
Spati=[Repati,opati] (3)
根据所述用药方案-患者关系特征向量和患者标签向量获取的用药物潜在向量Smedj的计 算公式如公式(4)所示:
Smedj=[Remedj,omedj] (4)
上述公式中,r为转换系数因子,(2)中的*表示med集合中各个所述用药方案的编号,而 (3)中的*表示pat集合中各个患者的编号。因为我们的关系矩阵E1为稀疏矩阵,当所述疗 效预测模型的训练集较大时,集患者集合pat和药物方案集合med中的数量和种类过多时, 所述患者潜在向量和药物潜在向量维度过大不而利于计算。获取的各个所述潜在向量为离散 的表示,无法体现不同患者之间的关系和不同药物方案之间的关系。因此,如图2所示,我 们在所述疗效预测模型中还增加了嵌入层,通过所述嵌入层将所述患者潜在向量和所述用药物在向量从离散的向量表示转换成连续的向量表示。具体的,我们可以采用二进制编码的方 式把患者潜在向量和药物潜在向量中的每个元素嵌入至所述嵌入层,以获得表征患者和用药 方案之间关系的嵌入矩阵。
步骤23:根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和 用药方案辅助信息矩阵,所述患者辅助信息矩阵中的元素表示包含所述患者相关的信息,所 述用药方案辅助信息矩阵中的元素表示所述用药方案相关的信息。
为了添加患者和药物的额外信息来辅助提取更加精准的患者和用药方案的相似性特征 信息,以非小细胞肺癌患者的用药决策为例,我们在步骤1采集的非小细胞患者相关信息中 还包括比如肿瘤突变基因,分期,用药,家族史,治疗措施,身高,体重,年龄,性别,生活习惯,症状和副作用这些患者辅助信息。采集的用药方案相关信息中还包括靶向药物组合 的药物的分子结构,化学结构,副作用,对应的靶点之间的关系这些用药方案辅助信息。这 些辅助信息,可以帮助所述疗效预测模型获取患者之间的相似信息以及用药方案之间的相似 性信息,从而可以预测患者和用药方案之间未知关系。因此,我们在图2的输入层中,还需 要根据所述患者相关信息和所述用药方案相关信息获取所述患者辅助信息矩阵Fp和所述用药方案辅助信息矩阵Fd。
步骤24:通过SDAE自编码器分别从所述患者辅助信息矩阵和用药方案辅助信息矩阵中 提取患者潜在因子向量和用药方案潜在因子向量,所述患者潜在因子向量和用药方案潜在因 子向量为所述自编码器的隐藏层输出信息。
如图2所示,我们分别使用第一SDAE自编码器和第二SDAE自编码器来分别所述患者 辅助信息矩阵Fp和用药方案辅助信息矩阵Fd中提取所述患者潜在因子向量和用药方案潜在 因子向量。所述SDAE自编码器是一个通过输入和输出来学习特定特征的神经网络。通过提 取特征来生成一个接近输入的输出,有助于我们通过提取的特征来反应原始的输入内容。 SDAE自编码器是通过堆叠多个DAE形成的深层网络模型。而DAE是AE的一个变体,它通常使用corrupt版本来重构原始输入,相对于原始的自编码器来说,更适用于复杂的情况。 在训练过程中加入噪声,以使训练的模型能够提取特征在被噪声污染的情况下也能有良好的 效果。因此,我们可以分别将所述患者辅助信息矩阵和所述药物方案辅助信息矩阵中的元素随机的设置为所述第一固定值(如0)以获得加噪患者辅助信息矩阵
Figure SMS_1
和加噪用药方案辅助 信息矩阵/>
Figure SMS_2
后,再分别通过所述SDAE自编码器提取患者潜在因子向量和用药方案潜在因子 向量。
以所述第一SDAE自编码器提取所述患者潜在因子向量为例,具体阐述一下所述SDAE 自编码器的工作过程。所述SDAE自编码器在结构上是对称的,对于四层的SDAE自编码器 而言,从0层到2层的训练过程可以看作是编码的过程,这一过程把有噪声的患者辅助信息 矩阵输抽象成更隐式的表达Fp2。同样的,第2层到第4层的过程可以被视为解码的过程,这一过程把所述更隐式的表达Fp2按照原始输入进行重构成Fpl输出。我们从编码器中训练得 到的中间层的所述更隐式的表达Fp2是从原始输入数据中提取的抽象的表示。我们把噪声添 加到所述自编码器的原始输入进行训练是为了让训练的所述SDAE自编码器更强健,提高它 的泛化性能,可以学习更稳定的特征表示,在数据稀疏和污染情况下也能有好的效果。毕竟,我们收集的特征信息并不足够完整和规范化。因此,我们通过SDAE自编码器来分别提取患 者潜在因子向量和用药方案潜在因子向量,提高了在用药方案评估稀疏情况下的给患者推荐 用药方***度。
具体的,我们将原始输入的患者辅助信息信息矩阵Fp中的元素随机设置为零,把Fp构 造成包含噪声的加噪患者辅助信息矩阵
Figure SMS_3
并将有噪声的/>
Figure SMS_4
输入所述第一SDAE自编码 器。我们假设所述第一SDAE自编码器总共有L层,则Fpl表示它的l层的输出。我们在训练中,首先初始化每层的权重,偏差和每层的表示输出。具体的,权重参数/>
Figure SMS_5
由/>
Figure SMS_6
生成,偏差参数/>
Figure SMS_7
由/>
Figure SMS_8
生成,而输出的Fpl通过/>
Figure SMS_9
生成。
其中,
Figure SMS_10
和/>
Figure SMS_11
是用于参数初始化的超参数,/>
Figure SMS_12
和/>
Figure SMS_13
表示患者辅助信息特征提 取的自编码器l层的权重和偏差,δ(·)表示sigmoid函数,I是单位向量。我们设置前L/2层 为所述第一SDAE自编码器的编码器部分,后L/2为所述第一SDAE自编码器的解码器部分。 患者的辅助信息特征用患者潜在因子向量表示,则所述患者潜在因子向量的提取就是学习两个映射函数,一个编码函数和一个解码函数fpat(Wpat,bpat)和gpat(Wp'at,b'pat),其中编码函数 把患者的辅助信息映射在隐藏层的,解码器是把隐藏的表示重构成患者的辅助信息。Wpat,bpat分别是编码器的权重矩阵和偏差矩阵,Wp'at,b'pat分别是解码器的权重矩阵和偏差矩阵。通过 重构的信息和原始的输入信息的偏差学习两个映射函数。之后用训练好的编码器完成特征提 取。对于噪声患者辅助信息矩阵/>
Figure SMS_14
编码器的隐层输出为/>
Figure SMS_15
其计算公式如公式(5):
Figure SMS_16
解码器目的是从噪声数据
Figure SMS_17
重建原数据Fp,解码器L层的输出表示如公式(6)所示:
Figure SMS_18
所述第二SDAE提取所述药物方案潜在因子向量的过程类似第一SDAE自编码器的上述 过程,在此不再累述。所述第一SDAE自编码器和第二SDAE自编码器的中间输出层的隐层 输出,即所述的患者潜在因子向量和用药方案潜在因子向量。
我们通过最小化重构误差训练所述SDAE自编码器来学习所述患者潜在因子向量Hpat和 所述药物方案潜在向量Hmed。同样以所述第一SDAE自编码器提取特征的重构误差为例,其 重构误差的定义如公式(7)所示:
Figure SMS_19
其中γpat=Wpat+W'pat表示模型的参数,
Figure SMS_20
是它的正则化参数,FpL是L层的输出,同 理,我们可以定义出所述第二SDAE自编码器提取特征的重构误差Lmed,其表示如公式(8)所示:
Figure SMS_21
步骤25:将所述药物潜在向量、所述药物方案潜在向量、所述患者因子向量以及所述用 药方案因子向量通过神经网络进行协同过滤处理,从而获取所述预测疗效评估信息。
在图2中,通过所述嵌入层将所述患者-用方案关系特征向量和用药方案-患者关系特征 向量转换成连续的向量表示分别输出对应的Zpat和Zmed,其中,Zpat为通过所述嵌入层转换 的患者-用方案关系特征转换向量,Zmed为通过所述嵌入层转换的患者-用方案关系特征转换 向量。
所述协同过滤的处理过程如下:
首先,我们将所述患者潜在因子向量Hpat的转置向量和所述患者-用药方案关系特征转 换向量Zpat相连接,以获得患者潜在表示Xpat,以及将所述用药方案潜在因子向量Hmed的转 置向量和所述用药方案-患者关系特征转换向量Zmed相连接,以获得用药方案潜在表示Ymed. 则:Xpat=Hpat T·Zpat;Ymed=Hmed T·Zmed
然后再把患者潜在表示Xpat中的元素和用药方案潜在表示Ymed中元素相乘以获得患者 用药方案潜在关系表示,其表示如公式(9)所示:
sin(Xpat,Ymed)=Xpat·Ymed (9)
最后根据所述患者用药方获取所述疗效预测评估值
Figure SMS_22
其获取公式如公式(10)所示:
Figure SMS_23
σ(·)表示激活函数,
Figure SMS_24
表示输出层的权重矩阵的转置,/>
Figure SMS_25
表示患者pati使用用药方案 medj治疗的疗效预测评估值。σ(·)可以是一个非线性激活函数,w可以从训练数据中被学 习。
由此可见,本发明提供的疗效预测模型基于患者和用药方案之间的历史记录关系结合患 者辅助相关信息和用药方案辅助相关信息,从中预测每一个所述用药方案对不同患者的疗效 评估值。就算某一患者和用药方案之间没有历史用药记录,即没有实际疗效评估值的记录,所述疗效预测模型也可以通过患者辅助相关信息和用药方案辅助相关信息,提取与所述某一 患者高度相似的另一个患者的相关信息,从根据所述另一患者的用药记录给所述某一患者推 荐合适的用药方案。因此,本发明通过利用辅助信息提取潜在因子表示并结合患者的用药关 系的潜在特征提取患者和用药方案的潜在表示来预测用药方案的疗效,能够帮助疗效预测模型实现更好的性能。
在本发明实施例中,我们还定义了所述疗效预测模型的损失函数,以便通过所述损失函 数训练所述疗效预测模型。所述损失函数由所述SDAE自编码器在进行特征提取过程中的最 小化重构误差和所述疗效预测模型进行所述疗效预测的预测误差组成,所述预测误差根据所述预测疗效评估信息和所述实际疗效评估信息确定。
一般来说,损失函数由所述自编码器进行辅助信息重构时的辅助信息重构误差和所述疗 效预测模型进行疗效预测时的疗效的预测误差组成。辅助信息重构误差包含患者和用药方案 的辅助信息特征提取的误差(即损失),由前面分析我们定义患者辅助信息的重构误差如下:
Figure SMS_26
其中
Figure SMS_27
表示正则化参数。/>
Figure SMS_28
表示加噪后患者辅助信息矩阵,/>
Figure SMS_29
为患者辅助信息在 经过所述第一SDAE自编码器进行特征提取重构后的输出。同理,所述用药方案辅助信息的 重构误差如下:
Figure SMS_30
其中,μ表示提取用药方案潜在因子向量的第二SDAE自编码器模型参数和正则化项 参数。
Figure SMS_31
表示加噪用药方案辅助信息矩阵,/>
Figure SMS_32
为用药方案辅助信息在经过所述第二SDAE自编码器进行特征提取重构后的输出。
疗效的预测误差表征所述疗效预测模型预估的疗效评估值与实际记录的疗效评估值之 间的误差。具体的,通过神经网络进行协同过滤获取预测的疗效评估值与实际的计算的疗效 评估值的误差。具体来说,对每个(pati,medj)对的输出预测疗效评估
Figure SMS_33
患者的疗效评估 可以看作是患者使用用药方案治疗疗效的标签,如果患者使用过该用药方案,则该患者使用 药物后的病况有记录,基于记录我们可以获得病情的好转程度的评估,获取实际记录的疗效 评估值eij。因此,基于疗效预测模型预测的疗效评估值/>
Figure SMS_34
可以看作是患者与用药方案有关的 治疗效果好转程度的预测。我们将相关的疗效评估/>
Figure SMS_35
限制在[-1,1]的范围内,以便我们能够 区分疗效的作用,因此可以使用tanh激活函数来实现,所述疗效预测模型的预测误差定义如公式(11)所示:
Figure SMS_36
其中R+表示一组治疗有效的实例,而R-表示一组治疗无效的实例,它们是没有试验过 的患者和用药方案关系的一组实例或者患者治疗后无改善作用或恶化的实例。λpre
Figure SMS_37
分 别表示正则化项和模型参数。因此,所述效预测模型的损失函数的定义如公式(12)所示, 其中,α和β表示损失函数的超参数:
Ldrug_pre=Lprediction+αLpat+βLmed (12)
步骤3:根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用 药方案。
将所述预测疗效评估信息中的预测疗效评估值按照大小从大到小排序,选择排序中前K 个所述预测疗效评估值对应的药物方案推荐给所述患者。
本发明实施例以非小细胞的肺癌患者的用药决策为例,非小细胞肺癌患者的用药方案为 靶向药物相关的用药方案,分子靶向药物的作用特点是针对肿瘤生长过程中关键性靶点进行 “精准打击”,以至于不会或很少伤及正常细胞。通过手术、化疗或放疗等手段治疗患者有效时,血清肿瘤标志物水平与治疗前相比有所下降,而在复发时则会再次明显上升,由此提示 血清肿瘤标志物水平有助于评价治疗疗效以及预测肿瘤复发。
肿瘤的治疗情况可以通过CT判断肿瘤面积和肿瘤标志物的下降水平来评估治疗效果的 好坏。我们假设治疗之前的肿瘤面积,包括扩散区域的肿瘤面积是
Figure SMS_38
治疗之前的肿瘤 标志物mari水平为/>
Figure SMS_39
则治疗后的肿瘤总体面积为/>
Figure SMS_40
肿瘤标志物水平为/>
Figure SMS_41
我们定义肿瘤标志物的正常水平为/>
Figure SMS_42
Figure SMS_43
一般为0。
我们根据治疗前后的肿瘤面积变化定义面积减少程度为:
Figure SMS_44
肿瘤标志物的变化情况也可反映疾病的治疗情况,通过标志物的变化能够一定程度上反
映治疗的效果,我 们将标志物的变化程度定义为:
Figure SMS_45
因此,我们定义用药方案的治疗的疗效评估方式如公式(15)所示,即所述eij的定义 公式:
Figure SMS_46
其中,
Figure SMS_47
分别为面积,非小细胞肺癌关联性高的肿瘤标志物和关联性低的肿 瘤标志物的重要性参数。imp表示与非小细胞肺癌的评估关联性高的肿瘤标志物集合,low表 示与非小细胞肺癌的关联性低的肿瘤标志物集合。/>
Figure SMS_48
表示与非小细胞肺癌的评估关联性高 的肿瘤标志物的变化程度,/>
Figure SMS_49
表示与非小细胞肺癌的评估关联性低的肿瘤标志物的变化程度。需要说明的是,依据本发明 的实际疗效评估方式不局限于本发明实施例所提供的方式。
由图2所示,本发明还提供了一种基于深度学习的用药决策***,其特征在于,包括: 数据收集模块、疗效预测模块和决策模块,被配置为收集患者相关信息、用药方案相关信息 和用药方案对患者的实际疗效效果的实际疗效评估信息,以获取分析数据集。所述疗效预测模块,被配置为根据所述分析数据集提取患者特征信息和、用药方案特征,并根据提取的各 个特征信息训练所述疗效预测模型,以获取各个用药方案对不同的患者治疗效果的预测疗效 评估信息。所述决策模块,被配置为根据所述预测疗效评估信息给所述患者推荐适合所述患 者个性化要求的所述用药方案。其中,所述疗效预测模块包括输入层、嵌入层、神经网络层、第一SDAE自编码器和第二SDAE自编码器。所示输入层被配置为根据所述分析数据获取获 取表征所述患者和所述用药方案之间关系的关系矩阵,所述关系矩阵中的关系元素表征所述 患者与所述用药方案之间的关系,若所述患者使用过所述用药方案,则对应的所述关系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则 对应的所述关系元素设置为第一固定值,并根据所述关系矩阵获取患者潜在向量和所述药物 潜在向量,每一个所述一个患者潜在向量的表示一个患者和不同的用药方案之间的关系,每 一个所述药物潜在向量表示一个用药方案和不同的患者之间的关系,以及根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和用药方案辅助信息矩阵,所述患 者辅助信息矩阵中的元素表示包含所述患者相关的信息,所述用药方案辅助信息矩阵中的元 素表示所述用药方案相关的信息。所述嵌入层,被配置为将所述患者潜在向量和所述用药方 案向量嵌入从离散的数据转换成连续的向量表示输入至所述神经网络层。所述第一SDAE自 编码器,被配置为从所述患者辅助信息矩阵中提取患者潜在因子向量,所述患者潜在因子向 量为所述第一SDAE自编码器的隐藏层输出信息。所述第二SDAE自编码器,被配置为从所 述用药方案辅助信息矩阵中提取用药方案潜在因子向量,所述用用药方案潜在因子向量为所述第二SDAE自编码器的隐藏层输出信息。所述神经网络层,被配置为对所述药物潜在向量、 所述药物方案潜在向量、所述患者因子向量以及所述用药方案因子向量进行协同过滤处理, 从而获取所述预测疗效评估信息。
为了评估预测方法的性能,我们使用了8倍交叉验证方法,因为该方法可以提供对真实 错误率的足够准确的估计。我们所收集的所有数据集中的80%数据作为训练集,20%的数据作为测试集。之后,针对模型中不同的特征参数和评估疗效参数进行测试,分别计算测试实 验的平均误差。这样,测试和训练将重复八次以确保实验的准确性。一般性地,我们设置几 个基本的指标来评估疗效预测模型的分类的性能。
TP(真阳性):患者使用过该药物方案并产生较好效果与预测得到的分类结果一致。
TN(真阴性):患者使用过该药物方案并产生较好效果与预测得到的分类结果相反。
FP(假阳性):患者使用过该药物方案并产生较坏效果与预测得到的分类结果相反。
TN(假阴性):患者使用过该药物方案并产生较坏效果与预测得到的分类结果一致。
针对患者预测疗效评估值排在靠前的K个用药方案中包含患者使用过且产生了较好效果 的用药方案,则为分类效果较好的样例,定为PT。类似地,针对患者预测的前K个用药方案中包含患者使用过且产生了较坏效果的药物,则为分类效果较差的样例,定为PN。
我们定义以下指标作为衡量预测结果的评估:
Figure SMS_50
Figure SMS_51
Figure SMS_52
Figure SMS_53
Figure SMS_54
为了便于标准化的度量,通过以上几个指标定义,可以将实例的数量结果转换为0到1 之间的比率。我们通过测试集验证模型预测性能的结果,分析所选的K值的大小和预测准确 率Ks,错误率Kn的关系。如图3所示,显示的是患者用药疗效较好情况下预测的该用药方 案作为候选项的样例占用药方案分类正确的样例的比例ks随着K值变化的情况。可以看出, 随着所选K值的增加,预测的效果也会越来越好,且增加较快,表明预测的用药方案比较偏 向于患者临床选择的用药方案。另一条关系曲线显示的是患者用药疗效较好情况下预测的该用药方案作为候选项的样例占用药方案分类正确的样例的比例Kn随着K值变化的情况。同 样,随着所选K值的增加,预测的错误样例也会增多,但增长缓慢。当K值较小的时,反例较少,表明K的取值影响着用药方案推荐的准确度。
图4表示的是疗效评估值的重要性参数和辅助信息重要性参数与评估指标Acc的关系。 可以看出评估值计算中面积参数的比重较大时,准确度会相对提高,这可能是因为肿瘤标志 物的变化不太稳定,通过它来判断疗效评估有一定的误差。且肿瘤面积的扩大意味着癌症病 情的加重,面积减少同样象征着病情的好转。另一组参数为患者辅助信息和药物辅助信息在 训练模型中的权重,可以看到,辅助信息对于提升模型的性能是重要的。药物的辅助信息更有助于提高药物疗效分类的准确性。
图5表示的是疗效评估值的重要性参数和辅助信息重要性参数与评估指标Sen的关系。 可以看出敏感度参数随着标志物trade-off的增加就,升高后下降,且上升下降的幅度较大。 这可能是因为癌细胞的面积可能在某些样例中没有太大变化,仅靠面积来判断易产生正例分 类成负例的情况。同理,标志物的敏感度较差,它的trade-off太大时,也会产生如此情况。 另一组参数为患者辅助信息和药物辅助信息在训练模型中的权重,可以看到,患者和用药方案的辅助信息对于敏感度具有相差不大的影响力。
图6表示的是疗效评估值的重要性参数和辅助信息重要性参数与评估指标Spec的关系。 可以看出随着肿瘤标志物的trade-off增加,特异性值减少后增加,且增加幅度较快。可能是 面积对于评估方式更具有特异性,肿瘤标志物的特异性有限。另一组参数为患者辅助信息和 用药方案辅助信息在训练模型中的权重与真实是不适合患者的用药方案分类成适合的药物的比例,可以看到,患者辅助信息更有助于提高疗效预测的特异性,用药方案辅助信息trade-off 更大时对预测的效果影响较大。这可能是因为患者的辅助信息的trade-off较小情况下,无法 更好地考虑患者的信息,从而针对患者进行用药。选择适合患者的用药方案对于提升模型的 性能是有帮助的。
图7和图8分别示意了腺癌和鳞癌患者在三线治疗情况下,采样指标的变化。为了便 于反应用药情况,我们通过CEA的变化和疗效评估值来直观反应在患者的治疗情况,以评估 本发明所提出的用药决策***在不同阶段下选择药物方案推荐的性能。在图中,每个节点表 示的是在这一用药周期内用药方案的疗效的反应,我们使用评估值来反应用药方案的疗效。 当CEA升高,我们认为病情反复,可能是用药方案中的药物产生了耐药性。因此,我们重新选择针对患者当前状况的用药方案。在不同概率参数控制和连续药物选择下的性能。同理, 对于鳞癌患者,我们了解到鳞癌患者对SCC-Ag的敏感度较高。同样的,我们通过SCC- Ag的变化和疗效评估值来反应患者用药后的治疗情况。在图8中,我们看到开始的情况节点 波动较大,评估值不稳定且较低,我们认为患者刚开始对用药方案无明显的反应。经过*** 调整重新选择患者适应性用药方案后,在接下来的用药周期内,标志物的检测指标开始下降,评估值也有所升高。当病情反复后,我们选择二线治疗,以及后线治疗方案皆可看出有较稳 定的效果。用药方案种类很多,选择也有很多,针对患者选择更适应患者的用药方案可以使 用药决策***推荐的每一阶段用药方案都有良好的改善效果,帮助医生提供给患者全方位全 生命周期的治疗服务。同时也帮助患者及时了解自身的情况,促进NSCLC的早期诊断。
图9显示了本发明所示的用药决策***的准确性。根据NSCLC患者的用药记录,我们 可以统计出医生诊断决策用药的准确度和***预测的准确度。从图中可以看出,医生的决策 是非常准确的。在小样本数据中,准确率高达98%。在大样本的数据中,准确率也能达到89%。 虽然***在小样本数据中,准确率较低,在0.32-0.47之间。这是由于样本量少,训练数据较 少,模型泛化能力差,***模型的结论并不足够支撑医生的决断,不能有效帮助医生提高效 率。在大样本数据中,训练数据增加,模型泛化能力增强。当样本数据达到4000时,准确率 能够提高到80%以上。
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该 发明仅为所述的具体实施例。根据以上描述,可作很多的修改和变化。本说明书选取并具体 描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范 围和等效物的限制。

Claims (8)

1.一种基于深度学习的用药决策方法,其特征在于,包括:
收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实际疗效评估信息,以获取分析数据集,
构建疗效预测模型,以根据所述分析数据集分析各个所述患者之间的关系、所述用药方案之间的关系,并结合所述实际疗效评估信息预测各个所述用药方案对不同的所述患者治疗效果的预测疗效评估信息,
根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用药方案;
所述预测模型获取所述预测疗效评估信息的步骤包括:
获取表征所述患者和所述用药方案之间关系的关系矩阵,所述关系矩阵中的关系元素表征所述患者与所述用药方案之间的关系,若所述患者使用过所述用药方案,则对应的所述关系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则对应的所述关系元素设置为第一固定值,
根据所述关系矩阵获取患者潜在向量和药物潜在向量,每一个所述一个患者潜在向量的表示一个患者和不同的用药方案之间的关系,每一个所述药物潜在向量表示一个用药方案和不同的患者之间的关系,
根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和用药方案辅助信息矩阵,所述患者辅助信息矩阵中的元素表示包含所述患者相关的信息,所述用药方案辅助信息矩阵中的元素表示所述用药方案相关的信息,
通过SDAE自编码器分别从所述患者辅助信息矩阵和用药方案辅助信息矩阵中提取患者潜在因子向量和用药方案潜在因子向量,所述患者潜在因子向量和用药方案潜在因子向量为所述自编码器的隐藏层输出信息,
将所述药物潜在向量、药物方案潜在向量、所述患者因子向量以及所述用药方案因子向量通过神经网络进行协同过滤,从以学习各个所述患者之间的相似性和各个所述用药方案之间的相似性,并结合所述患者和所述患者的历史用药方案之间的关系预测每一个所述用药方案对各个不同的所述患者的治疗效果,以获得所述预测疗效评估信息。
2.根据权利要求1所述的基于深度学习的用药决策方法,其特征在于,所述分析数据集包括患者集合和用药方案集合,根据所述关系矩阵获取患者潜在向量和所述药物潜在向量的步骤包括:
将所述关系矩阵中的非所述第一固定值均设置为第二固定值,以获得相似关系矩阵,
根据所述相似关系矩阵,获取表征各个所述患者对应的各个患者标签向量和表征各个所述药物方案对应药物标签向量,所述患者集合中的第i个患者标签向量除第i个元素为所述第二固定值外,其余的元素均设置为所述第一固定值,所述药物方案集合中的第j个药物方案标签向量除第j个元素为第二固定值外,其余的元素均设置为所述第一固定值,
从所述相似关系矩阵中提取第i个所述患者与所述用药方案集合中的各个用药方案之间关系的患者-用药方案关系特征向量,
从所述相似关系矩阵中提取第j个所述用药方案与所述患者集合中的各个患者之间关系的患用药方案-患者关系特征向量,
将所述患者-用药方案关系特征向量与所述第i个患者标签向量相连接,以获得所述第i个患者对应的所述患者潜在向量,
将所述用药方案-患者关系特征向量与所述第j个患者标签向量相连接,以获得所述第j个用药方案对应的所述药物潜在向量。
3.根据权利要求2所述的基于深度学习的用药决策方法,其特征在于,分别将所述患者辅助信息矩阵和所述药物方案辅助信息矩阵中的元素随机的设置为所述第一固定值后,再分别通过所述SDAE自编码器提取患者潜在因子向量和用药方案潜在因子向量。
4.根据权利要求3所述的基于深度学习的用药决策方法,其特征在于,通过最小化重构误差训练所述SDAE自编码器来学习所述患者潜在因子向量和所述药物方案潜在向量。
5.根据权利要求4所述的基于深度学习的用药决策方法,其特征在于,所述疗效预测模型的损失函数由所述SDAE自编码器在进行特征提取过程中的最小化重构误差和所述疗效预测模型进行所述疗效预测的预测误差组成,
所述预测误差根据所述预测疗效评估信息和所述实际疗效评估信息确定。
6.根据权利要求1所述的基于深度学习的用药决策方法,其特征在于,根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用药方案包括:
将所述预测疗效评估信息中的预测疗效评估值按照大小从大到小排序,选择排序中前K个所述预测疗效评估值对应的药物方案推荐给所述患者。
7.根据权利要求2所述的基于深度学习的用药决策方法,其特征在于,通过嵌入层将离散的所述患者潜在向量和所述药物方案潜在向量转换成连续的向量表示输入至所述神经网络。
8.一种基于深度学习的用药决策***,其特征在于,包括:数据收集模块、疗效预测模块和决策模块,被配置为收集患者相关信息、用药方案相关信息和用药方案对患者的实际疗效效果的实际疗效评估信息,以获取分析数据集,
所述疗效预测模块,被配置为根据所述分析数据集提取患者特征信息和、用药方案特征,并根据提取的各个特征信息训练所述疗效预测模型,以获取各个用药方案对不同的患者治疗效果的预测疗效评估信息,
所述决策模块,被配置为根据所述预测疗效评估信息给所述患者推荐适合所述患者个性化要求的所述用药方案;
所述疗效预测模块包括:
输入层,被配置为根据所述分析数据获取获取表征所述患者和所述用药方案之间关系的关系矩阵,所述关系矩阵中的关系元素表征所述患者与所述用药方案之间的关系,若所述患者使用过所述用药方案,则对应的所述关系元素表示为所述用药方案对所述患者的实际疗效评估值,若所述患者未使用过所述用药方案,则对应的所述关系元素设置为第一固定值,并根据所述关系矩阵获取患者潜在向量和药物潜在向量,每一个所述一个患者潜在向量的表示一个患者和不同的用药方案之间的关系,每一个所述药物潜在向量表示一个用药方案和不同的患者之间的关系,以及根据所述患者相关信息和所述用药方案相关信息分别获取患者辅助信息矩阵和用药方案辅助信息矩阵,所述患者辅助信息矩阵中的元素表示包含所述患者相关的信息,所述用药方案辅助信息矩阵中的元素表示所述用药方案相关的信息,
嵌入层,被配置为将所述患者潜在向量和所述用药方案向量嵌入从离散的数据转换成连续的向量表示输入至神经网络层,
第一SDAE自编码器,被配置为从所述患者辅助信息矩阵中提取患者潜在因子向量,所述患者潜在因子向量为所述第一SDAE自编码器的隐藏层输出信息,
第二SDAE自编码器,被配置为从所述用药方案辅助信息矩阵中提取用药方案潜在因子向量,所述用药方案潜在因子向量为所述第二SDAE自编码器的隐藏层输出信息,
神经网络层,被配置为对所述药物潜在向量、所述药物方案潜在向量、所述患者因子向量以及所述用药方案因子向量进行协同过滤处理,从而获取所述预测疗效评估信息。
CN202010543306.7A 2020-06-15 2020-06-15 一种基于深度学习的用药决策方法和*** Active CN111696678B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010543306.7A CN111696678B (zh) 2020-06-15 2020-06-15 一种基于深度学习的用药决策方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010543306.7A CN111696678B (zh) 2020-06-15 2020-06-15 一种基于深度学习的用药决策方法和***

Publications (2)

Publication Number Publication Date
CN111696678A CN111696678A (zh) 2020-09-22
CN111696678B true CN111696678B (zh) 2023-05-26

Family

ID=72481084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010543306.7A Active CN111696678B (zh) 2020-06-15 2020-06-15 一种基于深度学习的用药决策方法和***

Country Status (1)

Country Link
CN (1) CN111696678B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113113117A (zh) * 2021-03-25 2021-07-13 肖尧 一种中医诊疗***
CN113284627B (zh) * 2021-04-15 2024-05-17 北京交通大学 基于患者表征学习的用药推荐方法
CN114283949A (zh) * 2021-11-08 2022-04-05 湖南云视数据科技有限责任公司 一种基于深度学习的adr辅助决策***
CN115050451B (zh) * 2022-08-17 2022-11-04 合肥工业大学 败血症临床用药方案自动生成***
CN115376706B (zh) * 2022-10-26 2023-04-07 杭州艾名医学科技有限公司 一种基于预测模型的乳腺癌药物方案的预测方法及装置
CN116631578B (zh) * 2023-07-25 2023-10-13 山东硕杰医疗科技有限公司 一种肺癌网络综合管理信息平台
CN117690597B (zh) * 2023-11-29 2024-06-18 重庆爱永星辰标准医药服务有限公司 一种基于互联网的生物医药信息聚类分析方法
CN117334347B (zh) * 2023-12-01 2024-03-22 北京大学 评估治疗效果方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3703058A1 (en) * 2005-11-29 2020-09-02 Children's Hospital Medical Center A method of selecting a medication for a patient
CN107092797A (zh) * 2017-04-26 2017-08-25 广东亿荣电子商务有限公司 一种基于深度学习的药品推荐算法
CN108062970A (zh) * 2017-12-15 2018-05-22 泰康保险集团股份有限公司 药品推荐方法及装置
CN108109700B (zh) * 2017-12-19 2021-05-25 中国科学院深圳先进技术研究院 一种慢性病药物疗效评价方法和装置
US11183285B2 (en) * 2017-12-26 2021-11-23 International Business Machines Corporation Medication decision support
CN110349681A (zh) * 2019-07-11 2019-10-18 中南大学 用于非小细胞肺癌的联合用药推荐方法、***及装置
CN110827951A (zh) * 2019-12-24 2020-02-21 陕西省中医医院 一种临床智能决策平台

Also Published As

Publication number Publication date
CN111696678A (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
CN111696678B (zh) 一种基于深度学习的用药决策方法和***
Spooner et al. A comparison of machine learning methods for survival analysis of high-dimensional clinical data for dementia prediction
WO2021120936A1 (zh) 一种基于多任务学习模型的慢病预测***
Choi et al. Screening for prediabetes using machine learning models
Wang et al. Development of deep learning algorithm for detection of colorectal cancer in EHR data
Yu et al. Medical decision support system for cancer treatment in precision medicine in developing countries
Afsaneh et al. Recent applications of machine learning and deep learning models in the prediction, diagnosis, and management of diabetes: a comprehensive review
Nsugbe Toward a self-supervised architecture for semen quality prediction using environmental and lifestyle factors
CN111798954A (zh) 基于时间注意力机制和图卷积网络的药物组合推荐方法
WO2020243163A1 (en) Integrated neural networks for determining protocol configurations
McNutt et al. Using big data analytics to advance precision radiation oncology
CN111387938B (zh) 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测***
US11869633B2 (en) Analytics and machine learning framework for actionable intelligence from clinical and omics data
Ejiyi et al. A robust predictive diagnosis model for diabetes mellitus using Shapley-incorporated machine learning algorithms
Mounika et al. Prediction of type-2 diabetes using machine learning algorithms
Asswin et al. Transfer learning approach for pediatric pneumonia diagnosis using channel attention deep CNN architectures
US20240087750A1 (en) Machine learning systems and methods for predicting risk of incident opioid use disorder and opioid overdose
Syed et al. Artificial intelligence methods in computer-aided diagnostic tools and decision support analytics for clinical informatics
Zhang et al. Out-of-distribution generalized dynamic graph neural network for human albumin prediction
Zhang et al. A time-sensitive hybrid learning model for patient subgrouping
Singh et al. Ftl‐CoV19: A Transfer Learning Approach to Detect COVID‐19
WO2022212337A1 (en) Graph database techniques for machine learning
Oliullah et al. Analyzing the effectiveness of several machine learning methods for heart attack prediction
Anbananthen et al. A comparative performance analysis of hybrid and classical machine learning method in predicting diabetes
Cerasa et al. Predicting outcome in patients with brain injury: differences between machine learning versus conventional statistics. Biomedicines 10 (9), 2267

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant