CN113674867A - 临床数据挖掘方法、装置、电子设备和存储介质 - Google Patents

临床数据挖掘方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113674867A
CN113674867A CN202110851809.5A CN202110851809A CN113674867A CN 113674867 A CN113674867 A CN 113674867A CN 202110851809 A CN202110851809 A CN 202110851809A CN 113674867 A CN113674867 A CN 113674867A
Authority
CN
China
Prior art keywords
clinical
test
data
mining
trial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110851809.5A
Other languages
English (en)
Inventor
蒋建华
柏智强
秦云贺
周立运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huabin Licheng Technology Co ltd
Original Assignee
Shanghai Yaohui Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yaohui Information Technology Co ltd filed Critical Shanghai Yaohui Information Technology Co ltd
Priority to CN202110851809.5A priority Critical patent/CN113674867A/zh
Publication of CN113674867A publication Critical patent/CN113674867A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Bioethics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种临床数据挖掘,方法、装置、电子设备和存储介质,其中方法包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。本发明提供的方法、装置、电子设备和存储介质,从大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇。

Description

临床数据挖掘方法、装置、电子设备和存储介质
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种临床数据挖掘方法、装置、电子设备和存储介质。
背景技术
创新药物开发需要长期投入大量的人力、物力和财力,创新药物临床开发策略、市场竞争格局以及项目估值具有非常重要的现实意义。一般地,临床开发策略、市场竞争格局及项目估值需要深入调研多个关键信息,如流行病学、临床指南、创新药管线、临床试验、临床数据等,其中临床试验和临床数据调研是一个无法避开的关键环节。现阶段,临床试验调研可以借助clinical trials等官方登记平台或商业化数据库,但是这些调研手段存在以下局限性:
官方登记平台记录的数据并不全面,如缺乏临床试验结果信息等,需要从其他数据源中如论文、资讯等信息中获取,多方采集的数据量庞大且数据类型多,直接使用采集所得的数据进行数据调研分析,需要付出大量人力成本和时间成本,且由于没有有效的针对核心临床数据的挖掘方法和标准,做主流趋势判断可能带来方向偏颇。
发明内容
本发明提供一种临床数据挖掘方法、装置、电子设备和存储介质,用以解决现有技术中数据量庞大不利于进行调研分析的问题。
本发明提供一种临床数据挖掘方法,包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
根据本发明提供的一种临床数据挖掘方法,所述预设挖掘规则包括如下规则中的至少一种:试验阶段挖掘规则,用于挖掘预设临床试验阶段下注册申报的临床试验;招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验;试验类型挖掘规则,用于挖掘目标试验类型下的临床试验;指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。
根据本发明提供的一种临床数据挖掘方法,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,包括:基于所述试验阶段挖掘规则中的预设临床试验阶段,以及所述各临床试验的临床试验阶段和注册申报状态,对所述各临床试验的试验数据进行筛选;所述临床试验阶段包含在所述试验数据内,所述注册申报状态是基于所述试验数据或者所述临床试验文本确定的。
根据本发明提供的一种临床数据挖掘方法,所述注册申报状态是基于对应临床试验的相关公告文本确定的,所述相关公告文本是基于如下步骤确定的:基于预先设定的药品名称和原研企业名称的关联关系,确定任一临床试验的药品名称对应的原研企业名称;基于所述任一临床试验的原研企业名称,以及所述任一临床试验的试验数据中的标识信息,从所述临床试验文本中提取所述相关公告文本。
根据本发明提供的一种临床数据挖掘方法,所述招募人数挖掘规则中,任一适应症的招募人数阈值是基于所述任一适应症下的各临床试验的试验招募人数确定的;所述适应症和试验招募人数包含在所述试验数据内。
根据本发明提供的一种临床数据挖掘方法,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据,包括:基于当前挖掘规则,对上一临床试验集合进行筛选,得到当前临床试验集合;所述当前挖掘规则即基于挖掘规则执行顺序,从所述试验阶段挖掘规则、所述招募人数挖掘规则、所述试验类型挖掘规则或所述指标类型挖掘规则中确定的,首个挖掘规则的上一临床试验集合包括所述各临床试验的试验数据,最尾的临床试验集合包括所述目标临床试验及其试验数据。
根据本发明提供的一种临床数据挖掘方法,所述得到目标临床试验及其试验数据,之后还包括:对各目标临床试验的试验数据进行标准化处理,所述标准化处理包括适应症信息、药品信息、发起人信息、试验日期、试验地区、招募人数、试验方案、试验状态中的至少一种的标准化。
本发明还提供一种临床数据挖掘装置,包括:采集单元、提取单元和筛选单元。其中,采集单元用于采集临床试验文本;提取单元用于从所述临床试验文本中提取各临床试验的试验数据;筛选单元用于基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述临床数据挖掘方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述临床数据挖掘方法的步骤。
本发明提供的临床数据挖掘方法、装置、电子设备和存储介质,通过基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的预设挖掘规则,从大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇,无需付出大量时间和人力成本,即可有效实现目标临床数据的挖掘,提高了数据挖掘效率和可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的临床数据挖掘方法的流程示意图;
图2是本发明提供的临床数据挖掘方法中步骤130一个实施例的流程示意图;
图3是本发明提供的临床数据挖掘装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的临床数据挖掘方法的流程示意图,如图1所示,依据本发明实施例提供的临床数据挖掘方法得到的目标临床试验及其试验数据,可以应用在创新药物临床开发策略的制定、预测目前及未来的市场竞争格局及项目估值。该方法包括以下步骤:
步骤110,采集临床试验文本。
在此,临床试验文本是指含有临床试验的相关信息的文本数据,临床试验文本具体可以包含多个文本,其中单个文本可以包含针对单个临床试验相关信息的文本数据,也可以包含针对多个临床试验相关信息的文本数据,本发明实施例对此不作具体限定。临床试验文本的采集来源包括但不限于:各国临床登记官网、论文、资讯、会议摘要等。采集方式可以通过爬虫采集,也可以通过搜索采集,本发明实施例对此不做具体限定。
在实施中,步骤110中的临床试验文本可以是实时采集的,也可以是根据预先设定好的时间间隔定时采集的。
步骤120,从临床试验文本中提取各临床试验的试验数据。
此步骤中,以临床试验为单位,提取各个临床试验的试验数据。具体到药物临床试验,各个临床试验的试验数据包括以下内容中的至少一种:临床阶段、临床登记号、适应症信息、药品信息、纳入标准、发起人信息、试验日期、试验地区、试验方案、试验状态。
针对试验数据的提取,其具体提取方式可以是基于关键字匹配或者规则匹配等。
例如,基于关键字匹配,从临床试验文本中提取“临床阶段”信息,从中提取临床阶段为I期、I/II期、II期、III期的临床试验,并对数据进行清洗、转换为标准的临床阶段数据;
如,获取的原始数据为:Phase 1,Phase 2,清洗标准化的临床阶段分别对应的是I期、II期。
步骤130,基于预设挖掘规则,对各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
在此,目标临床试验即需要进行挖掘筛选的临床试验,目标临床试验的预设挖掘规则可以由用户自行指定。考虑到核心临床试验对于创新药物临床开发策略、预测目前及未来的市场竞争格局及项目估值均有指导意义,可以将核心临床试验作为目标临床试验进行数据挖掘。此处,目标临床试验需满足以下两个准则中的至少一个:
(1)开发企业发起的注册性临床试验,该类临床试验可支持监管审批;
(2)研究者发起的高质量随机对照临床试验,该临床试验能够支持临床指南的变更。
为了获得满足上述两个准则的目标临床试验,需建立标准化的预设挖掘规则。此处的预设挖掘规则的设置,考虑了包括临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型在内的四个维度中的至少一个维度。
其中,基于临床试验阶段确定的预设挖掘规则,从不同临床阶段在试验目标上的区别入手,为不同的临床试验阶段设置不同的挖掘规则,例如临床阶段可以是I期、I/II期、II期或者III期。I期临床试验包括初步的临床药理学、人体安全性评价试验及药代动力学试验,为制定给药方案提供依据。II期临床试验目的是初步评价药物对目标适应症患者的治疗作用和安全性,也包括为III期临床试验研究设计和给药剂量方案的确定提供依据。III期临床试验目的是进一步验证药物对目标适应症患者的治疗作用和安全性,评价利益与风险关系,最终为药物注册申请的审查提供充分的依据。综合上述各临床试验阶段的试验目标,可以设置III期临床试验为需要挖掘的临床试验,也可以设置I期、I/II期或II期临床试验需要结合其他信息判断是否为需要挖掘的临床试验。
基于适应症招募人数阈值确定的预设挖掘规则,可以从不同适应症的流行病学现状入手,为不同的适应症设置不同的招募人数的取值范围,结合临床试验的实际招募人数,判断该临床试验是否是需要挖掘的临床试验。此处,适应症招募人数阈值可以是通过数据分析得到的,也可以是工作人员预先设置好的。针对于不同适应症的招募人数的设置,可以具体考虑适应症流行病学现状,流行病学人群越大,则意味着临床试验招募人数越多。满足招募人数的临床试验的可信度越高,越能支持监管审批,支持临床指南的变更。
基于临床试验类型确定的预设挖掘规则,临床试验类型包括探索性、前瞻性、回顾性、注册临床、上市后研究或真实世界研究等,可以根据实际需要挖掘的目标临床试验的类型,设置挖掘规则。例如可以设置确定为目标临床试验为注册临床类型,对属于该类的临床试验进行挖掘;或者也可以设置排除在目标之外的类型,对属于该类的临床试验进行滤除,例如将开放标签扩展临床、回顾性研究及剂量和用药顺序的探索试验排除在目标临床试验之外。
基于终点指标类型确定的预设挖掘规则,终点指标类型包括主要终点指标或次要终点指标,可以根据实际需要挖掘的目标临床试验的终点指标类型,设置挖掘规则。例如可以设置目标临床试验终点指标类型为主要终点指标为与有效性相关指标,对属于该类的临床试验进行挖掘;或者也可以设置排除在目标之外的类型,对属于该类的临床试验进行滤除,例如滤除安全性相关指标的临床试验。
通过应用预设挖掘规则,以临床试验为单位进行目标临床试验挖掘,即可得到能够满足实际挖掘需求的各目标临床试验,以及各目标临床试验的试验数据。
本发明实施例提供的方法,通过基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的预设挖掘规则,从大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇,无需付出大量时间和人力成本,即可有效实现目标临床数据的挖掘,提高了数据挖掘效率和可靠性。
基于上述实施例,步骤110包括:
基于各国临床登记官网、论文、资讯、会议摘要,采集临床试验文本。
此处,通过从各个数据源中采集临床试验文本,相较于仅借助官方登记平台或商业数据库,临床试验的试验数据来源更加丰富,保证了数据全面不遗漏,同时将各个数据源的临床试验数据集中整合在一个平台,方便后期数据挖掘和分析研究。
基于上述实施例,预设挖掘规则包括如下规则中的至少一种:
试验阶段挖掘规则,用于挖掘预设临床试验阶段下注册申报的临床试验;
招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验;
试验类型挖掘规则,用于挖掘目标试验类型下的临床试验;
指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。
具体地,试验阶段挖掘规则,用于筛选出试验阶段符合用于注册申报的目标临床试验。试验阶段挖掘规则中,预设临床试验阶段即预先设置的一个或者多个临床试验阶段,例如常见的临床试验阶段包括I期、I/II期、II期和III期,可以将其中的一种或者多种作为预设临床试验阶段。
例如当预设临床试验阶段为III期,考虑到III期本来为药物注册申请的审查提供依据,可以默认III期是符合用于注册申报的,若任一临床试验的阶段是III期,可以直接将该临床试验确定为需要挖掘的临床试验。
又例如,当预设阶段为其他的I期、I/II期或者II期,可以通过试验数据内包含的信息判断该临床试验是否用于注册申报,也可以根据对应临床试验的相关公告文本,并且结合公告文本中与注册申报相关的内容,判断是否用于注册申报,满足两个条件,确定该临床试验是需要挖掘的临床试验。
招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验。
此处,需要通过试验数据确定临床试验的适应症和招募人数阈值。为了保证临床试验的有效性,需要确定该临床试验对应适应症的招募人数大于对应适应症招募人数阈值。其中,对应适应症招募人数阈值可以是通过数据分析得到的,也可以是预设的。如果该条临床试验的招募人数大于对应适应症招募人数阈值,则确认该条临床试验属于目标临床试验。
试验类型挖掘规则,用于挖掘目标试验类型下的临床试验,在一个实施例中,具体的挖掘过程如下:
(1)对临床试验进行试验类型打标
获取每条临床试验对应的临床试验方案,通过实体识别或基于规则匹配,将临床试验方案与试验类型标签进行绑定;此处,试验类型标签可以是“前瞻性”、“非盲(开放)”、“双盲”、“多中心”、“单臂”、“安慰剂对照”等;
(2)基于试验类型标签,对临床试验进行筛选
例如,可以预先设置试验类型标签“双盲”、“安慰剂对照”和“单臂”作为目标试验类型,从各临床试验中筛选试验类型为“双盲”、“安慰剂对照”或者“单臂”的临床试验,作为目标临床试验。
指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。这里的目标指标类型可以设置为与有效性相关的主要终点指标。获取每条临床试验对应的临床试验方案,通过实体识别或基于规则匹配获取临床主要终点指标,若主要终点指标为与有效性相关指标(非安全性相关指标),则将该条临床试验纳入目标临床试验。
其中有效性相关指标可以包括:OS(Overall Survival)、PFS(progression-freesurvival)、DFS(Disease-free survival)、ORR(Objective Response Rate)、DCR(Diseasecontrol rate);例如,针对任一临床试验的试验数据中包含的临床试验方案,可以将其以文本的形式输入到实体识别模型中,得到实体识别模型输出的作为实体的指标类型,如下表所示,其中文本即临床试验方案,主要终点即实体识别所得的指标类型。主要终点PFS为有效性终点指标,则该临床试验属于目标临床试验。
Figure BDA0003182274320000101
基于上述实施例,步骤130包括:
基于试验阶段挖掘规则中的预设临床试验阶段,以及各临床试验的临床试验阶段和注册申报状态,对各临床试验的试验数据进行筛选;临床试验阶段包含在试验数据内,注册申报状态是基于试验数据或者临床试验文本确定的。
其中,注册申报状态是基于试验数据或者临床试验文本确定的,具体获取方式可以是以下方式中的一种或多种:
从论文、会议资料等临床结果相关资料的背景信息中获取:论文、会议资料等临床结果相关资料的背景信息通常会说明该临床试验是否用于注册申报,临床结果相关资料包含在临床试验文本中;
从药品说明书中获取:部分临床研究信息中,药品说明书与临床登记号是关联的,通过试验数据中包含的临床登记号即可得到药品说明书,进而获取注册申报状态;
从审评材料中获取:药品在申报上市时,会向美国食品和药物管理局FDA(Foodand Drug Administration)递交审评材料,通常审评材料与临床登记号是关联的,通过试验数据中包含的临床登记号即可得到审评材料,进而获取注册申报状态;
从公司公告中获取:如果任意临床试验的临床试验阶段满足试验阶段挖掘规则中设置的预设临床试验阶段,则可以通过该临床试验的试验数据中包含的药品名称,对该临床试验进行溯源,从而获取该临床试验的相关公告文本,并据此确定临床试验的注册申报状态,以便于结合临床试验的临床试验阶段和注册申报状态两方面信息,判断该临床试验是否可能是目标临床试验。
进一步地,注册申报状态是基于对应临床试验的相关公告文本确定的,相关公告文本是基于如下步骤确定的:
基于预先设定的药品名称和原研企业名称的关联关系,确定任一临床试验的药品名称对应的原研企业名称;基于该临床试验的原研企业名称,以及该临床试验的试验数据中的标识信息,从临床试验文本中提取相关公告文本。
在此,相关公告文本可以是药品原研企业发布的与临床试验相关的公告,也可以是国家药监局签发的药物临床试验批准通知书或者其他与临床试验相关的公告,本发明实施例对此不作具体限定。
例如,在任意临床试验的临床试验阶段为预设临床试验阶段的前提下,可以基于对应临床试验的药品名称,使用关键字匹配的方法从临床试验文本中提取出相关公告文本,并且结合相关公告文本中与注册申报相关的内容,判断该临床试验是否用于注册申报。如果确定是用于注册申报,则该临床试验是需要挖掘的临床试验。
具体地,药品名称和原研企业名称的关联关系是预先设置好的,通过查询任一临床试验的药品名称即可获得与该药品名称对应的原研企业名称。
在此基础上,即可结合该临床试验的原研企业名称,以及该临床试验的试验数据中的标识信息,进行相关公告文本的提取。此处,标识信息即临床试验的标识,具体可以是临床登记号,也可以是临床阶段+适应症+药品名称。例如,可以先从临床试验文本中提取原研企业发布的公告,然后通过临床登记号来筛选出与临床试验相关的目标公告,也可以通过临床阶段+药品名称+适应症的形式直接从临床试验文本中筛选相关公告文本,本发明实施例对此不作具体限定。
在一个实施例中,基于试验阶段挖掘规则的筛选过程如下:
(1)从临床试验文本中获取“临床阶段”信息,从中提取临床阶段为I期、I/II期、II期、III期的临床试验;
(2)从上述获取的临床试验中,提取临床登记号、药品信息、适应症信息,得到标准化的药品名称;
(3)于已建立的药品-原研企业关联关系中获取原研企业名称,并从临床试验文本中获取原研企业公告。
(4)从原研公告中筛选出与临床试验相关的公告内容,并判断公告中是否确定该临床试验用于注册申报;
如,可以通过药品名称+适应症+临床阶段来筛选出目标公告,或通过临床登记号来筛选出目标公告;
如,在目标原研企业发的公告中,通过“Cadonilimab”+“转移性***”+“II期”筛选出目标公告信息为“2021年1月,Cadonilimab完成了中国治疗复发或转移性***的注册性II期临床试验患者入组。”
基于上述信息判断得知:该药品在该适应症下开展的临床II期试验用于注册申报。由此,该临床试验纳入目标临床试验。
在上述实施例的基础上,任一适应症的招募人数阈值是基于该适应症下的各临床试验的试验招募人数确定的。
具体地,通过任一临床试验的试验数据可以得到该适应症下的试验招募人数,按照相同的适应症对同一适应症下不同临床试验的试验招募人数进行聚合,从而得到每个适应症下执行临床试验的试验招募人数的取值范围,并由此确定每个适应症的招募人数阈值。
需要说明的是,此处所指的适应症可以是细分适应症。
在一个实施例中,具体挖掘过程如下:
(1)预先建立细分适应症字典
从临床试验文本中获取每个临床登记号对应的适应症信息及纳入标准,从上述两个信息中实时识别包括但不限于如下维度:①疾病名称,②疾病分期;③生物标志物;④疗法定位;⑤疗法类型;⑥前期治疗方案;⑦患者基线(如患者年龄、性别等),基于上述维度,综合构建一套符合市场估值的细分适应症字典;
如,非小细胞肺癌的细分适应症如下:
非小细胞肺癌/晚期/EGFR突变/一线
非小细胞肺癌/晚期/EGFR突变/二线
非小细胞肺癌/II-IIIB期/EGFR突变/可以切除/新辅助
(2)获取细分适应症对应的招募人数阈值
基于上述步骤,从临床试验文本中获取每个临床登记号对应的细分适应症及该临床试验招募人数,按照相同的细分适应症对数据进行聚合,通过数据分析得到每个适应症下试验招募人数的取值范围,并由此确定每个适应症的招募人数阈值;
(3)判断获取的临床试验招募人数是否满足要求
获取每条临床试验对应的细分适应症及该临床试验招募人数,若招募人数满足条件,则纳入该临床试验;
如,通过大数据分析得知:非小细胞肺癌/晚期/EGFR突变/一线的招募人数取值范围为:≥150人,可以将150人作为招募人数阈值,即判断试验招募人数是否合理的阈值。若上述临床试验中细分适应症为非小细胞肺癌/晚期/EGFR突变/一线的招募人数明显少于150人(如只有50人),则排除该临床试验。
基于上述任一实施例,步骤130包括:
基于当前挖掘规则,对上一临床试验集合进行筛选,得到当前临床试验集合;当前挖掘规则即基于挖掘规则执行顺序,从试验阶段挖掘规则、招募人数挖掘规则、试验类型挖掘规则或指标类型挖掘规则中确定的,首个挖掘规则的上一临床试验集合包括各临床试验的试验数据,最尾的临床试验集合包括目标临床试验及其试验数据。
具体地,考虑到临床试验数据量庞大,为了进一步提高数据筛选的效率,可以依次使用上述4个预设挖掘规则,对各临床试验的试验数据进行递进式分层筛选。
此处,挖掘规则执行顺序可以按照用户的需求自行确定,本发明实施例对此不做具体限定。
在一个具体的例子中,如图2所示,挖掘过程如下:
步骤210,基于试验阶段挖掘规则,对各临床试验的试验数据进行筛选,得到第一临床试验集合;
步骤220,基于招募人数挖掘规则,对第一临床试验集合进行筛选,得到第二临床试验集合;
步骤230,基于试验类型挖掘规则,对第二临床试验集合进行筛选,得到第三临床试验集合;
步骤240,基于指标类型挖掘规则,对第三临床试验集合进行筛选,得到目标临床试验及其试验数据。
每经过一次预设挖掘规则的筛选后,得到一个候选集,目标临床试验搜索空间就会减小。经过4次挖掘筛选后,最终得到目标临床试验及其试验数据,从而最大限度的精简数据量,提高数据挖掘的执行速度与效率。
需要说明的是,步骤210得到的第一临床试验集合,是满足预设试验阶段挖掘规则的临床试验及其试验数据的集合;在此基础上基于招募人数挖掘规则,挖掘所得的第二临床试验集合,是满足预设试验阶段挖掘规则和招募人数挖掘规则的临床试验及其试验数据的集合;在此基础上基于试验类型挖掘规则,挖掘所得的第三临床试验集合,是满足预设试验阶段挖掘规则、招募人数挖掘规则和实验类型挖掘规则的临床试验及其试验数据的集合;在此基础上基于指标类型挖掘规则,挖掘所得的目标临床试验及其试验数据,是满足预设试验阶段挖掘规则、招募人数挖掘规则、实验类型挖掘规则和指标类型挖掘规则的临床试验及其试验数据。
基于上述任一实施例,得到目标临床试验及其试验数据,之后还包括:对各目标临床试验的试验数据进行标准化处理,标准化处理包括适应症信息、药品信息、发起人信息、试验日期、试验地区、招募人数、试验方案、试验状态中的至少一种的标准化。
具体地,标准化临床试验相关数据,包括但不限于如下内容:
(1)标准化适应症信息
从目标临床试验的试验数据中获取每个临床登记号对应的疾病信息,于已建立的适应症字典进行匹配,从而得到标准的适应症名称。
如,
原始数据 标准化数据
Non Small Cell Lung Cancer 非小细胞肺癌
(2)标准化药品信息,并从中获取靶点信息
从目标临床试验的试验数据中获取每个临床登记号对应的治疗方案信息,从中通过实体识别提取出临床试验药品名称,于数据库中已建立的药品字典中进行匹配,获取标准的药品名称;
基于已建立的药品和靶点的关联关系获取药品名称对应的靶点名称;
(3)标准化发起人信息
从目标临床试验的试验数据中获取每个临床登记号对应的发起人信息,于数据库中已建立的企业字典进行匹配,获取标准发起人信息;
(4)标准化临床试验开始日期、完成日期、临床试验天数
从目标临床试验的试验数据中获取每个临床登记号对应的临床试验开始日期及结束日期信息,将数据清洗后转化为标准日期格式;如,
原始数据:
Actual Study Start Date:September 16,2015
Actual Primary Completion Date:September 15,2017
清洗转化后的数据:
开始日期:2015-09-16
结束日期:2017-09-15
临床试验天数(天)=结束日期-开始日期;
(5)标准化试验地区
从目标临床试验的试验数据中获取每个临床登记号对应的实验开展地点信息,从数据中提取国家信息,并将国家名称转化为国家简称;如,
原始数据为“China,Beijing”,清洗后数据为“CN”;
原始数据为“New York,New York,United States”,清洗后数据为“US”;
(6)临床招募人数
从目标临床试验的试验数据中获取每个临床登记号对应的招募人数信息,从中提取出数字信息;如,
原始数据为:450participants,则提取临床招募人数为:450
(7)标准化试验方案
从目标临床试验的试验数据中获取每个临床登记号对应的治疗方案信息及对照方案信息,从上述信息中实体识别药品名称,于数据库中已建立的药品字典中进行匹配,得到标准的试验组药品名称及对照组药品名称;如,
临床登记号NCT03052608中获取的治疗方案,进过标准化处理后得到结果为:
疾病 试验组 对照组
非小细胞肺癌/晚期/ALK阳性/一线 劳拉替尼 克唑替尼
(8)格式化临床试验结果信息
从目标临床试验的试验数据中获取每个临床登记号对应的实验方法和试验结果,
①从试验方案中通过实体识别或基于规则匹配获取预设临床主要/次要终点指标,如,
Figure BDA0003182274320000171
Figure BDA0003182274320000181
②根据上述从主要/次要终点指标信息,从相应试验结果中获取目标临床试验对应的“主要终点数据”或“次要终点数据”或“不良反应数据”,并进行格式化处理,提取其中终点指标及对应的数据。如,
Figure BDA0003182274320000182
(9)标准化试验状态
预先定义试验状态标准化为3种状态:进行中、已完成、已终止
从目标临床试验的试验数据中提取试验状态信息,基于提取的试验状态信息,将试验状态对应转化为标准的3种简单状态;如,
①若获取信息为“Completed”,则标记为“已完成”;
②若获取信息为“Suspended”或“Terminated”或“Withdrawn”,则标记为“已终止”;
③若获取信息为“Not yet recruiting”或“Recruiting”或“Enrolling byinvitation”或“Active,not recruiting”,则,判断是否存在上述临床结果信息,若存在,则标记为“已完成”,若不存在,则标记为“进行中。
需要说明的是,上述标准化方案也可以应用在步骤120得到各临床试验的试验数据的清洗标准化处理中,由此得到标准化的各临床试验的试验数据,为后续的数据挖掘提供支持和便利。
采用本发明实施例的方法,高度标准化了药品、适应症、临床数据和临床试验登记信息,最终建立了适应症、药品、临床结果与临床试验登记信息之间的关联关系,该关联关系能够针对特定靶点或疾病快速进行领域趋势分析。
此外,在完成各目标临床试验的试验数据进行标准化处理之后,可以形成一套高效的核心临床数据分析挖掘平台。
下面对本发明提供的临床数据挖掘装置进行描述,下文描述的临床数据挖掘装置与上文描述的临床数据挖掘方法可相互对应参照。
图3是本发明提供的临床数据挖掘装置的结构示意图,如图3所示,该装置包括:
采集单元310,用于采集临床试验文本;
提取单元320,用于从所述临床试验文本中提取各临床试验的试验数据;
筛选单元330,用于基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
本发明实施例提供的装置,通过从各个数据源中采集临床试验文本,从临床试验文本中提取各临床试验的试验数据,相较于仅借助官方登记平台或商业数据库,临床试验的试验数据来源更加丰富,保证了数据全面不遗漏,同时集中整合了各个数据源的临床试验数据,方便后期数据挖掘和分析研究;通过基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的预设挖掘规则,从全球登记的大量临床试验中筛选出可用于创新药物临床开发策略、市场竞争格局分析有实际价值的目标临床试验及其试验数据,避免了直接使用原始临床试验数据做主流趋势判断可能带来的方向偏颇。
基于上述实施例,筛选单元330用于:
基于所述试验阶段挖掘规则中的预设临床试验阶段,以及所述各临床试验的临床试验阶段和注册申报状态,对所述各临床试验的试验数据进行筛选;所述临床试验阶段包含在所述试验数据内,所述注册申报状态是基于所述试验数据或者所述临床试验文本确定的。
基于上述任一实施例,筛选单元330用于:
基于当前挖掘规则,对上一临床试验集合进行筛选,得到当前临床试验集合;
所述当前挖掘规则即基于挖掘规则执行顺序,从所述试验阶段挖掘规则、所述招募人数挖掘规则、所述试验类型挖掘规则或所述指标类型挖掘规则中确定的,首个挖掘规则的上一临床试验集合包括所述各临床试验的试验数据,最尾的临床试验集合包括所述目标临床试验及其试验数据。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行临床数据挖掘方法,该方法包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的临床数据挖掘方法,该方法包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的临床数据挖掘方法,该方法包括:采集临床试验文本;从所述临床试验文本中提取各临床试验的试验数据;基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种临床数据挖掘方法,其特征在于,包括:
采集临床试验文本;
从所述临床试验文本中提取各临床试验的试验数据;
基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
2.根据权利要求1所述的临床数据挖掘方法,其特征在于,所述预设挖掘规则包括如下规则中的至少一种:
试验阶段挖掘规则,用于挖掘预设临床试验阶段下注册申报的临床试验;
招募人数挖掘规则,用于挖掘招募人数大于对应适应症招募人数阈值的临床试验;
试验类型挖掘规则,用于挖掘目标试验类型下的临床试验;
指标类型挖掘规则,用于挖掘目标指标类型下的临床试验。
3.根据权利要求2所述的临床数据挖掘方法,其特征在于,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,包括:
基于所述试验阶段挖掘规则中的预设临床试验阶段,以及所述各临床试验的临床试验阶段和注册申报状态,对所述各临床试验的试验数据进行筛选;
所述临床试验阶段包含在所述试验数据内,所述注册申报状态是基于所述试验数据或者所述临床试验文本确定的。
4.根据权利要求3所述的所述的临床数据挖掘方法,其特征在于,所述注册申报状态是基于对应临床试验的相关公告文本确定的,所述相关公告文本是基于如下步骤确定的:
基于预先设定的药品名称和原研企业名称的关联关系,确定任一临床试验的药品名称对应的原研企业名称;
基于所述任一临床试验的原研企业名称,以及所述任一临床试验的试验数据中的标识信息,从所述临床试验文本中提取所述相关公告文本。
5.根据权利要求2所述的临床数据挖掘方法,其特征在于,所述招募人数挖掘规则中,任一适应症的招募人数阈值是基于所述任一适应症下的各临床试验的试验招募人数确定的;所述适应症和所述试验招募人数包含在所述试验数据内。
6.根据权利要求2至5中任一项所述的临床数据挖掘方法,其特征在于,所述基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据,包括:
基于当前挖掘规则,对上一临床试验集合进行筛选,得到当前临床试验集合;
所述当前挖掘规则即基于挖掘规则执行顺序,从所述试验阶段挖掘规则、所述招募人数挖掘规则、所述试验类型挖掘规则或所述指标类型挖掘规则中确定的,首个挖掘规则的上一临床试验集合包括所述各临床试验的试验数据,最尾的临床试验集合包括所述目标临床试验及其试验数据。
7.根据权利要求1至5中任一项所述的临床数据挖掘方法,其特征在于,所述得到目标临床试验及其试验数据,之后还包括:
对各目标临床试验的试验数据进行标准化处理,所述标准化处理包括适应症信息、药品信息、发起人信息、试验日期、试验地区、招募人数、试验方案、试验状态中的至少一种的标准化。
8.一种临床数据挖掘装置,其特征在于,包括:
采集单元,用于采集临床试验文本;
提取单元,用于从所述临床试验文本中提取各临床试验的试验数据;
筛选单元,用于基于预设挖掘规则,对所述各临床试验的试验数据进行筛选,得到目标临床试验及其试验数据;所述预设挖掘规则是基于临床试验阶段、适应症招募人数阈值、临床试验类型和终点指标类型中的至少一种确定的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述临床数据挖掘方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述临床数据挖掘方法的步骤。
CN202110851809.5A 2021-07-27 2021-07-27 临床数据挖掘方法、装置、电子设备和存储介质 Pending CN113674867A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110851809.5A CN113674867A (zh) 2021-07-27 2021-07-27 临床数据挖掘方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110851809.5A CN113674867A (zh) 2021-07-27 2021-07-27 临床数据挖掘方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113674867A true CN113674867A (zh) 2021-11-19

Family

ID=78540368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110851809.5A Pending CN113674867A (zh) 2021-07-27 2021-07-27 临床数据挖掘方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113674867A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114334045A (zh) * 2021-12-28 2022-04-12 科临达康医药生物科技(北京)有限公司 临床试验方案生成方法、装置和设备
CN115019976A (zh) * 2022-03-23 2022-09-06 数魔方(北京)医药科技有限公司 药品信息挖掘方法、装置、药品信息查询方法和装置

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1636210A (zh) * 2001-11-02 2005-07-06 美国西门子医疗解决公司 用于临床试验的病人数据挖掘
CN1714352A (zh) * 2002-10-23 2005-12-28 资本苏睿尼集团国际公司 临床试验信息管理的***和方法
US20100250273A1 (en) * 2009-03-26 2010-09-30 Li Gen Site effectiveness index and methods to measure and improve operational effectiveness in clinical trial execution
CN102054129A (zh) * 2010-12-29 2011-05-11 中国医学科学院阜外心血管病医院 一种临床药理试验信息处理***
US20160042155A1 (en) * 2014-08-06 2016-02-11 Gen LI Methods of forecasting enrollment rate in clinical trial
CN106056511A (zh) * 2016-08-02 2016-10-26 天津阿贝斯努科技有限公司 一种药物临床试验网络化监督管理***
CN107633153A (zh) * 2017-08-22 2018-01-26 深圳华大基因研究院 一种肿瘤个体化临床实验文本挖掘的方法和***
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据***的构建方法
CN108615560A (zh) * 2018-03-19 2018-10-02 安徽锐欧赛智能科技有限公司 一种基于数据挖掘的临床医疗数据分析方法
CN109830303A (zh) * 2019-02-01 2019-05-31 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
CN111145847A (zh) * 2019-12-31 2020-05-12 天津新开心生活科技有限公司 临床试验数据的录入方法及装置、介质和电子设备
CN111341455A (zh) * 2020-02-10 2020-06-26 厦门茶蕊生物医药科技有限公司 临床试验一体化云平台管理***、方法及存储介质
CN112289454A (zh) * 2020-09-10 2021-01-29 上海柯林布瑞信息技术有限公司 临床数据的打标签方法及装置、存储介质、终端
CN112489812A (zh) * 2020-11-30 2021-03-12 北京华彬立成科技有限公司 药物开发分析方法、装置、电子设备和存储介质
CN112970069A (zh) * 2018-08-08 2021-06-15 李�根 开发临床试验方案的方法和***

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1636210A (zh) * 2001-11-02 2005-07-06 美国西门子医疗解决公司 用于临床试验的病人数据挖掘
CN1714352A (zh) * 2002-10-23 2005-12-28 资本苏睿尼集团国际公司 临床试验信息管理的***和方法
US20100250273A1 (en) * 2009-03-26 2010-09-30 Li Gen Site effectiveness index and methods to measure and improve operational effectiveness in clinical trial execution
CN102054129A (zh) * 2010-12-29 2011-05-11 中国医学科学院阜外心血管病医院 一种临床药理试验信息处理***
US20160042155A1 (en) * 2014-08-06 2016-02-11 Gen LI Methods of forecasting enrollment rate in clinical trial
CN106056511A (zh) * 2016-08-02 2016-10-26 天津阿贝斯努科技有限公司 一种药物临床试验网络化监督管理***
CN107633153A (zh) * 2017-08-22 2018-01-26 深圳华大基因研究院 一种肿瘤个体化临床实验文本挖掘的方法和***
CN108615560A (zh) * 2018-03-19 2018-10-02 安徽锐欧赛智能科技有限公司 一种基于数据挖掘的临床医疗数据分析方法
CN108538395A (zh) * 2018-04-02 2018-09-14 上海市儿童医院 一种通用的医疗专病数据***的构建方法
CN112970069A (zh) * 2018-08-08 2021-06-15 李�根 开发临床试验方案的方法和***
CN109830303A (zh) * 2019-02-01 2019-05-31 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
CN111145847A (zh) * 2019-12-31 2020-05-12 天津新开心生活科技有限公司 临床试验数据的录入方法及装置、介质和电子设备
CN111341455A (zh) * 2020-02-10 2020-06-26 厦门茶蕊生物医药科技有限公司 临床试验一体化云平台管理***、方法及存储介质
CN112289454A (zh) * 2020-09-10 2021-01-29 上海柯林布瑞信息技术有限公司 临床数据的打标签方法及装置、存储介质、终端
CN112489812A (zh) * 2020-11-30 2021-03-12 北京华彬立成科技有限公司 药物开发分析方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李鹃;: "面向临床路径的常用数据挖掘方法概述", 中国卫生产业, no. 27, pages 198 - 199 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114334045A (zh) * 2021-12-28 2022-04-12 科临达康医药生物科技(北京)有限公司 临床试验方案生成方法、装置和设备
CN115019976A (zh) * 2022-03-23 2022-09-06 数魔方(北京)医药科技有限公司 药品信息挖掘方法、装置、药品信息查询方法和装置
CN115019976B (zh) * 2022-03-23 2023-03-21 数魔方(北京)医药科技有限公司 药品信息挖掘方法、装置、药品信息查询方法和装置

Similar Documents

Publication Publication Date Title
Petitti Meta-analysis, decision analysis, and cost-effectiveness analysis: methods for quantitative synthesis in medicine
Smith et al. Methods to compare adverse events in twitter to FAERS, drug information databases, and systematic reviews: proof of concept with adalimumab
CN113674867A (zh) 临床数据挖掘方法、装置、电子设备和存储介质
JP2005508544A (ja) 個体群に基づく分析による患者データマイニング
CN113539515B (zh) 临床需求挖掘方法、装置、电子设备和存储介质
Bhattacharya et al. Analysis of eligibility criteria representation in industry-standard clinical trial protocols
Pavlov et al. Reference medical datasets (MosMedData) for independent external evaluation of algorithms based on artificial intelligence in diagnostics
Paynter et al. A prospective comparison of evidence synthesis search strategies developed with and without text-mining tools
Adewumi et al. An evaluation of the practice of transparency and reproducibility in addiction medicine literature
Dyer et al. Improvement in follow-up imaging with a patient tracking system and computerized registry for lung nodule management
CN114255877A (zh) 靶点信息挖掘和检索方法、装置、电子设备和存储介质
Bonczar et al. How to write an umbrella review? A step-by-step tutorial with tips and tricks
Padilha et al. Patient safety in Intensive Care Units: development of a research project
Bradley et al. Systematically reviewing the evidence
CN107610783A (zh) 一种脑肿瘤信息平台
Truong et al. Population adjusted‐indirect comparisons in health technology assessment: A methodological systematic review
CN113889279B (zh) 联合疗法信息挖掘和查询方法、装置和电子设备
Amanzadeh et al. Digital cognitive tests for dementia screening: A systematic review
Mathias et al. Characterizing pharmacogenomic‐guided medication use with a clinical data repository
Smischney et al. Retrospective derivation and validation of a search algorithm to identify emergent endotracheal intubations in the intensive care unit
CN114121293A (zh) 临床试验信息挖掘和查询方法及装置
CN113868488A (zh) 药品研发竞争数据分析方法、装置、电子设备和存储介质
CN113921103A (zh) 鉴别诊断病种敏感性测量方法、装置、电子设备及介质
CN113723826A (zh) 仿制药早期情报监测方法、装置、电子设备和存储介质
Consumers et al. Study quality guide

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231206

Address after: Room 403, 4th Floor, Building 11, No. 8 Heying Road, Science and Technology Park, Changping District, Beijing, 102299

Applicant after: Beijing Huabin Licheng Technology Co.,Ltd.

Address before: Room 178, 4th floor, building 1, no.5199 Gonghexin Road, Baoshan District, Shanghai, 200431

Applicant before: Shanghai Yaohui Information Technology Co.,Ltd.

TA01 Transfer of patent application right