CN112270988A - 一种罕见病辅助诊断的方法及*** - Google Patents

一种罕见病辅助诊断的方法及*** Download PDF

Info

Publication number
CN112270988A
CN112270988A CN202011114018.6A CN202011114018A CN112270988A CN 112270988 A CN112270988 A CN 112270988A CN 202011114018 A CN202011114018 A CN 202011114018A CN 112270988 A CN112270988 A CN 112270988A
Authority
CN
China
Prior art keywords
disease
rare
information
model
diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011114018.6A
Other languages
English (en)
Other versions
CN112270988B (zh
Inventor
黄书鑫
陈詹妮
陈荣山
熊慧
张丰丰
曾缘欢
廖晓佳
郭莉莎
王琳
谢文龙
姚迅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Jiyuan Medical Laboratory Co ltd
Original Assignee
Xiamen Genokon Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Genokon Medical Technology Co ltd filed Critical Xiamen Genokon Medical Technology Co ltd
Priority to CN202011114018.6A priority Critical patent/CN112270988B/zh
Publication of CN112270988A publication Critical patent/CN112270988A/zh
Application granted granted Critical
Publication of CN112270988B publication Critical patent/CN112270988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种用于指导罕见病患者就诊的方法及***,能通过对临床症状信息的分析,为罕见病患者提供实时的就诊建议,包括临床症状对应的可能相关的罕见病信息,疾病描述、疾病受累***的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段等信息。让罕见病患者不再毫无目的性的四处奔波求医,大大缩短了罕见病的诊断时间,为患者赢得最佳治疗时机,同时也减轻了患者家庭的经济和精神负担。

Description

一种罕见病辅助诊断的方法及***
技术领域
本发明属临床医学辅助诊断、导诊领域,具体涉及一种用于指导罕见病患者就诊的方法及***。
背景技术
罕见病,原指发病率很低、很少见的疾病,通常表现为慢性、高致残致死率的一类疾病。然而随着社会进步,特别是医疗技术的迅猛发展,越来越多的罕见病患者得以存续,以此带来的巨大的医疗需求凸显。全球现有3.5亿的罕见病患者,我国的罕见病患者也并不罕见,我国现有罕见病群体人数近2000万人,每年新增超过20万人。
面对如此庞大的患者群体,我国的罕见病诊断水平总体却不高,由于罕见病存在着单病种人群发病率低、病例分散、临床表现复杂多样、常常涉及多个器官多个***等特点,造成了近30%的罕见病患者从症状初显到确诊需经历5-10家医院,2-5种科室,平均耗时5-30年,误诊、漏诊率高达65%。因此,如何提高罕见病患者的就医效率,特别是如何有效地缩短罕见病患者从症状初显到疾病确诊之间的时间,以及医疗资源的合理支配和缓解医患矛盾,一直是罕见病诊疗的关键难点问题。
发明内容
本发明实施例的目的是提供一种用于指导罕见病患者就诊的方法及***,能通过对临床症状信息的分析,为罕见病患者提供实时的就诊建议,包括临床症状对应的可能相关的罕见病信息,疾病描述、疾病受累***的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段等信息。
为实现上述目的,本发明实施例提供了一种用于指导罕见病患者就诊的方法,包括如下步骤。
步骤1,获取用户的输入信息,包含但不限于对患者的临床症状自我表述、临床病历、临床检查数据等临床信息。
步骤2,对步骤1的信息通过罕见病诊断术语模型、DAG模型(directed acyclicgraphs,有向无环图)和/或DP模型(dynamical programming,动态规划)和/或HMM模型(Hidden Markov Model,隐式马尔科夫模型)进行分词,获得关键诊断信息。所述的罕见病诊断术语模型其特征在于,提取HPO(Human Phenotype Ontology,人类表型本体)英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要等信息,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库。对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,进而构建包含训练集,验证集和测试集的罕见病诊断术语知识库***,建立trie树分词模型,最终获得罕见病诊断术语模型。
步骤3,对步骤2获得的关键信息通过罕见病典型诊断表型模型、LSA模型(LatentSemantic Analysis,潜在语义分析)和聚类分析模型,进行模糊匹配,映射为标准表型。所述的罕见病典型诊断表型模型其特征在于,收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,进而构建包含训练集,验证集和测试集的罕见病诊断表型知识库***,最终建立罕见病典型诊断表型模型。
步骤4,将得到的标准表型进行HPO(Human Phenotype Ontology,人类表型本体)转换,提炼为HPO号。
步骤5,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括但不限于疾病的描述、疾病受累***的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略等信息。其特征在于,收集罕见病标准表型和疾病信息,建立罕见病表型疾病数据库,进而构建包含训练集,验证集和测试集的罕见病表型疾病数据库,最终建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,获得OMIM(Online Mendelian Inheritance in Man,人类孟德尔遗传病)号,并使用OMIM号,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM网站上收录的所有OMIM号词条信息;依据收集的OMIM号词条信息建立OMIM表型数据库;收集NCBI上收录的基因介绍,基因在染色体上的位置信息;依据收集的基因信息,建立基因数据库;使用建立的基因数据库,与现有检测技术进行数据统计,建立基因检测手段数据库。
本发明实施例提供了一种用于指导罕见病患者就诊***,由信息收集模块,信息处理模块和输出模块组成。进一步地,所述的信息收集模块,用于收集患者临床症状信息,由文字词条组成。所述的信息处理模块,用于将信息收集模块的文字词条进行分析,并转换为标准的疾病表型术语(CHPO)。所述的信息输出模块,用于输出所述的结果信息。
本发明的具有的有益效果。
本发明的***部署于云端,用户可通过电脑、手机等智能设备通过互联网随时随地使用。让罕见病患者,尤其是无法通过现有医疗手段进行快速确诊的罕见病患者,能够通过本***了解临床症状对应的罕见病疾病信息及科学的就诊流程,确诊的关键临床指征及检查手段,为罕见病患者提供实时的就诊建议和详实的疾病相关信息。让罕见病患者不再毫无目的性的四处奔波求医,大大缩短了罕见病的诊断时间,为患者赢得最佳治疗时机,同时也减轻了患者家庭的经济和精神负担。
本发明的***也可以部署到医院内部使用,通过收集罕见病的问诊消息和病历信息,结合医生诊断之后的先验知识,通过人工智能技术,运行统计模型建立智能辅助诊断***,帮助基层全科医生进行常见病多发病的规范化诊疗、实时对危重症的识别、罕见病的提醒,实现罕见病的真正分级诊疗。借此智能诊断***,可以解决罕见病医生资源分布不均的问题,使罕见病患者无需特意选择专家问诊,在附近医院便可获得初步检查,无法解决再寻找专家,合理分配医疗资源,保证罕见病患者,医院双方利益最大化。
本发明仅提供了一种用于指导罕见病患者就诊的方法及***,为罕见病患者提供实时的就诊建议,优化了罕见病诊断流程、提高了诊断效率和诊断准确率,为患者的早日确诊提供了强有力的支持。本发明还缓解了患者都集中到大医院的问题,顺应了国家分级诊疗的改革趋势,让医疗资源得到更合理的应用。
附图说明
图1为本发明的***流程图。
图2为本发明的***信息分词处理流程图。
具体实施方式
下面结合实施例具体说明本发明。如图1所示,本发明提供的一种用于指导罕见病患者就诊***,由信息收集模块,信息处理模块和输出模块组成。
进一步地,所述的信息收集模块,用于收集患者临床症状信息,由文字词条组成。获取用户的输入信息,包含但不限于对患者的临床症状自我表述、临床病历、临床检查数据等临床信息。
所述的信息处理模块,用于将信息收集模块的文字词条进行分析,并转换为标准的疾病表型术语(CHPO)。如图2所示,对信息收集模块获取的信息通过罕见病诊断术语模型、DAG模型(directed acyclic graphs,有向无环图)和/或DP模型(dynamicalprogramming,动态规划)和/或HMM模型(Hidden Markov Model,隐式马尔科夫模型)进行分词,获得关键诊断信息。其中罕见病诊断术语模型的构建方法如下。提取HPO(HumanPhenotype Ontology,人类表型本体)英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要等信息,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库。对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,进而构建包含训练集,验证集和测试集的罕见病诊断术语知识库***,建立trie树分词模型,最终获得罕见病诊断术语模型。
进一步地,对获得关键诊断信息通过罕见病典型诊断表型模型、LSA模型(LatentSemantic Analysis,潜在语义分析)和聚类分析模型,进行模糊匹配,映射为标准表型。其中罕见病典型诊断表型模型的构建方法如下。收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,进而构建包含训练集,验证集和测试集的罕见病诊断表型知识库***,最终建立罕见病典型诊断表型模型。
进一步地,将得到的标准表型进行HPO(Human Phenotype Ontology,人类表型本体)转换,提炼为HPO号。
进一步地,所述的信息输出模块,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括但不限于疾病的描述、疾病受累***的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略等信息。所述的方法包括,收集罕见病标准表型和疾病信息;依据收集的罕见病标准表型和疾病信息,建立罕见病表型疾病数据库;通过罕见病表型疾病数据库,构建训练集,验证集和测试集;采用构建的罕见病表型疾病数据库,建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,获得OMIM(Online Mendelian Inheritance in Man,人类孟德尔遗传病)号,并使用OMIM号,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM网站上收录的所有OMIM号词条信息;依据收集的OMIM号词条信息建立OMIM表型数据库;收集NCBI上收录的基因介绍,基因在染色体上的位置信息;依据收集的基因信息,建立基因数据库;使用建立的基因数据库,与现有检测技术进行数据统计,建立基因检测手段数据库。

Claims (1)

1.一种用于指导罕见病患者就诊的方法,包括:
步骤1,获取用户的输入信息,包含但不限于对患者的临床症状自我表述、临床病历、临床检查数据等临床信息;
步骤2,通过罕见病诊断术语模型、DAG模型和/或DP模型和/或HMM模型进行分词,获得关键诊断信息;所述的罕见病诊断术语模型其特征在于,提取HPO英文数据库、中文CHPO数据库中的HPO号、HPO名称、定义、描述、同义词、关联关系和文献名及摘要等信息,进行清洗整理,并根据HPO的类别信息映射医院科室信息后,构建HPO中英文数据库;对HPO中英文数据库进行分词,清洗并统计词频,对高频医学词汇进行校正,构建HPO中英文词库,同时收集罕见病的问诊记录信息和/或就诊病历信息,建立罕见病的术语词典,进而构建包含训练集,验证集和测试集的罕见病诊断术语知识库***,建立trie树分词模型,最终获得罕见病诊断术语模型;
步骤3,对步骤2获得的关键信息通过罕见病典型诊断表型模型、LSA模型和聚类分析模型,进行模糊匹配,映射为标准表型;所述的罕见病典型诊断表型模型其特征在于,收集罕见病的各类症状信息及诊断信息及罕见病专家医师的先验知识,建立罕见病的诊断表型数据库和诊断表型数据库里面的各病历信息,进而构建包含训练集,验证集和测试集的罕见病诊断表型知识库***,最终建立罕见病典型诊断表型模型;
步骤4,将得到的标准表型进行HPO转换,提炼为HPO号;
步骤5,依据预先建立的典型疾病训练模型,对获得的HPO号进行处理,输出结果信息,所述的结果信息包括至少20种可能相关疾病,以及每一种可能相关疾病的介绍,包括但不限于疾病的描述、疾病受累***的表型以及疾病的首诊科室、就诊流程、检查科目、确诊的关键临床指征及检查手段、遗传模式以及基因检测策略等信息;其特征在于,收集罕见病标准表型和疾病信息,建立罕见病表型疾病数据库,进而构建包含训练集,验证集和测试集的罕见病表型疾病数据库,最终建立罕见病表型疾病模型;使用罕见病表型疾病模型进行模型映射,运用人类遗传病预测模型,进行预测相关疾病基因,使用疾病基因反向预测关联疾病,与罕见病表型疾病模型预测结果相互校正,获得最终关联疾病和相关基因,检测策略结果,其中包括:收集OMIM号词条信息,收集NCBI上收录的基因介绍,基因在染色体上的位置信息,建立基因数据库,并与现有检测技术进行数据统计,建立基因检测手段数据库。
CN202011114018.6A 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法 Active CN112270988B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011114018.6A CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011114018.6A CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Publications (2)

Publication Number Publication Date
CN112270988A true CN112270988A (zh) 2021-01-26
CN112270988B CN112270988B (zh) 2022-07-29

Family

ID=74337260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011114018.6A Active CN112270988B (zh) 2020-12-04 2020-12-04 一种罕见病辅助诊断的方法

Country Status (1)

Country Link
CN (1) CN112270988B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724867A (zh) * 2021-11-03 2021-11-30 北京大学第三医院(北京大学第三临床医学院) 提示***及方法
CN116562266A (zh) * 2023-07-10 2023-08-08 中国医学科学院北京协和医院 文本分析方法、计算机设备及计算机可读存储介质
CN116796046A (zh) * 2023-08-29 2023-09-22 武汉大学人民医院(湖北省人民医院) 基于罕见特征的病例检索方法及装置
WO2024060508A1 (zh) * 2022-09-20 2024-03-28 浙江大学 知识驱动的罕见病可视化问答式辅助鉴别诊断***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577907A (zh) * 2017-09-08 2018-01-12 成都奇恩生物科技有限公司 一种基于互联网的罕见病辅助诊断***及使用方法
US20190325988A1 (en) * 2018-04-18 2019-10-24 Rady Children's Hospital Research Center Method and system for rapid genetic analysis
CN110688493A (zh) * 2019-09-26 2020-01-14 京东方科技集团股份有限公司 一种关联关系构建方法、装置及电子设备
CN111951955A (zh) * 2020-08-13 2020-11-17 神州数码医疗科技股份有限公司 一种基于规则推理的临床决策支持***构建方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577907A (zh) * 2017-09-08 2018-01-12 成都奇恩生物科技有限公司 一种基于互联网的罕见病辅助诊断***及使用方法
US20190325988A1 (en) * 2018-04-18 2019-10-24 Rady Children's Hospital Research Center Method and system for rapid genetic analysis
CN110688493A (zh) * 2019-09-26 2020-01-14 京东方科技集团股份有限公司 一种关联关系构建方法、装置及电子设备
CN111951955A (zh) * 2020-08-13 2020-11-17 神州数码医疗科技股份有限公司 一种基于规则推理的临床决策支持***构建方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
乔凯等: "基于大数据技术的临床诊断决策***", 《科技资讯》 *
杨琳等: "复旦大学附属儿科医院高通量测序数据分析流程(第二版)对遗传疾病候选变异基因筛选用时和准确性分析", 《中国循证儿科杂志》 *
顾坚磊等: "人工智能技术的应用:罕见病临床决策***的需求、现状与挑战", 《第二军医大学学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724867A (zh) * 2021-11-03 2021-11-30 北京大学第三医院(北京大学第三临床医学院) 提示***及方法
WO2024060508A1 (zh) * 2022-09-20 2024-03-28 浙江大学 知识驱动的罕见病可视化问答式辅助鉴别诊断***及方法
CN116562266A (zh) * 2023-07-10 2023-08-08 中国医学科学院北京协和医院 文本分析方法、计算机设备及计算机可读存储介质
CN116562266B (zh) * 2023-07-10 2023-09-15 中国医学科学院北京协和医院 文本分析方法、计算机设备及计算机可读存储介质
CN116796046A (zh) * 2023-08-29 2023-09-22 武汉大学人民医院(湖北省人民医院) 基于罕见特征的病例检索方法及装置
CN116796046B (zh) * 2023-08-29 2023-11-10 武汉大学人民医院(湖北省人民医院) 基于罕见特征的病例检索方法及装置

Also Published As

Publication number Publication date
CN112270988B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN112270988B (zh) 一种罕见病辅助诊断的方法
Alizadehsani et al. A database for using machine learning and data mining techniques for coronary artery disease diagnosis
CN110021364B (zh) 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测***
CN110634573A (zh) 一种临床脑梗患者复发风险预警评分可视化模型***及其评价方法
CN107103207B (zh) 基于病例多组学变异特征的精准医学知识搜索***及实现方法
CN112541056B (zh) 医学术语标准化方法、装置、电子设备及存储介质
CN112530535B (zh) 基于健康医疗大数据建立疾病专病队列的方法及装置
Bhatt Artificial intelligence in managing clinical trial design and conduct: Man and machine still on the learning curve?
Tou et al. Automatic infection detection based on electronic medical records
Hammami et al. Automated classification of cancer morphology from Italian pathology reports using Natural Language Processing techniques: A rule-based approach
CN117271804B (zh) 一种共病特征知识库生成方法、装置、设备及介质
US20170220743A1 (en) Tracking real-time assessment of quality monitoring in endoscopy
Wang et al. EHR2Vec: representation learning of medical concepts from temporal patterns of clinical notes based on self-attention mechanism
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及***
WO2021008601A1 (zh) 一种医学数据的检验方法
KR20130047384A (ko) 유전변이 데이터 베이스 구축 장치 및 방법
CN114649071A (zh) 一种基于真实世界数据的消化性溃疡治疗方案的预测***
Mandava MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning
Zaveri et al. MetaCrowd: crowdsourcing biomedical metadata quality assessment
CN115862897A (zh) 一种基于临床数据的症候群监测方法及***
CN111161881A (zh) 一种疾病共现关系的识别方法、装置及存储介质
CN109859813A (zh) 一种实体修饰词识别方法及装置
CN113192630A (zh) 一种基于文本分割的再入院预测方法
Bampa et al. Detecting adverse drug events from Swedish electronic health records using text mining
CN112820410A (zh) 一种临床脑梗患者复发风险预警评分可视化模型***及其评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240328

Address after: Room 304, No. 59-1 Wanghai Road, Siming District, Xiamen City, Fujian Province, 361008

Patentee after: Xiamen Jiyuan medical laboratory Co.,Ltd.

Country or region after: China

Address before: 361008 4th floor, South Building, 61 Wanghai Road, Siming District, Xiamen City, Fujian Province

Patentee before: XIAMEN GENOKON MEDICAL TECHNOLOGY CO.,LTD.

Country or region before: China