CN111175480A - 一种血液生化指标计算性别和年龄的方法 - Google Patents
一种血液生化指标计算性别和年龄的方法 Download PDFInfo
- Publication number
- CN111175480A CN111175480A CN202010029900.4A CN202010029900A CN111175480A CN 111175480 A CN111175480 A CN 111175480A CN 202010029900 A CN202010029900 A CN 202010029900A CN 111175480 A CN111175480 A CN 111175480A
- Authority
- CN
- China
- Prior art keywords
- blood
- age
- model
- blood biochemical
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Urology & Nephrology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Food Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Hematology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及血液检测技术领域,且公开了一种血液生化指标计算性别和年龄的方法,包括血液生化指标数据收集、数据预处理、模型建立,所述样本收集后对其进行数据预处理。血液指标为衡量对象,增加测量的全面性,同时血液指标包含了多组学的代谢物,可以更加全面的反应个体衰老状况,并解释衰老水平,并通过DNN模型对血液生化指标进行计算,使得整个流程更加便捷化,使得血液生化指标传入DNN模型后,即可得到测试结果,且计算模型中的各项参数和模型结构经过多次验证,保证计算结果的准确性,同时所选取的血液生化指标是临床使用和体检机构中最常见的指标,获取难度小成本低,解释程度高,使得样本被计算后得出的结果更加全面化。
Description
技术领域
本发明涉及血液检测技术领域,具体为一种血液生化指标计算性别和年龄的方法。
背景技术
衰老是个体不可避免的生命阶段,是生物发育成熟后的一个持续、动态并缓慢发生的阶段,在这一阶段中,个体机能减退、生理结构组分逐渐退行性病变,同时伴发一系列退行性疾病,如老年骨质增生、阿尔兹海默症(老年痴呆症)、帕金森综合征等。衰老伴随的器官功能减退、细胞和分子水平的改变渐进性影响健康,因此衰老与疾病和死亡密切相关。近年来,关于个体衰老的研究也成为生命科学中一个热门的研究领域。衰老的个体差异较大,同一个体各个***和器官的衰老水平和速度也不同,因此历法年龄并非反应寿命的最可靠指标,生物学年龄则更为精确。
类似MARK-AGE的大型纵向项目已经开始研究多种生物标记物在衰老过程中的改变与实际年龄的关系,甲基化相关的标记物、转录组代谢组相关代谢物、端粒长度、免疫细胞数量和应答效果等都可作为衡量个体年龄的标准之一。爱丁堡大学的研究团队根据血液中的DNA甲基化水平预测个体年龄,然后将这一年龄与个体真实年龄进行比较,结果发现,甲基化预测年龄比实际年龄大五岁以上老人,死亡风险要高21‰;端粒普遍存在于染色体末端,一方面保护染色体不被降解,另一方面也防止染色体相互融合,一但端粒耗尽,染色体将无法正常***,细胞的更新也将结束,因此端粒的长度强烈指向细胞***潜力的大小,端粒越短表明细胞再生能力越小,越长则表示细胞再生活力越强,剩余***次数充裕。
然而现有的技术所研究的指标大多缺乏对全部器官或者***的整体描述,只针对某一***或个体的某一层面做衰老方面的解释;同时这些指标的测量难度大、成本高;最重要的是这些研究获取的指标大多从具有病理性特征的个体上选取,并不具有针对所有个体的普遍性,血液检测是医学和健康产业中最常见、最简单的检测,血液指标在自然状态下个体差异多样,并且对不同的生理状况反应敏感(炎症或醉酒情况等),因此血液检测在临床上的使用十分普遍。研究表明,个体步入老年后,血液中红细胞数量较青壮年时减少约10%到20%,红细胞比容和血红细胞蛋白量均有降低;白细胞也会随着年龄的增长而降低,其中以淋巴细胞降低的最明显,因此老年人的免疫能力普遍降低,发生感染、炎症和肿瘤的几率增高;白蛋白数量逐渐减少,血脂总量显著升高,甘油三酯含量增加,胆固醇含量增加等,以上血液指标均已被证明是个体衰老的标记物。
现有计算个体年龄的方法只针对个体的某个器官或组织,缺乏对个体衰老的整体描述和解释,无法全面的反应个体衰老情况,血液指标涉及多种组学代谢物,以血液指标作为计算个体年龄的方法可以更加全面的描述个体衰老情况;
甲基化相关的标记物、转录组代谢组相关代谢物、端粒长度、免疫细胞数量和应答效果来衡量衰老与个体年龄的方法需要检测的指标获取难度大、成本高,血液检测在临床的使用上更加普遍,指标更易获取。
发明内容
针对上述背景技术的不足,本发明提供了一种血液生化指标计算性别和年龄的方法,具备获取样本难度小、成本低、数据精准度高的优点,解决了背景技术提出的问题。
本发明提供如下技术方案:一种血液生化指标计算性别和年龄的方法,包括血液生化指标数据收集、数据预处理、模型建立,所述样本收集后对其进行数据预处理,然后经过DNN模型计算后得出结果,所述血液生化指标按以下方法计算性别和年龄:
第一步,收集原始数据,共计收入92062个样本,所述每个样本中包含个体年龄、性别和19项血液生化指标,所述所选指标常见于医院和体检机构的血常规和血液生化指标检测报告单;
第二步数据预处理,移除有遗漏数据的样本和明显错误离群值(Outliar)的样本后,总计获得26754例完整样本用于两个模型的训练和测试,随后对19项血液生化指标进行标准化处理,将所有指标的数值都映射在0,1范围内;
第三步模型建立与评估,在使用模型进行计算时,将待测样本的19项血液生化指标直接传入模型中,经过DNN模型计算后,传出即为计算好的年龄和性别。
优选的,所述19项血液生化指标包括白蛋白、葡萄糖、尿素、胆固醇、总蛋白、血清钠、肌酸酐、血红蛋白、总胆红素、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、血清钙、血清钾、血细胞比容、平均红细胞血红蛋白浓度、平均红细胞体积、血小板计数和红细胞计数。
优选的,所述年龄计算使用DNN回归算法,性别计算使用DNN分类算法。
优选的,所述DNN模型主要由输入层、隐藏层和输出层构成、每层中有若干神经元,输入层神经元与输入变量个数对应,输出层神经元与输出结果变量个数对应。
本发明具备以下有益效果:
该血液生化指标计算性别和年龄的方法,通过以血液指标为衡量对象,增加测量的全面性,同时血液指标包含了多组学的代谢物,可以更加全面的反应个体衰老状况,并解释衰老水平,并通过DNN模型对血液生化指标进行计算,使得整个流程更加便捷化,使得血液生化指标传入DNN模型后,即可得到测试结果,且计算模型中的各项参数和模型结构经过多次验证,保证计算结果的准确性,同时所选取的血液生化指标是临床使用和体检机构中最常见的指标,获取难度小成本低,解释程度高,使得样本被计算后得出的结果更加全面化。
附图说明
图1为本发明流程示意图;
图2为深度神经网络DNN算法结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,一种血液生化指标计算性别和年龄的方法,包括血液生化指标数据收集、数据预处理、模型建立,所述样本收集后对其进行数据预处理,该计算方法分为性别计算和年龄计算两部分,每一部分都包括计算模型的训练和模型的使用两个步骤,模型的训练我们都使用DNN算法,该算法经验证,在这项技术的结果准确率、解释性上都显著高于其他机器学习算法(k近邻算法、随机森林、线性回归、支持向量机等),DNN算法中引入隐藏层和神经元、增强了模型的表达能力,同时DNN在自动缩放神经元权重方面的特性,也最大程度的丰富了模型发展方向,然后经过DNN模型计算后得出结果,所述血液生化指标按以下方法计算性别和年龄:
第一步,收集原始数据,共计收入92062个样本,所述每个样本中包含个体年龄、性别和19项血液生化指标,所述所选指标常见于医院和体检机构的血常规和血液生化指标检测报告单;
第二步数据预处理,移除有遗漏数据的样本和明显错误离群值(Outliar)的样本后,总计获得26754例完整样本用于两个模型的训练和测试,随后对19项血液生化指标进行标准化处理,将所有指标的数值都映射在0,1范围内,避免模型在不同维度上的迭代速度不同,从而造成模型收敛缓慢的问题,提升模型的收敛速度;
第三步模型建立与评估,在使用模型进行计算时,将待测样本的19项血液生化指标直接传入模型中,经过DNN模型计算后,传出即为计算好的年龄和性别。
其中,所述19项血液生化指标包括白蛋白、葡萄糖、尿素、胆固醇、总蛋白、血清钠、肌酸酐、血红蛋白、总胆红素、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、血清钙、血清钾、血细胞比容、平均红细胞血红蛋白浓度、平均红细胞体积、血小板计数和红细胞计数。
其中,所述年龄计算使用DNN回归算法,性别计算使用DNN分类算法,便于区分血液样本中的年龄和性别,使得测试的结果更加精确化。
其中,所述DNN模型主要由输入层、隐藏层和输出层构成、每层中有若干神经元,输入层神经元与输入变量个数对应,输出层神经元与输出结果变量个数对应,使得样本在测量中,通过输入层的神经元分析,得出测量。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (4)
1.一种血液生化指标计算性别和年龄的方法,其特征在于:包括血液生化指标数据收集、数据预处理、模型建立,所述样本收集后对其进行数据预处理,然后经过DNN模型计算后得出结果,所述血液生化指标按以下方法计算性别和年龄:
第一步,收集原始数据,共计收入92062个样本,所述每个样本中包含个体年龄、性别和19项血液生化指标,所述所选指标常见于医院和体检机构的血常规和血液生化指标检测报告单;
第二步数据预处理,移除有遗漏数据的样本和明显错误离群值(Outliar)的样本后,总计获得26754例完整样本用于两个模型的训练和测试,随后对19项血液生化指标进行标准化处理,将所有指标的数值都映射在0,1范围内;
第三步模型建立与评估,在使用模型进行计算时,将待测样本的19项血液生化指标直接传入模型中,经过DNN模型计算后,传出即为计算好的年龄和性别。
2.根据权利要求1所述的一种血液生化指标计算性别和年龄的方法,其特征在于:所述19项血液生化指标包括白蛋白、葡萄糖、尿素、胆固醇、总蛋白、血清钠、肌酸酐、血红蛋白、总胆红素、甘油三酯、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇、血清钙、血清钾、血细胞比容、平均红细胞血红蛋白浓度、平均红细胞体积、血小板计数和红细胞计数。
3.根据权利要求1所述的一种血液生化指标计算性别和年龄的方法,其特征在于:所述年龄计算使用DNN回归算法,性别计算使用DNN分类算法。
4.根据权利要求1所述的一种血液生化指标计算性别和年龄的方法,其特征在于:所述DNN模型主要由输入层、隐藏层和输出层构成、每层中有若干神经元,输入层神经元与输入变量个数对应,输出层神经元与输出结果变量个数对应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010029900.4A CN111175480A (zh) | 2020-01-13 | 2020-01-13 | 一种血液生化指标计算性别和年龄的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010029900.4A CN111175480A (zh) | 2020-01-13 | 2020-01-13 | 一种血液生化指标计算性别和年龄的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111175480A true CN111175480A (zh) | 2020-05-19 |
Family
ID=70658013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010029900.4A Pending CN111175480A (zh) | 2020-01-13 | 2020-01-13 | 一种血液生化指标计算性别和年龄的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111175480A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112462073A (zh) * | 2020-11-03 | 2021-03-09 | 佛山市第一人民医院(中山大学附属佛山医院) | 一种血液学指标的数据处理方法及*** |
CN112568872A (zh) * | 2020-12-30 | 2021-03-30 | 深圳大学 | 基于mri影像和血液生化指标的脑龄融合预测方法 |
CN113380327A (zh) * | 2021-03-15 | 2021-09-10 | 浙江大学 | 一种基于全外周血转录组的人体生物学年龄预测与人体衰老程度评估方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212410A (zh) * | 1998-09-17 | 1999-03-31 | 林洋介 | 衰老检诊仪 |
CN101482923A (zh) * | 2009-01-19 | 2009-07-15 | 刘云 | 视频监控中人体目标的检测与性别识别方法 |
CN106793768A (zh) * | 2014-04-17 | 2017-05-31 | 脱其泰有限责任公司 | 光子栅栏 |
CN107133495A (zh) * | 2017-05-04 | 2017-09-05 | 北京医院 | 一种非整倍性生物信息的分析方法和分析*** |
CN107208153A (zh) * | 2015-01-13 | 2017-09-26 | 香港中文大学 | 血浆线粒体dna分析的应用 |
CN108315393A (zh) * | 2018-01-26 | 2018-07-24 | 中国医学科学院放射医学研究所 | 定量检测游离dna的方法、应用及检测游离dna的试剂盒 |
WO2019165064A1 (en) * | 2018-02-21 | 2019-08-29 | Mars, Incorporated | Markers for determining the biological age of a dog |
-
2020
- 2020-01-13 CN CN202010029900.4A patent/CN111175480A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212410A (zh) * | 1998-09-17 | 1999-03-31 | 林洋介 | 衰老检诊仪 |
CN101482923A (zh) * | 2009-01-19 | 2009-07-15 | 刘云 | 视频监控中人体目标的检测与性别识别方法 |
CN106793768A (zh) * | 2014-04-17 | 2017-05-31 | 脱其泰有限责任公司 | 光子栅栏 |
CN107208153A (zh) * | 2015-01-13 | 2017-09-26 | 香港中文大学 | 血浆线粒体dna分析的应用 |
CN107133495A (zh) * | 2017-05-04 | 2017-09-05 | 北京医院 | 一种非整倍性生物信息的分析方法和分析*** |
CN108315393A (zh) * | 2018-01-26 | 2018-07-24 | 中国医学科学院放射医学研究所 | 定量检测游离dna的方法、应用及检测游离dna的试剂盒 |
WO2019165064A1 (en) * | 2018-02-21 | 2019-08-29 | Mars, Incorporated | Markers for determining the biological age of a dog |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112462073A (zh) * | 2020-11-03 | 2021-03-09 | 佛山市第一人民医院(中山大学附属佛山医院) | 一种血液学指标的数据处理方法及*** |
CN112462073B (zh) * | 2020-11-03 | 2024-06-11 | 佛山市第一人民医院(中山大学附属佛山医院) | 一种血液学指标的数据处理方法及*** |
CN112568872A (zh) * | 2020-12-30 | 2021-03-30 | 深圳大学 | 基于mri影像和血液生化指标的脑龄融合预测方法 |
CN112568872B (zh) * | 2020-12-30 | 2021-11-02 | 深圳大学 | 基于mri影像和血液生化指标的脑龄融合预测方法 |
CN113380327A (zh) * | 2021-03-15 | 2021-09-10 | 浙江大学 | 一种基于全外周血转录组的人体生物学年龄预测与人体衰老程度评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111292853B (zh) | 基于多参数的心血管疾病风险预测网络模型及其构建方法 | |
CN111175480A (zh) | 一种血液生化指标计算性别和年龄的方法 | |
CN112466402A (zh) | 一种使用血液标志物预测年龄的方法 | |
CN111261282A (zh) | 一种基于机器学习的脓毒症早期预测方法 | |
CN106339593B (zh) | 基于医疗数据建模的川崎病分类预测方法 | |
CN113327679A (zh) | 一种肺栓塞临床风险及预后评分方法与*** | |
CN113053535B (zh) | 一种医疗信息预测***及医疗信息预测方法 | |
CN114220540A (zh) | 一种糖尿病肾病风险预测模型的构建方法及应用 | |
CN114141363B (zh) | 一种基于机器学习方法的重症胰腺炎预测模型构建方法 | |
CN109273093A (zh) | 一种川崎病风险评估模型的构建方法及构建*** | |
CN112101413A (zh) | 面向脑卒中风险预测的智能*** | |
CN113380327B (zh) | 一种人体生物学年龄预测与人体衰老程度评估方法 | |
CN113470816A (zh) | 一种基于机器学习的糖尿病肾病预测方法、***和预测装置 | |
CN111413492A (zh) | 一种用于检测新型冠状病毒covid-2019肺炎的方法及*** | |
CN109585011A (zh) | 胸痛患者的病症诊断方法及机器可读存储介质 | |
CN117612729A (zh) | 基于临床化验指标预判胡蜂蛰伤病人轻症或重症的方法 | |
CN117116475A (zh) | 缺血性脑卒中的风险预测方法、***、终端及存储介质 | |
SE532103C2 (sv) | Metod för att bestämma hälsostatus från analyter i vätskeprover | |
CN112837818A (zh) | 一种评估乙肝患者肝纤维化程度的模型 | |
CN111951964A (zh) | 一种快速检测新型冠状病毒肺炎的方法及*** | |
CN111341452A (zh) | 多***萎缩失能预测方法、模型建立方法、装置及设备 | |
CN116861252A (zh) | 一种基于平衡功能异常的跌倒评估模型的构建方法 | |
Hashem et al. | Prediction of the degree of liver fibrosis using different pattern recognition techniques | |
CN107610780B (zh) | 一种生理信息数据的分析评价***及方法 | |
CN112485162A (zh) | 一种使用血液标志物预测性别的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200519 |
|
RJ01 | Rejection of invention patent application after publication |