CN111768810A - 一种菌群移植治疗糖尿病的供受体配型算法 - Google Patents
一种菌群移植治疗糖尿病的供受体配型算法 Download PDFInfo
- Publication number
- CN111768810A CN111768810A CN202010576251.XA CN202010576251A CN111768810A CN 111768810 A CN111768810 A CN 111768810A CN 202010576251 A CN202010576251 A CN 202010576251A CN 111768810 A CN111768810 A CN 111768810A
- Authority
- CN
- China
- Prior art keywords
- data
- donor
- diabetes
- recipient
- flora
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 55
- 238000002054 transplantation Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000000694 effects Effects 0.000 claims abstract description 33
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000011282 treatment Methods 0.000 claims abstract description 23
- 238000010197 meta-analysis Methods 0.000 claims abstract description 21
- 239000000203 mixture Substances 0.000 claims abstract description 19
- 230000036541 health Effects 0.000 claims abstract description 14
- 238000010276 construction Methods 0.000 claims abstract description 3
- 238000011160 research Methods 0.000 claims description 39
- 239000011159 matrix material Substances 0.000 claims description 29
- 241000894006 Bacteria Species 0.000 claims description 21
- 230000000968 intestinal effect Effects 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000009286 beneficial effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 8
- 241000566145 Otus Species 0.000 claims description 7
- 230000029036 donor selection Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000007547 defect Effects 0.000 claims description 4
- 238000007400 DNA extraction Methods 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 210000001035 gastrointestinal tract Anatomy 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003914 insulin secretion Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 241000792859 Enema Species 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002052 colonoscopy Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 239000007920 enema Substances 0.000 description 1
- 229940095399 enema Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000003345 hyperglycaemic effect Effects 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 238000011866 long-term treatment Methods 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000022558 protein metabolic process Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种菌群移植治疗糖尿病的供受体配型算法,属于临床医疗技术领域,菌群移植治疗糖尿病的供受体配型算法包括医疗健康数据建立步骤、16S序列分析步骤、数据Meta分析构建配型模型步骤以及层次分析法供体选择步骤。本发明公开的菌群移植治疗糖尿病的供受体配型算法,结合现有医疗健康数据库和供体的信息,采用16S序列分析数据库的菌群构成特征,再采用Meta分析确立特征构建糖尿病供受体配型模型,通过层次分析法建立层次结构模型计算相应的权重来合理的挑选最优供体,以保证菌群移植治疗效果。
Description
技术领域
本发明涉及临床医疗技术领域,尤其涉及一种菌群移植治疗糖尿病的供受体配型算法。
背景技术
糖尿病是由于胰岛素分泌或胰岛素作用缺陷引起的以高血糖为特征的内分泌代谢性疾病,伴有碳水化合物、脂肪和蛋白质代谢障碍。糖尿病的患病率在近几十年里迅速增加,成为世界范围内日益严重的公共健康问题。据Ogurtsova等报道显示,2015年全球糖尿病患者有4.15亿,患病率为8.8%,到2040年将达6.42亿,患病率达10.4%。中国是糖尿病患病率最高的国家之一,在成年人中,糖尿病患病率为11.6%,糖尿病前期的患病率为50.1%。而2型糖尿病是在胰岛素抵抗背景下由于胰岛β细胞胰岛素分泌进行性减少所导致,在糖尿病人群中占90%~95%。糖尿病如果未被预测及检出,未得到及时治疗,血糖水平控制差,机体长期处于高血糖状态,将导致机体大血管、微血管和神经***产生一系列并发症,严重影响糖尿病患者的生活质量与寿命。所以糖尿病的早期预测、诊断与及时治疗,在改善预后、降低并发症发生率及提高患者生活质量等方面具有积极作用。
大量文献表明糖尿病等慢性疾病与肠道菌群失调有关,包括肠道菌群组成、功能和细菌产生的代谢物的急剧变化。因此,目前尝试用菌群移植的方法来治疗糖尿病。菌群移植指将健康供体的肠道菌群通过智能肠菌处理***制成混悬液或胶囊,移植到患者胃肠道内,通过重建患者正常功能的肠道菌群以实现其肠道及肠道外疾病的治疗。现在仍然在大多数研究中使用鼻空肠管、结肠镜检查或灌肠,有时需要多次使用才能有效治疗某些疾病。大多数研究都观察到,短期和长期的治疗耐受性都很好,很少出现不良事件,这些事件似乎主要源自最初的疾病严重程度,而不是菌群移植本身。因此,如何为患者匹配合适的菌群供体以保证菌群移植治疗的有效性,是菌群移植医疗技术急需解决的技术难题。
发明内容
为了克服现有技术的缺陷,本发明所要解决的技术问题在于提出一种菌群移植治疗糖尿病的供受体配型算法,结合现有医疗健康数据库和供体的信息,采用16S序列分析数据库的菌群构成特征,再采用Meta分析确立特征构建糖尿病供受体配型模型,通过层次分析法建立层次结构模型计算相应的权重来合理地挑选最优供体,以保证菌群移植治疗效果。
为达此目的,本发明采用以下技术方案:
本发明提供的一种菌群移植治疗糖尿病的供受体配型算法,包括医疗健康数据建立步骤、16S序列分析步骤、数据Meta分析构建配型模型步骤以及层次分析法供体选择步骤;首先,采取医疗健康数据建立步骤,基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据,建立数据库;其次,采取16S序列分析步骤,根据不同数据的特征进行数据预处理,基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果;再次,采取数据Meta分析构建配型模型步骤,通过Meta分析法处理研究文献数据以及16S序列分析所得数据,提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征,构建糖尿病供受体配型模型;最后,采取层次分析法供体选择步骤,配型模型通过层次分析法分解特征层次结构,对供体库中供体进行打分排序,选择最优值供体,使患者获得最优供体配型。
本发明优选地技术方案在于,在16S序列分析步骤中,数据预处理是基于下载研究文献的描述,根据不同文献数据的参数对数据进行预处理,并记录相关参数,相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。
本发明优选地技术方案在于,在16S序列分析步骤中,进行16S序列分析时,首先,对下载的研究文献数据根据分组信息以及序列长度进行分类,准备好相应的配置文件,再基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果。
本发明优选地技术方案在于,在数据Meta分析构建配型模型步骤中,基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,进行异质性检验,根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度;当I^2>50%时,认为各个研究间有比较明显的异质性,此时采用随机效应模型进行分析;当I^2≤50%时,认为各个研究间没有较明显的异质性,此时采用固定效应模型进行分析。
本发明优选地技术方案在于,在数据Meta分析构建配型模型步骤中,基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,采用二分类变量法对研究数据的效应量进行分析计算,得出风险比RR值、比数比OR值以及风险差RD值,以分析特征变量与病患治疗效果的紧密或差异程度。
本发明优选地技术方案在于,在数据Meta分析构建配型模型步骤中,在进行异质性检验以及计算效应量之后,选择合适的效应模型进行合并,根据效应量以及P值,选择在所有研究中共有的特征构建配型模型。
本发明优选地技术方案在于,层次分析法供体选择步骤包括如下步骤:首先,采取建立层次结构模型步骤,将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层,建立供受体配型层次结构,其中,准则层包括距离、多样性、有益菌以及有害菌;其次,采取构造判断矩阵步骤,构造两两比较判断矩阵,判断矩阵用数值表示下层元素对上层元素的相对重要性;再次,采取层次单排序及其一致性检验步骤,进行层次单排序,计算单一准则下元素的相对权值,通过随机一致性比率CR来检验判断矩阵的一致性,当CR<0.1时,认为判断矩阵具有满意的一致性,当CR≥0.1时,则需重新调整判断矩阵,使其具有一致性;再次,采取层次综合排序步骤,计算各层元素对目标层的总排序权重,检验一致性;最后,采取综合权重得分选取供体步骤,根据综合权重得分进行排序,选择权重高的供体作为最优供体。
本发明优选地技术方案在于,在建立层次结构模型步骤中,构成准则层的各个因素的计算公式如下:
其中,SA,i,SB,i表示第i个OTU分别在供体群落和受体群落中的个数;
多样牲:index多样性=60%*f缺OTU在供体中出现的频率+40%*Abu缺OTU出现的平均相对丰度;
有益菌:index有益菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度;
有害菌:index有害菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度。
本发明优选地技术方案在于,在医疗健康数据建立步骤中,数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种,所属数据库检索基于关键词为type 2 diabetic、16SrRNA以及human。
本发明的有益效果为:
本发明提供的菌群移植治疗糖尿病的供受体配型算法,结合现有医疗健康数据库和供体的信息,采用16S序列分析数据库的菌群构成特征,再采用Meta分析确立特征构建糖尿病供受体配型模型,通过层次分析法建立层次结构模型计算相应的权重来合理的挑选最优供体,以保证菌群移植治疗效果。层次分析法将人的主观性想法用数字方式进行量化,使其更为科学性、合理性,再通过排序计算和一致检验,证明所得权重的重要性,使方案间的重要性得到保证。具体有如下有益效果:
(1)建立了一种菌群移植治疗糖尿病的供受体配型模型,综合考虑了供体和患者的菌群组成和多样性等方面;
(2)采用Meta分析结合多篇研究对肠道菌群alpha多样性、beta多样性和菌群特征进行综合分析,进而筛选出特征构建模型,结果更加合理,具有说服力;
(3)运用层次分析法对供体进行打分排序,进而选择出最优供体。所得结果兼顾了评价的主观和客观性,更加合理,有利于菌群移植的顺利进行。
附图说明
图1是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的配型流程示意图一;
图2是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的供体配型多目标优化层次分析示意图;
图3是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的配型流程示意图二;
图4是本发明具体实施方式中提供的层次分析法供体选择步骤的流程示意图。
图中:
S1、医疗健康数据建立步骤;S2、16S序列分析步骤;S3、数据Meta分析构建配型模型步骤;S4、层次分析法供体选择步骤;S41、建立层次结构模型步骤;S42、构造判断矩阵步骤;S43、层次单排序及其一致性检验步骤;S44、层次综合排序步骤;S45、综合权重得分选取供体步骤。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
如图1至图4所示,为了便于患者匹配合适的菌群供体,以保证菌群移植治疗的有效性。进一步地,本实施例中提供的一种菌群移植治疗糖尿病的供受体配型算法,包括医疗健康数据建立步骤S1、16S序列分析步骤S2、数据Meta分析构建配型模型步骤S3以及层次分析法供体选择步骤S4;首先,采取医疗健康数据建立步骤S1,基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据,建立数据库;其次,采取16S序列分析步骤S2,根据不同数据的特征进行数据预处理,基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果;再次,采取数据Meta分析构建配型模型步骤S3,通过Meta分析法处理研究文献数据以及16S序列分析所得数据,提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征,构建糖尿病供受体配型模型;最后,采取层次分析法供体选择步骤S4,配型模型通过层次分析法分解特征层次结构,对供体库中供体进行打分排序,选择最优值供体,使患者获得最优供体配型。通过16S序列分析步骤S2,对肠道菌群进行高通量测序,通过分析测序序列的构成了解特定环境中肠道菌群的构成情况或基因的组成以及功能,核心是研究菌群样本中的物种分类、物种丰度以及***进化,通过OTU分析,可以知道研究样本中的菌群多样性和不同菌群的丰度。通过数据Meta分析构建配型模型步骤S3,可以检验研究文献间存在的差异性,目的是检查各个独立研究的结果是否具有可合并性,再计算效应量和权重,反映变量之间的紧密或差异程度,再根据计算结果合并效应模型,提取研究文献中肠道菌群alpha多样性、beta多样性和菌属共有数据组成特征,构建糖尿病供受体配型模型。其中,Alpha多样性指标,是一个一维的数值,指的是环境样本内物种多样性大小,Alpha多样性指标可描述样本内物种多样性,这个指标仅与当前样本有关,与其他样本无关,因此多个样本之间的差异远近关系用Alpha多样性难以表达。Beta多样性定义为群落组成变化的程度,或群落分化的程度,与环境的复杂梯度或环境的模式有关。也就是说,Beta多样性的分析是对样本间差异距离的分析。Beta多样性可以用一到多维度的数据表现出来,不仅可以反映了样本多样性之间的关系,而且还反映了生物群落之间的分化程度。因此,为了对不同样本之间的生物群落之间的差异进行量化,本算法还提取了Beta多样性来表达生物群落多样性,不仅可以帮助研究者理解各个样本的生物多样性如何,还可以帮助解释样本为什么以这种方式聚集或分散。在层次分析法供体选择步骤S4中,层次分析法是将为患者匹配合适的菌群供体的决策问题按总目标、各层子目标、评价准则直至具体的供体配型备投方案的顺序分解为不同的层次结构,然后用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各供体配型备择方案对为患者匹配合适的菌群供体的总目标的最终权重,此最终权重最大者即为最优方案。通过上述过程,便于患者匹配合适的菌群供体,以保证菌群移植治疗的有效性。
优选地,在16S序列分析步骤S2中,数据预处理是基于下载研究文献的描述,根据不同文献数据的参数对数据进行预处理,并记录相关参数,相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。在进行16S序列分析时,首先捕获其16S区域(引物PCR),然后测序,以便后续分析肠道菌群的构成情况或基因的组成以及功能。
优选地,在16S序列分析步骤S2中,进行16S序列分析时,首先,对下载的研究文献数据根据分组信息以及序列长度进行分类,准备好相应的配置文件,再基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果。因为16S拥有极好的保守性,因此可以用于鉴别不同的物种,然后分析逻辑,聚类成OTU,再比对已知数据库进行注释结果,以便后续分析肠道菌群的构成情况或基因的组成以及功能。
优选地,在数据Meta分析构建配型模型步骤S3中,基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,进行异质性检验,根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度;当I^2>50%时,认为各个研究间有比较明显的异质性,此时采用随机效应模型进行分析;当I^2≤50%时,认为各个研究间没有较明显的异质性,此时采用固定效应模型进行分析。其中,计算异质性公式如下所示:
I^2=(Q-df)/Q×100% (1),
公式(1)中df为自由度,一般取k-1,k为研究的个数,公式(2)中为合并的效应量,Q服从于自由度为k-1的χ2分布,χ2(α,k-1),α为统计学检验的错误概率,一般为0.05。当I^2>50%时,认为各个研究间有比较明显的异质性,此时采用随机效应模型进行分析;反之,则采用固定效应模型进行分析。
优选地,在数据Meta分析构建配型模型步骤S3中,基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,采用二分类变量法对研究数据的效应量进行分析计算,得出风险比RR值、比数比OR值以及风险差RD值,以分析特征变量与病患治疗效果的紧密或差异程度。其中,基于二分类数据的效应量的计算公式如下所示:
表1:基于距离的二联表
糖尿病 | 非糖尿病 | N | |
低-median | A | B | n<sub>1</sub> |
高-median | C | D | n<sub>2</sub> |
其中低-median、高-median分别指低于或高于距离的中位值,A、B分别表示该研究中低于距离中位值的样本发生糖尿病,不发生糖尿病的个数;C、D分别表示该研究为中高于距离中位值的样本发生糖尿病,不发生糖尿病的个数,n1、n2分别代表低于距离的中位值的样本总个数和高于距离的中位值的样本总个数。此外,研究的特征变量除了距离,还可以包括多样性、有益菌以及有害菌。具体计算公式如下所示:
通过上述过程,分析各个研究治疗方案中的特征变量与病患治疗效果的关联程度,以筛选出有效的研究治疗方案、相应的特征变量组成及其权重关系。
优选地,在数据Meta分析构建配型模型步骤S3中,在进行异质性检验以及计算效应量之后,选择合适的效应模型进行合并,根据效应量以及P值,选择在所有研究中共有的特征构建配型模型。通过上述过程,确保构建的配型模型更准确可靠。
优选地,层次分析法供体选择步骤S4包括如下步骤:首先,采取建立层次结构模型步骤S41,将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层,建立供受体配型层次结构,其中,准则层包括距离、多样性、有益菌以及有害菌;其次,采取构造判断矩阵步骤S42,构造两两比较判断矩阵,判断矩阵用数值表示下层元素对上层元素的相对重要性;再次,采取层次单排序及其一致性检验步骤S43,进行层次单排序,计算单一准则下元素的相对权值,通过随机一致性比率CR来检验判断矩阵的一致性,当CR<0.1时,认为判断矩阵具有满意的一致性,当CR≥0.1时,则需重新调整判断矩阵,使其具有一致性;再次,采取层次综合排序步骤S44,计算各层元素对目标层的总排序权重,检验一致性;最后,采取综合权重得分选取供体步骤S45,根据综合权重得分进行排序,选择权重高的供体作为最优供体。
在构造判断矩阵步骤S42中,构造两两比较判断矩阵,所述判断矩阵用数值表示下层元素对上层元素的相对重要性,将比较的结果用数值表示。一般使用数字1~9作为标度(见表2)。
表2:因素比值规则表
例如,对准则层的四个因素距离、多样性、有益菌以及有害菌进行专家打分(见表3),
表3:四个因素的打分表
因此构造的判断矩阵为:
在层次单排序及其一致性检验步骤S43中,进行层次单排序,计算单一准则下元素的相对权值,采用随机一致性比率CR来检验判断矩阵的一致性,其计算公式为:
CR=CI/RI (6),
公式(6)中RI为随机一致性指标(见表4),CI为一致性指标,公式(7)中n为本层指标的个数,λmax为判断矩阵的最大特征根;当CR<0.1时,认为判断矩阵具有满意的一致性,反之,则需重新调整判断矩阵,使其具有一致性。
表4:RI数值表
在层次综合排序步骤S44中,进行层次综合排序,检验一致性,即计算各层元素对目标层的总排序权重,计算公式为:
公式(8)中ckj表表示C层包含的n个元素相对于上一层B层因素的层次单排序,bj为B层单排序权值。
通过上述过程,根据综合权重得分进行排序,选择权重高的作为最优供体,便于患者匹配最合适的菌群供体,以保证菌群移植治疗的有效性。
优选地,在建立层次结构模型步骤S41中,构成准则层的各个因素的计算公式如下:
其中,SA,i,SB,i表示第i个OTU分别在供体群落和受体群落中的个数;
多样牲:index多样性=60%*f缺OTU在供体中出现的频率+40%*Abu缺OTU出现的平均相对丰度;
有益菌:index有益菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度;
有害菌:index有害菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度。
其中,Bray-Curtis距离主要基于OTUs的计数统计,比较供体群落和受体群落之间的组成差异,DBray-Curtis值越小表示二者组成差异小。通过上述过程,以便根据构成准则层的各个因素的具体数据进行打分排序。
优选地,在医疗健康数据建立步骤S1中,数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种,所属数据库检索基于关键词为type 2 diabetic、16SrRNA以及human。通过上述过程,使得医疗健康数据的来源更准确可靠。
本发明是通过优选实施例进行描述的,本领域技术人员知悉,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。本发明不受此处所公开的具体实施例的限制,其他落入本申请的权利要求内的实施例都属于本发明保护的范围。
Claims (9)
1.一种菌群移植治疗糖尿病的供受体配型算法,其特征在于:
包括医疗健康数据建立步骤(S1)、16S序列分析步骤(S2)、数据Meta分析构建配型模型步骤(S3)以及层次分析法供体选择步骤(S4);
首先,采取所述医疗健康数据建立步骤(S1),基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据,建立数据库;
其次,采取所述16S序列分析步骤(S2),根据不同数据的特征进行数据预处理,基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果;
再次,采取所述数据Meta分析构建配型模型步骤(S3),通过Meta分析法处理研究文献数据以及16S序列分析所得数据,提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征,构建糖尿病供受体配型模型;
最后,采取所述层次分析法供体选择步骤(S4),所述配型模型通过层次分析法分解特征层次结构,对供体库中供体进行打分排序,选择最优值供体,使患者获得最优供体配型。
2.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述16S序列分析步骤(S2)中,所述数据预处理是基于下载研究文献的描述,根据不同文献数据的参数对数据进行预处理,并记录相关参数,所述相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。
3.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述16S序列分析步骤(S2)中,进行所述16S序列分析时,首先,对下载的研究文献数据根据分组信息以及序列长度进行分类,准备好相应的配置文件,再基于相同类型的参数进行16S序列分析,得到多个OTU及其对应的注释结果。
4.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述数据Meta分析构建配型模型步骤(S3)中,基于研究文献数据以及所述16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,进行异质性检验,根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度;
当I^2>50%时,认为各个研究间有比较明显的异质性,此时采用随机效应模型进行分析;
当I^2≤50%时,认为各个研究间没有较明显的异质性,此时采用固定效应模型进行分析。
5.根据权利要求4所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述数据Meta分析构建配型模型步骤(S3)中,基于研究文献数据以及所述16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析,采用二分类变量法对研究数据的效应量进行分析计算,得出风险比RR值、比数比OR值以及风险差RD值,以分析特征变量与病患治疗效果的紧密或差异程度。
6.根据权利要求5所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述数据Meta分析构建配型模型步骤(S3)中,在进行异质性检验以及计算效应量之后,选择合适的效应模型进行合并,根据效应量以及P值,选择在所有研究中共有的特征构建所述配型模型。
7.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
所述层次分析法供体选择步骤(S4)包括如下步骤:
首先,采取建立层次结构模型步骤(S41),将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层,建立供受体配型层次结构,其中,所述准则层包括距离、多样性、有益菌以及有害菌;
其次,采取构造判断矩阵步骤(S42),构造两两比较判断矩阵,所述判断矩阵用数值表示下层元素对上层元素的相对重要性;
再次,采取层次单排序及其一致性检验步骤(S43),进行层次单排序,计算单一准则下元素的相对权值,通过随机一致性比率CR来检验判断矩阵的一致性,当CR<0.1时,认为判断矩阵具有满意的一致性,当CR≥0.1时,则需重新调整判断矩阵,使其具有一致性;
再次,采取层次综合排序步骤(S44),计算各层元素对目标层的总排序权重,检验一致性;
最后,采取综合权重得分选取供体步骤(S45),根据综合权重得分进行排序,选择权重高的供体作为最优供体。
8.根据权利要求7所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述建立层次结构模型步骤(S41)中,构成所述准则层的各个因素的计算公式如下:
其中,SA,i,SB,i表示第i个OTU分别在供体群落和受体群落中的个数;
所述多样性:
index多样性=60%*f缺OTU在供体中出现的频率+40%*Abu缺oTU出现的平均相对丰度;
所述有益菌:
index有益菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度;
所述有害菌:
index有害菌=60%*f缺genus在供体中出现的频率+40%*Abu缺genus出现的平均相对丰度。
9.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法,其特征在于:
在所述医疗健康数据建立步骤(S1)中,数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种,所属数据库检索基于关键词为type 2diabetic、16SrRNA以及human。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010576251.XA CN111768810B (zh) | 2020-06-22 | 2020-06-22 | 一种菌群移植治疗糖尿病的供受体配型算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010576251.XA CN111768810B (zh) | 2020-06-22 | 2020-06-22 | 一种菌群移植治疗糖尿病的供受体配型算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111768810A true CN111768810A (zh) | 2020-10-13 |
CN111768810B CN111768810B (zh) | 2024-07-12 |
Family
ID=72721843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010576251.XA Active CN111768810B (zh) | 2020-06-22 | 2020-06-22 | 一种菌群移植治疗糖尿病的供受体配型算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111768810B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164059A (zh) * | 2020-10-20 | 2021-01-01 | 沈阳东软智能医疗科技研究院有限公司 | 一种病灶检测方法、装置及相关产品 |
CN114496279A (zh) * | 2022-01-12 | 2022-05-13 | 广州保量医疗科技有限公司 | 菌群移植配型的排序方法、***、计算机设备及存储介质 |
CN114496277A (zh) * | 2022-01-12 | 2022-05-13 | 广州保量医疗科技有限公司 | 肠道菌群配型的多组学数据优化方法、***、设备及介质 |
CN117037914A (zh) * | 2023-07-25 | 2023-11-10 | 中科国康(浙江)生命科学有限公司 | 一种基于个体特征定向制备的肠道菌群的*** |
CN117312893A (zh) * | 2023-03-28 | 2023-12-29 | 广东弘元普康医疗科技有限公司 | 一种菌群匹配度的评估方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109706235A (zh) * | 2019-01-29 | 2019-05-03 | 广州康昕瑞基因健康科技有限公司 | 一种肠道微生物菌群的检测和分析方法及其*** |
CN109897906A (zh) * | 2019-03-04 | 2019-06-18 | 福建西陇生物技术有限公司 | 一种肠道菌群16S rRNA基因的检测方法及其应用 |
CN110144415A (zh) * | 2019-04-23 | 2019-08-20 | 大连大学 | 一种基于肠道菌群预测引进奶牛健康和免疫力水平方法 |
-
2020
- 2020-06-22 CN CN202010576251.XA patent/CN111768810B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109706235A (zh) * | 2019-01-29 | 2019-05-03 | 广州康昕瑞基因健康科技有限公司 | 一种肠道微生物菌群的检测和分析方法及其*** |
CN109897906A (zh) * | 2019-03-04 | 2019-06-18 | 福建西陇生物技术有限公司 | 一种肠道菌群16S rRNA基因的检测方法及其应用 |
CN110144415A (zh) * | 2019-04-23 | 2019-08-20 | 大连大学 | 一种基于肠道菌群预测引进奶牛健康和免疫力水平方法 |
Non-Patent Citations (5)
Title |
---|
刘平著: "中医药科研思路与方法", 30 September 2013, 上海科学技术出版社, pages: 178 - 181 * |
曾宪涛,任学群主编: "分子流行病学研究与***评价 Meta分析", 30 June 2018, 中国协和医科大学出版社, pages: 90 - 91 * |
李洪超;张银花;刘国恩;: "糖尿病治疗终点指标综述与复合终点的权重构建", 中国药物经济学, no. 02, 30 April 2010 (2010-04-30) * |
谷禾健康: "微生物群落多样性测序与功能分析", Retrieved from the Internet <URL:https://www.zhihu.com/tardis/sogou/art/78301387> * |
陈洪月编著: "Pro/ENGINEER、ANSYS、MATLAB软件及应用", 31 July 2017, 东北大学出版社, pages: 518 - 520 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164059A (zh) * | 2020-10-20 | 2021-01-01 | 沈阳东软智能医疗科技研究院有限公司 | 一种病灶检测方法、装置及相关产品 |
CN112164059B (zh) * | 2020-10-20 | 2024-02-13 | 沈阳东软智能医疗科技研究院有限公司 | 一种病灶检测方法、装置及相关产品 |
CN114496279A (zh) * | 2022-01-12 | 2022-05-13 | 广州保量医疗科技有限公司 | 菌群移植配型的排序方法、***、计算机设备及存储介质 |
CN114496277A (zh) * | 2022-01-12 | 2022-05-13 | 广州保量医疗科技有限公司 | 肠道菌群配型的多组学数据优化方法、***、设备及介质 |
CN114496277B (zh) * | 2022-01-12 | 2022-07-26 | 广州保量医疗科技有限公司 | 肠道菌群配型的多组学数据优化方法、***、设备及介质 |
CN117312893A (zh) * | 2023-03-28 | 2023-12-29 | 广东弘元普康医疗科技有限公司 | 一种菌群匹配度的评估方法及相关装置 |
CN117312893B (zh) * | 2023-03-28 | 2024-04-09 | 广东弘元普康医疗科技有限公司 | 一种菌群匹配度的评估方法及相关装置 |
CN117037914A (zh) * | 2023-07-25 | 2023-11-10 | 中科国康(浙江)生命科学有限公司 | 一种基于个体特征定向制备的肠道菌群的*** |
CN117037914B (zh) * | 2023-07-25 | 2024-04-02 | 中科国康(浙江)生命科学有限公司 | 一种基于个体特征定向制备的肠道菌群的*** |
Also Published As
Publication number | Publication date |
---|---|
CN111768810B (zh) | 2024-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111768810A (zh) | 一种菌群移植治疗糖尿病的供受体配型算法 | |
Tigga et al. | Prediction of type 2 diabetes using machine learning classification methods | |
Ball et al. | Subtypes of ***e abusers: Support for a Type A–Type B distinction. | |
WO2021190300A1 (zh) | Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及*** | |
CN107403072A (zh) | 一种基于机器学习的2型糖尿病预测预警方法 | |
CN107194138B (zh) | 一种基于体检数据建模的空腹血糖预测方法 | |
CN108511056A (zh) | 基于脑卒中患者相似性分析的治疗方案推荐方法及*** | |
CN112117006A (zh) | 基于集成学习的2型糖尿病肾脏疾病患病风险评估*** | |
CN108345768B (zh) | 一种确定婴幼儿肠道菌群成熟度的方法和标志物组合 | |
CN111951975A (zh) | 一种基于深度学习模型gpt-2的脓毒症早期预警方法 | |
CN113239279B (zh) | 一种慢性病医疗数据采集分析管理方法及云平台 | |
CN111387938B (zh) | 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测*** | |
CN113808747B (zh) | 一种缺血性脑卒中复发预测方法 | |
CN115083616B (zh) | 一种基于自监督图聚类的慢性肾病亚型挖掘*** | |
CN113470816A (zh) | 一种基于机器学习的糖尿病肾病预测方法、***和预测装置 | |
CN114898873A (zh) | 一种糖尿病前期患者心血管疾病风险的预测方法及*** | |
CN113571180A (zh) | 基于c肽分层及脏器功能的2型糖尿病人工智能诊疗管理*** | |
CN117012392A (zh) | 高血压风险评估模型构建方法、膳食食疗及健康管理*** | |
Hou et al. | Feature selection and prediction model for type 2 diabetes in the chinese population with machine learning | |
CN111883258A (zh) | 一种构建ohss分度分型预测模型的方法 | |
CN110358849A (zh) | 源于肠道的诊断胰腺炎的生物标志物、筛选方法及其用途 | |
CN112820397B (zh) | 一种冠状动脉旁路移植术围术期风险预测模型的建立方法 | |
Lomo et al. | Cluster analysis of type II Diabetes Mellitus Patients with the Fuzzy C-means method | |
CN112185585A (zh) | 一种基于代谢组学的糖尿病早期预警方法 | |
CN116386882A (zh) | 融合不同人群遗传信息的冠心病遗传风险预测方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |