CN111768810A

CN111768810A - 一种菌群移植治疗糖尿病的供受体配型算法

Info

Publication number: CN111768810A
Application number: CN202010576251.XA
Authority: CN
Inventors: 肖传兴; 张帮周; 曹曼; 何剑全; 陈章然; 汪涵
Original assignee: Xiamen Chengge Biotechnology Co ltd
Current assignee: Xiamen Chengge Biotechnology Co ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2020-10-13
Anticipated expiration: 2040-06-22
Also published as: CN111768810B

Abstract

本发明公开了一种菌群移植治疗糖尿病的供受体配型算法，属于临床医疗技术领域，菌群移植治疗糖尿病的供受体配型算法包括医疗健康数据建立步骤、16S序列分析步骤、数据Meta分析构建配型模型步骤以及层次分析法供体选择步骤。本发明公开的菌群移植治疗糖尿病的供受体配型算法，结合现有医疗健康数据库和供体的信息，采用16S序列分析数据库的菌群构成特征，再采用Meta分析确立特征构建糖尿病供受体配型模型，通过层次分析法建立层次结构模型计算相应的权重来合理的挑选最优供体，以保证菌群移植治疗效果。

Description

一种菌群移植治疗糖尿病的供受体配型算法

技术领域

本发明涉及临床医疗技术领域，尤其涉及一种菌群移植治疗糖尿病的供受体配型算法。

背景技术

糖尿病是由于胰岛素分泌或胰岛素作用缺陷引起的以高血糖为特征的内分泌代谢性疾病，伴有碳水化合物、脂肪和蛋白质代谢障碍。糖尿病的患病率在近几十年里迅速增加，成为世界范围内日益严重的公共健康问题。据Ogurtsova等报道显示，2015年全球糖尿病患者有4.15亿，患病率为8.8％，到2040年将达6.42亿，患病率达10.4％。中国是糖尿病患病率最高的国家之一，在成年人中，糖尿病患病率为11.6％，糖尿病前期的患病率为50.1％。而2型糖尿病是在胰岛素抵抗背景下由于胰岛β细胞胰岛素分泌进行性减少所导致，在糖尿病人群中占90％～95％。糖尿病如果未被预测及检出，未得到及时治疗，血糖水平控制差，机体长期处于高血糖状态，将导致机体大血管、微血管和神经***产生一系列并发症，严重影响糖尿病患者的生活质量与寿命。所以糖尿病的早期预测、诊断与及时治疗，在改善预后、降低并发症发生率及提高患者生活质量等方面具有积极作用。

大量文献表明糖尿病等慢性疾病与肠道菌群失调有关，包括肠道菌群组成、功能和细菌产生的代谢物的急剧变化。因此，目前尝试用菌群移植的方法来治疗糖尿病。菌群移植指将健康供体的肠道菌群通过智能肠菌处理***制成混悬液或胶囊，移植到患者胃肠道内，通过重建患者正常功能的肠道菌群以实现其肠道及肠道外疾病的治疗。现在仍然在大多数研究中使用鼻空肠管、结肠镜检查或灌肠，有时需要多次使用才能有效治疗某些疾病。大多数研究都观察到，短期和长期的治疗耐受性都很好，很少出现不良事件，这些事件似乎主要源自最初的疾病严重程度，而不是菌群移植本身。因此，如何为患者匹配合适的菌群供体以保证菌群移植治疗的有效性，是菌群移植医疗技术急需解决的技术难题。

发明内容

为了克服现有技术的缺陷，本发明所要解决的技术问题在于提出一种菌群移植治疗糖尿病的供受体配型算法，结合现有医疗健康数据库和供体的信息，采用16S序列分析数据库的菌群构成特征，再采用Meta分析确立特征构建糖尿病供受体配型模型，通过层次分析法建立层次结构模型计算相应的权重来合理地挑选最优供体，以保证菌群移植治疗效果。

为达此目的，本发明采用以下技术方案：

本发明提供的一种菌群移植治疗糖尿病的供受体配型算法，包括医疗健康数据建立步骤、16S序列分析步骤、数据Meta分析构建配型模型步骤以及层次分析法供体选择步骤；首先，采取医疗健康数据建立步骤，基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据，建立数据库；其次，采取16S序列分析步骤，根据不同数据的特征进行数据预处理，基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果；再次，采取数据Meta分析构建配型模型步骤，通过Meta分析法处理研究文献数据以及16S序列分析所得数据，提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征，构建糖尿病供受体配型模型；最后，采取层次分析法供体选择步骤，配型模型通过层次分析法分解特征层次结构，对供体库中供体进行打分排序，选择最优值供体，使患者获得最优供体配型。

本发明优选地技术方案在于，在16S序列分析步骤中，数据预处理是基于下载研究文献的描述，根据不同文献数据的参数对数据进行预处理，并记录相关参数，相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。

本发明优选地技术方案在于，在16S序列分析步骤中，进行16S序列分析时，首先，对下载的研究文献数据根据分组信息以及序列长度进行分类，准备好相应的配置文件，再基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果。

本发明优选地技术方案在于，在数据Meta分析构建配型模型步骤中，基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，进行异质性检验，根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度；当I^2>50％时，认为各个研究间有比较明显的异质性，此时采用随机效应模型进行分析；当I^2≤50％时，认为各个研究间没有较明显的异质性，此时采用固定效应模型进行分析。

本发明优选地技术方案在于，在数据Meta分析构建配型模型步骤中，基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，采用二分类变量法对研究数据的效应量进行分析计算，得出风险比RR值、比数比OR值以及风险差RD值，以分析特征变量与病患治疗效果的紧密或差异程度。

本发明优选地技术方案在于，在数据Meta分析构建配型模型步骤中，在进行异质性检验以及计算效应量之后，选择合适的效应模型进行合并，根据效应量以及P值，选择在所有研究中共有的特征构建配型模型。

本发明优选地技术方案在于，层次分析法供体选择步骤包括如下步骤：首先，采取建立层次结构模型步骤，将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层，建立供受体配型层次结构，其中，准则层包括距离、多样性、有益菌以及有害菌；其次，采取构造判断矩阵步骤，构造两两比较判断矩阵，判断矩阵用数值表示下层元素对上层元素的相对重要性；再次，采取层次单排序及其一致性检验步骤，进行层次单排序，计算单一准则下元素的相对权值，通过随机一致性比率CR来检验判断矩阵的一致性，当CR＜0.1时，认为判断矩阵具有满意的一致性，当CR≥0.1时，则需重新调整判断矩阵，使其具有一致性；再次，采取层次综合排序步骤，计算各层元素对目标层的总排序权重，检验一致性；最后，采取综合权重得分选取供体步骤，根据综合权重得分进行排序，选择权重高的供体作为最优供体。

本发明优选地技术方案在于，在建立层次结构模型步骤中，构成准则层的各个因素的计算公式如下：

距离：

其中，S_A，i，S_B，i表示第i个OTU分别在供体群落和受体群落中的个数；

多样牲：index_多样性＝60％*f_{缺OTU在供体中出现的频率}+40％*Abu_{缺OTU出现的平均相对丰度}；

有益菌：index_有益菌＝60％*f_{缺genus在供体中出现的频率}+40％*Abu_{缺genus出现的平均相对丰度}；

有害菌：index_有害菌＝60％*f_{缺genus在供体中出现的频率}+40％*Abu_{缺genus出现的平均相对丰度}。

本发明优选地技术方案在于，在医疗健康数据建立步骤中，数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种，所属数据库检索基于关键词为type 2 diabetic、16SrRNA以及human。

本发明的有益效果为：

本发明提供的菌群移植治疗糖尿病的供受体配型算法，结合现有医疗健康数据库和供体的信息，采用16S序列分析数据库的菌群构成特征，再采用Meta分析确立特征构建糖尿病供受体配型模型，通过层次分析法建立层次结构模型计算相应的权重来合理的挑选最优供体，以保证菌群移植治疗效果。层次分析法将人的主观性想法用数字方式进行量化，使其更为科学性、合理性，再通过排序计算和一致检验，证明所得权重的重要性，使方案间的重要性得到保证。具体有如下有益效果：

(1)建立了一种菌群移植治疗糖尿病的供受体配型模型，综合考虑了供体和患者的菌群组成和多样性等方面；

(2)采用Meta分析结合多篇研究对肠道菌群alpha多样性、beta多样性和菌群特征进行综合分析，进而筛选出特征构建模型，结果更加合理，具有说服力；

(3)运用层次分析法对供体进行打分排序，进而选择出最优供体。所得结果兼顾了评价的主观和客观性，更加合理，有利于菌群移植的顺利进行。

附图说明

图1是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的配型流程示意图一；

图2是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的供体配型多目标优化层次分析示意图；

图3是本发明具体实施方式中提供的菌群移植治疗糖尿病的供受体配型算法的配型流程示意图二；

图4是本发明具体实施方式中提供的层次分析法供体选择步骤的流程示意图。

图中：

S1、医疗健康数据建立步骤；S2、16S序列分析步骤；S3、数据Meta分析构建配型模型步骤；S4、层次分析法供体选择步骤；S41、建立层次结构模型步骤；S42、构造判断矩阵步骤；S43、层次单排序及其一致性检验步骤；S44、层次综合排序步骤；S45、综合权重得分选取供体步骤。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

如图1至图4所示，为了便于患者匹配合适的菌群供体，以保证菌群移植治疗的有效性。进一步地，本实施例中提供的一种菌群移植治疗糖尿病的供受体配型算法，包括医疗健康数据建立步骤S1、16S序列分析步骤S2、数据Meta分析构建配型模型步骤S3以及层次分析法供体选择步骤S4；首先，采取医疗健康数据建立步骤S1，基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据，建立数据库；其次，采取16S序列分析步骤S2，根据不同数据的特征进行数据预处理，基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果；再次，采取数据Meta分析构建配型模型步骤S3，通过Meta分析法处理研究文献数据以及16S序列分析所得数据，提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征，构建糖尿病供受体配型模型；最后，采取层次分析法供体选择步骤S4，配型模型通过层次分析法分解特征层次结构，对供体库中供体进行打分排序，选择最优值供体，使患者获得最优供体配型。通过16S序列分析步骤S2，对肠道菌群进行高通量测序，通过分析测序序列的构成了解特定环境中肠道菌群的构成情况或基因的组成以及功能，核心是研究菌群样本中的物种分类、物种丰度以及***进化，通过OTU分析，可以知道研究样本中的菌群多样性和不同菌群的丰度。通过数据Meta分析构建配型模型步骤S3，可以检验研究文献间存在的差异性，目的是检查各个独立研究的结果是否具有可合并性，再计算效应量和权重，反映变量之间的紧密或差异程度，再根据计算结果合并效应模型，提取研究文献中肠道菌群alpha多样性、beta多样性和菌属共有数据组成特征，构建糖尿病供受体配型模型。其中，Alpha多样性指标，是一个一维的数值，指的是环境样本内物种多样性大小，Alpha多样性指标可描述样本内物种多样性，这个指标仅与当前样本有关，与其他样本无关，因此多个样本之间的差异远近关系用Alpha多样性难以表达。Beta多样性定义为群落组成变化的程度，或群落分化的程度，与环境的复杂梯度或环境的模式有关。也就是说，Beta多样性的分析是对样本间差异距离的分析。Beta多样性可以用一到多维度的数据表现出来，不仅可以反映了样本多样性之间的关系，而且还反映了生物群落之间的分化程度。因此，为了对不同样本之间的生物群落之间的差异进行量化，本算法还提取了Beta多样性来表达生物群落多样性，不仅可以帮助研究者理解各个样本的生物多样性如何，还可以帮助解释样本为什么以这种方式聚集或分散。在层次分析法供体选择步骤S4中，层次分析法是将为患者匹配合适的菌群供体的决策问题按总目标、各层子目标、评价准则直至具体的供体配型备投方案的顺序分解为不同的层次结构，然后用求解判断矩阵特征向量的办法，求得每一层次的各元素对上一层次某元素的优先权重，最后再加权和的方法递阶归并各供体配型备择方案对为患者匹配合适的菌群供体的总目标的最终权重，此最终权重最大者即为最优方案。通过上述过程，便于患者匹配合适的菌群供体，以保证菌群移植治疗的有效性。

优选地，在16S序列分析步骤S2中，数据预处理是基于下载研究文献的描述，根据不同文献数据的参数对数据进行预处理，并记录相关参数，相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。在进行16S序列分析时，首先捕获其16S区域(引物PCR)，然后测序，以便后续分析肠道菌群的构成情况或基因的组成以及功能。

优选地，在16S序列分析步骤S2中，进行16S序列分析时，首先，对下载的研究文献数据根据分组信息以及序列长度进行分类，准备好相应的配置文件，再基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果。因为16S拥有极好的保守性，因此可以用于鉴别不同的物种，然后分析逻辑，聚类成OTU，再比对已知数据库进行注释结果，以便后续分析肠道菌群的构成情况或基因的组成以及功能。

优选地，在数据Meta分析构建配型模型步骤S3中，基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，进行异质性检验，根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度；当I^2>50％时，认为各个研究间有比较明显的异质性，此时采用随机效应模型进行分析；当I^2≤50％时，认为各个研究间没有较明显的异质性，此时采用固定效应模型进行分析。其中，计算异质性公式如下所示：

I^2＝(Q-df)/Q×100％ (1)，

公式(1)中df为自由度，一般取k-1，k为研究的个数，公式(2)中

为合并的效应量，Q服从于自由度为k-1的χ²分布，χ²(α,k-1),α为统计学检验的错误概率，一般为0.05。当I^2>50％时，认为各个研究间有比较明显的异质性，此时采用随机效应模型进行分析；反之，则采用固定效应模型进行分析。

优选地，在数据Meta分析构建配型模型步骤S3中，基于研究文献数据以及16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，采用二分类变量法对研究数据的效应量进行分析计算，得出风险比RR值、比数比OR值以及风险差RD值，以分析特征变量与病患治疗效果的紧密或差异程度。其中，基于二分类数据的效应量的计算公式如下所示：

表1：基于距离的二联表

	糖尿病	非糖尿病	N
				低-median	A	B	n<sub>1</sub>
高-median	C	D	n<sub>2</sub>

其中低-median、高-median分别指低于或高于距离的中位值，A、B分别表示该研究中低于距离中位值的样本发生糖尿病，不发生糖尿病的个数；C、D分别表示该研究为中高于距离中位值的样本发生糖尿病，不发生糖尿病的个数，n₁、n₂分别代表低于距离的中位值的样本总个数和高于距离的中位值的样本总个数。此外，研究的特征变量除了距离，还可以包括多样性、有益菌以及有害菌。具体计算公式如下所示：

风险比(RR)：

比数比(OR)：

风险差(RD)：

通过上述过程，分析各个研究治疗方案中的特征变量与病患治疗效果的关联程度，以筛选出有效的研究治疗方案、相应的特征变量组成及其权重关系。

优选地，在数据Meta分析构建配型模型步骤S3中，在进行异质性检验以及计算效应量之后，选择合适的效应模型进行合并，根据效应量以及P值，选择在所有研究中共有的特征构建配型模型。通过上述过程，确保构建的配型模型更准确可靠。

优选地，层次分析法供体选择步骤S4包括如下步骤：首先，采取建立层次结构模型步骤S41，将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层，建立供受体配型层次结构，其中，准则层包括距离、多样性、有益菌以及有害菌；其次，采取构造判断矩阵步骤S42，构造两两比较判断矩阵，判断矩阵用数值表示下层元素对上层元素的相对重要性；再次，采取层次单排序及其一致性检验步骤S43，进行层次单排序，计算单一准则下元素的相对权值，通过随机一致性比率CR来检验判断矩阵的一致性，当CR<0.1时，认为判断矩阵具有满意的一致性，当CR≥0.1时，则需重新调整判断矩阵，使其具有一致性；再次，采取层次综合排序步骤S44，计算各层元素对目标层的总排序权重，检验一致性；最后，采取综合权重得分选取供体步骤S45，根据综合权重得分进行排序，选择权重高的供体作为最优供体。

在构造判断矩阵步骤S42中，构造两两比较判断矩阵，所述判断矩阵用数值表示下层元素对上层元素的相对重要性，将比较的结果用数值表示。一般使用数字1～9作为标度(见表2)。

表2：因素比值规则表

例如，对准则层的四个因素距离、多样性、有益菌以及有害菌进行专家打分(见表3)，

表3：四个因素的打分表

因此构造的判断矩阵为：

在层次单排序及其一致性检验步骤S43中，进行层次单排序，计算单一准则下元素的相对权值，采用随机一致性比率CR来检验判断矩阵的一致性，其计算公式为：

CR＝CI/RI (6)，

公式(6)中RI为随机一致性指标(见表4)，CI为一致性指标，公式(7)中n为本层指标的个数，λmax为判断矩阵的最大特征根；当CR<0.1时，认为判断矩阵具有满意的一致性，反之，则需重新调整判断矩阵，使其具有一致性。

表4：RI数值表

在层次综合排序步骤S44中，进行层次综合排序，检验一致性，即计算各层元素对目标层的总排序权重，计算公式为：

公式(8)中c_kj表表示C层包含的n个元素相对于上一层B层因素的层次单排序，b_j为B层单排序权值。

通过上述过程，根据综合权重得分进行排序，选择权重高的作为最优供体，便于患者匹配最合适的菌群供体，以保证菌群移植治疗的有效性。

优选地，在建立层次结构模型步骤S41中，构成准则层的各个因素的计算公式如下：

距离：

其中，Bray-Curtis距离主要基于OTUs的计数统计，比较供体群落和受体群落之间的组成差异，D_Bray-Curtis值越小表示二者组成差异小。通过上述过程，以便根据构成准则层的各个因素的具体数据进行打分排序。

优选地，在医疗健康数据建立步骤S1中，数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种，所属数据库检索基于关键词为type 2 diabetic、16SrRNA以及human。通过上述过程，使得医疗健康数据的来源更准确可靠。

本发明是通过优选实施例进行描述的，本领域技术人员知悉，在不脱离本发明的精神和范围的情况下，可以对这些特征和实施例进行各种改变或等效替换。本发明不受此处所公开的具体实施例的限制，其他落入本申请的权利要求内的实施例都属于本发明保护的范围。

Claims

1.一种菌群移植治疗糖尿病的供受体配型算法，其特征在于：

包括医疗健康数据建立步骤(S1)、16S序列分析步骤(S2)、数据Meta分析构建配型模型步骤(S3)以及层次分析法供体选择步骤(S4)；

首先，采取所述医疗健康数据建立步骤(S1)，基于研究文献收集临床糖尿病患者和健康人体肠道菌群的数据，建立数据库；

其次，采取所述16S序列分析步骤(S2)，根据不同数据的特征进行数据预处理，基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果；

再次，采取所述数据Meta分析构建配型模型步骤(S3)，通过Meta分析法处理研究文献数据以及16S序列分析所得数据，提取肠道菌群alpha多样性、beta多样性和菌属数据组成特征，构建糖尿病供受体配型模型；

最后，采取所述层次分析法供体选择步骤(S4)，所述配型模型通过层次分析法分解特征层次结构，对供体库中供体进行打分排序，选择最优值供体，使患者获得最优供体配型。

2.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述16S序列分析步骤(S2)中，所述数据预处理是基于下载研究文献的描述，根据不同文献数据的参数对数据进行预处理，并记录相关参数，所述相关参数包括测序区域、DNA提取试剂盒、测序平台、引物、barcode、单双端。

3.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述16S序列分析步骤(S2)中，进行所述16S序列分析时，首先，对下载的研究文献数据根据分组信息以及序列长度进行分类，准备好相应的配置文件，再基于相同类型的参数进行16S序列分析，得到多个OTU及其对应的注释结果。

4.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述数据Meta分析构建配型模型步骤(S3)中，基于研究文献数据以及所述16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，进行异质性检验，根据异质性部分在效应总的变异中所占的比重I^2分析各个研究间存在的差异程度；

当I^2>50％时，认为各个研究间有比较明显的异质性，此时采用随机效应模型进行分析；

当I^2≤50％时，认为各个研究间没有较明显的异质性，此时采用固定效应模型进行分析。

5.根据权利要求4所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述数据Meta分析构建配型模型步骤(S3)中，基于研究文献数据以及所述16S序列分析得到的OTU及其对应的注释结果数据进行Meta分析，采用二分类变量法对研究数据的效应量进行分析计算，得出风险比RR值、比数比OR值以及风险差RD值，以分析特征变量与病患治疗效果的紧密或差异程度。

6.根据权利要求5所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述数据Meta分析构建配型模型步骤(S3)中，在进行异质性检验以及计算效应量之后，选择合适的效应模型进行合并，根据效应量以及P值，选择在所有研究中共有的特征构建所述配型模型。

7.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

所述层次分析法供体选择步骤(S4)包括如下步骤：

首先，采取建立层次结构模型步骤(S41)，将糖尿病患者供受体配型涉及的因素划分为目标层、准则层以及方案层，建立供受体配型层次结构，其中，所述准则层包括距离、多样性、有益菌以及有害菌；

其次，采取构造判断矩阵步骤(S42)，构造两两比较判断矩阵，所述判断矩阵用数值表示下层元素对上层元素的相对重要性；

再次，采取层次单排序及其一致性检验步骤(S43)，进行层次单排序，计算单一准则下元素的相对权值，通过随机一致性比率CR来检验判断矩阵的一致性，当CR<0.1时，认为判断矩阵具有满意的一致性，当CR≥0.1时，则需重新调整判断矩阵，使其具有一致性；

再次，采取层次综合排序步骤(S44)，计算各层元素对目标层的总排序权重，检验一致性；

最后，采取综合权重得分选取供体步骤(S45)，根据综合权重得分进行排序，选择权重高的供体作为最优供体。

8.根据权利要求7所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述建立层次结构模型步骤(S41)中，构成所述准则层的各个因素的计算公式如下：

所述距离：

其中，S_A,i,S_B,i表示第i个OTU分别在供体群落和受体群落中的个数；

所述多样性：

index_多样性＝60％*f_{缺OTU在供体中出现的频率}+40％*Abu_{缺oTU出现的平均相对丰度}；

所述有益菌：

index_有益菌＝60％*f_{缺genus在供体中出现的频率}+40％*Abu_{缺genus出现的平均相对丰度}；

所述有害菌：

index_有害菌＝60％*f_{缺genus在供体中出现的频率}+40％*Abu_{缺genus出现的平均相对丰度}。

9.根据权利要求1所述的菌群移植治疗糖尿病的供受体配型算法，其特征在于：

在所述医疗健康数据建立步骤(S1)中，数据来源为Pubmed、Web of Science、EMBASE以及The Cochrane Central Register of Controlled Trials(CENTRAL)数据库中的至少一种，所属数据库检索基于关键词为type 2diabetic、16SrRNA以及human。