CN106202846B - 口腔微生物群落检测模型的构建方法 - Google Patents

口腔微生物群落检测模型的构建方法 Download PDF

Info

Publication number
CN106202846B
CN106202846B CN201510216080.9A CN201510216080A CN106202846B CN 106202846 B CN106202846 B CN 106202846B CN 201510216080 A CN201510216080 A CN 201510216080A CN 106202846 B CN106202846 B CN 106202846B
Authority
CN
China
Prior art keywords
data
model
microbial community
oral
detection model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510216080.9A
Other languages
English (en)
Other versions
CN106202846A (zh
Inventor
滕飞
杨芳
黄适
凌均棨
徐健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ORAL SUBSIDIARY SUN YAT-SEN UNIVERSITY HOSPITAL
Qingdao Institute of Bioenergy and Bioprocess Technology of CAS
Original Assignee
ORAL SUBSIDIARY SUN YAT-SEN UNIVERSITY HOSPITAL
Qingdao Institute of Bioenergy and Bioprocess Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ORAL SUBSIDIARY SUN YAT-SEN UNIVERSITY HOSPITAL, Qingdao Institute of Bioenergy and Bioprocess Technology of CAS filed Critical ORAL SUBSIDIARY SUN YAT-SEN UNIVERSITY HOSPITAL
Priority to CN201510216080.9A priority Critical patent/CN106202846B/zh
Publication of CN106202846A publication Critical patent/CN106202846A/zh
Application granted granted Critical
Publication of CN106202846B publication Critical patent/CN106202846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及微生物检测模型领域,具体的说是一种口腔微生物群落检测模型的构建方法。本发明包括以下步骤:数据收集,数据筛选,数据剔除,模型的初步构建和模型的优化。本发明的模型对象采集处理简易、无侵害性、成本低、检测对象相对简单;建模优化方法易于操作、数据处理高效、检测能力强。

Description

口腔微生物群落检测模型的构建方法
技术领域
本发明涉及微生物检测模型领域,具体的说是一种口腔微生物群落检测模型的构建方法。
背景技术
寄生于人体的大量共生菌群作为后天禀赋的主要承载者与人体的健康息息相关。目前认为共生微生物可作为人体的第二基因组,其遗传信息的总和被称为微生物组(microbiome),赋予人类不依赖于自身进化而获得的复杂个体特征。因此,全面认识人体共生菌群的基础上,才能深度揭示其对人体健康或疾病状态的影响,从而构建微生物群落存在及变化情况与特定的疾病之间的联系。
口腔***是连通人体内外的交通枢纽,为人体共生菌群非常重要的栖息位点,其包括牙齿生态区、牙周生态区、口腔黏膜生态区、唾液生态区等多个生态区,其微生物群落结构复杂,这些微生物以细菌为主,也有少量真菌、病毒、古细菌的存在。口腔菌群失调与口腔疾病如龋齿、牙龈炎、牙周炎等发生发展有关,甚至与全身性疾病如糖尿病、心血管疾病、胰腺癌等具有显著相关。维持口腔菌群结构和功能的健康平衡状态,对于人体健康具有深刻而不容忽视的重大意义。此外,与血液和尿液作为疾病诊断媒介相比,口腔位点采样具有低侵害性、低成本、样品采集和处理简易、快捷等优势。
现有的检测模型构建的数据通常是通过横向研究方法而获得,即比较健康人群和疾病人群的特征而获得特定特征健康和疾病差异。但慢性疾病发展的不同阶段存在变异性;而疾病的同一发展阶段在不同个体间亦存在一定异质性,如可受到宿主基因、免疫、生活习惯等因素影响。而年龄(时间)因素对于诊断数据也有着深刻而不容忽视的影响。这些基于单时间点的横断面研究方法,忽略时间轴上健康状态下的自然变异和疾病状态下的特殊变异等特征,无法真实揭示疾病的机制,极大降低了所筛选出的标记物的精确性和鲁棒性,从而极大限制了诊断和监测方法的性能。此外,对于疾病诊断采样通常集中于单一位点,如血液样品或尿液样品等。但不同位点提供的有效信息存在差异,目前对于不同采样位点对于同一种疾病诊断的是否具有优劣性,是否不同位点对于疾病诊断存在互补性均较少考察。因此,多数诊断方法和模型止步于生物因子的筛选后简单建模,未将其方法和模型进一步优化和完善,限制了其临床转化和应用前景。因此,好的诊断方法应考察不同参数以优化方法,使其自身具备高敏感性、高特异性,同时在临床应用上应满足高通量、易操作、无侵害性和低成本等要求。
发明内容
针对现有技术中存在的上述不足之处,本发明要解决的技术问题是提供一种口腔微生物群落检测模型的构建方法。
本发明为实现上述目的所采用的技术方案是:一种口腔微生物群落检测模型的构建方法,包括以下步骤:
数据收集:在待收集人群中收集口腔微生物群落数据,并随着待收集人群的年龄增长,收集多个时间点的口腔微生物群落数据,并在所述待收集人群中区分出在患有牙病人群和未患有牙病人群在多个时间点上的口腔微生物群落数据;
数据筛选:在所述未患有牙病人群在多个时间点上的口腔微生物群落数据中,筛选出于年龄相关的微生物群落;
数据剔除:在所述患有牙病人群在多个时间点上的口腔微生物群落数据中,剔除数据筛选步骤得到的微生物群落的数据成分;
模型的初步构建:利用数据剔除步骤得到的口腔微生物群落数据,初步构建口腔微生物群落检测模型;
模型的优化:分别考察种系发育水平和不同生态位点对于初步模型的效能的影响,并进一步在不影响模型性能前提下根据模型变量对模型性能重要性程度精简变量,最终确定优化的模型。
所述口腔微生物群落数据为高通量测序手段获得微生物群落的16s RNA或全基因组信息。
所述数据筛选,具体为:利用随机森林回归分析方法处理健康人群多时间点口腔微生物群落数据,分别筛选出具有区分年龄能力的微生物标记物。
所述模型的初步构建,包括以下步骤:
(1)从患有牙病人群多时间点口腔微生物群落数据中去除数据筛选步骤所得的年龄相关的微生物数据;
(2)利用随机森林二分类方法处理已进行剔除步骤的患有牙病人群多时间点的口腔微生物群落数据,建立初步检测模型。
所述模型的优化,包括以下步骤:
(1)分别建立不同种系发育水平检测模型;
(2)基于各种系发育水平建立不同生态位点的检测模型;
(3)确定可最优化模型的种系发育水平和生态位点后,定量此条件下检测模型的每个变量对模型的重要性程度,评价在不降低模型性能前提最简化的变量组合数目,从而确定最终优化模型。
所述种系发育水平包括门、纲、目、科、属、种共六个水平
所述生态位点包括单一生态位点和多个生态位点组合的复合生态位点。
所述模型用作检测口腔疾病发生的可能性评价。
本发明具有以下优点及有益效果:
1.模型对象采集处理简易、无侵害性、成本低、检测对象相对简单;
2.建模优化方法易于操作、数据处理高效、检测能力强;
3.模型应用广泛:其应用对象不仅适用于大规模人群筛选,也可针对个体实现最终监测;其应用形式不仅可检测口腔微生物宿主此时状态,也可预测宿主未来可能发生状态。
附图说明
图1为本发明方法的实施流程图;
图2为本发明实施提供的实验设计图;
图3为本发明实施提供的口腔微生物群落结构特征图;
图4为本发明实施提供的口腔微生物群落功能特征图;
图5为本发明实施提供的通过随机森林回归方法筛选出与年龄相关的口腔微生物及其功能组成热图;
图6为本发明实施提供的基于随机森林二分类方法不同种系发育水平和位点的疾病检测模型的准确率箱状图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
本发明以利用口腔牙菌斑和唾液微生物群落构建和优化儿童口腔状态的检测模型作为实施例(图1),包括下列内容:
(1)收集儿童口腔健康状态临床信息(表1):
对广州市南方中英文幼儿园全日制儿童的口腔健康进行追踪调查,每半年检查一次,持续一年三次检查,之后再间隔一年进行检查,根据三次调查记录的儿童dmfs(龋,失,补牙数)指数,根据本研究目的选择具有下述三类口腔健康变化特征的儿童纳入此课题研究:①健康对照组(H2H组):口腔龋病状况始终保持健康的17名儿童;②龋病发生组(H2C组):口腔龋病状况经历从健康到龋病新发过程的21名儿童;③龋病进展组(C2C组):口腔龋病状况经历从已患龋到龋病发展过程的12名儿童。入选标准包括:年龄约4岁,20颗乳牙全部萌出,排除标准包括:有全身***性疾病和牙周、口臭等口腔疾患,三个月未服用抗生素。选取所有入选儿童的三次口腔检查时所取的龈上牙菌斑和唾液样品共计284个,按照dmfs指数进行如下分类:低龋样品(LC,0<dmfs<6)39个,重症婴幼儿龋样品(SC,dmfs≥6)29个,健康对照样品(H,dmfs=0)74个。无论低龋和高龋样品均为龋病样品。而其中健康对照样品分为绝对健康样品和相对健康样品:绝对健康样品是指两个时间点均为健康的前一个时间点的样本;对应地,如果宿主某一时间为健康状态,但在下一个时间点口腔情况为龋病状态,其健康状态样品即定义为相对健康样本。就整个实验流程各项细节及以后的数据公布等事宜征得志愿者监护人同意,并签署知情同意书。
调查方法:由两名牙体牙髓专科医生以视诊结合探诊的方式进行检查,检查器械高温高压消毒,必要时借助棉签去除软垢。检查前统一认识、方法和标准,标准一致性检验的Kappa值均大于0.92。采用世界卫生组织《口腔健康调查基本方法》(1997年)对龋病的诊断标准。冠龋诊断标准:牙齿的窝沟点隙或光滑面有明显龋洞、或明显釉质下破坏、或明确可探及软化洞底或洞壁的病损记为龋齿,包括有充填物或已窝沟封闭同时有龋者。有下列表现而缺乏其他阳性症状时不列入龋齿记录范围:①白色或白垩色斑点;②探诊无软化的着色或粗糙斑点;③釉质点隙或窝沟着色,但无明显釉质下潜行破坏;④中到重度氟斑牙,有光泽、质硬、有小凹陷;⑤根据分布或病史,结合触诊、视诊观察因磨损而造成病损龋齿。
表1本发明实例提供的样本临床数据
(2)收集儿童唾液和龈上菌斑样本:
取样前一小时受试者避免进食及饮水,每次取样均在早上9:100-12:00,取样时儿童保持轻仰头、闭眼、直立座位。收集儿童无刺激性唾液于50ml无菌离心管中;再使用无菌牙刷采集全部萌出乳牙龈上菌斑1分钟,将粘附于牙刷上菌斑转移至盛有10ml双蒸水的50ml离心管,取样时避免触碰黏膜等口腔其他位点。对样品分别编号并置于-80℃保存待提取DNA。
(3)基因组DNA提取和PCR扩增16S rRNA基因片段
采用高盐DNA提取方法。将盛有菌斑离心管以13,000rpm/min速度离心15min,弃上清,加入1ml裂解液,裂解液混合物中加入30μL蛋白酶K及150μL 10%SDS,53℃水浴震荡过夜培养。加入400μL 5M NaCl冰上培养10min,13,000rpm.min-1离心10min。加入等体积的饱和酚溶液,至水相酚混匀成乳液状,以13,000rpm/min速度离心15min,吸取上层黏稠水相至新管,重复酚抽提一次。加等体积的氯仿异戊醇混合液(24:1),转动混匀,以13,000rpm/min速度离心15min,取上层黏稠水相转移。加入800μL异丙醇,室温培养1min,以13,000rpm/min速度离心15min。弃上清,70%乙醇洗两次,干燥后溶于50μL TE溶液。
采用Qubit超微量分光光度仪定量DNA浓度,电泳检测DNA完整性。提取后的DNA保存于-20℃。约15ng DNA用于构建16S扩增文库。
为获得相对准确的种系发育信息,选取16S rRNA片段上V1-V3高变区(Escherichia coli positions 5-534)作为PCR扩增目标片段。确定PCR上游引物(5’-NNNNNNN-TGGAGAGTTTGATCCTGGCTCAG-3’)及下游引物(5’-NNNNNNN-TACCGCGGCTGCTGGCAC-3’),NNNNNNN即IDtag,是为区别不同样品来源而设计的随机组合的七个碱基,分别加入上下游引物的5’端,利用该多样品平行标记技术完成多个样品同时在测序仪上测序。
每个样品进行三次PCR扩增,PCR反应体系(25μL)包含12.5μL的Gotag Hotstart聚合酶,各1μL上下游引物(浓度5pM),1μL基因组DNA(5ngμL-1),9.5μL PCR级别无菌水,在Thermocycler PCR system进行反应。反应条件设定为:95℃预变性2min,94℃变性30s,退火56℃25s,72℃延伸25s,共25个循环,最后72℃延伸5min[4]。PCR产物混合后全部进行凝胶电泳(1.2%Q琼脂糖,5V cm-1,40min),确认扩增效果,将琼脂糖胶放置在紫外灯下,割取约500bp长度的DNA条带,按照Qiagen MiniElute试剂盒提供的操作流程进行回收、纯化目的片段DNA,用20μL洗涤。
(4)454GS FLX Titanium测序
主要流程如下:①文库制备,采用Agilent BioAnalyzer 2100生物分析仪及PicoGreen超微量分光光度仪联合定量,将不同样品以等摩尔混合后共构建三份DNA文库,与特异性接头连接修饰,变性处理回收单链DNA;②乳化PCR,将DNA文库固定于磁珠,经扩增乳化,形成油水混合物,每个DNA片断在微反应器进行独立平行扩增,产生数百万计相同拷贝。打破乳化状态,回收纯化结合于磁珠上的DNA片段;③测序反应,将携带DNA的磁珠与其他反应物混合,放入PTP板中置于454GS FLX Titanium机器中,每一个与模板链互补的核苷酸的添加都会产生荧光信号并被CCD照相机所捕获,逐步完成测序;④数据收集,通过***信息学工具对测序反应数据进行碱基解析。
(5)将获得的高通量数据转换成具体的微生物群落数据
序列质量控制:454高质量序列分析流程主要基于MOTHUR平台,设定质量控制规范,符合标准的序列片段被视为高质量序列,予以保留。①至少有一端引物能被匹配,允许的编辑距离(***、删除、缺失、错配的碱基数量)不超过2;②序列长度大于150bp;③设置一个50bp的碱基阅读框,从每条序列的第一个碱基开始逐个碱基向后移动,每移动一个碱基,计算一次该阅读框内的质量分数均值,该质量指数均值需大于35;④不含有模糊碱基;⑤允许标签序列错配数量不超过1。经初步过滤后,需要进一步对序列进行测序错误的筛查,包括“preclustering”和嵌合体(Chimera)序列查找等步骤。Preclustering可较好控制在后期OTU聚类中生成单一序列OTU的比例,即降低由测序错误带来的OTU数目或者生物多样性的过高估计。嵌合体(Chimera)序列通常由PCR产生,序列虽然测序质量没有问题,但属于非生物序列。选择UCHIME程序查找并删除这些序列。
基于16S数据库的种系发育信息分析:采用mothur分类方法针对人类口腔核心微生物16S数据库(CORE)进行从门到种水平细菌种系信息划归,分别统计各个样品在每个分类水平上各物种的序列数,并与该样品总体获得的序列数计算比值,从而获取每个门类各物种的相对丰度。
(6)不同因素对于口腔菌群分布的影响:
以Jensen-Shannon矩阵为基础的群落结构计算方法:其除了样品间的进化距离外,还可调查样品菌种水平物种丰度或上的区别。样品中细菌种的丰度分布可以看作是物种的概率分布,可以利用样品间这种概率分布的互信息熵(Jensen-Shannon divergence,JSD)来度量样品间的微生物组的区别。样品间的距离D(a,b)的计算公式如下:
Pa和Pb分别代表样品a和样品b中的丰度分布。JSD(X,Y)定义了两个样品中不同的概率分布X和Y间的互信息熵(Jensen-Shannon divergence)。
KLD是X和Y间的Kullback-Leibler离散度,具体的计算方法如下:
非监督的主坐标分析:将Jensen-Shannon矩阵进行主坐标分析(PCoA:PrincipalCoordinates Analysis)以展示不同样本间差异,PCoA将各个物种信息视为互相独立不关联的变量,以样本×变量相对丰度的矩阵进行分析,以在不考虑环境因子影响的前提下,无偏见、整体的观察样本的内在菌群结果,发现一个或多个潜在的变量(主坐标,Principalcoordinate,PC)以最大程度的在较低维度上最好的解释样本内在的变异,每一个主坐标代表在此维度下可解释的整体结构变异程度,从而达到数据降维处理并对样品排序的目的,其中样本的得分(Score)是物种得分的线性组合。
置换多元统计分析结果显示决定口腔微生物菌群分布的重要因素,支持口腔微生物群落模型需进行年龄因素的删除和位点因素的优化(图1,图2):
①不同位点是决定菌群分布的最重要因素,即无论在疾病还是健康个体内或个体间,唾液和牙菌斑菌群物种组成显著不同(图2)。
②在各个生态位点,影响菌群分布的重要因素根据其重要性排名顺序为:时间/年龄因素、龋病状态、样品分组、个体异质性(图2)。
在不同分组中(包括H2H、H2C、C2C组),各影响对于菌群分布的特征表现在(图2):
③时间因素:在本研究中时间因素不但包括年龄因素,对涉及疾病状态组别而言还涵盖了随时间推移龋病发生发展对于菌群结构影响。结果显示除菌斑来源的CCC组外,时间因素对不同位点来源的各个组均有显著影响,且对菌斑来源HHH组影响最大,即宿主生理年龄对口腔微生物菌群具有重要影响因素。
④龋病状态:在龋病发生组(H2C)中,健康和疾病状态可显著区分菌群结构,其此因素高于其他因素对于菌群结构分布的影响。此外,在所有样品中,健康菌群与低龋或高龋菌群均有显著差异。
⑤个体异质性:虽不同样品间的不同组别的个体异质性存在差异,但健康和疾病状态间或不同时间点样品差异大小,均大于个体之间差异。
以上结果提示:口腔菌群可作为龋病发生检测的媒介,而在建立检测模型和方法时生态位点因素和年龄因素亦不容忽视。
(7)筛选年龄相关的微生物标记物:
在机器学习中,随机森林方法是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。随机森林方法不但可以建立分类模型,同时可确定区分特定状态或标签的变量,并可通过其重要性值以判断其区分能力的大小。在本实例中,随机森林方法利用R的randomForest软件包实现,建立5000棵树,其他均为默认设置。以输入数据的2/3作为训练数据集,以输入数据的1/3作为测试数据集,随机进行100次实验以降低误差。
在筛选年龄相关标记物时,以H2H组中的的数据作为输入变量,以其每个样本对应的实际月龄作为样本信息,将其回归到离散的输出变量(预测的月龄),从而随机森林即可获得区分年龄的分类器并筛选出与与年龄因素相关的各个水平的物种(图3)。进一步将变量按照其对模型重要性排序,将随着变量减少而模型性能未显著改变的变量组合作为最终年龄相关的微生物标记物(图3)。此步骤,在不同物种水平和不同生态位点均分别独立进行。在本实例图中,以微生物种水平为例。
(8)初步建立口腔状态检测模型的方法
利用机械学习的随机森林方法,以龋病发生组和龋病进展组中宿主口腔状态为龋病和绝对健康的样本作为输入变量,将其与健康和龋病二分类的输出变量对应,建立分类模型。此外,将年龄因素相关的标记物从建模变量中全部剔除。
(9)优化已建立的口腔状态检测模型的方法
首先,在同一位点,分别建立从门、纲、目、科、属、种六个水平的龋病发生检测模型。结果显在同一位点,尽管不同种系发育水平的检测模型准确率变化较大,但基于种水平的检测模型准确率最高(图4)。
其次,在同一种系发育水平,分别建立牙菌斑、唾液和复合位点(牙菌斑和唾液)的龋病发生检测模型。在同一种系发育水平,牙菌斑来源模型准确率高于唾液来源模型,而复合微单模型的准确率略高于二者(图4)。因此,基于复合位点来源的细菌种建立的龋病检测模型的准确率最为理想。
最后,进一步优化这个以全部微生物为变量的模型,将变量按照其对模型重要性排序,将随着变量减少而模型性能未显著改变的20个变量组合作为最终模型变量(图5)。其中,12个变量来源于牙菌斑样品而8个变量来源于唾液样品(图5)。
此外,将细菌种水平的不同位点模型应用于对表1中21个相对健康样本的进行检测,发现不同模型将这些样品多分类为龋病状态样品(图6),而这些相对健康样品在下一个时间点均是龋病状态样品,提示利用本方法建立的模型不仅可以检测口腔当前状态,同时可预测口腔未来状态。
本发明所述的随机森林回归分析方法和二分类方法可参见Breiman L(2001)Random forests.Mach Learn 45:5–32.)和(Knights D,Costello EK,KnightR.Supervised classification of human microbiota.FEMS Microbiol Rev.2011 Mar;35(2):343-59.doi:10.1111/j.1574-6976.2010.00251.x.Epub 2010 Oct7.Review.PubMed PMID:21039646。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实施范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。

Claims (7)

1.一种口腔微生物群落检测模型的构建方法,其特征在于,包括以下步骤:
数据收集:在待收集人群中收集口腔微生物群落数据,并随着待收集人群的年龄增长,收集多个时间点的口腔微生物群落数据,并在所述待收集人群中区分出在患有牙病人群和未患有牙病人群在多个时间点上的口腔微生物群落数据;
数据筛选:在所述未患有牙病人群在多个时间点上的口腔微生物群落数据中,筛选出与年龄相关的微生物群落;
数据剔除:在所述患有牙病人群在多个时间点上的口腔微生物群落数据中,剔除数据筛选步骤得到的微生物群落的数据成分;
模型的初步构建:利用数据剔除步骤得到的口腔微生物群落数据,初步构建口腔微生物群落检测模型;
模型的优化:分别考察种系发育水平和不同生态位点对于初步模型的效能的影响,并进一步在不影响模型性能前提下根据模型变量对模型性能重要性程度精简变量,最终确定优化的模型。
2.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述口腔微生物群落数据为高通量测序手段获得微生物群落的16s RNA或全基因组信息。
3.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述数据筛选,具体为:利用随机森林回归分析方法处理健康人群多时间点口腔微生物群落数据,分别筛选出具有区分年龄能力的微生物标记物。
4.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述模型的初步构建,包括以下步骤:
(1)从患有牙病人群多时间点口腔微生物群落数据中去除数据筛选步骤所得的年龄相关的微生物数据;
(2)利用随机森林二分类方法处理已进行剔除步骤的患有牙病人群多时间点的口腔微生物群落数据,建立初步检测模型。
5.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述模型的优化,包括以下步骤:
(1)分别建立不同种系发育水平检测模型;
(2)基于各种系发育水平建立不同生态位点的检测模型;
(3)确定可最优化模型的种系发育水平和生态位点后,定量此条件下检测模型的每个变量对模型的重要性程度,评价在不降低模型性能前提下最简化的变量组合数目,从而确定最终优化模型。
6.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述种系发育水平包括门、纲、目、科、属、种共六个水平。
7.根据权利要求1所述的口腔微生物群落检测模型的构建方法,其特征在于,所述生态位点包括单一生态位点和多个生态位点组合的复合生态位点。
CN201510216080.9A 2015-04-30 2015-04-30 口腔微生物群落检测模型的构建方法 Active CN106202846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510216080.9A CN106202846B (zh) 2015-04-30 2015-04-30 口腔微生物群落检测模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510216080.9A CN106202846B (zh) 2015-04-30 2015-04-30 口腔微生物群落检测模型的构建方法

Publications (2)

Publication Number Publication Date
CN106202846A CN106202846A (zh) 2016-12-07
CN106202846B true CN106202846B (zh) 2018-12-25

Family

ID=57458217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510216080.9A Active CN106202846B (zh) 2015-04-30 2015-04-30 口腔微生物群落检测模型的构建方法

Country Status (1)

Country Link
CN (1) CN106202846B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018107350A1 (zh) * 2016-12-13 2018-06-21 深圳华大基因研究院 提纯可逆阻断脱氧核糖核苷三磷酸的方法和测序方法
CN108346465A (zh) * 2017-01-22 2018-07-31 中国科学院昆明动物研究所 一种定义和度量生物集合群落物种特异度之多样性的概念和方法
CN107273711B (zh) * 2017-06-22 2021-03-23 宁波大学 一种对虾健康状况指示菌群的筛选方法
CN108805390B (zh) * 2018-04-12 2021-07-30 浙江大学城市学院 一种智能的刷牙过程评价方法
CN109102852A (zh) * 2018-08-22 2018-12-28 泰康保险集团股份有限公司 用户数据处理方法、装置、电子设备及计算机可读介质
CN111261222B (zh) * 2018-12-03 2023-08-11 中国科学院青岛生物能源与过程研究所 口腔微生物群落检测模型的构建方法
CN113688178B (zh) * 2021-08-09 2023-04-07 中国科学院青岛生物能源与过程研究所 一种足迹核算方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080305475A1 (en) * 2007-06-07 2008-12-11 Kao Corporation Microbial community analysis
CN101833613A (zh) * 2010-06-04 2010-09-15 中国科学院青岛生物能源与过程研究所 一种口腔微生物群落数据库及其应用
CN103305607A (zh) * 2013-05-22 2013-09-18 宁波大学 一种基于微生物群落变化的水产养殖病害预测方法
WO2014179965A1 (en) * 2013-05-09 2014-11-13 The Procter & Gamble Company Biomarker identifying method and system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006094803A (ja) * 2004-09-30 2006-04-13 Shimane Univ T−rflpをもちいた微生物群集構造の解析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080305475A1 (en) * 2007-06-07 2008-12-11 Kao Corporation Microbial community analysis
CN101833613A (zh) * 2010-06-04 2010-09-15 中国科学院青岛生物能源与过程研究所 一种口腔微生物群落数据库及其应用
WO2014179965A1 (en) * 2013-05-09 2014-11-13 The Procter & Gamble Company Biomarker identifying method and system
CN103305607A (zh) * 2013-05-22 2013-09-18 宁波大学 一种基于微生物群落变化的水产养殖病害预测方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
16SrRNA基因序列分析在人体微生物组学研究中的进展及应用;田芳云 等;《中国老年学》;20140831;第34卷(第15期);第4396-4398页 *
Bacterial profile of dentine caries and the impact of pH on bacterial population diversity;Nima Kianoush 等;《Plos One》;20140327;第9卷(第3期);第1-10页 *
GeneSrF and varSelRF: a web-based tool and R package for gene selection and classification using random forest;Ramón Diaz-Uriarte;《Bmc Bioinformatics》;20070903;第8卷;第1-7页 *
人颊黏膜微生物群落年龄相关性演替研究;张洋洋 等;《华西口腔医学杂志》;20140430;第32卷(第2期);第177-181页 *
新一代高通量技术在龋病相关的口腔菌群宏基因组学研究中的应用;凌均棨 等;《中华口腔医学研究杂志》;20110831;第5卷(第4期);第341-346页 *
随机森林回归分析及在代谢调控关系研究中的应用;李贞子 等;《中国卫生统计》;20120430;第29卷(第2期);第158-160,163页 *
随机森林在基因表达数据分析中的应用及研究进展;武晓岩 等;《2007年中国卫生统计学术大会论文集》;20080828;第289-303页 *

Also Published As

Publication number Publication date
CN106202846A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN106202846B (zh) 口腔微生物群落检测模型的构建方法
CN106202989B (zh) 一种基于口腔微生物群落获得儿童个体生物年龄的方法
Shaiber et al. Functional and genetic markers of niche partitioning among enigmatic members of the human oral microbiome
Joos et al. Daring to be differential: metabarcoding analysis of soil and plant-related microbial communities using amplicon sequence variants and operational taxonomical units
Liu et al. Species boundaries in plant pathogenic fungi: a Colletotrichum case study
Manor et al. Mapping the inner workings of the microbiome: genomic-and metagenomic-based study of metabolism and metabolic interactions in the human microbiome
Fitzsimons et al. Nearly finished genomes produced using gel microdroplet culturing reveal substantial intraspecies genomic diversity within the human microbiome
Buschbom et al. Testing “species pair” hypotheses: evolutionary processes in the lichen-forming species complex Porpidia flavocoerulescens and Porpidia melinodes
Hauer et al. Accurate phylogenetic relationships among Mycobacterium bovis strains circulating in France based on whole genome sequencing and single nucleotide polymorphism analysis
CN104039982A (zh) 一种分析微生物群落组成的方法和装置
CN101833613A (zh) 一种口腔微生物群落数据库及其应用
Kumar et al. Probing periodontal microbial dark matter using metataxonomics and metagenomics
CN110283903A (zh) 用于诊断胰腺炎的肠道微生物菌群
Abdel-Glil et al. Core genome multilocus sequence typing scheme for improved characterization and epidemiological surveillance of pathogenic Brucella
Cai et al. Cryptic species in the parasitic Amoebophrya species complex revealed by a polyphasic approach
Jia et al. Sequencing introduced false positive rare taxa lead to biased microbial community diversity, assembly, and interaction interpretation in amplicon studies
Dextro et al. Trends in free‐access genomic data accelerate advances in cyanobacteria taxonomy
CN106446599A (zh) 一种筛选婴幼儿龋病的口腔致病性生物标记物的方法
Ntushelo Identifying bacteria and studying bacterial diversity using the 16S ribosomal RNA gene-based sequencing techniques: A review
Petrone et al. RESCUE: a validated Nanopore pipeline to classify bacteria through long-read, 16S-ITS-23S rRNA sequencing
Benucci et al. Stochastic and deterministic processes shape bioenergy crop microbiomes along a vertical soil niche
KR20190074576A (ko) 세균총 분석 시스템 및 방법
JP7423101B2 (ja) 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法
Müller Competitive-Binding Based Optical Dna Mapping-from Bacterial Plasmids to the Human Genome
Logan IV Optimized Levenshtein Distance for Clustering third-generation sequencing data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant