CN109564189A - 电泳图谱分析 - Google Patents

电泳图谱分析 Download PDF

Info

Publication number
CN109564189A
CN109564189A CN201780048325.9A CN201780048325A CN109564189A CN 109564189 A CN109564189 A CN 109564189A CN 201780048325 A CN201780048325 A CN 201780048325A CN 109564189 A CN109564189 A CN 109564189A
Authority
CN
China
Prior art keywords
data
electrophorogram
dyestuff
original
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780048325.9A
Other languages
English (en)
Other versions
CN109564189B (zh
Inventor
大卫·金
布鲁斯·戈德曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Integenx Inc
Original Assignee
Integenx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Integenx Inc filed Critical Integenx Inc
Publication of CN109564189A publication Critical patent/CN109564189A/zh
Application granted granted Critical
Publication of CN109564189B publication Critical patent/CN109564189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • G01N27/44717Arrangements for investigating the separated zones, e.g. localising zones
    • G01N27/44721Arrangements for investigating the separated zones, e.g. localising zones by optical means
    • G01N27/44726Arrangements for investigating the separated zones, e.g. localising zones by optical means using specific dyes, markers or binding molecules
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • G01N27/44717Arrangements for investigating the separated zones, e.g. localising zones
    • G01N27/44721Arrangements for investigating the separated zones, e.g. localising zones by optical means

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了用于分析原始电泳图谱数据的方法。一些方法包含从原始电泳图谱数据中提取作为时间或位置的函数的颜色数据,从电泳图谱中选择一个或多个含有第一种染料的颜色数据并且基本上不含来自电泳中使用的其它染料的颜色数据的峰。所述方法还包含确定所述第一种染料的色谱,并且使用所述第一种染料的所述色谱对所述原始电泳图谱数据的颜色数据进行去卷积,以分离每种染料对所述原始电泳图谱数据的贡献。本发明还公开了用于产生电泳图谱的***和装置。

Description

电泳图谱分析
相关申请的交叉引用
本申请要求于2016年12月9日提交的美国临时专利申请第62/432,512号的权益,所述申请通过引用整体并入本文且用于所有目的。
背景技术
电泳是分散粒子在空间均匀电场的影响下相对于流体的运动。这可能是由粒子表面和周围流体之间存在的带电界面所引起。电泳是生物化学中多种用于按照大小、电荷或结合亲和力分离分子的分析技术的基础。电泳和其它分离技术有时使用另外两种染料来区分两种或更多种核酸序列或其它特征。
发明内容
本公开的一个方面涉及从原始电泳图谱数据产生电泳图谱的方法,所述原始电泳图谱数据包括一系列一个或多个峰,每个峰包括作为波长和时间或位置的函数的信号强度值,并且每个峰对应于一个或多个唯一大分子,每个大分子由多种不同染料中的一种进行标记。每个峰具有来自一种或多种所述染料的光谱贡献。这些方法可以通过以下操作表征:(a)接收所述原始电泳图谱数据;(b)对于所述多种不同染料中的第一种染料,从所述原始电泳图谱数据中选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰;(c)从(b)中识别的所述一种或多种颜色峰中确定所述第一种染料的色谱,其中,所述第一种染料的所述色谱包括仅作为所述第一种染料的波长函数的信号强度值;以及(d)使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱,对所述原始电泳图谱数据进行去卷积。所述去卷积可以将每一种所述染料对所述原始电泳图谱数据的贡献分离,并产生所述电泳图谱。
在一些实施例中,一种方法包括对所述多种不同染料中的至少一种所述其它染料重复操作(b)到(c)。换句话说,对于每次通过(b)到(c),使用不同的一种其它染料替换第一种染料。在一些实施例中,一种方法包括对每一种所述不同染料重复操作(b)到(c)。
在某些实施例中,所述大分子是来自基因组或染色体的另外两个基因座的DNA序列的扩增反应的扩增子。在一些情况下,所述基因组是人类基因组。在一些情况下,所述基因座位于多态性位点。在一些情况下,所述多态性位点是STR位点。在一些情况下,至少存在约十六个基因座和/或至少三种染料。在某些实施例中,所述方法还包含使用所述电泳图谱识别形成产生所述原始电泳图谱数据的样品的个体的等位基因。
在某些实施例中,所述方法还包含对包含所述大分子的样品执行电泳。在这样的实施例中,执行电泳会生成所述原始电泳图谱数据。请注意,所述方法在执行电泳之前还可以包含一个或多个样品制备操作。这样的操作可以包含,例如,获得样品(例如,犯罪现场样品或口腔样品),从样品中提取细胞,裂解细胞,从样品中提取核酸,扩增核酸或整个基因组的特定基因座等。
在某些实施例中,在五十到五百个不同颜色通道(例如,分光光度计的通道)之间提供颜色数据。在一些情况下,使用分光光度计获得所述颜色峰的所述信号强度与波长数据。
在某些实施例中,选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰包含:应用标准以便从所述原始电泳图谱数据中选择一个或多个基本上隔离的且基本上为纯光谱的颜色峰。在一些实施方式中,所述标准包含识别具有在波长维度上单调增加或减少的部分的颜色峰(所述波长维度上的位置表示不同的波长)。在一些实施例中,所述标准包含识别具有在至少预定值的波长维度上具有斜率的部分的颜色峰。在一些实施例中,所述标准包含识别至少通过阈值持续时间或位置差异与其它峰分离的峰。
在一些实施方式中,应用所述标准以便选择一个或多个基本上隔离的且基本上为纯光谱的颜色峰来识别多个基本上隔离的且基本上为纯光谱的峰。在一些情况下,所述方法还包含以下操作:组合所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱,以产生所述第一种染料的所述色谱。组合所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱可以包含:产生所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的加权平均值。产生所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的加权平均值可以包含:根据所述基本上隔离的且基本上为纯光谱的颜色峰的峰高和/或峰宽,对所述基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的每一个进行加权。
在某些实施例中,所述方法还包含:(i)将所述多个基本上隔离的且基本上为纯光谱的颜色峰相关联以识别所述多个峰的子集,所述子集中的多个峰与不在所述子集中的所述多个峰之外的其它峰相比具有更高的相关性;以及(ii)将所述基本上隔离的且基本上为纯光谱的峰的子集组合以产生所述第一种染料的所述色谱。
在某些实施例中,所述方法还包含从所述第一种染料的所述色谱和所述多种不同染料的所述其它染料中制备校准矩阵。在这样的实施例中,使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱,对所述原始电泳图谱数据进行去卷积包含:将所述校准矩阵应用到所述原始电泳图谱数据。在一些实施方式中,所述校准矩阵包含所有所述多种不同染料的色谱。
在一些实施方式中,采用单个样品产生所述原始电泳图谱数据和所述一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多个不同染料中任何其它染料的信号强度的颜色峰。
在某些实施例中,所述大分子是寡核苷酸。在某些实施例中,产生所述原始电泳图谱数据的唯一大分子的数量大于标记所述唯一大分子的不同染料的数量。在某些实施例中,所述方法还包含使用所述电泳图谱识别与所述原始电泳图谱数据中的峰对应的大分子。
本公开的另一个方面涉及可以通过以下特征表征的***:(a)毛细管,其布置成接收包括多个唯一大分子的样品并且使所述样品通过所述毛细管,使得不同的所述唯一大分子在不同时间穿过所述毛细管的询问区域;(b)光学元件,其相对于彼此设置以从所述询问区域接收颜色信号;以及(c)控制器,其用于对染料执行内部校准。在某些实施例中,所述控制器设计或配置成执行或促使执行以下操作:(i)将所述颜色信号转换为包括一系列峰的原始电泳图谱数据,每个峰包括作为波长和时间或位置的函数的信号强度值,并且每个峰对应于一个或多个唯一大分子,每个大分子由多种不同染料中的一种进行标记,其中,每个峰具有来自一种或多种所述染料的光谱贡献,(ii)对于所述多种不同染料中的第一种染料,从所述原始电泳图谱数据中选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰,(iii)从(ii)中识别的所述一种或多种颜色峰中确定所述第一种染料的色谱,其中,所述第一种染料的所述色谱包括仅作为所述第一种染料的波长函数的信号强度值,以及(iv)使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱,对所述原始电泳图谱数据进行去卷积,以分离每一种所述染料对所述原始电泳图谱数据的贡献并产生所述电泳图谱。
在某些实施例中,所述控制器进一步设计或配置成执行或促使执行一个或多个上述计算方法操作。所述控制器可以接收、存储或生成可执行的项目指令,以促使所述方法操作中任一项得以执行。
本公开的另一个方面涉及分析样品的方法,所述样品包括一种或多种由多种不同染料中的一种标记的唯一大分子。这些方法可以通过以下操作表征:(a)对所述样品执行电泳运行以产生包括一系列峰的第一原始电泳图谱数据,每个峰对应于一个或多个所述唯一大分子,其中,每个峰具有来自所述多种不同染料中的一种或多种的光谱贡献;(b)分析所述第一原始电泳图谱数据并从与所述大分子相关联的所述多种不同染料中识别未校准染料,所述未校准染料的基本上纯的光谱未从所述原始电泳图谱数据中识别出;(c)从相关电泳运行的第二原始电泳图谱数据中识别所述未校准染料的基本上纯的光谱;以及(d)使用来自所述第二原始电泳图谱数据的所述未校准染料光谱的所述基本上纯的光谱,对所述第一原始电泳图谱数据进行去卷积,以分离所述多种不同染料中的每一种对所述第一原始电泳图谱数据的贡献,从而产生第一电泳图谱。
在某些实施例中,所述方法还包含以下操作:从所述第一原始电泳图谱数据中提取多通道颜色数据作为时间或位置的函数,其中,所述颜色数据表示来自所述多种不同染料的所述光谱贡献。
在某些实施例中,所述相关电泳运行是在与用于产生所述第一原始电泳图谱数据的相同装置上运行的下一顺序电泳。在某些实施例中,所述第一原始电泳图谱数据和所述第二原始电泳图谱数据是由在单个装置中相同位置处进行的运行产生的。在某些实施例中,所述第一原始电泳图谱数据和所述第二原始电泳图谱数据是由在单个装置中两个不同位置处同时进行的运行产生的。
在一些情况下,所述方法还包含:在对所述第一原始电泳图谱数据进行去卷积之前,缩放所述第二原始电泳图谱数据中所述未校准染料的所述基本上纯的光谱。所述缩放可以涉及使用获得的关于第一经校准染料的光谱的信息来修改所述未校准染料的所述基本上纯的光谱,所述第一经校准染料的光谱由所述第一原始电泳图谱数据和所述第二原始电泳图谱数据获得。
在某些实施例中,唯一大分子的数量大于不同染料的数量。在某些实施例中,所述第一原始电泳图谱数据的每个峰包括作为波长和时间或位置的函数的信号强度值。
本公开的又一个方面涉及可以通过以下元件表征的***:(a)毛细管,其布置成接收包括多个唯一大分子的样品并且使所述样品通过所述毛细管,使得不同的所述唯一大分子在不同时间穿过所述毛细管的询问区域;(b)光学元件,其相对于彼此设置以从所述询问区域接收颜色信号;以及(c)控制器,其可以由从相关电泳运行(与执行校准的运行相关)获得的染料校准光谱产生或促进产生电泳图谱。在某些实施例中,所述控制器设计或配置成执行或促使执行以下操作:(i)将所述颜色信号转换为包括一系列峰的原始电泳图谱数据,每个峰对应于所述多个唯一大分子中的一个或多个,所述大分子由多种不同染料中的一种进行标记,(ii)对所述样品执行电泳运行以产生包括一系列峰的第一原始电泳图谱数据,每个峰对应于一个或多个所述唯一大分子,其中,每个峰具有来自所述多种不同染料中的一种或多种的光谱贡献,(iii)分析所述第一原始电泳图谱数据并从与所述大分子相关联的所述多种不同染料中识别未校准染料,所述未校准染料的基本上纯的光谱未从所述原始电泳图谱数据中识别出,(iv)从相关电泳运行的第二原始电泳图谱数据中识别所述未校准染料的基本上纯的光谱,以及(v)使用来自所述第二原始电泳图谱数据的所述未校准染料光谱的所述基本上纯的光谱,对所述第一原始电泳图谱数据进行去卷积,以分离所述多种不同染料中的每一种对所述第一原始电泳图谱数据的贡献。这可以产生或促进产生第一电泳图谱。
在某些实施例中,所述控制器进一步设计或配置成执行或促使执行本公开的前述方面的一个或多个所述计算方法操作。所述控制器可以接收、存储或生成可执行的项目指令,以促使所述方法操作中任一项得以执行。
下文将参照相关附图对本公开的上述及其它特征进行更详细的描述。
附图说明
图1呈现了配置用于进行样品制备(例如裂解,核酸提取和核酸扩增)然后进行电泳的装置的示意图。
图2呈现了可以用于对原始电泳图谱数据进行去卷积的矩阵操作的简化示例。
图3呈现了可以根据本文公开的某些方法分析的原始电泳图谱数据的示例。
图4呈现了可以根据本文描述的某些方法从原始电泳图谱数据中产生的电泳图谱的示例。
图5呈现了当以长曝光时间操作电泳光学***时可以获得的原始电泳图谱数据的示例。
图6呈现了当以短曝光时间操作电泳光学***时可以获得的原始电泳图谱数据的示例,以用于对比目的。
图7是示出了如何一起使用长曝光扫描数据和短曝光扫描数据来提供改进的原始电泳图谱数据的过程流程图。
图8呈现了可以使用长曝光扫描数据和短曝光扫描数据产生的嫁接电泳图谱数据的示例。
图9是示出了如何在样品中从生成原始电泳图谱数据的染料的原始电泳图谱数据中获得纯光谱的校准数据的过程流程图。
图10是描绘了如何在样品外从生成原始电泳图谱数据的染料的原始电泳图谱数据中获得纯光谱的校准数据的过程流程图。
图11呈现了根据本文某些实施例的可以用于制备用于电泳的样品的分析物制备模块的示意描绘。
图12呈现了可以根据本文某些实施例使用的毛细管电泳***的分析模块的示意图。
具体实施方式
简介
虽然本文示出并描述了本发明的各种实施例,但是本领域技术人员应当理解,这些实施例仅通过示例的方式提供。在不脱离本发明的情况下,本领域技术人员可以想到多种变化、改变和替换。应当理解,可以采用本文所述的本发明实施例的各种替代方案。
如本文所使用的,术语“样品”是指含有生物材料的样品。样品可以是例如流体样品(例如,血液样品)或者组织样品(例如,面颊拭子)。样品可以是较大样品的一部分。样品可以是具有核酸的生物样品,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)或蛋白质。样品可以是法医样品或环境样品。样品可以在引入***之前进行预处理;预处理可以包含从不适合***的材料中进行提取,对细胞量、DNA或其它生物聚合物或分子的数量进行量化,浓缩样品,将例如***之类的细胞类型与上皮细胞相分离,使用例如珠粒处理或其它浓缩方法对DNA进行浓缩,或者其它样品操纵方式。样品可以在载体中携带,例如拭子,擦拭物,海绵,刮刀,材料冲压件,目标分析物飞溅其上的材料,食物样品,分析物在其中溶解的液体,例如水、苏打水。样品可以是直接的生物样品,例如血液、***、唾液之类的液体;或者是固体,例如固体组织样品、肉或骨。
术语“染料”用于指可以通过其电磁波谱检测和分类的任何化合物或组合物。染料通常在特定的窄光谱带中发射、透射或吸收电磁辐射,所述光谱带可以位于电磁波谱的可见光、红外线、紫外线或其它区域。在本公开的上下文中,染料可以与特定基因组基因座的隔离的等位基因序列相关联(例如,通过化学和/或物理方式结合)。以这种方式,染料的特征可以与电泳图谱中的基因组基因座相关联。在某些实施例中,染料是荧光团。其它示例包括能量转移络合物和猝灭络合物。
术语“运行”是指单个样品在单个毛细管中进行电泳一次。相同的样品可以稍后在相同或不同的装置中重新运行,或者在同一装置中但使用不同的毛细管同时重新运行。因此,运行对于装置/毛细管和特定时间是唯一的。可以使用相同的检测装置但使用不同的毛细管,同时进行多次运行。
术语“电泳图谱”是指描绘了在电泳运行中由染料发射的光随时间的强度图,或在电泳运行期间(例如在毛细管上)随位置的强度图。在一些情况下,电泳图谱呈现针对多种染料发射的光的复合图形,所有这些都在相同的时间轴上。
染料发出的光由染料的“色谱”表征,所述“色谱”是染料在被激发时发出的光的波长的相对强度。
术语“原始电泳图谱数据”是指在电泳运行中作为时间或位置的函数收集的多个不同波长中的每一个下的光强度。在某些实施例中,可以通过分光光度计在约100个不同波长的每一个下测量光强度。这些光强度可以由单一染料或染料组合产生。例如,如果两种染料在时间x(或位置x)和波长y处发光,则时间x和波长y的原始电泳图谱强度值将基于来自两种染料的贡献。
染料发出的光强度可以通过染料的色谱作为原始电泳图谱数据的贡献的函数来测量。可以使用例如本文描述的矩阵运算之类的去卷积过程来确定所述贡献。在一些实施例中,电泳图谱中特定时间点的特定染料的强度由标量表示,所述标量对应于在该时间点的可检测分析物(例如,扩增的STR)的浓度的量。去卷积可以提供一个时间点处原始数据中每种染料的绝对量,所述量可以表示为电泳图谱中应有峰的高度。在一个示例中,染料在一个时间点的强度是通过将染料的色谱与电泳图谱的最小二乘拟合来确定的。例如,电泳图谱峰下的面积与提供染料信号的分析物的“量”的染料的“强度”有关。
***概览
在某些实施例中,装置配置成用于获得并分析电泳图谱;所述装置在本文中也称为仪器或***。所述装置运行并读取电泳图谱。在某些实施例中,其部件包括毛细管,试剂,用于将试剂输送到毛细管的射流,用于从染料读取信号的光学***,以及用于协调所有其它部件的操作的控制***。毛细管各自包括询问区域,在询问区域中,产生荧光信号并读取(通过电泳)移动通过毛细管的扩增子。光学***可以包括:激发源,其用于将激发光引导到毛细管的询问区域中的荧光团(或响应光激发的其它染料);检测***,其用于读取从荧光团或询问区域中的其它染料发出的辐射;以及几何光学元件(例如,透镜,反射镜,分束器,孔等),其用于将来自激发源的光耦合到询问区域,并且用于将来自询问区域的光耦合到检测***。检测***可以是分光光度计或者可以检测多个不同波长的辐射量级信息(例如,辐射强度)的任何其它***。分光仪配有光学检测器,例如CCD或光电倍增管阵列。光通过光栅或类似元件分离成光谱分量。一种备选的检测***包括一系列分束器和光电探测器,其中分束器根据波长过滤光。在2015年10月21日提交的美国专利申请公开2016/0116439中描述了合适的检测装置的另一个示例,所述申请通过引用整体并入本文。
图1显示了在一些实施方式中用于样品处理和分析的***。***1900可以获得电泳图谱并从电泳图谱中分析核酸谱。图5和图6显示了可以收集的原始电泳图谱数据的两个示例。图8显示了从收集的数据中生成的核酸谱(电泳图谱)的示例图。
***1900可以包括样品制备子***,样品分析子***和控制子***。
***1900的样品制备子***可以包括:样品盒接口103,其配置成通过狭槽接合样品盒;试剂源,其用于执行生物化学方案;射流组合件,其配置成在样品制备子***内移动试剂。射流组合件可以包括泵,例如注射泵。所述泵可通过阀门流体地连接到试剂(例如水和裂解缓冲液)的出口并连接到空气源。泵可以配置成通过流体管线将裂解缓冲液和水输送到样品盒。
样品分析子***可以包括电泳组合件,其包括阳极,阴极以及与阳极和阴极电连通并流体连通的电泳毛细管,以及在样品盒中的样品出口与到毛细管的入口之间连通的样品入口。这些可以包含在例如电泳盒104中。样品分析子***可以进一步包括光学组合件,所述光学组合件包括相干光源,例如激光器,光具组,所述光具组包括例如透镜和检测器,其配置成与电泳毛细管对准并检测其中的光学信号(例如荧光)。在一个示例中,电泳盒还包含电泳分离介质源,并且在一些情况下,包括液体试剂源(例如水和裂解缓冲液),其通过电泳盒中的出口输送到***。用于电泳的分离通道可以采用两种主要形式。一种形式是“毛细管”,其是指通常为圆柱形的长型结构。另一种是“微通道”,其是指微流体设备(例如微流体片或板)中的微流体通道。
控制子***可以包含编程为操作***的计算机。控制子***可以包括用户接口101,其接收来自用户的指令,所述指令发送到计算机并将信息从计算机显示给用户。用户界面101可以如2016年4月28日公开的美国专利申请公开第2016/00116439号中所述,所述申请通过引用整体并入本文。在一些情况下,控制子***包含通信***,所述通信***配置成将信息发送到远程服务器并从远程服务器接收信息。
电泳图谱分析
下面进一步描述了用于分析电泳图谱的方法和***。虽然本文的大部分讨论使用电泳,并且特别是STR电泳(作为一个示例),但所公开的方法和***具有其它应用。一般,它们适用于任何生物化学或生物分析技术,这种技术采用不同的染料来识别不同的大分子基因座或在空间和/或时间上分离的其它生物学特征。核酸测序和流式细胞术是使用与不同生物学特征(例如,唯一核酸序列和唯一细胞)相关的不同染料的其它分析技术的示例,并且因此可以使用本文描述的方法和***。例如,所述方法和***可以帮助识别测序仪的单独读数和/或细胞仪中的不同细胞。
1.电泳图谱设计:扩增基因组的多个基因座,并且通过不同的荧光染料识别每个基因座。
当电泳***采用的基因座比染料更多时,则重复使用一些染料,并且在一些情况下重复使用所有染料。在一个示例中,存在二十四个基因座和六种染料。在一些实施方式中,仅使用单个电泳图谱。每个基因座的PCR引物与染料连接。以这种方式,来自基因组基因座的PCR产物(扩增子)由单一染料标记,因此将特定基因座与特定染料相关联。
STR电泳图谱变量的范围示例:
染料数量:一到大约十种或者大约三到八种。出于讨论的目的,通常将使用六种作为示例。
通道数(检测且电子装箱的光学波长):大约十到三千个,或者大约五十到五百个。出于本讨论的目的,通常将使用100作为示例。
毛细管(泳道)的数量:大约一到五百个,例如大约十个;IntegenX提供的一些电泳图谱生成装置仅使用一个毛细管,而一些则使用八个毛细管。当使用八个时,通常将其中的七个用于不同的样品(有时来自七个不同的个体),并且使用一个用于对照,例如等位基因分型标准物。
基因座数:二到大约五十个,或者大约十六到二十六个。在某些核酸测序应用中可以考虑更多。
变量组合:在某些实施例中,电泳以大于1:1的比例,采用多个唯一基因座和多个唯一染料。例如,所述比例可以是至少约2:1,或至少约4:1,或至少约8:1,并且在一些情况下甚至大于约20:1。在某些实施例中,电泳以至少约1.5:1,或者至少约10:1,或者至少约15:1,或者至少约20:1的比例,采用多个颜色通道和多个唯一染料。
出于本讨论的目的,通常将使用二十四个作为示例。应当注意的是,为每个基因座提供了唯一的PCR引物对。
方便起见,本公开将会经常涉及其中存在100个通道、六种染料、二十四个基因座和一个毛细管(泳道)的实施例。在任何时候使用这些值中的一个时,应当理解可以替换成其它值,特别是在本文所述范围内的值。
2.在电泳运行期间,分光光度计从询问区域读取光强度信号,并且在多个通道(例如,100个光谱数据通道)中产生光学数据。
用于运行的完整多通道数据采集含有在电泳毛细管的询问区域处的多个时间点的连续光谱发射数据。得到的数据是作为时间函数的多通道(颜色)量级值。时间对应于PCR扩增基因座(例如,STR基因座)的扩增子的大小(相对于电荷的长度或质量)。根据装置设计,可以并行读取多个毛细管电泳图谱(例如,大约八个)。从技术上讲,在多通道数据采集期间收集的数据可以称为原始电泳图谱数据。这些数据包含在毛细管或其它电泳介质中作为波长和时间(或位置)的函数的信号强度值。参见图3(z方向上的强度和水平方向上的波长和时间)。本文描述的方法将原始电泳图谱数据转换成电泳图谱,呈现了作为时间或位置的函数的各个染料的强度。换句话说,所述过程将原始强度/波长数据转换成表示存在与通过电泳分离的各个大分子相关联的各个染料的数据。
3.将光谱扫描的原始电泳图谱数据去卷积成不同的光谱峰,每个光谱峰对于所述过程中使用的特定一种染料而言是唯一的。
原始信号提供分光光度计的所有100个通道(或一些其它数量的通道,这取决于分光光度计的设计)的量级,并且因为来自不同染料的峰在光谱组成和时间(这对应于DNA扩增子片段的大小和电荷)上重叠,多种染料可能会在任何时刻对信号有贡献。换句话说,在原始电泳图谱数据中的特定时间,多种染料可能对特定通道的量级值有贡献。为了将所述原始量级数据去卷积成唯一染料的单个光谱峰值,所述过程需要在电泳图谱运行中使用的每种染料的校准信息(例如,纯光谱)。
各种去卷积技术是本领域技术人员已知的。例如,参见J.M.Butler,“法医DNA分型的高级主题(Advanced Topics in Forensic DNA Typing)”;《方法论(Methodology,)》,第150-158页(2012),爱思唯尔公司(Elsevier,Inc.),其通过引用整体并入本文。
校准用于单个仪器;即,此处描述的过程仅用于单个仪器。每种仪器都按照此处描述的方式单独校准。由于例如温度之类的环境操作条件的变化,机械变化会使光学检测装置中的部件发生位置变化。这些变化通常大到需要进行新的校准。校准应尽可能经常进行,理想情况下每次运行校准一次。
4.从样品中获得染料的光谱
电泳图谱中使用的每种染料的校准信息是从用作电泳图谱数据的实际样品中获得的。这样做的好处在于为手边的实际样品提供准确的校准。比较在特定条件下和在某个时间或在操作条件下获取校准数据的情况,所述操作条件可能无法为使用校准信息的电泳图谱提供适当的校准表示。
在本文的某些实施例中,为每次运行单独进行校准,并且仅使用来自该运行的校准信息(例如,染料的纯光谱)。在一些实施例中,运行的校准使用来自当前运行的一些信息和来自相关运行的其它信息。相关运行可以是在所考虑的运行之前或之后不久(例如,立即)在同一仪器上执行的当前运行。更普遍地,相关运行可以是获得有效染料校准数据的最近运行。相关运行还可以是同时在同一仪器上进行但是不同电泳毛细管的运行。应当注意的是,由于两个毛细管之间在光学***和/或仪器的其它特征方面存在几何差异,两个毛细管在单个仪器中同时且使用相同试剂运行,可能有轻微光谱偏移的纯染料光谱。
在一些实施方式中,获得染料的至少一个纯光谱,然后将其用于校准矩阵中以进行光谱去卷积。在一些实施方式中,获得染料的多个纯光谱,其可以经归一化、平均或以其它方式组合以提供形成校准矩阵的值。
在一些实施方式中,可能无法从运行中的数据获得特定染料的纯光谱。在这种情况下,特定染料的纯光谱可以从一种或多种其它染料的一个或多个光谱中得到。在一些实施方式中,特定染料的纯光谱与一种或多种其它染料的光谱的关系,可以从不同的运行或者不同的泳道或毛细管中获得。所述关系还可以从使用类似染料和硬件获得的预先记录的数据中获得。这样的关系可以用于从所考虑的运行中的一种或多种其它染料的光谱推断,以获得特定染料的光谱。
5.应用校准信息
要去卷积的原始电泳图谱数据是以给定时间点时例如100个通道的颜色数据的形式提供。电泳图谱中的峰表示存在基因组数据(以及与生物学特征相关的染料)。在一些实施方式中,峰包括约3到50个时间点。出于进一步讨论的目的,每个峰的典型时间点数是10。每个时间点的数据都是独立处理的。峰中任何点的100通道颜色数据必须去卷积成六种不同染料(或者与样品处理中采用的同样多的染料)的信息。
从样品获得校准信息,并且对于每种染料,校准数据表示为100个量级(例如,光度计强度)值,分光光度计的每个通道对应一个。换句话说,染料的校准数据包含100个值,每个通道对应一个信号量级。
例如,利用以校准矩阵的形式组织的校准数据来完成去卷积。对于数据中的给定时间点,校准矩阵有效地将100行的向量(每个来自100个通道的数据对应一行)转换为六行的向量(每种染料对应一行)。这是通过100列乘以6行的矩阵实现的。
所需校准矩阵由100行和6列的“泄放”矩阵的伪逆获得。六列表示已校准的六种不同染料的光谱,而100行表示分光光度计的100个通道。
图2示意性地显示了如何获得校准矩阵302并将其用于对列向量304中的原始电泳图谱数据进行去卷积的简化示例。矩阵301是具有六列的“泄放”矩阵,每列表示对应于六种染料之一的纯光谱的数据。为了更简单的说明,“泄放矩阵”的每列仅有12行表示12个颜色通道,而不是100行代表100个颜色通道,如上例所解释的。实际上,可以有如上所述100或更多个通道,其可以在矩阵中由100行或更多行表示。
由泄放矩阵301中左起第一列表示的第一种染料在顶部开始的第二个颜色通道处具有强度峰。所述第一种染料的色谱在前三个颜色通道中的值为1、2和1。由第二列表示的染料在第11个颜色通道处具有色谱峰,在第10、11和12个颜色通道处的信号幅度为1、2和1。由校准矩阵中的第三列表示的第三种染料在第五个颜色通道中具有峰。类似地,由校准矩阵中的第四列呈现的第四种染料在第六个颜色通道处具有色谱峰。由校准矩阵中的第五列呈现的第五种染料在第七个颜色通道处具有色谱峰。由校准矩阵的第六列呈现的第六种染料在第八个颜色通道处具有色谱峰。
列向量304示出了表示单个时间点的原始电泳图谱数据的列向量的简化示例。列向量304具有12行,每行呈现一个颜色通道的电泳图谱数据。
由列向量304表示的原始数据包含以第二个颜色通道(从顶部开始)为中心的峰,其在前三个颜色通道中的示意性数据值为1、2和1。实际上,实际数据值可以是不同的,例如高达数千RFU的值。由列向量304表示的原始电泳图谱数据还包含第11个通道的通道处的峰,其在第10到第12个颜色通道的数据值为1、2和1。
为了对原始数据的列向量304进行去卷积以获得每种染料的值,在一些实施方式中,可以通过Moore-Penrose伪逆从泄放矩阵301获得校准矩阵302。在其它实施方式中,可以使用单值分解技术从泄放矩阵301获得校准矩阵302。
校准矩阵302具有六行,每行对应一种染料。校准矩阵302具有12列,每列对应一个颜色通道。当校准矩阵302乘以原始电泳图谱数据的列向量304时,获得具有六行的列向量306,每行表示六种染料中的一种检测到的信号的强度或幅度。可以对列向量的值进行归一化以用于下游处理。在所述简化的示例中,可以看出列向量304在顶部第二个颜色通道处和从顶部从底部第11个颜色通道处具有峰。这两个峰对应于由第一和第二行校准矩阵呈现的两种染料的光谱峰。如此,列向量306提供了在对列向量304的原始数据进行去卷积之后的六种染料的值。
6.如何获得每种染料的校准数据
在本公开中,校准数据是每种染料的光谱。寻找这样的光谱依赖于找到与单一染料相关联未被其它染料污染的光谱峰。用于创建校准矩阵的校准数据采用运行中使用的每种染料的染料光谱的形式。每个染料光谱含有每个颜色通道的量级值(波长)。通常,非零值集中在相对较小的光谱区域中。
在某些实施例中,通过识别确定为未被来自其它染料的信号污染的特定颜色峰(例如,作为特定时间点的波长函数的强度),从样品原始电泳图谱数据中获得染料光谱。通过考虑三维原始数据峰形式的信号信息来识别未被污染的颜色峰,其中一个维度是峰的量级(通常为信号强度)(或者构成所述峰的颜色通道中的读数的量级),另一个维度是(例如,在毛细管的询问区域)记录峰的时间,而第三个维度是与峰相关联的波长/颜色信息。通过简单地识别整体具有显著斜率并且与最接近的其它量级的峰(在时间上)合理分离的高量级值的群组,可以及时对峰进行解析。
原始电泳图谱数据可以以三维阵列提供。每个数据点包括具有从分光仪记录的100个装箱颜色的强度的时间值。参见图3,其中垂直(z方向)轴表示信号强度(量级),长水平轴表示时间(或位置),并且短水平轴表示颜色或波长。将这些数据点的痕迹转换成三维阵列,利用6种染料强度替换100种颜色。参见图4,其中不同的色带表示不同染料。该结果可以视为电泳图谱。
为了识别潜在的纯染料峰,可以基于波长维度中的斜率来表征量级数据。基于分光光度计的颜色通道将波长维度分成位置。在图3所示的示例中,使用了100个通道。通道按波长顺序排列。
因为染料在窄波长带内发出辐射,所以在波长维度上具有陡峭斜率的颜色峰表明该峰中的颜色来自单一染料。这些峰是用于校准其所代表的染料的候选峰。可以考虑波长维度中的各种标准。例如,峰的上升沿和/或下降沿可能需要单调增加和减少。另外,上升沿和/或下降沿可能需要具有至少预定值的斜率。
进一步地,可以选择在已知由特定染料发出的波长处具有平均值或其它中心趋势的峰。如果颜色峰的特征波长大于到所考虑的染料的波长的阈值距离(例如,5或10nm),则考虑丢弃颜色峰。
对于每种染料,该过程识别出一种或多种潜在的纯光谱颜色峰。再一次,这是通过识别在光谱上和时间上紧凑并且在时间上与最近的邻峰合理分离的颜色峰来完成的。在一些识别出多个候选颜色峰的情况下,识别出有限数量用于校准。在一个实施例中,所述过程通过考虑候选峰的光谱之间的相关性从候选峰中选择特定染料的峰。选择显示最强相关性的那些颜色峰用于校准。例如,使用十个最相关的颜色峰,或者使用五个最相关的颜色峰,或者使用三个最相关的颜色峰,或者使用两个最相关的颜色峰。在备选实施例中,仅使用单个颜色峰值。在一些情况下,所述过程将考虑尽可能多的颜色峰,以满足紧凑性和分离标准(或者用于选择候选峰的任何标准)。如果仅识别出单个颜色峰,则仅将所述峰用于校准所考虑的染料。
可以使用各种相关性统计测量来关联两个光谱,包括但不限于皮尔森相关系数,斯皮尔曼秩相关系数,肯德尔tau秩相关系数,随机化依赖系数,多色相关和其它距离相关技术。
如果选择多个候选颜色峰用于染料光谱以进行校准,可以对所选峰的光谱进行平均或以其它方式组合以提供单一染料光谱。在一个示例中,对每个所选颜色峰的光谱进行归一化,然后逐个通道进行平均。换句话说,对所选颜色峰的每个通道的量级值进行平均,以提供平均染料光谱用于校准。在一些情况下,使用加权平均数来对峰进行平均,其中权重可以通过与颜色峰的可能可靠性相关联的参数来确定。这些参数的示例包括(i)图心、平均值或颜色峰的其它中心趋势的大小(例如,信号强度),对更大的量级赋予更大的权重,以及(ii)峰宽,对更窄的峰赋予更大的权重等。在一些示例中,将染料的三个单独峰组合以制备染料的纯光谱。在如上所述的校准矩阵中使用最终染料光谱。
7.备份分析
当无法从样品中识别单个染料峰时,可以采用备份程序。这种情况可能出现在非常复杂的样品中,例如“等位基因分型标准物”,其为包含样品的所有可能等位基因的测试样品。这些样品在所有染料颜色中具有如此多的峰以致于很难找到任何纯的(即,可以由单一染料产生的)峰。
每种染料的过程步骤:
a.确定当前样品是否包含通过例如上述方法生成纯光谱的信息。如果是,使用所述纯光谱校准当前样品。
b.如果(a)不成立,使用仪器采集的最新样品的校准信息。然而,如有必要,则对其进行缩放,以考虑进行校准时的时间与当前时间之间可能存在的变化。
应当注意的是,校准数据不需要从使用仪器分析的最新样品中获取。它可以从仪器中随后分析的样品中获取。或者它可以从并行或先前运行中使用的另一个毛细管中获取。如上所述,一些仪器配置成并行运行多个样品。在理想情况下,使用每个毛细管运行为每种染料产生其自己的校准信息。
c.识别缩放-识别至少一种可以从当前样品中为其产生纯光谱的不同染料(即,具有与所考虑的一种或多种染料的颜色不同的染料)。换句话说,所述过程会识别出满足(a)的要求的染料。将所述染料的来自当前样品的纯光谱与所述染料的来自最新样品的纯光谱(即用于校准当前样品的纯光谱)进行比较。当前样品与最近样品中携带的染料的光谱之间的关系定义了应用于从最近样品(即,不满足(a)的要求的染料的样品)中获取的其它染料的纯光谱的缩放。这些先前确定的染料光谱的缩放版本用于校准当前样品。缩放可能涉及光谱偏移和/或峰形变化。
应当注意的是,在一些实施例中,每次运行包含含有已知长度的DNA片段并且具有已知染料的校准物。这些片段中的一些比样品中可能存在的任何等位基因的片段更大。结果,在与这种大片段相关联的数据区域中发现的颜色峰值保证仅含有来自单一染料(例如,橙色)的信号。来自这些颜色峰的信号用于识别产生颜色峰的染料的纯光谱。所述光谱可以用在所考虑样品的校准矩阵中。它还可以用于缩放不符合(a)的要求的染料的光谱。
应当注意的是,在其它实施例中,另外的光谱校准染料可以与DNA片段结合并与样品一起运行。这种校准片段的长度与样品中含有的任何片段长度基本上不同。这种校准染料在与来自样品的PCR产物(或其它大分子)结合的那些染料基本上不同的波长区域中发光。来自所述另外的校准染料的数据可以如上所述用于缩放不满足(a)的要求的染料的光谱。
d.对于从相关运行中获取的任何纯染料光谱,应用针对纯光谱识别的任何缩放(例如,波长偏移或光谱形状变化)。移位可以是观察到的中心趋势(例如,平均值或中值)或图心或作为波长函数的其它峰特征的变化。可以以多种方式修改光谱形状。一种方法是对每种染料光谱进行归一化,然后将原始光谱形状乘以(c)中识别的缩放染料之前和当前之间的缩放差异。
8.信号饱和
在一些实验条件和硬件环境中,在捕获和分析电泳图谱数据时存在信号饱和问题。一方面,如果光检测传感器使用长曝光时间捕获光,信号可能对于高强度数据变得饱和。另一方面,如果以短曝光时间捕获光,信号的强度或信噪比可能过低而无法提供良好结果。图5和图6显示了说明所述问题的两个电泳图谱数据图。在图5中,以长曝光时间捕获原始电泳图谱数据。水平轴示出了指示DNA分子大小的扫描指数。垂直轴示出了相对荧光单位(RFU)的信号强度。
在水平轴上大约5到大约9的范围内的检测数据具有相对较好的强度水平。当使用较短的曝光时间捕获相同的样品信号时,结果是不一样的,如图6所示。图5中的数据峰606对应于图6中的数据峰706。数据峰606具有相对较强的强度,其可以为电泳图谱分析提供良好的信号。相反,图6中的数据峰706较低,这可能不足以提供充分的信号。
图5中所示的长曝光数据在水平轴上大约5到大约9的范围内提供良好的信号。然而,水平轴的大约4到大约5的范围内的数据存在相反的问题。图5中的信号峰602和604是饱和的。这种饱和会导致信息丢失,使得其不能区分数据峰602和604之间的信号强度差异。图6中的电泳图谱数据峰702和704分别对应于图5中的峰602和604。数据峰702和704具有良好的信号强度并且不饱和,而且两个峰值之间的差异清晰可见。
一些实施方式通过利用短曝光扫描数据嫁接长曝光扫描数据来解决这个问题,从而扩大了***捕获的数据的有效动态范围。图7示出了根据一些实施方式的用于嫁接长曝光和短曝光扫描数据的过程800。当长曝光数据饱和时,过程800利用短曝光数据。在各种实施方式中,所述过程在上述光谱去卷积之前执行。
过程800从记录长曝光扫描和短曝光扫描开始。参见框802。在一些实施方式中,短曝光时间约为10毫秒且长曝光时间约为100毫秒。可以使用短曝光时间和长曝光时间的其它值,这取决于硬件和数据处理流程的操作特性。
过程800继续从操作802中记录的长曝光扫描中识别满足标准的长曝光扫描数据。参见框804。在一些实施方式中,长曝光数据的信号电平满足信号电平阈值或落入信号电平范围内。在一些实施方式中,长曝光扫描数据的信号电平介于10,000RFU和25,000RFU之间。在一些实施方式中,参考标准范围或标准电平,使用波长信道25或对应于特定PCR引物染料的信道的信号电平。在一些实施方式中,使用除了信道25之外的信道的信号电平。在一些实施方式中,当存在拉曼谱线且接通激光器时识别扫描数据。在一些实施方式中,可以使用不同范围或不同电平的信号电平来识别数据。举例来说,在一些实施方式中,信号电平介于5,000RFU和30,000RFU之间。在一些实施方式中,信号电平介于4,000RFU和35,000RFU之间。在一些实施方式中,选择信号电平的值以确保长曝光时间的信号相对较大但未饱和,而同时不会过小,使得短曝光时间的相应扫描仍具有充分的信号电平。
在一些实施方式中,获得多次扫描并且对来自多次扫描的数据进行平均以获得缩放因子,如下面进一步描述的。在一些实施方式中,识别100次扫描。在一些实施方式中,识别10、20、30、40、50、100、200、500、1000和5000次扫描。在一些实施方式中,当无法识别如上所述的足够的扫描时,可以使用较少数量的扫描。
过程800进一步涉及识别对应于所识别的长曝光扫描数据的短曝光扫描数据。参见框806。在一些实施方式中,基于时间接近度或与长曝光扫描数据的关系来识别短曝光扫描数据。例如,短曝光时间原始数据可以使用线性插值在时间上与长曝光时间原始数据对齐。在一些实施方式中,短曝光数据可以通过本文其它地方所描述的各种相关技术与长曝光数据相关联。
过程800继续基于所识别的长曝光扫描数据和所识别的短曝光扫描数据来获得缩放因子。参见框808。在一些实施方式中,缩放因子是长曝光数据与对应的短曝光数据之间的比率。在一些实施方式中,缩放因子是两个数据之间的差。在一些实施方式中,缩放因子是从反映长曝光数据和短曝光扫描数据之间的关系的其它量中选择的。在一些实施方式中,缩放因子可以是将短曝光扫描数据与长曝光扫描数据相关联的函数。在一些实施方式中,使用多个长曝光扫描数据和多个短曝光扫描数据获得多个比率,并且将多个比率的平均值用作缩放因子。在一些实施方式中,使用多个长曝光扫描数据和多个短曝光扫描数据获得两个数据之间的关系或函数,并且所述关系或函数用作缩放因子。
然后,过程800继续利用通过缩放因子缩放的相应短曝光数据替换802中记录的长曝光数据,替换的数据的信号电平超出阈值。在一些缩放因子为比率的实施方式中,通过将短曝光数据乘以缩放因子来获得缩放的数据。在一些缩放因子为函数的实施方式中,通过将函数应用于短曝光扫描数据来获得缩放数据。事实上,过程800嫁接长曝光数据和短曝光数据以获得更大的动态范围。
然后可以进一步分析嫁接的电泳图谱数据以获得核酸谱。图8显示了使用这种嫁接的数据电泳图谱数据获得的核酸谱的示例。
示例
处理流程示例
在图9中描绘了用于光谱去卷积的处理流程示例。在本示例中,使用当前样品的电泳图谱校准一种或多种染料。
1.运行样品并提取多通道颜色数据作为时间函数(电泳图谱)。参见操作1003。在某些实施例中,使用所有通道的所有颜色数据。参见例如图3。
2.通过应用选择隔离的且纯光谱的峰的标准,识别染料光谱的候选颜色峰。参见操作1005。在某些实施例中,这是通过识别多通道原始电泳数据中的强度峰来实现的。候选颜色峰可能需要具有指定阈值强度水平,这可以凭经验选择。在一个示例中,选择阈值以去除可能是噪声的候选颜色峰。
候选颜色峰可能需要在波长维度上单调增加或减少。换句话说,在一个时间点,随着波长朝向峰增加,候选颜色峰值应该具有单调递增的强度值,或者当波长远离峰减小时,候选颜色峰值应该具有单调递减的强度值。单调性要求可以应用于颜色峰的一侧或两侧,并且可以在距离峰一定距离时应用。例如,单峰性检查可能需要从峰的最大值单调减少到峰的两侧峰高的15%。
更进一步地,候选颜色峰应该以已知由要求纯光谱的染料中的一种发出的波长为中心或在其附近。例如,如果候选颜色峰的波长不在所考虑的染料的任何预期最大强度的波长的约5nm内,则可以从进一步考虑中丢弃候选颜色峰。
3.确定峰之间的相关性以识别最相关峰的群组,每个群组可能代表单个染料的纯光谱峰。参见操作1007。
在一些实施例中,首先基于波长将颜色峰分隔成特定染料的颜色峰,并且在所述分隔之后应用相关性。另选地,通过互相关分析所有候选颜色峰,并且所述过程本身自分隔与特定染料相关的峰。
4.对于每种染料(操作1009)
a.选择与彼此最强相关的候选颜色峰(及其相关联的光谱)的子集(例如,选择三个最高度相关的峰)。参见操作1011。
b.平均或以其它方式组合候选颜色峰的光谱以生成所考虑的染料的单一纯光谱。参见操作1013。
5.从每种染料的纯光谱生成校准矩阵。参见操作1017。
6.通过将校准矩阵应用于原始电泳图谱数据,对所考虑的样品的原始电泳图谱数据进行去卷积。参见操作1019。
在一些实施例中,对单一染料按顺序执行操作1005、1007、1011和1013。换句话说,对单一染料执行操作1005和1007(所述操作一次仅识别一种染料的候选颜色峰值)。当完成操作1013时(获得一种染料的纯光谱),所述过程循环回到操作1005,其中识别所考虑的下一种染料的候选颜色峰。
在图10中描绘了另一个处理流程示例。在本示例中,使用当前样品的电泳图谱校准至少一种染料,并且使用相关样品的电泳图谱校准至少一种其它染料。
1.识别一种或多种无法从电泳图谱数据中识别出纯光谱的染料。参见操作1103。
对于每个这种染料,
2.识别在相关运行中获得的纯光谱(在时间或空间上与当前运行相关)。参见操作1107。
3.任选地缩放2中识别的纯光谱。
从可以在所考虑的样品中以及相关运行的样品中产生纯光谱的染料中识别一个或多个缩放因子。参见操作1109。通过比较所考虑的样品中的染料的纯光谱和相关运行来获得缩放因子。参见操作1111。
将缩放因子应用于来自相关运行的纯光谱。参见操作1113。
***示例
在一些实施方式中,***包括数个集成模块,包含分析物制备模块,检测和分析模块以及控制模块。
分析物制备模块
图11显示了一些实施方式的分析物制备模块的实施例。分析物制备模块可以包括样品盒模块,其接收样品盒并配置成使流体在盒内移动。样品盒包括用于接收样品的样品容器和用于执行例如细胞裂解、DNA捕获和洗涤、DNA扩增和DNA稀释之类的功能的区域。射流歧管连接到压力源,可以将压力(例如,空气压力)输送到盒中以移动样品盒内的液体。试剂盒连接到压力源,可以将试剂(例如,缓冲液和/或水)移动到样品盒中。可以通过流体导管将样品和缓冲液从盒中移出到分析组合件。在一个实施例中,样品盒包括流体片,所述流体片包括射流层、致动层以及夹在二者之间的弹性体层,其中射流层包括流体通道,致动层包括致动通道。所述片可以包含由致动层致动的阀和泵。在这样的实施例中,样品盒模块可以包含连接到压力源的气动歧管,当歧管与盒接合时,所述歧管将压力传输到盒的气动部。所述气动压力可以操作盒中的泵和阀,以使流体在盒周围移动并从盒中流出。
美国专利第8,894,946号中描述了分析物制备模块的元件和特征的进一步细节,所述专利通过引用整体并入本文。
分析和检测模块
图12显示了分析和检测模块,其包含(1)毛细管电泳组合件,(2)检测组合件以及(3)分析组合件。
样品(例如,扩增的DNA或对照物)和缓冲液(例如,电泳缓冲液)沿路径从分析物制备模块流过流体导管(例如,管道),并且流出以废弃,所述路径可以包含变性加热器,用于将分析物注入毛细管的阴极组合件。变性加热器加热含有DNA的流体并将双链DNA中的链变性为单链。阴极组合件可以包含连接到电压源的电极,例如叉形电极。当定位待分析的样品以便注入时,电极可以提供电压以将分析物注入毛细管中。毛细管填充有分离介质,例如线性聚丙烯酰胺(例如,LPA V2e,可从加利福尼亚州普莱森顿IntegenX公司购得)。毛细管末端电连接到电压源,例如阳极和阴极。使用检测模块检测分离的分析物。检测模块可以采用例如激光器和检测器,例如CCD相机,CMOS,光电倍增管或光电二极管。阳极组合件(例如,阳极盒接口)可以包括与毛细管电连接的阳极和电压源。阳极组合件还可以包含分离介质源和用于将分离介质引入毛细管中的压力源。阳极组合件可以包含电泳缓冲液。分离介质和/或电泳缓冲液可以包含在阳极盒中。阳极盒可以配置成可移除地***阳极组合件中。其可以含有足以进行一次或多次运行的分离介质和/或电泳缓冲液。
毛细管电泳组合件
毛细管电泳组合件可以包含:注射组合件,其可以包含变性组合件,阴极组合件;毛细管组合件;阳极组合件;毛细管填充组合件,其用于为毛细管填充分离介质;定位组合件,其用于定位分析物(或样品)以注入毛细管;以及在阳极和阴极之间施加电压的电源。
毛细管电泳***可以包含一个或多个毛细管,以促进样品或产物分离,这可以协助分析。在一些实施例中,流体流动路径将样品或产物从盒引导到流体流动路径和分离通道之间的交叉点。将样品从流体流动路径引导到分离通道,并借助于电场(如可以在***的阳极和阴极上施加电势时产生)引导通过分离通道。美国专利第8,894,946号提供了用于分析的电泳毛细管的示例,其可以和本文的***一起使用。毛细管可以***流体导管中以进行流体连通和电连通。
检测组合件
检测器可以用来观察或监测电泳毛细管(或通道)中的材料。检测器可以是例如基于电荷耦合器件(CCD)相机的***或者基于互补金属氧化物半导体(CMOS)相机的***。
在一些实施例中,所述***包含单个电泳通道或毛细管。美国专利申请公开第2016/0116439号描述了这样的***,所述申请通过引用整体并入本文用于所有目的。
在其它实施方式中,所述***包含多个(例如,4、8、10、16、24、32、40、48或更多个)电泳分离通道(例如,毛细管)。美国专利第8,894,946号描述了这种***。所述***还包含光源(例如,激光器设备或发光二极管),光学检测器和光学选择器。激光器设备定位成将来自激光器设备的光束传递到至少一个电泳毛细管。光学检测器进行光学耦合以从至少一个电泳毛细管接收光学信号。激光器设备、光学检测器和光学选择器的布置允许光学检测器选择性地检测来自多个电泳毛细管中的任何一个或多个的光学信号。
可以基于适于区分分离的分析物(例如,核酸片段)的输出波长来部分地选择激光器设备。核酸片段可以由一定数量的(例如,2、3、4、5或更多个)光谱可分辨的荧光染料标记(例如,通过使用扩增中的那些染料标记的PCR引物),使得具有不同序列但具有相同尺寸和相同的电泳迁移率的片段仍然可以借助利用具有光谱可分辨的发射光谱的染料进行标记,来区分彼此。可以选择具有一个或两个输出波长激光器设备,其有效地激发用于标记核酸片段的荧光染料。激光器设备可以具有单一输出波长(例如,大约488nm)或双波长(例如,大约488nm和大约514nm)。激光器设备可以以适当的速率(例如,大约1Hz到大约5Hz,或大约2或3Hz)扫描每个分离通道的内部。由激光器设备激发的每种染料的荧光发射可以穿过滤光器和棱镜,并且可以成像到例如CCD相机或CMOS相机上。
在一个实施例中,毛细管布置成阵列。在一个实施例中,光学选择器光学定位在激光器设备和多个电泳毛细管之间。来自激光器设备的光束递送到单个电泳毛细管而不是输送到其它电泳毛细管。在一个实施例中,光学选择器是扫描物镜,其将来自激光器设备的光束引导到单个电泳毛细管而不是引导到其它电泳毛细管。在一个实施例中,扫描物镜适于相对于来自激光器设备进入扫描物镜的光束进行横穿运动。在另一个实施例中,光学选择器是使光束从激光器设备传递到单个电泳毛细管而不是其它电泳毛细管的孔。一个实施例进一步包括毛细管对准检测器,其进行光学耦合以接收来自单个电泳毛细管的光束的反射。反射表明光束与单个电泳毛细管对准。
在一个实施例中,光学选择器光学定位在一个或多个电泳毛细管和光学检测器之间。从多个电泳毛细管到光学检测器的光学信号限于单个电泳毛细管。
各个实施例进一步包含光学耦合在激光器设备和光学检测器之间的波长相关光束组合器,或者光学耦合在激光器设备和光学检测器之间的空间光束组合器。
分析组合件
分析组合件可以包括计算机,计算机包括存储器和处理器,所述处理器用于在计算机中执行代码,以便接收检测组合件的数据输出,处理数据并产生报告所分析的分析物的度量或特征的文件(例如,答复)。
在一个实施例中,分析模块可以包括存储器和执行代码的处理器,所述代码执行分析以通过长度和附着的染料的光谱特征对STR片段进行分类,然后将所述信息与辅助信息(例如等位基因分型标准物的分离情况)一起使用,以确定检测到的扩增产物中存在哪些STR等位基因;这一过程通常被称为调用STR等位基因。在STR分析的情况下,分析组合件可以接收原始电泳图谱数据,将其转换为可以被例如等位基因调用软件识别的格式,并且使用所述等位基因调用软件识别等位基因并以可以被用户理解或数据库识别的格式进行报告。例如,分析组合件可以获取电泳图谱并产生由例如FBI国家DNA检索***(NDIS)识别的CODIS文件。
由分离扩增的STR片段产生的电泳图谱,可以通过***使用如下文进一步描述的光谱去卷积方法进行分析。光谱去卷积方法对电泳图谱的颜色数据进行去卷积,以分离每种染料对电泳图谱的贡献。
***的检测模态(例如,光学检测)将产生数据流,所述数据流是来自附着于STR片段的荧光染料的信号以及大量光学和电子背景效应的的混合。所述数据流可以处理成可以由STR调用软件(例如,专业***)消耗的形式。
大多数商用STR调用专业***所预期的输入数据通常包含N×M维数的阵列,其中N是***检测到的染料数,而M是在分离期间获取的时间点序列。一些专业***对N和M有上限,而这可能因产品而异。商用专业***对这些数据流做出了许多辅助性假设:
(1)已清除检测模式下的大多数电子和光学噪声。
(2)N个通道中的每一个在名义上引用相同的定义为“零”的暗信号。
(3)已对每个片段进行了充分测量,以确保STR试剂盒中最小尺寸重复模式具有足够的碱基对分辨率。在名义上,这意味着采样频率足以在其使片段迁移穿过检测器的时间内完成5到10次测量。
(4)N维中的每个单独通道表示来自单一染料的光子信号,与检测模式中所可能的一样多。在不满足这种条件的程度上,这被称为“渗透”。
STR调用软件可以提供的功能包括:
(1)相对于泳道内尺寸标准调整片段大小。
(2)使用(可能是可选的)等位基因分型标准物校准等位基因区。
(3)使用形态带阻滤波器调用等位基因(用于常见的PCR效应,例如,扫描残迹)。
(4)基于例如信噪比之类的数学测量的质量标志分配。
(5)将摘要输出生成作为文本调用。
实践者可以适当地调整STR调用软件的性能,以使假阳性测量集最小化。用于此的程序在本领域中是已知的并且对于可商购的软件,可以包含在产品文档中。
如上所述,专业***将提供识别数据流中发现的片段的碱基对大小,并且如果存在则将初步等位基因分配附加到每个片段的服务。此外,可以将质量标志分配给等位基因调用,将所述等位基因调用报告给分析员。然后,实践者基于来自标志的信息决定STR图谱实际上是什么。通过建立规则引擎以将调用和质量标志处理成最终图谱,可以进一步使所述过程自动化。可以针对***的数据对所述规则引擎进行训练,以便基于来自***的质量标志的具体内容来了解何时保留以及何时拒绝等位基因。
控制模块
本文提供的***包括使用各种硬件和/或软件实施的控制模块。在一些实施例中,一种用于样品制备、处理和分析的***包含具有中央处理单元的控制器,存储器(随机存取存储器和/或只读存储器),通信接口,数据存储单元和显示器。通信接口包含网络接口,用于使***能够与内联网(包含其它***和子***)以及因特网(包含万维网)进行交互。数据存储单元包含用于数据传输和存储的一个或多个硬盘和/或高速缓存器。数据存储单元可以包含一个或多个数据库,例如关系数据库。在一些情况下,所述***进一步包含数据仓库,用于存储信息,例如,用户信息(例如,档案)和结果。在一些情况下,数据仓库驻留在远离***的计算机***上。在一些实施例中,***可以包含关系数据库和一个或多个服务器,例如,例如数据服务器。所述***可以包含一个或多个通信端口(COM端口),一个或多个输入/输出(I/O)模块,例如I/O接口。处理器可以是中央处理单元(CPU)或用于并行处理的多个CPU。
所述***可以配置成用于数据挖掘和提取、转换和加载(ETL)操作,这可以允许***将信息从原始数据源(或挖掘的数据)加载到数据仓库中。数据仓库可以配置成与商业智能***(例如,Business )一起使用。它还可以配置成与法医数据库一起使用,例如美国国家DNA检索***(NDIS)或英国NDAD,州DNA检索***(SDIS)或本地DNA检索***(LDIS)或其它包含来自已知和未知受试者、法医样品或其它样品类型(例如生物体识别)的档案的数据库。
本文提供的***和方法的各方面可以在编程中实施。所述技术的各个方面可以被认为是通常为可执行代码和/或相关数据的形式的“产品”或“制品”,所述可执行代码和/或相关数据在一种机器可读介质上承载或体现。“存储”型介质可以包含任何或所有的计算机有形存储器、处理器等、或可以随时提供非临时性存储用于软件编程的其相关联的模块,例如,各种半导体存储器,磁带驱动器,磁盘驱动器等。软件的全部或部分有时可以通过因特网或各种其它电信网络进行通信。例如,这种通信可以使软件能够从一台计算机或处理器加载到另一台计算机或处理器,例如,从管理服务器或主计算机加载到应用服务器的计算机平台。因此,可以承载软件元件的另一种类型的介质包含光波、电波和电磁波,例如跨本地设备之间的物理接口中使用,通过有线和光学陆线网络使用和通过各种空中链路使用。携带这些波的物理元件(例如,有线或无线链路,光链路等)也可以被视为承载软件的介质。如本文所使用的,除非限定为非临时性有形“存储”介质,否则例如计算机或机器“可读介质”之类的术语是指参与向处理器提供指令以供执行的任何介质。
因此,例如计算机可执行代码之类的机器可读介质可以采取多种形式,包括但不限于有形存储介质,载波介质或物理传输介质。非易失性存储介质包含例如光盘或磁盘,例如任何计算机等中任何存储设备,例如可以用于实施在附图中示出的数据库等。易失性存储介质包含动态存储器,例如这种计算机平台的主存储器。有形传输介质包含同轴电缆;铜线和光纤,包含计算机***内包括总线的线。载波传输介质可以采取电信号或电磁信号,或声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,常见形式的计算机可读介质包含:例如,软盘,可折叠磁盘,硬盘,磁带,任何其它磁介质,CD-ROM,DVD或DVD-ROM,任何其它光学介质,穿孔卡纸磁带,具有孔图案的任何其它物理存储介质,RAM,ROM,PROM和EPROM,FLASH-EPROM,任何其它存储芯片或盒式磁带,载波传输数据或指令,传输此类载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其它介质。多种这些形式的计算机可读介质可涉及将一个或多个指令的一个或多个序列传送到处理器以便执行。
在一些实施例中,将***配置成与一个或多个远程设备(例如远程电子设备)通信。使用通信接口便于这种远程连接。在一些情景中,***通过用户的电子设备上的用户界面向用户呈现信息(或从用户请求动作的信息)(参见下文)。用户界面可以是图形用户界面(GUI)。在一些情况下,GUI在用户的例如便携式电子设备(例如,移动电话,智能电话)之类的电子设备上运行。电子设备可以包括用于执行软件的操作***和电子设备的图形用户界面。
在一些实施例中,***通过在***或用户的电子设备上运行的图形用户界面(GUI),向用户提供警报、更新、通知、警告和/或其它通信。GUI可以允许用户访问***,以便例如创建或更新配置文件,查看状态更新,设置***以进行样品制备和处理,或查看样品制备、处理和/或分析的结果。可以将***配置成仅在用户提供许可标记(例如出入证和/或密码)时运行。***可以记录并提供关于样品监管链、污染或篡改的信息。记录和提供这种信息的***可以包含:操作***访问控制(例如,操作员许可要求);样品控制(例如,用于指示从盒中引入或移除样品的传感器);外壳控制(例如,指示门打开和关闭的传感器)和盒控制(例如,用于指示盒***、正确就位和移除的传感器)。
在一些实施例中,***包含用于样品处理和/或分析的一个或多个模块,以及用于促进样品处理和/或分析的控制器。控制器可以包含一个或多个处理器,例如中央处理单元(CPU),多个CPU或多核CPU,用于执行机器可读代码以实施样品处理和/或分析。在一些情况下,***将样品从一个模块按顺序引导到另一个模块,例如从样品制备模块到电泳模块。
尽管出于清晰理解的目的已经在一些细节上对前述发明进行了描述,但是显而易见的是,可以在本发明的范围内实施某些改变和修改。应当注意,有多种备选方式实施本发明的过程和数据库。因此,所提供的实施例被认为是说明性的而非限制性的,并且本发明不限于本文所提供的细节。

Claims (43)

1.一种从原始电泳图谱数据产生电泳图谱的方法,所述原始电泳图谱数据包括一系列一个或多个峰,每个峰包括作为波长和时间或位置的函数的信号强度值,并且每个峰对应于一个或多个唯一大分子,每个大分子由多种不同染料中的一种进行标记,其中,每个峰具有来自一种或多种所述染料的光谱贡献,所述方法包括:
(a)接收所述原始电泳图谱数据;
(b)对于多种不同染料中的第一种染料,从所述原始电泳图谱数据中选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰;
(c)从(b)中识别的所述一种或多种颜色峰中确定所述第一种染料的色谱,其中,所述第一种染料的所述色谱包括仅作为所述第一种染料的波长函数的信号强度值;以及
(d)使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱,对所述原始电泳图谱数据进行去卷积,以分离每一种所述染料对所述原始电泳图谱数据的贡献并产生所述电泳图谱。
2.根据权利要求1所述的方法,其进一步包括对所述多种不同染料中的至少另外一种所述其它染料重复操作(b)到(c)。
3.根据权利要求1所述的方法,其进一步包括对所述多种不同染料中的至少另外两种所述其它染料重复操作(b)到(c)。
4.根据权利要求1所述的方法,其进一步包括对每一种所述不同染料重复操作(b)到(c)。
5.根据权利要求1所述的方法,其中,所述大分子是来自基因组或染色体的另外两个基因座的DNA序列的扩增反应的扩增子。
6.根据权利要求5所述的方法,其中,所述基因组是人类基因组。
7.根据权利要求5所述的方法,其中,所述基因座位于多态性位点。
8.根据权利要求7所述的方法,其中,所述多态性位点是STR位点。
9.根据权利要求7所述的方法,其进一步包括使用所述电泳图谱识别形成产生所述原始电泳图谱数据的样品的个体的等位基因。
10.根据权利要求7所述的方法,其中,至少存在约十六个基因座,以及至少三种染料。
11.根据前述权利要求中任一项所述的方法,其进一步包括对包含所述大分子的样品执行电泳,其中,执行电泳会生成所述原始电泳图谱数据。
12.根据前述权利要求中任一项所述的方法,其中,选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰包括:应用标准以便从所述原始电泳图谱数据中选择一个或多个基本上隔离的且基本上为纯光谱的颜色峰。
13.根据权利要求12所述的方法,其中,所述标准包括识别具有在波长维度上单调增加或减少的部分的颜色峰,其中,所述波长维度上的位置表示不同的波长。
14.根据权利要求12所述的方法,其中,所述标准包括识别具有在至少预定值的波长维度上具有斜率的部分的颜色峰,其中,所述波长维度上的位置表示不同的波长。
15.根据权利要求12所述的方法,其中,所述标准包括识别至少通过阈值持续时间或位置差异与其它峰分离的峰。
16.根据权利要求12所述的方法,其中,应用标准以便选择一个或多个基本上隔离的且基本上为纯光谱的颜色峰来识别多个基本上隔离的且基本上为纯光谱的峰。
17.根据权利要求16所述的方法,其进一步包括组合所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱,以产生所述第一种染料的所述色谱。
18.根据权利要求17所述的方法,其中,组合所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱包括:产生所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的加权平均值。
19.根据权利要求18所述的方法,其中,产生所述多个基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的加权平均值包括:根据所述基本上隔离的且基本上为纯光谱的颜色峰的峰高和/或峰宽,对所述基本上隔离的且基本上为纯光谱的颜色峰的所述光谱的每一个进行加权。
20.根据权利要求16所述的方法,其进一步包括:
将所述多个基本上隔离的且基本上为纯光谱的颜色峰相关联以识别所述多个峰的子集,所述子集中的多个峰与不在所述子集中的所述多个峰之外的其它峰相比具有更高的相关性;以及
将所述基本上隔离的且基本上为纯光谱的峰的子集组合以产生所述第一种染料的所述色谱。
21.根据前述权利要求中任一项所述的方法,其中,在五十到五百个不同颜色通道之间提供颜色数据。
22.根据权利要求21所述的方法,其中,使用分光光度计获得所述颜色峰的所述信号强度与波长数据。
23.根据前述权利要求中任一项所述的方法,其进一步包括从所述第一种染料的所述色谱和所述多种不同染料的所述其它染料中制备校准矩阵,且其中,使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱对所述原始电泳图谱数据进行去卷积包括:将所述校准矩阵应用于所述原始电泳图谱数据。
24.根据权利要求23所述的方法,其中,所述校准矩阵包括所有所述多种不同染料的色谱。
25.根据前述权利要求中任一项所述的方法,其中,采用单个样品产生所述原始电泳图谱数据和所述一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多个不同染料中任何其它染料的信号强度的颜色峰。
26.根据前述权利要求中任一项所述的方法,其中,所述大分子是寡核苷酸。
27.根据权利要求1所述的方法,其中,产生所述原始电泳图谱数据的唯一大分子的数量大于标记所述唯一大分子的不同染料的数量。
28.根据权利要求1所述的方法,其进一步包括:使用所述电泳图谱识别与所述原始电泳图谱数据中的峰对应的大分子。
29.一种***,其包括:
毛细管,其布置成接收包括多个唯一大分子的样品并且使所述样品通过所述毛细管,使得不同的所述唯一大分子在不同时间穿过所述毛细管的询问区域;
光学元件,其相对于彼此布置以从所述询问区域接收颜色信号;以及
控制器,其设计或配置成:
(i)将所述颜色信号转换为包括一系列峰的原始电泳图谱数据,每个峰包括作为波长和时间或位置的函数的信号强度值,并且每个峰对应于一个或多个唯一大分子,每个大分子由多种不同染料中的一种进行标记,其中,每个峰具有来自一种或多种所述染料的光谱贡献,
(ii)对于多种不同染料中的第一种染料,从所述原始电泳图谱数据中选择一个或多个含有所述第一种染料的信号强度与波长数据并且基本上不含所述多种不同染料的任何其它染料的信号强度的颜色峰,
(iii)从(ii)中识别的所述一种或多种颜色峰中确定所述第一种染料的色谱,其中,所述第一种染料的所述色谱包括仅作为所述第一种染料的波长函数的信号强度值,以及
(iv)使用所述第一种染料的所述色谱,以及所述多种不同染料的所述其它染料的色谱,对所述原始电泳图谱数据进行去卷积,以分离每一种所述染料对所述原始电泳图谱数据的贡献并产生所述电泳图谱。
30.根据权利要求29所述的***,其中,所述控制器进一步设计或配置成对包括所述大分子的样品执行或促使执行电泳,其中,执行电泳会生成所述原始电泳图谱数据。
31.根据权利要求29所述的***,其中,所述控制器进一步设计或配置成执行或促使执行根据权利要求2到4、9、12到20、23、24和28中任一项所述的操作。
32.一种分析样品的方法,所述样品包括一个或多个由多种不同染料中的一种标记的唯一大分子,所述方法包括:
对所述样品执行电泳运行以产生包括一系列峰的第一原始电泳图谱数据,每个峰对应于一个或多个所述唯一大分子,其中,每个峰具有来自所述多种不同染料中的一种或多种的光谱贡献;
分析所述第一原始电泳图谱数据并从与所述大分子相关联的所述多种不同染料中识别未校准染料,所述未校准染料的基本上纯的光谱未从所述原始电泳图谱数据中识别出;
从相关电泳运行的第二原始电泳图谱数据中识别所述未校准染料的基本上纯的光谱;以及
使用来自所述第二原始电泳图谱数据的所述未校准染料光谱的所述基本上纯的光谱,对所述第一原始电泳图谱数据进行去卷积,以分离所述多种不同染料中的每一种对所述第一原始电泳图谱数据的贡献,从而产生第一电泳图谱。
33.根据权利要求32所述的方法,其进一步包括:从所述第一原始电泳图谱数据中提取多通道颜色数据作为时间或位置的函数,其中,所述颜色数据表示来自所述多种不同染料的所述光谱贡献。
34.根据权利要求33所述的方法,其中,所述相关电泳运行是在与用于产生所述第一原始电泳图谱数据的相同装置上运行的下一顺序电泳。
35.根据权利要求32、33或34所述的方法,其中,所述第一原始电泳图谱数据和所述第二原始电泳图谱数据是由在单个装置中相同位置处进行的运行产生的。
36.根据权利要求32或33中任一项所述的方法,其中,所述第一原始电泳图谱数据和所述第二原始电泳图谱数据是由在单个装置中两个不同位置处同时进行的运行产生的。
37.根据权利要求32到36中任一项所述的方法,其进一步包括:在对所述第一原始电泳图谱数据进行去卷积之前,缩放所述第二原始电泳图谱数据中所述未校准染料的所述基本上纯的光谱。
38.根据权利要求37所述的方法,其中,所述缩放包括使用获得的关于第一经校准染料的光谱的信息来修改所述未校准染料的所述基本上纯的光谱,所述第一经校准染料的光谱由所述第一原始电泳图谱数据和所述第二原始电泳图谱数据获得。
39.根据权利要求32所述的方法,其中,唯一大分子的数量大于不同染料的数量。
40.根据权利要求32所述的方法,其中,所述第一原始电泳图谱数据的每个峰包括作为波长和时间或位置的函数的信号强度值。
41.一种***,其包括:
毛细管,其布置成接收包括多个唯一大分子的样品并且使所述样品通过所述毛细管,使得不同的所述唯一大分子在不同时间穿过所述毛细管的询问区域;
光学元件,其相对于彼此布置以从所述询问区域接收颜色信号;以及
控制器,其设计或配置成:
(i)将所述颜色信号转换为包括一系列峰的原始电泳图谱数据,每个峰对应于所述多个唯一大分子中的一个或多个,所述大分子由多种不同染料中的一种进行标记,
(ii)对所述样品执行电泳运行以产生包括一系列峰的第一原始电泳图谱数据,每个峰对应于一个或多个所述唯一大分子,其中,每个峰具有来自所述多种不同染料中的一种或多种的光谱贡献,
(iii)分析所述第一原始电泳图谱数据并从与所述大分子相关联的所述多种不同染料中识别未校准染料,所述未校准染料的基本上纯的光谱未从所述原始电泳图谱数据中识别出,
(iv)从相关电泳运行的第二原始电泳图谱数据中识别所述未校准染料的基本上纯的光谱,以及
(v)使用来自所述第二原始电泳图谱数据的所述未校准染料的所述基本上纯的光谱,对所述第一原始电泳图谱数据进行去卷积,以分离所述多种不同染料中的每一种对所述第一原始电泳图谱数据的贡献,从而产生第一电泳图谱。
42.根据权利要求41所述的***,其中,所述控制器进一步设计或配置成对包括所述大分子的样品执行或促使执行电泳,其中,执行电泳会生成所述原始电泳图谱数据。
43.根据权利要求41所述的***,其中,所述控制器进一步设计或配置成执行或促使执行根据权利要求33、37和38中任一项所述的操作。
CN201780048325.9A 2016-12-09 2017-12-08 电泳图谱分析 Active CN109564189B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662432512P 2016-12-09 2016-12-09
US62/432,512 2016-12-09
PCT/US2017/065447 WO2018107111A1 (en) 2016-12-09 2017-12-08 Electropherogram analysis

Publications (2)

Publication Number Publication Date
CN109564189A true CN109564189A (zh) 2019-04-02
CN109564189B CN109564189B (zh) 2023-09-19

Family

ID=62492360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780048325.9A Active CN109564189B (zh) 2016-12-09 2017-12-08 电泳图谱分析

Country Status (4)

Country Link
US (2) US20190353613A1 (zh)
EP (1) EP3551764A4 (zh)
CN (1) CN109564189B (zh)
WO (1) WO2018107111A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114391098A (zh) * 2019-09-17 2022-04-22 株式会社日立高新技术 生物体试料分析装置、生物体试料分析方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017205796A2 (en) * 2016-05-27 2017-11-30 Life Technologies Corporation Methods and systems for graphical user interfaces for biological data
JP7022670B2 (ja) * 2018-09-10 2022-02-18 株式会社日立ハイテク スペクトル校正装置及びスペクトル校正方法
WO2023141554A1 (en) * 2022-01-21 2023-07-27 IntegenX, Inc. System for adaptive spectral calibration
DE102022201532A1 (de) 2022-02-15 2023-08-17 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zur Kalibrierung eines Analysesystems für Lab-on-Chip-Kartuschen

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138205A1 (en) * 1998-04-16 2002-09-26 Northeastern University Expert system for analysis of DNA sequencing electropherograms
US20020166767A1 (en) * 2001-05-07 2002-11-14 Mcvey Walter R. Electrophoretic method and system having internal lane standards for color calibration
US20050115837A1 (en) * 2003-12-01 2005-06-02 Dean Burgi Analyte identification in transformed electropherograms
US20050161328A1 (en) * 2000-09-11 2005-07-28 Changsheng Liu Electrophoretic analysis system having in-situ calibration
US20060252070A1 (en) * 2005-04-28 2006-11-09 Applera Corporation Multi-Color Light Detection With Imaging Detectors
US20120015825A1 (en) * 2010-07-06 2012-01-19 Pacific Biosciences Of California, Inc. Analytical systems and methods with software mask
CN102741409A (zh) * 2009-11-25 2012-10-17 生命科技公司 等位基因梯基因座

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050059046A1 (en) * 2003-06-18 2005-03-17 Applera Corporation Methods and systems for the analysis of biological sequence data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138205A1 (en) * 1998-04-16 2002-09-26 Northeastern University Expert system for analysis of DNA sequencing electropherograms
US20050161328A1 (en) * 2000-09-11 2005-07-28 Changsheng Liu Electrophoretic analysis system having in-situ calibration
US20020166767A1 (en) * 2001-05-07 2002-11-14 Mcvey Walter R. Electrophoretic method and system having internal lane standards for color calibration
US20050115837A1 (en) * 2003-12-01 2005-06-02 Dean Burgi Analyte identification in transformed electropherograms
US20060252070A1 (en) * 2005-04-28 2006-11-09 Applera Corporation Multi-Color Light Detection With Imaging Detectors
CN102741409A (zh) * 2009-11-25 2012-10-17 生命科技公司 等位基因梯基因座
US20120015825A1 (en) * 2010-07-06 2012-01-19 Pacific Biosciences Of California, Inc. Analytical systems and methods with software mask

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114391098A (zh) * 2019-09-17 2022-04-22 株式会社日立高新技术 生物体试料分析装置、生物体试料分析方法

Also Published As

Publication number Publication date
WO2018107111A1 (en) 2018-06-14
EP3551764A4 (en) 2020-08-05
CN109564189B (zh) 2023-09-19
EP3551764A1 (en) 2019-10-16
US20190353613A1 (en) 2019-11-21
US20230152276A1 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
CN109564189A (zh) 电泳图谱分析
CN110234771A (zh) 单光源双光通道测序
US5871628A (en) Automatic sequencer/genotyper having extended spectral response
US9658148B2 (en) Particle analysis and sorting apparatus and methods
US9952133B2 (en) Particle analysis and sorting apparatus and methods
CN103443290A (zh) 用于评估生物分子特性的***和方法
JP2000503774A (ja) 統計的信頼区間の決定を含む多成分分析方法
JP2010523115A5 (zh)
CN105143469B (zh) 核酸分析装置及使用其的核酸分析方法
Cohen et al. Multispectral live‐cell imaging
US20130338010A1 (en) Filter architecture for analytical devices
CN109117796A (zh) 碱基识别方法及装置、生成彩色图像的方法及***
CN115087747A (zh) 使用时间分辨发光测量法对生物材料进行空间分析的组合物和方法
Acuña-Rodriguez et al. Live-cell fluorescence spectral imaging as a data science challenge
WO2022019006A1 (ja) 情報処理システム及び情報処理方法
US20020166767A1 (en) Electrophoretic method and system having internal lane standards for color calibration
CN114134025A (zh) 基因测序***及其测序方法
Smith et al. Quantitative imaging of MS2-tagged hTR in Cajal bodies: photobleaching and photoactivation
WO2023171463A1 (ja) 情報処理装置及び情報処理システム
Nieman et al. Hyperspectral imaging system for quantitative identification and discrimination of fluorescent labels in the presence of autofluorescence
Chen et al. 64-channel label-free fluorescence detection and single-particle counting device
US20230168195A1 (en) Particle analysis system, information processing method, and program
US20210358566A1 (en) Resolution indices for detecting heterogeneity in data and methods of use thereof
CN117233100A (zh) 基于色度sCMOS的多色荧光数字PCR定量检测方法
CN116064751A (zh) 多谱段数字pcr检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant