CN101002093A

CN101002093A - 图像分析和试验***

Info

Publication number: CN101002093A
Application number: CN 200580008039
Authority: CN
Inventors: 弗拉基米尔·特莫夫; 伊利亚·雷弗金
Original assignee: Chemicon International Inc
Current assignee: Chemicon International Inc
Priority date: 2004-01-15
Filing date: 2005-01-18
Publication date: 2007-07-18

Abstract

用于测定和/或分析细胞成分分布和动力学的***。

Description

图像分析和试验***

优先权申请的交叉参考

本申请根据并要求依据35 U.S.C.§119(e)的以下U.S.临时专利申请的权益，其以它们的整体引入作为参考用于所有目的：序列号No.60/537,454，于2004年1月15日提交；和序列号No.11/039,077，于2005年1月17日提交，名称为IMAGE ANALYSIS SYSTME，并且命名Vladimir Temov和Ilya Ravkin作为发明人。

相关申请的交叉参考

本申请将下述美国专利申请的整体引入作为参考以用于所有目的：序列号No.09/549,970，2000年4月14日提交；序列号No.09/694,077，2000年10月19日提交；序列号No.10/120,900，2002年4月10日提交；序列号No.10/238,914，2002年9月9日提交；序列号No.10/273,605，2002年10月18日提交；序列号No.10/282,904，2002年10月28日提交；序列号No.10/282,940，2002年10月28日提交；序列号No.10/382,796，2003年3月5日提交；序列号No.10/382,797，2003年3月5日提交；序列号No.10/382,818，2003年3月5日提交；序列号No.10/407,630，2003年4月4日提交；序列号No.10/444,573，2003年5月23日提交；序列号No.10/445,291，2003年5月23日提交；序列号No.10/713,866，2003年11月14日提交；序列号No.10/842,954，2004年5月10日提交；序列号No.10/901,942，2004年7月28日提交；和序列号No.10/942,322，2004年9月15日提交。

本申请将下述美国临时专利申请的整体引入作为参考以用于所有用途：序列号No.60/129,664，1999年4月15目提交；序列号No.60/170,947，1999年12月15日提交；序列号No.60/241,714，2000年10月18日提交；序列号No.60/259,416，2000年12月28日提交；序列号No.60/293,863，2001年5月24日提交；序列号No.60/299,267，2001年6月18日提交；序列号No.60/299,810，2001年6月20日提交；序列号No.60/307,649，2001年7月24日提交；序列号No.60/307,650，2001年7月24日提交；序列号No.60/310,540，2001年8月6日提交；序列号No.60/317,409，2001年9月4日提交；序列号No.60/318,156，2001年9月7日提交；序列号No.60/328,614，2001年10月10日提交；序列号No.60/343,682，2001年10月26日提交；序列号No.60/343,685，2001年10月26日提交；序列号No.60/344,482，2001年10月26日提交；序列号No.60/344,483，2001年10月26日提交；序列号No.60/345,606，2001年10月26日提交；序列号No.60/348,025，2001年10月26日提交；序列号No.60/348,027，2001年10月26日提交；序列号No.60/359,207，2002年2月21日提交；序列号No.60/362,001，2002年3月5日提交；序列号No.60/362,055，2002年3月5日提交；序列号No.60/362,238，2002年3月5日提交；序列号No.60/370,313，2002年4月4日提交；序列号No.60/383,091，2002年5月23日提交；序列号No.60/383,092，2002年5月23日提交；序列号No.60/413,407，2002年9月24日提交；序列号No.60/413,675，2002年9月24日提交；序列号No.60/421,280，2002年10月25日提交；序列号No.60/426,633，2002年11月14日提交；序列号No.60/469,508，2003年5月8目提交；序列号No.60/473,064，2003年5月22日提交；序列号No.60/503,406，2003年9月15日提交；序列号No.60/523,747，2003年11月19日提交；和序列号No.60/585,150，2004年7月2日提交。

本申请将下述PCT专利申请的整体引入作为参考以用于所有用途：序列号No.PCT/US01/51413，2001年10月18日提交，并于2002年5月16日以公开No.WO 02/37944公开。

介绍

分子和超分子组件的机化和动力学在细胞***的功能中起到重要的作用。尤其是真核细胞与许多结构上和/或功能上相关的、有机化到特定位置或诸如细胞器官等区室中的成分高度有机化化。例如，选择的与真核细胞中能量产生相关的细胞成分有机化到线粒体中，而选择的与细胞控制和遗传有关的细胞成分有机化到细胞核中。更加通常的，真核细胞可以包括许多不同的机化以用于许多不同的功能细胞器官或区室，其包括细胞核、线粒体、叶绿体、溶酶体、过氧物酶体、液泡、高尔基体、粗糙或光滑的内质网、中心体、质膜、核被膜、核内体、分泌小泡等等。

这些不同区室以及细胞和生物有机体的组成部分通常可以是高动力态的。因此，特定分子可以在细胞中的不同区域之间和/或在细胞和细胞外介质之间活跃的转运和/或扩散。在一些情况下，细胞可以从一个区室到另一个区室移动或易位，以响应细胞周期的变化、细胞信号传导(例如激素)、疾病状态等等。此外，在诸如酶等分子的情况下，控制这些分布和动力学的机制可以独立于控制或影响催化作用的机制，这意味着它们可以对候选药物提供唯一的、之前未利用的靶，其潜在的允许带有相似功能功能性的成分(诸如激酶)根据相异的位置或易位信号或行为而被靶向。值得注意的，很多潜在的与疾病状态相关的分子，诸如转录因子和激酶，在激活步骤过程中尤其是从细胞质到细胞核易位。

图像分析中诸如易位图像分析等的“自然”方法是将图像分割为多个区室，诸如单独细胞的细胞核和细胞质，测量在每个区室中的信号染色的数量并计算作为二者的比率或区别的易位的度量〔1，2〕。这种方法的变体是分析在更小区室中的信号染色，所述区室通过它们与细胞核的边界或中心的空间关系而界定〔3，4〕。在所有情况下，这些方法需要图像分割。因此，因为分割通常对图像特征和伪像(artifact)敏感，并且还可能不佳地以放大率缩放，这就需要这样的***，所述***不需要或至少不严格的依赖于分割。

概述

本学说提供用于测定和/或分析细胞成分分布和动力学的***。

附图简述

图1是根据本学说的用于图像分析的一般框架的示意图。画面A表示带有不同报道基因图像的细胞，画面B表示示范性的三维直方图，以及画面C表示三种示范性二维直方图，

图2是一系列显微照片，其表示在MCF7细胞中NFκB的核易位。左-阴性的、中间-中间的、右-阳性的状态。FITC染色的图像以10X物镜获取。

图3是通过模型和真实细胞的一套示范性染色和复染色分布图。A、B-模型；C、D-真实的；A、C-阳性的；B、D-阳性的。S-单染色；CS-复染色。

图4是在理想模型***(A、B)、干扰模型***(C、D)、和真实细胞(E、F)中的单染色(垂直轴)和复染色(水平轴)的一套交叉直方图。两个轴上的标度是0-255。线表示计算的近似值。

图5是一套图表，其表示斜率(左)的近似值作为从右到左增加的分布的子集(右)中的复染色强度的函数。中线表示所得的斜率值。顶画面-蛋白质的核定位；底画面-蛋白质的细胞质定位。

图6是用于细胞质到细胞核的易位试验的图像分析的可能的计算方案流程图。

图7是一套表示不同放大率的单独(逐个细胞(cell-by-cell))和整体斜率的图表。

图8是表示由虚线的椭圆示出的核仁如何通过产生点群而改变二维染色分布的一套图表，其导致低估斜率。这种影响可以通过填充对应于核仁的信号图像中的孔而校正。A、B-单细胞分析；C、D-多细胞整体分析。A、C-未校正数据；B、D-校正(填充)数据。斜率：(A)61、(B)72、(C)1.21、(D)1.61。

图9是表示根据本学说各方面的用于填充核仁的示范性方法一系列的画面。

图10是在MCF7细胞中的NFKB的细胞质到核的易位的一套剂量相关的图像中的斜率分布的一套直方图。此直方图表示带有给定斜率(垂直轴)对斜率(水平轴)的细胞的百分比。

图11是表示通过斜率直方图的第一主分量说明的数据集的变化的棒状图。

图12是表示在斜率直方图中的原始特征单元(bins)上的主分量权重的图表。

图13是表示斜率直方图的第一两主分量的空间中的细胞质到细胞核的易位试验的图像分布的曲线图。虚线箭头表示TNFα剂量的增加。

图14是核易位的剂量曲线，表示平均细胞斜率(垂直轴)对TNFα浓度(水平轴)。V-因子＝0.77。

图15是V-因子的图表，其用于作为在不同图像大小的插值放大率(水平轴)的函数的细胞核易位的度量(垂直轴)。

图16是一系列显微照片，其表示膜到细胞质的易位。左-阴性的、中间-中间的、右-阳性的状态。

图17是对于用于膜到细胞质易位的模型***中的细胞核复染色和单染色的联合分布的一套图表。顶部-膜定位、底部-细胞质定位。左-染色的二维分布、右-通过模型细胞的分布图。

图18是用于在真实细胞中单染色和复染色的联合分布的一套图表。顶部-膜定位、底部-细胞质定位。左-染色的二维分布、右-通过模型细胞的分布图。

图19是对于用于膜到细胞质易位的以随机噪音干扰的模型***中单染色和膜复染色的联合分布的一套图表。顶部-膜定位、底部-细胞质定位。左-染色的二维分布、右-通过模型细胞的分布图。

图20是在物镜放大率为10X的带有2*2单元划分(binning)的Transfluor试验的一系列图像。A-阴性的、B-中间的、C-阳性的。

图21是在原始图像中、在由大小1的结构元素开运算的图像中、以及在由大小4的结构元素开运算的图像中用于图24试验的、通过细胞的一套亮度分布图。左-阴性的、中间-中间的、右-阳性的状态。

图22是表示Transfluor试验的阴性、中间的、和阳性状态的粒状光谱的一套曲线图。水平轴-开运算大小、垂直轴-在此开运算的图像容量的百分数。

图23是表示用于在放大率(水平轴)和图像大小(如在图中所示的)的相对粒度的z值(垂直轴)依赖性的一套曲线。画出了最好试验表现的范围的轮廓。

详细描述

本学说提供了用于测定和/或分析细胞成分的分布和动力学的***。这些可以包括用于制备、定位、治疗、和/或分析样本等的装置、方法、组合物、和工具包的***可以尤其适用于两种或更多物质联合分布的研究，尤其是其中一种或更多的这些物质起到参考或复染色的作用，以及一种或更多这些物质起到信号染色的作用。例如，在一些实施方式中，参考或复染色可以用作用于细胞特征或区室的标记，并且信号染色可以用于能够与细胞一起易位的物质的分布的研究。这些易位可以包括细胞质到细胞核的易位、细胞核到细胞质的易位、膜到细胞质(或细胞核)的易位、细胞质(或细胞核)到膜的易位等等。

作为用在此处的制备样本可以包括，其中，(1)选择、分离、浓缩、培养、修饰、和/或合成组合物、细胞成分、细胞、组织、和/或任何其他试验成分等，(2)选择、形成、和/或修饰样本载体和/或样本容器，分别诸如编码载体和/或多孔***，和诸如微量培养板，和/或(3)相关联的样本和样本载体、和/或样本和样本容器等。

作为此处所使用的定位样本可以包括用于治疗和/或分析等的定位样本(和/或任何相关的样本载体)。这样的定位其中可以包括，(1)混合样本，(2)在治疗和/或分析位点分配样本，和/或(3)在治疗和/或分析位点分散样本，例如，分别允许接近样本和/或样本的可视化。

作为此处所使用的治疗样本可以包括将样本暴露于一些条件，诸如化学品、温度、浓度(例如，诸如氢离子(pH)、盐离子等的离子浓度)、和/或类似的、和/或其变化。这些条件可以包括候选的调节子，例如未知的或部分特征化效果的条件，诸如候选转录调节子。

作为此处所使用的分析样本可以包括定性的和/或定量的观察和/或测量样本条件(例如大小、质量、密度等)和/或由样本引起的条件(例如，酶基质的损耗、酶产品的产生等)，使用任何适合的方法(例如，光学的(成像、吸收、散射、发光、光致发光(例如荧光或磷光)、化学发光等)、磁共振、和/或流体力学等)。这样的分析还可以包括检测和/或说明包括***和/或拮抗物的样本或其调节子的存在、数量和/或活性，和/或从多重样本分析测定趋势或主旨。这样的分析还可以包括测定和/或分析生物***中两种或更多染色或其它的位置和/或活性指示剂的联合分布，例如用于易位试验等。

通过本学说提供的***还包括，但不限于在以下实施例中描述的，并还可以选择性的结合装置、方法(包括标记和转染方法)、组合物(包括分子、细胞、组织等)、和/或工具包、或其组分，如在以上交叉参考中所列的不同专利申请中所述的，并引入本文作为参考。

实施例

以下的实施例描述了本学说的选择的方面和实施方式，尤其是示范性的分布和动力学试验。这些实施例被包括用于说明并不旨在限制或定义本学说的整体范围。本学说的另外方面在以上所列的交叉参考的不同专利申请中描述并引入本文作为参考，尤其是美国临时专利申请序列号N.60/537,454，于2004年1月15日提交；和美国临时专利申请序列号No.____，于2005年1月17提交，题目为IMAGE ANALYSIS SYSTEM，并命名Vladimir Temov和Ilya Ravkin作为发明人。这些两个临时专利申请包括彩图和额外的、补充并进一步说明以下所述概念的文本，尤其是在实施例1、2和4中。

实施例1. 细胞质到细胞核的易位的试验

1.1.背景

图1示出本学说示范性实施方式的一般数据框架：细胞质到细胞核(或细胞核到细胞质)的易位的试验。视场(field of view)是在不同光谱范围和/或以不同的光学模式数字地获取的(或模拟地获取，并转换成数字的)，如此存在，或可以使之成为来自相同场的所有图像中的像素对像素的一致。不同的光谱范围可以包括不同的波长带，诸如蓝和绿等。不同光学模式可以包括不同成像技术，诸如光致发光和透射等。此框架允许二维分布的分析、或一系列的这种分布、或直到报道图像的数目的更高维度的分布的分析。这样的联合分布可以在像素的不同子集中分析，范围从整个图像向下到单细胞的部分。

1.2 基于染色的2D分布的方法.

模型和实验分布.

本学说可以包括根据信号和复染色的联合分布的易位事件的分析。收集代表数据并针对MCF7细胞中转录因子NFkB响应于TNFα浓度(见例如图2)的易位而对其分析。为了发现细胞核易位的稳定的度量，我们还已经定义并研究细胞核复染色和信号染色的空间分布的模型，当它从细胞质到细胞核易位的时候。与实验数据相比较的模型结果在不同条件和干扰下研究以寻找稳定的度量。

图3表示沿着线的强度分布图，所述线穿过包含信号染色和复染色的模型(画面A和B)和真实(画面C和D)细胞。模型细胞包括铃型复染色(细胞核)强度分布，和或(画面A)带有带有铃型凹陷的较宽的铃型信号染色强度分布，对应于在信号和复染色之间的负相关，或(画面B)铃型信号染色强度分布，对应于信号和复染色之间的正相关。真实细胞呈现与模型细胞基本相似的分布图。此处，绘制通过两个细胞的画面C的分布图呈现负相关，绘制通过三个细胞的画面D的分布图呈现正相关。所有模型和真实的分布图被独立的标准化到它们各自的强度最大值。

1.3 交叉相关的量化

使用任何适合的方法可以观察和/或分析信号染色和复染色之间和/或其变化的交叉相关或联合分布。在一些情况下，可视地观察值或变化是可能的并足够简单的。但是，在大多数情况下，定量地观察值或变化是所期望的或是必要的，尤其是在诸如可能包括许多样本分析的扫描的背景中。

图4显示信号染色(垂直轴)和复染色(水平轴)的交叉直方图或相关图表。具体的，信号染色的强度(或其一些适合量度或函数)绘制为相关的复染色(或其一些适合量度或函数)强度的函数。因此，在图表的左下象限中的数据点对应于具有信号染色和复染色二者的低浓度的图像部分，右上象限中的数据点对应于具有信号染色和复染色二者的高浓度的图像区域，左上象限中的数据点对应于具有高信号染色浓度，但是低复染色的浓度的图像区域，右下象限中的数据点对应于具有低信号染色浓度，但是高复染色的浓度的图像区域。在这些图表中，负相关性将趋向于揭示为具有负斜率的数据点的分布，且正相关性将趋向于揭示为具有正斜率的数据点的分布。为了得到稳定的度量，所述度量以从负到正的情况转换为特征，或反之亦然，我们分析在模型和真实细胞上的染色的联合分布。在理想的情况下，模型空间染色分布循环对称并校准的，如图3(A、B)示出的。用于这些情况的交叉直方图如图4(A、B)所示出的。如果通过偏置两个染色的中心、通过从圆形到椭圆形改变形状、和/或增加噪音等而干扰模型，此分布成为模糊的，如图4(C、D)所示出的。通常的阴性和阳性的真实细胞具有如图4(E、F)所示出的交叉直方图。这些分布间接表明合适的易位度量可以定义为近似于直方图右侧的直线线段的斜率(或更加粗糙的所述斜率的符号)。这部分分布对应于更强的细胞核染色并也接近细胞核的中心。离中心越远，所述分布就越分散，并且近似值的可靠性越少。

图5显示斜率(左)的近似值作为从右到左增加的分布的子集(右)中的复染色强度的函数。通过绘制从右到左的近似斜率，并选择近似值最稳定处的范围，而得到用于与直线近似的分布部分。

图5还显示在这种方法上的可能变化。这种变化可以包括再计算两个斜率。顶线是以所有在初始斜率片断(我们将称之为斜率1)之上的点计算的回归线；底线是以所有在初始斜率片断(我们将称之为斜率2)以下的点计算的回归线。如果所有三个斜率(即，初始斜率、斜率1和斜率2)有相同的符号，那么结果是具有最大绝对值的一个。但是，如果它们具有不同的符号，那么选择原始斜率。我们称此度量为斜率3。

1.4 整体的、逐个细胞的、逐个群的分析

本学说可以应用到整个图像或其部分，包括但是不限于单细胞的选择的部分，选择的细胞、和/或选择的细胞的群或区域等。图6显示用于细胞质到细胞核易位试验中的图像分析的可能的计算方案的流程图。

此方法在单细胞水平的应用可以抵消或压制在表达或染色中的变化，其在易位的情况下可以是非信息。在一些情况(例如，低放大率)，将图像分割为单细胞是困难的；而分析可以在相近位置的细胞群上进行。这可能不能说明在群内的细胞之间的生物变异，但是其将说明在群间的变异。在群间的变异还可以由于技术的或实验的原因，诸如不均匀的照明。分析可以应用到单细胞，不需要细胞或细胞核边界的认识，而是简单的需要包含分离细胞的区域的认识。

整体分析也具有其优点。它在低放大率可以更快和/或更稳定。针对整体(整个)分析的异议通常在于其不能说明细胞间的变异，还在于不排除不需要的细胞。无论如何分析所接受的细胞，单独的或作为整体，第二问题可以直接处理。用于这种讨论的目的，有两点：(1)整体分析不能给出和单细胞分析一样好的平均反应的度量，以及(2)平均度量独自可能不是充分信息的。第一点可以至少部分的克服，通过将强度标准化，在此情况中整体度量通常与单细胞度量的均值一样好，见图7。第二条在1.9部分论述。

1.5 分割为组分.标记

结合强度图像的分水岭

图像可以作为整体和/或部分或成分来分析。分割为部分可以用于两个目的：(1)便于所选图像特征的分析，诸如细胞群、单细胞、和/或其部分；以及(2)作为程序中的一个步骤，便于选择性的强度均衡。

分割可以使用任何适合的机制执行，诸如：(1)寻找标记，和(2)寻找分割线。

标记可以通过任何适合的算法寻找。例如，固定值(标记对照)可以从细胞核复染色图像减去饱和，以及所得图像在细胞核复染色图像之内重建[11]。而本图像可以从复染色图像减去，并转换为二值图像。这种二值图像的组成部分是标记。可以在标记上施加进一步的限制：只有具有在给定阈值(标记亮度)之上至少一像素的标记被保留用于第二步骤。根据放大率和噪音水平，细胞核复颜色的图像在此算法之前可以被平滑。这种测定标记的方法可以处理不同大小和形状的细胞。其它方法，例如基于帽子变换(top-hat transform)[11]的方法也可以使用。

在组成部分之间的分割线(例如，细胞核、细胞等)可以通过任何适合的算法找出。例如，分割线可以定义为复染色图像和信号染色图像的线性组合的倒像图像的分水岭[5、6、10]。使用线性组合而不只是细胞核复染色图像的理由在于细胞经常不对称的且不平均的隔开。来自核染色图像的分割线可能通过细胞的中间切割。信号染色的应用产生更精确的分割线。线性组合的系数可以根据染色和图像获取的特性而不同。

1.6 强度标准化

复染色和信号染色的联合分布可以标准化为它们各自的最大值。这可以在分布上或在初始图像上完成。结果是相同的，但是使图像标准化对用户提供额外的反馈，并可以显示在标准化之前不可见的特征。

使用任何适合的机制，标准化(和/或其它尺度改变)可以在整个图像和/或其部分上执行。例如，如上所述，标准化可以在组分中进行。在这种情况，所有来自一组分的像素乘以相同的数字，分别用于信号染色和用于复染色。可替换的，通过将平滑表面应用于信号染色和复染色的图像，标准化可以完成而不需要分割图像。标准化可以具有局部均衡图像的效果，并可以包括图像尺度改变，如此最大值和/或整合值等于单位值或一些其它预选值。

1.7 伪像的去除、门控、分类

生理学的可变性和/或其它条件可以产生影响试验结果的伪像。例如一些细胞，诸如足够低的密度的MCF7，其具有显而易见的有丝***细胞的百分比，其核膜被打破并且染色体已经聚集。染色体可以用核酸染料密集染色的这些细胞可以产生伪造的“阴性”结果并扰乱试验的阳性状态。但是，这些细胞可以根据它们的高细胞核染色强度和/或明显小于正常尺寸(undersized)的“细胞核”等而被排除(或去除)。此处，“排除”可以包括不用于随后的计算和/或作表，和/或不用于最后的试验结果的测定等。可以被排除的所述信息或结果可以包括一个或更多细胞、一个或更多的细胞区域等的部分和/或整体。因此，在示范性实施方式中，其中细胞与荧光丝接触，或在其上或在其下延伸，细胞被影响的部分可以被排除，和/或所有被影响的细胞可以被排除等。更通常的，诸如其它细胞类型和/或非细胞伪像等的、可以通过它的强度、形状、大小、和/或位置等而被区分的任何伪像也可以被排除。

相反的，在一些情况下，诸如在交叉直方图中的斜率值等的交叉相关性可以用于细胞分类，而不是排除细胞。例如，有丝***细胞可以升高交叉直方图中的负斜率，由于信号染色将趋向于从复(细胞核)染色区域中被排除，而***间期的细胞可以升高正斜率，至少如果存在信号染色和复染色的位置之间的正相关性。

1.8 图像处理.通过填充孔的核仁去除

从细胞质到细胞核易位的蛋白质和其它分子通常不进入核仁。这种倾向可产生伪像，除非考虑，因为其可以解释为易位的缺失。

图8表示在关于核仁的交叉直方图斜率估算中的误差。引起这些误差是因为带有高复染色(即细胞核染色)强度的区域与低信号染色强度的区域相关，甚至是存在易位的时候，因为从核仁排除信号染色。

这些伪像可以通过识别核仁并从细胞核掩模中除去它们的掩模而被处理。但是，这种方法通常遭受与分割和掩模相同的缺点(见背景)。

伪像还可以通过改变信号染色的图像而处理，如此其不具有不期望的特征，例如通过填充孔，而似乎没有核仁。填充核仁但不填充阴性细胞的整个细胞核是一个挑战，所述阴性细胞的整个细胞核看起来也像孔。一种方法是(1)生成信号和复染色图像的基于像素的乘操作的图像，(2)填充图像中的孔[10]，而(3)将增量添加到原始信号染色图像。这个增量可以被大于1的常数乘。这种方法的缺点在于靠近细胞核边缘的孔(核仁)可能没有完全填充。可替换的方法是在信号染色图像上直接填充孔，但是仅选择在它们之中的那些落入作为核仁特征的大小的范围的(即，其对于给定细胞的类型、条件设置等等来说既不是太小也不是太大的)。

图9表示用于填充核仁的示范性步骤。在每个画面中的虚线表示在没有核仁的情况下想像的信号染色分布图。画面A表示通过核仁的强度分布。画面B表示在填充孔之后的强度分布。画面C表示在平滑之后的强度分布。最后，画面D表示在填充区域的掩模之下选择的平滑的并填充的图像的最大程度。选择性的平滑步骤还可以改善填充后的强度分布。

更加通常的，图像可以被修改，如果这导致更好的感兴趣的最后试验测量的估算，例如，如1.10部分所述的所度量的质量。一个实施例是平滑。在一些情况下，这可以改善斜率度量，尤其是如果图像在具有浅视野深度的设备上被获取。

1.9 异种.位置和变异的群度量

主成分分析

本学说包括用于说明或解释细胞群中异种的***。例如，在蛋白质从细胞质到细胞核的易位过程中，不是所有细胞都同步的行动，而且不同细胞甚至可以呈现为相反的行为。

在一些情况，寻找或测定易位的单个(标量)度量可以是可能的或期望的。在这样的情况下，可以合理的将群减少到位置量度，诸如均值(平均)、中值、众数等。在细胞群中变异的度量还可以提供有价值的信息。在出现在此处的实施例中，诸如标准差、自中值的中位差等的变异度量呈现为剂量相关的行为，恰恰类似于位置度量。

在相同和/或其它情况，找到或测定易位的多维(向量)度量可以是可能的或期望的。在这样的例子中，其可以合理的使用多维统计学方法，诸如主成分分析[12](PCA)。多维分析可以提供额外的或更加详细的关于细胞行为和异种的信息。

图10是一套直方图或曲线图，其表示在一套图像中的斜率分布，所述图像表示MCF7细胞中NFκB从细胞质到细胞核的剂量相关的易位。此处，给定斜率的细胞百分比(垂直轴)表示为斜率的函数(水平轴)。

图11-13表示来自图10中的多维PCA分析数据的结果。在本实施例中的多维向量是细胞中斜率分布的直方图，如图11所示。特征是在直方图中的单元(bin)，以及数据组(cases)是剂量和在每一剂量的可能的重复。主成分是非相关的一组向量，其是原始向量组的线性组合。根据数据设置的性质，最初的若干主成分可以解释其中的大部分变异。例如，此处的最初的两个主成份解释几乎90％的变异，所以将数据组的维度从十减少到2是合理的。通过分析它们在原始特征上的权重，其意义赋予给主成份，如图12示出的。在这个实施例中，第一主成分可以解释为易位的阳性，由于负斜率的权重是负的，正斜率的权重是正的。第二主成份可以解释为同质性，由于高的正和高的负斜率二者都具有正权重，以及零附近的斜率具有负的权重。对于MCF7细胞的NF_κB的核易位的剂量曲线和点的分布，可以绘制在斜率直方图的最初的两主成分的空间中，如图13所示。

1.10 用于细胞成像试验的试验和算法质量的度量

在细胞成像试验中，用于描述试验特征的度量(或多个度量)可以从由照相机记录的信号中移除。此外，不同的算法在相同图像上可以产生的不同的试验度量。这对于重新分布(例如，核易位)的试验是尤其敏锐的，其中总强度可以不变，且其中试验结果可以比依赖于原始图像而更加依赖算法。为了确定哪种解决方案对于给定试验和算法是最低限度可以接受的，我们分析不同光学放大率的相同的孔区域或/和不同插值放大率的相同图像组。以类似的方式，通过比较来自不同大小图像的量度来分析细胞数量的影响。为了比较结果，我们使用此处所讨论的质量度量。

诸如高产出筛选试验等的质量试验，可以通过依赖于试验的动态范围和可变性的统计学参数而计算，诸如z-因子[9]：

Z = 1 - 3 {\frac{{SD}_{pos} + {SD}_{neg}}{| M_{pos} - M_{neg} |}}

此处，SD是标准差，M是平均值，并且pos和neg是试验的两种极端状态，其定义它的动态范围。Z因子的范围从-∞到1。用于基于细胞的试验，大于0.5的z因子被认为是好的。Z因子已经被证明为对于捕捉和并比较由试验生物学和由使用仪器(例如，吸量)引起的变异性是十分有效的。基于成像的细胞试验引入几种新的变量：成像分辨率、成像区域大小、和数据提取算法。成像区域大小是变量，由于其通常小于整个***(例如，小于整个微量培养板的孔)被成像和分析。由于具有类似于z因子的质量度量，允许我们使在我们控制之下的变量最优化，例如，找到最佳的数据提取算法。此处，我们将处理特定的细胞图像分析算法并使用质量度量以最优化图像分辨率和大小。

除了引入新的变量，细胞成像试验可以引导我们重新考虑质量度量本身。源自图像的试验量度可能是计算起来非常复杂的。例如，它们可包括操作具有饱和来自试验的阴性和阳性状态的值的效果，人为的减少变异性。这可能无意的发生并甚至不被意识到。此外，如果对于其阳性和阴性状态的试验的值不重叠(以及如果他们重叠，其可能不是非常有用的试验)，通过应用将所有正值映射到单独的数值中，以及所有负值映射另外的单独的值中的数学转换，z因子可以被有目的的操作。处理这种情况的一种方式是使用试验状态(剂量曲线)的剂量依赖序列的质量度量，带有彼此足够接近的剂量，如此人工操作将是不可能的。这导致以下量度，我们称之为“v-因子”：

V = 1 - 6 {\frac{{SD}_{of_fit}}{| M_{pos} - M_{neg} |}}

此处

{SD}_{of_fit} = \sqrt{Σ_{1}^{n} \frac{{(f_{\exp} - f_{\mod})}^{2}}{n}}

此处，f_exp和f_mod是分别在给定浓度的试验量度的实验数值和模型数值，以及n是在剂量曲线中的实验点的数目。

如果仅有两个剂量点，V因子转换为z因子。可以根据反应的性质选择模型，曲线经常是自然的选择。可替换的，在一些情况下，没有使用特定模型，以及几个重复的平均值用作在上述方程式中的f_mod。然而，通过此公式给出v因子：

V = 1 - 6 {\frac{Average_{SD}_{neg}}{| M_{pos} - M_{neg} |}}

所述v因子比z因子更少的容易受到由计算引起的饱和伪像的影响。还有其它的细微差别。在剂量反应曲线中间的标准差经常大于在极端的标准差。这是因为曲线上的最高点经常测定为在饱和浓度，因此任何分散误差对反应的影响很小。最低点通常是零浓度，其也避免了分散误差。相反的，体积误差的影响在剂量反应曲线的中间有它的最大效果。因此，至少由于这些原因，考虑整个曲线可以提供更加现实的试验数据质量的量度。

1.1剂量依赖.图像大小和放大率依赖

单细胞斜率的平均值可以用作试验参数，例如使来自孔的数据特征化。

图14表示核易位剂量曲线，用于计算作为试验参数的平均细胞斜率的适合性。从一组剂量依赖的图像收集数据，诸如那些在图2中的。此处，平均细胞斜率(垂直轴)绘制为TNFα浓度(水平轴)的函数。相应的v因子是0.77。

图15表示作为不同图像大小(报告为平方毫米)的插值放大率(水平轴)的函数的、用于核易位量度的v因子(垂直轴)。具体的，这种算法的行为被研究作为(1)插值图像放大率，从起初的10X放大率下降到2X的放大率，以及(2)图像大小，从0.510mm²向下到0.009mm²，的函数。v因子用作质量度量。通过双线性方法完成图像插值。为了研究图像大小的依赖性，对于曲线中各点的原始图像分割为较小尺寸的图像片断。接下来，各个较小图像用于产生易位量度，并且这些量度用于v-因子的公式。用于这些不同分析的结果在图15中示出，其表示算法到达0.8左右的v因子的稳定水平状态，其在4X或更大的放大率，及图像大小为0.34mm²或更大情况下。

平均细胞斜率算法可以具有几种期望的特征：(1)其不需要分割为亚细胞的区室；(2)其以放大率很好的缩放；(3)其不需要用户可设置的参数；(4)其对图像的总强度或对细胞间的强度变化不敏感；(5)其基于允许我们测试干扰(例如，噪音、不规则形状等)效果并寻找稳定量度的模型；以及(6)其可以整体的和/或在单细胞水平使用。

1.12 参数的最优化.最佳量度的选择

如果有可以用作必被分析的大组图像的参考的至少两个点(以及相应的图像)，在1.10部分描述的质量度量可以应用。这种排列的例子将成为一个板，所述板带有一些用作阴性和阳性对照的孔，以及用作测试孔的其它孔。在剂量曲线实验中，整个曲线可以用于计算质量。一旦其要应用到的样本和质量度量被建立，可能引起使参数最优化以达到最大可能质量的问题。类似的，如果几种带有相同生物学意义的量度通过算法(例如，斜率1或斜率3；单个斜率或整体斜率)获得，它们当中最好的可以在质量基础上选择。

此处所描述的易位量度没有任何真正的用户定义参数，至少在如环¹的宽度的是用户的参数的相同意义中。但是，有一些建立到算法中的参数，其可能需要对新细胞类型或特定染色调整或从中受益。例如，如1.5部分中所述的标记和分水岭的参数控制检测。最优化的适合的方法是在本领域[13]中所熟知的。

最优化的实践应用可以是不同的。阳性和阴性对照可以存在于每个板上，一次用于一组板，或(在一些情况中)被计算而不是被度量。在剂量曲线实验中，各曲线可以单独优化，或优化可以对指定的控制曲线进行，等等。

实施例2. 膜到细胞质易位试验

本实施例描述本学说的另一种示范性实施方式：膜到细胞质(或细胞质到膜)的易位试验。在这个试验中，诸如蛋白质等的标记的部分从细胞的原生质膜易位到细胞质。

图16表示GFP标记的存活细胞的运动系列的图像。此处，左画面是阴性状态(无易位)，中间画面是中间状态(一些易位)，以及右画面是阳性状态(显著易位)。

图17表示膜到细胞质易位中的信号和复染色的联合分布的模型。此处，顶画面表示膜的定位，和底画面表示细胞质的定位。复染色具有在核中的高水平染色，以及低的但不是零的水平的细胞质染色。

图18表示来自真实细胞的分布。此处，顶部和底部画面分别表示膜和细胞质的定位，如图17所示。以上定义的斜率的相同的量度可以用于描述膜到细胞质的易位的特征。此外，直方图暗示了量度的使用，所述量度根据斜率段到Y轴的的延长之上的点，如在图17和18中由虚线的矩形所示出的。

图19表示信号和复染色的联合分布的模型，此处用于试验中的复染色不是细胞核染色，而是膜染色。所述膜的定位情况可以通过单独的斜率描述，但是细胞质定位使用两个斜率参数。

更通常的，具有256*256单元(bin)的初始的直方图可以分为较粗糙的栅格，如图17中示出的。可以选择单元(bin)的大小以提供在各单元(bin)中的合理数量的观察。然后，各2D直方图成为在N-维空间中的向量，此处N-是单元(bin)的数字。这允许作为模式识别问题来处理此问题并使用方法⁸的所有可得到的集成。

实施例3. 粒状重组试验的扩散

3.1 背景

响应刺激，细胞组分可以从扩散到粒状亚细胞模式(和反之亦然)重新排列，诸如带有调节子的细胞治疗。例如，蛋白质可以补充到(和/或移动到)亚细胞质区域(例如小泡)和到亚核区域(例如，PML体)以响应适合配体的治疗。因此，需要***(包括方法、算法、和设备)以测量在不同测试条件下报道基因在细胞中、在细胞上或围绕细胞的扩散变化，诸如在筛选试验中暴露于多个未知效果的调节子。

3.2 受体激活(Transfluor)试验

Transfluor试验(由Xsira Pharmaceuticals^TM经营的)用于测量G-蛋白偶联受体(GPCRs)的活性。这个试验采用融合到β-抑制蛋白的绿色荧光蛋白(GFP)作为受体。试验的基础是测量这种融合蛋白的亚细胞位置，其根据受体活性而变化。尤其是，此融合蛋白根据受体活性(例如配体结合)的从扩散细胞质位置到粒状细胞质分布(和/或膜相关)的变化。由于β-抑制蛋白涉及许多GPCRs的调节，其被考虑作为通用试验，也就是说，一个可以用作测量不同类别GPCRs的活性的试验。

在Transfluor试验中的受体内在化引起图像呈现报道基因的更多的粒状分布。尤其是，报道基因在细胞内的分布变为较少均一的，以形成集中的报道基因信号的“地点(spots)”和“圆点(dots)”。Transfluor图像的实施例在图20中示出。所述图像使用带有2*2单元划分(binning)的10X放大率的物镜采集。画面A表示不带有GPCR激活的“阴性”细胞并呈现报道基因的扩散分布。画面B表示带有部分激活的GPCR的“中间”细胞。画面C表示带有完全激活的GPCR的“阳性”细胞并呈现报道基因的粒状分布。

3.3 分析Transfluor图像的方法

本学说提供用于分析Transfluor图像的方法。在一些实施例中，此方法可以使简单测量中粒度的直观概念形式化。例如，此方法可以采用在数学形态学中已知的概念作为大小分类[11]，粒度测定[15]、模式光谱[14]、和粒状光谱[17]。通过带有增加尺寸的结构元素的原始图像系列开运算而产生分布。在腐蚀步骤中，各像素的值设置为对应于它的环境像素(例如，在其角落和侧面的四个像素，或完全围绕像素的八个像素，等等)的最小值。在膨胀步骤中，各像素的值设置为对应于它的环境像素的最大值。各开运算可以包括一个和更多的相继的腐蚀步骤，一个或更多的相继的膨胀步骤跟随其后。腐蚀(和膨胀)步骤的数量决定开运算的大小(和结构元素的大小)。例如，大小“一”的开运算通过单独的腐蚀和膨胀步骤产生，大小“二”的开运算通过由两个膨胀步骤跟随的两个腐蚀步骤产生，等等。每次开运算后，产生的开运算过的图像的容积被计算为所有像素的总合。

图21表增加尺寸的开运算如何影响带有不同粒度的图像。亮度分布在通过细胞(在各画面中指示为由穿过细胞的线嵌入)取得的画面A-C中示出。从左到右的三个画面表示Transfluor试验的阴性的、中间的、和阳性的状态。在各画面的图表中呈现用于原始图像(顶部分布)的亮度分布，通过大小1的结构元素开运算的图像(中间分布)，和通过大小4的结构元素开运算的图像(底面分布)。

以不同的开运算大小开运算的图像的容积的差异是粒状光谱，通过以下公式给出：

G(n)＝V(γ_n-1(X))-V(γ_n(X))

此处X是图像，n是开运算大小，也称之为厚度，G(n)是在第n个开运算的粒状光谱，γ_n(X)是图像X的第n个开运算，V(X)是图像X的容积(像素值总和)。对于试验的阴性、中间、和阳性状态的粒状光谱在图22中示出，其带有相对于在这个开运算(y-轴)的图像容积百分数而绘制的开运算(x-轴)的大小。为了描述试验的不同状态的特征，我们引入称为相对粒度的量度，通过以下公示给出：

RG＝G(T1)/G(T2)

此处，RG是相对粒度，T1是试验的粒状(阳性)状态最大特征厚度，T2是试验的分散(阴性)状态的最大特征厚度。T1和T2并不是必须为单独的值，而可以是厚度范围，在这个情况下采用粒状光谱值的平均值。使用区域开运算[16]代替开运算以产生的粒状光谱可以是有益的。

为了研究放大率和图像大小对相对粒度的影响，我们使用z值，因为不能得到详细的剂量曲线。用于实验的两组图像：一组用于阳性状态和一组用于阴性状态。在每组中，一个图像使用10X物镜得到，一个使用20X物镜得到，二者都具有2乘2的单元划分(binning)；因此根据空间分辨率，我们在此处称它们为5X和10X放大率。这样具有使图表能够对比于所描述的其它试验的益处。20X的图像对应于10X图像中间的四分之一。此外，我们使用的图像是10X图像的中间的四分之一。三种图像的每一个被分成四个片断，和为阴性和阳性状态，各片断计算一个试验测量-相对粒度。然后Z数值使用阴性和阳性设置来计算。图23表示好的试验成绩(以虚线的椭圆形示出的)的窗口，在2X及以上的放大率，和0.4mm²的图像大小。

以上表述的算法可以具有几个期望的特征：(1)不需要分割，(2)以放大率很好地缩放，(3)具有清楚的生物学意义，(4)不需要设置任何用户参数，以及(5)对总图像强度不敏感，其可以通过照相机设置的差别而引起。

实施例4. 示范性实施方式

本实施例描述了本学说选择的实施方式，表述为一系列编号的段落：

1.生物细胞中报道基因的联合分布的量度的计算方法，其包括：(A)提供至少两个在细胞中可观测的报道基因；(B)得到细胞中报道基因的数字图像；以及(C)使用报道基因图像值的至少二维分布来计算细胞条件的量度特征。

2.段落1的方法，其中有N个报道基因，且其中使用的步骤包括形成至少一直方图的步骤，所述直方图选自在相同物体的图像组中的报道基因值的N-维直方图、在相同物体的图像组中的报道基因值的若干2-维直方图，以及在相同物体的图像组中的报道基因值的维度在2和N之间的若干直方图组成的组。

3.段落1的方法，其中使用的步骤包括使至少一个报道基因图像的强度规格化(局部均衡化)的步骤。

4.段落1的方法，其中使用的步骤是在单独的逐个细胞基础上进行。

5.段落1的方法，其中使用的步骤是对图像中的细胞子集(可以是单独的细胞或对于作为整体的亚群)执行的。

6.段落1的方法，其中使用的步骤是对整个图像执行的，不识别单独的细胞。

7.段落1的方法，其中使用的步骤包括从图像去除伪像的步骤。

8.段落2的方法，其中使用的步骤还包括使模型适应于N-维直方图，其中所述量度是模型参数。

9.段落1的方法，其中第一报道基因与细胞区室关联，以及第二报道基因与蛋白质(或其它物质)关联，所述蛋白质在实验条件下可以从一个细胞区室到另一细胞区室改变它的位置。

10.段落1的方法，其中所述第一报道基因与细胞核关联，以及第二报道基因与蛋白质(和其它物质)关联，所述蛋白质在实验条件下可以从细胞质到细胞核，或细胞核到细胞质改变它的位置。

11.段落1的方法，其中第一报道基因与细胞核关联，以及第二报道基因与蛋白质(和其它物质)关联，所述蛋白质在实验条件下可以从细胞膜到细胞质，或细胞质到细胞膜改变它的位置。

12.段落1的方法，其中第一报道基因与细胞膜关联，以及第二报道基因与蛋白质(或其它物质)关联，所述蛋白质在实验条件下可以从细胞膜到细胞质，或细胞质到细胞膜改变它的位置。

13.段落8和10的方法，其中所述模型是可变长度的直线段，所述可变长度近似于易位的蛋白质报道基因相对于细胞核报道基因(例如，如图20示出的)的分布的右边，其中所述量度是这条线的斜率。

14.段落8和11的方法，其中所述模型基于可变长度的直线段，其近似于易位的蛋白质报道基因相对于核报道基因(例如，如图26示出的)的分布的右边，并且其中所述量度是分布(例如，如图26示出的)中点的子集的统计量。

15.段落8和12的方法，其中所述模型是基于可变长度的直线段，其近似于易位的蛋白质报道基因相对于膜报道基因(例如，如图28示出的)的分布的右边。

16.段落2的方法，其中所述N-维直方图被视为M-维向量(M是这样的直方图中的单元(bin)的总数)，其中每个细胞(或细胞群，或整个图像)被视为M-维空间中的点，其中使用模式识别方法分析细胞。

17.段落16的方法，其中这样的模式识别方法是到预定类别中的细胞分类法，其中所述量度是对这样的类别相似的程度和类名。

18.段落1的方法，其中报道基因图像被预处理为使一些不期望的特征(例如，由于核仁而填充孔)弱化或将其校正，或加强一些期望的特征。

19.段落4的方法，细胞群通过位置的统计学量度或通过变异的统计学量度而描述特征。

20.段落19的方法，其中所述位置的量度选自由平均值、中值、众数等组成的组；并且其中所述变异的量度选自标准差、围绕中值的中值偏差等组成的组。

21.段落4的方法，其中细胞群通过单细胞量度分布的直方图的主成分分析(PCA)来描述特征。

22.段落1的方法，其中量度是细胞状态的名义(分类)量度，例如细胞循环周期的阶段。

23.段落1的方法，其中获得数字图像的步骤对于至少两个不同的报道基因同时执行。

24.段落1的方法，其中获得数字图像的步骤对于至少两个不同的报道基因相继执行。

25.段落1的方法，其中所述度量在低放大率，例如≤2X物镜(～≥5μm/像素)。

26.生物细胞中报道基因的联合分布的量度的计算方法，其包括：(A)提供至少两个在细胞中可观测的报道基因；(B)在至少两个测试条件下得到细胞中报道基因的数字图像；(C)使用报道基因值的至少二维分布来计算细胞条件的度量特征；以及(D)在至少两个测试条件下提供在细胞量度上计算的质量度量。

27.段落26的方法，其中使用的步骤包括依赖一套数字参数的图像分析方法。

28.段落27的方法，其中选择数字参数的值以在至少两个测试条件下优化在细胞量度上计算的质量度量。

29.段落26的方法，其中使用的步骤包括至少两种计算细胞度量的方法，和在至少两个测试条件下给出最佳质量量度的方法的选择。

30.段落26的方法，其中使用的步骤包括选择图像子集的步骤，所述子集给出最佳质量量度(例如，在孔中的***的最佳的照相机视野或在照相机视野中的***的最佳区域-大多数用于聚焦的原因)。

31.段落28、29、和30的方法，其中所述选择(优化)在至少两个测试条件的一套上执行并应用到其它测试条件。

32.段落26的方法，其中所述测试条件是试剂的不同浓度。

33.段落32的方法，其中所述试剂是候选的药物化合物。

34.段落26的方法，其中所述测试条件是某一过程的不同时间点。

35.将带有生物细胞的图像分割为含有单细胞或细胞群的片断的方法，其包括在图像上进行分水岭变换，所述图像是至少两个报道基因图像的组合。

以上所述的公开可以包括带有独立实用性的多个截然不同的发明。即使这些发明的每一个已经以其优选的形式公开，作为在本文中公开的和说明的其特定实施方式不被认为是限制的意思，因为许多变化是可能的。发明的主题包括本文所公开的不同元素、特征、功能、和/或特性的所有新的和非显而易见的组合以及子组合。以下权利要求特别指出被认为是新的和非显而易见的某些组合以及子组合。以特征、功能、元素、和/或特性的组合以及子组合实施的发明可以申请中要求权力，所述申请要求了这个以及相关申请的优选权。这样的权利要求，不论是否指向不同发明或相同发明，以及是否更宽、更窄，等同，或不同于原始权利要求的范围，也被认为包括在本公开的本发明的主题之内。

参考

1.美国专利号5,989,835，标题“用于基于细胞的筛选的***。”

2.PCT公布号WO 03/078965，标题“用于自动颜色分割和对于细胞区室的部分局部强度度量的最小有效响应的***和方法。”

3.美国公布号2003/0059093，标题“用于确定感兴趣细胞区室组织的方法。”

4.美国公布号2003/0202689，标题“用于生物标本的基于放射的图像分析。”

5.S.Beucher和F.Meyer的“分割的形态学方法：分水岭变换”，图像处理中的形态学，E.R.Dougherty-Ed.，pp.433-481，Marcel Dekker，New York，1993.。

6.L.Vincent和P.Soille的″数字空间中的分水岭：基于沉浸模拟的有效算法″，IEEE Transactions of Pattem Analysis and Machine Intelligence，13，No.6，pp.583-598，1991。

7.I.Ravkin、V.Temov、A.Nelson、M.Zarowitz、M.Hoopes、Y.Verhovsky、G.Ascue、S.Goldbard、O.Beske、B.Bhagwat和H.Marciniak的″使用编码载体的多路高通量图像血细胞计数″，Proc.SPIE Vol.5322，pp.52-63，2004(生物分子、细胞和组织的成像、处理和分析II；D.Nicolau、J.Enderlein、R.Leif和D.Farkas；Eds。)

8.R.Duda、P.Hart和D.Stork的“模式分类”，Wiley-Interscience，2nd Ed.，2000。

9.J.Zhang、T.Chung和K Oldenburg的″用于高通量筛选试验的计算和确认的简单统计参数″J.Biomol.Screening 4：pp.67-73，1999。

10.图像处理工具包，The MathWorks，Inc.

http://www.mathworks.com/products/image/。

11 .J.Serra的“图像分析和数学形态学”，Vol.1.Academic Press，London，1989。

12.I.Jolliffe的“主成分分析”，Springer-Verlag，2nd Ed.，2002。

13.R.Fletcher的“优化的实用方法”，Wiley，2nd Ed.，2000。

14.P.Maragos的″模式光谱和多尺度形状表示″，IEEE Transactions onPattern Analysis and Machine Intelligence，11，N7，pp.701-716，1989。

15.L.Vincent的″粒度测定和开运算树″，Fundamenta Informaticae，41，No.1-2，pp.57-90，IOS Press，2000。

16.L.Vincent的″用于灰度级图像的形态学区域开运算和闭运算″，Proc.NATO Shape in Picture Workshop，Driebergen，The Netherlands，pp.197-208，1992。

17.I.Ravkin和V.Temov的″位表示技术和图像处理″，Applied Informatics，v.14，pp.41-90，Finances and Statistics，Moskow，1988(in Russian)。

1.U.S.Patent No.5,989,835，entitled″System for cell-based screening.″

2.PCT Publication No.WO 03/078965，entitled″System and method forautomatic color segmentation and minimum significant response formeasurement of fractional localized intensity of cellular compartments.″

3.U.S.Publication No.2003/0059093，entitled″Methods for determining theorganization of a cellular component of interest.″

4.U.S.Publication No.2003/0202689，entitled″Ray-based image analysis forbiological specimens.″

5.S.Beucher and F.Meyer，″The Morphological Approach to Segmentation：The Watershed Transformation″in：Mathematical Morphology in ImageProcessing，E.R.Dougherty-Ed.，pp.433-481，Marcel Dekker，New York，1993.

6.L.Vincent and P.Soille，″Watersheds in Digital Spaces：An EfficientAlgorithm Based on Immersion Simulations″，IEEE Transactions of PattemAnalysis and Machine Intelligence，13，No.6，pp.583-598，1991.

7.I.Ravkin，V.Temov，A.Nelson，M.Zarowitz，M.Hoopes，Y.Verhovsky，G.Ascue，S.Goldbard，O.Beske，B.Bhagwat，and H.Marciniak，″Multiplexedhigh-throughput image cytometry using encoded carriers″，Proc.SPIE Vol.5322，pp.52-63，2004(Imaging，Manipulation，and Analysis of Biomolecules，Cells，and Tissues II；D.Nicolau，J.Enderlein，R.Leif，and D.Farkas；Eds.)

8.R.Duda，P.Hart，and D.Stork，Pattern Classification，Wiley-Interscience，2nd Ed.，2000.

9.J.Zhang，T.Chung，and K Oldenburg，″A simple statistical parameter for usein evaluation and validation of high throughput screening assays，″J.Biomol.Screening 4：pp.67-73，1999.

10.Image Processing Toolbox，The MathWorks，Inc.http://www.mathworks.com/products/image/.

11.J.Serra，Image Analysis and Mathematical Morphology，Vol.1.AcademicPress，London，1989.

12.I.Jolliffe，Principal Component Analysis，Springer-Verlag，2nd Ed.，2002.

13.R.Fletcher，Practical Methods of Optimization，Wiley，2nd Ed.，2000.

14.P.Maragos，″Pattern spectrum and multiscale shape representation″，IEEETransactions on Pattern Analysis and Machine Intelligence，11，N 7，pp.701-716，1989.

15.L.Vincent，″Granulometries and Opening Trees，″FundamentaInformaticae，41，No.1-2，pp.57-90，IOS Press，2000.

16.L.Vincent，″Morphological Area Opening and Closing for GrayscaleImages，″Proc.NATO Shape in Picture Workshop，Driebergen，The Netherlands，pp.197-208，1992.

17.I.Ravkin and V.Temov，″Bit representation techniques and imageprocessing，″Applied Informatics，v.14，pp.41-90，Finances and Statistics，Moskow，1988(in Russian).

Claims

1.一种计算生物细胞中报道基因联合分布量度的方法，其包括：

提供至少两个报道基因，其在细胞中是可视的；

得到细胞中所述报道基因的数字图像；以及

使用报道基因的所述图像值的至少二维分布以计算所述细胞的条件的量度特征。

2.如权利要求1所述的方法，其中有N个报道基因，以及其中所述使用的步骤包括形成至少一直方图的步骤，所述直方图选自在相同物体的图像组中的报道基因值的N-维直方图、在相同物体的图像组中的报道基因值的多个2-维直方图，以及在相同物体的图像组中的报道基因值的维度在2和N之间的多个直方图组成的组。

3.如权利要求1所述的方法，其中所述使用的步骤包括使至少一个所述报道基因图像的强度标准化的步骤。

4.如权利要求1所述的方法，其中所述使用的步骤在单独的逐个细胞的基础上进行。

5.如权利要求1所述的方法，其中所述使用的步骤对所述图像中的细胞子集进行。

6.如权利要求1所述的方法，其中所述使用的步骤的进行不带有单独细胞的识别。

7.如权利要求1所述的方法，其中所述使用的步骤包括从所述图像去除伪像的步骤。

8.如权利要求2所述的方法，其中所述使用的步骤还包括使模型适合于所述N-维直方图，及其中所述量度是所述模型的参数。

9.如权利要求1所述的方法，其中所述第一报道基因与细胞区室关联，以及所述第二报道基因与一个蛋白质关联，所述蛋白质在实验条件下可以从一个细胞区室到另一细胞区室改变它的位置。

10.如权利要求1所述的方法，其中所述第一报道基因与所述细胞核关联，以及所述第二报道基因与一个蛋白质关联，所述蛋白质在实验条件下可以从细胞质到细胞核、或细胞核到细胞质改变它的位置。

11.如权利要求1所述的方法，其中所述第一报道基因与所述细胞核关联，以及所述第二报道基因与一个蛋白质关联，所述蛋白质在实验条件下可以从细胞膜到细胞质、或细胞质到细胞膜改变它的位置。

12.如权利要求1所述的方法，其中所述第一报道基因与所述细胞膜关联，以及所述第二报道基因与一个蛋白质关联，所述蛋白质在实验条件下可以从细胞膜到细胞质、或细胞质到细胞膜改变它的位置。

13.如权利要求10所述的方法，其中存在N个报道基因，其中所述使用的步骤包括形成至少一直方图的步骤，所述直方图选自在相同物体的图像组中的报道基因值的N-维直方图、在相同物体的图像组中的报道基因值的多个2-维直方图，以及在相同物体的图像组中的报道基因值的维度在2和N之间的多个直方图组成的组，其中所述步骤还包括使模型适合于所述N-维直方图，其中所述量度是所述模型的参数，其中所述模型是可变长度的直线段，其近似于所述易位的蛋白质报道基因相对于细胞核报道基因分布的右边，以及其中所述量度是此线的斜率。

14.如权利要求11所述的方法，其中存在N个报道基因，其中所述使用的步骤包括形成至少一直方图的步骤，所述直方图选自在相同物体的图像组中的报道基因值的N-维直方图、在相同物体的图像组中的报道基因值的多个2-维直方图，以及在相同物体的图像组中的报道基因值的维度在2和N之间的多个直方图组成的组，其中所述步骤还包括使模型适合于所述N-维直方图，其中所述量度是所述模型的参数，其中所述模型基于可变长度的直线段，其近似于所述易位的蛋白质报道基因相对于细胞核报道基因分布的右边，其中所述量度是所述分布中点的子集的统计量。

15.如权利要求12所述的方法，其中存在N个报道基因，其中所述使用的步骤包括形成至少一直方图的步骤，所述直方图选自在相同物体的图像组中的报道基因值的N-维直方图、在相同物体的图像组中的报道基因值的多个2-维直方图，以及在相同物体的图像组中的报道基因值的维度在2和N之间的多个直方图组成的组，其中所述步骤还包括使模型适合于所述N-维直方图，其中所述量度是所述模型的参数，其中所述模型基于可变长度的直线段，其近似于所述易位的蛋白质报道基因相对于膜报道基因分布的右边。

16.如权利要求2所述的方法，其中所述N-维直方图被视为M-维向量(M是在此直方图中的单元的所述总数)，其中各细胞(或细胞群、或所述整个图像)被视为在所述M-维空间中的点，以及其中使用模式识别方法分析细胞。

17.如权利要求16所述的方法，其中此模式识别方法是把细胞分类到预定类别中，其中所述量度是相对此类别的相似度和类名。

18.如权利要求1所述的方法，其中报道基因图像被预处理以弱化或校正一些不期望的特征，或加强一些期望的特征。

19.如权利要求4所述的方法，其中所述细胞群通过位置的统计学量度或通过变异的统计学量度标定。

20.如权利要求19所述的方法，其中所述位置量度是选自平均值、中值、和众数组成的组，以及其中所述变异的量度是选自包括标准差、以及围绕中值的中值偏差的组。

21.如权利要求4所述的方法，其中所述细胞群由所述单细胞量度分布的所述直方图的主成分分析(PCA)来标定。

22.如权利要求1所述的方法，其中量度是细胞状态的名义(分类)量度。

23.如权利要求1所述的方法，其中所述获得数字图像的步骤对至少两个不同的报道基因同时进行。

24.如权利要求1所述的方法，其中所述得到数字图像的步骤对至少两个不同的报道基相继进行。

25.如权利要求1所述的方法，其中所述量度是在低放大率。

26.一种计算生物细胞中报道基因联合分布的量度的方法，其包括：

提供至少两个报道基因，其在细胞中是可视的；

在至少两个测试条件下得到细胞中所述报道基因的数字图像；

使用报道基因值的至少二维分布来计算所述细胞条件的度量特征；以及

在所述至少两个测试条件下提供在细胞量度上计算的质量度量。

27.如权利要求26所述的方法，其中所述使用的步骤包括根据一套数字参数的图像分析方法。

28.如权利要求27所述的方法，其中在所述至少两个测试条件下选择所述数字参数的值以优化在细胞量度上计算的所述质量度量。

29.如权利要求26所述的方法，其中所述使用的步骤包括至少两种计算细胞量度的方法，以及在所述至少两个测试条件下给出最佳质量度量的所述方法的选择。

30.如权利要求26所述的方法，其中所述使用的步骤包括选择给出最佳质量度量的图像子集的步骤。

31.如权利要求28、29、和30任一项所述的方法，其中所述选在至少两种测试条件下的一套上进行并应用到其它测试条件。

32.如权利要求26所述的方法，其中所述测试条件是试剂的不同浓度。

33.如权利要求32所述的方法，其中所述试剂是候选药物化合物。

34.如权利要求26所述的方法，其中所述测试条件是某一过程的不同时间点。

35.一种将带有生物细胞的图像分割为含有单细胞或细胞群的片断的方法，其包括在图像上进行分水岭变换，所述图像是至少两个报道基因的图像的组合。