CN118096640A - 用于鉴定图像序列中的分析物的方法 - Google Patents

用于鉴定图像序列中的分析物的方法 Download PDF

Info

Publication number
CN118096640A
CN118096640A CN202311595009.7A CN202311595009A CN118096640A CN 118096640 A CN118096640 A CN 118096640A CN 202311595009 A CN202311595009 A CN 202311595009A CN 118096640 A CN118096640 A CN 118096640A
Authority
CN
China
Prior art keywords
image
sequence
signal
analyte
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311595009.7A
Other languages
English (en)
Inventor
M·阿姆托尔
D·哈斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Carl Zeiss Microscopy GmbH
Original Assignee
Carl Zeiss Microscopy GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Carl Zeiss Microscopy GmbH filed Critical Carl Zeiss Microscopy GmbH
Publication of CN118096640A publication Critical patent/CN118096640A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种用于鉴定图像序列中的分析物的方法,图像序列通过在多轮染色中用标记物标记分析物并用相机检测标记物产生。相机在每轮染色中拍摄图像序列的一个图像。标记物分析物图像信号包括染色和未染色信号。该方法包括:提取图像序列的各一个图像区的多个信号序列,滤出候选信号序列,其至少其中一个染色和/或未染色信号与各自信号序列的至少其中另一个染色和/或未染色信号的比例是表征比例,和/或候选信号序列具有包括至少一个表征比例的表征标记,当信号序列具有至少一个表征比例和/或表征标记时,信号序列被鉴别为候选信号序列。若信号序列被鉴别为候选信号序列,则依据候选信号序列分配或鉴别分析物类型或将候选信号序列分配给背景。

Description

用于鉴定图像序列中的分析物的方法
技术领域
本发明涉及用于鉴定图像序列中的分析物的方法、用于训练具有用于提取图像序列中的候选区的候选提取模型的机器学习***的方法、用于训练具有用于确定图像序列的图像的配准信息的配准模型的机器学习***的方法、用于鉴定图像序列中的分析物的方法和用于借助配准模型确定图像序列的图像的配准信息的方法。
背景技术
从EP2992115B1中得到一种用于通过在多轮染色中用标记物染色待鉴定分析物来鉴定分析物的方法。标记物由寡核苷酸和与之偶联的染料构成,染料一般是荧光染料。寡核苷酸对待鉴定分析物的一定部分有特异性。但标记物的若干寡核苷酸对于各自分析物并非明确无疑。但由于有多轮染色而有可能进行分析物的明确无疑确定,因为在进行多轮染色之后可以将多个不同标记物分配给某个寡核苷酸并且所配属的多个标记物于是对于各自分析物是明确无疑的。
可利用这种方法在体外例如在细胞中借助荧光显微镜检测不同分析物。分析物可以是RNA、特别是mRNA或tRNA。分析物也可以是DNA的片段。
通常有许多分析物位于样本内,其可利用上述染色轮被并行鉴定,即便其在此情况下应是不同的分析物。样本内分析物越多,各自染色轮中待检标记物数量越大。在自动采集并评估相应图像信号情况下必须获得样本内所有标记物的图像信号并也与样本内的未由标记物引起的图像信号区分开。
从WO2020/254519A1和WO2021/255244A1中得到另一种方法,借此尤其能鉴定分析物、但也能鉴定蛋白质。在该方法中,首先将对各自分析物有特异性的探针偶联至分析物。探针含有不与分析物杂交的寡核苷酸残基。解码寡核苷酸在这些游离残基上杂交,解码寡核苷酸相对于游离残基突出。在突出部处,标记物分子(简称标记物)与染料杂交。在该方法中也在多轮染色中在相应分析物上产生一系列图像信号,它们给出关于各自存在的分析物的推断。但也知道了如下方法,此时标记物直接结合于寡核苷酸游离残基上。
事实表明,用于描述多轮染色的图像信号的数据量可以是几TB。处理这样大量的数据需要相应大的存储器需求。由此造成的购置和维护成本相应高。SSD硬盘优选用作数据存储器,其一方面适于存储如此大量的数据,另一方面允许快速访问数据。但是,SSD硬盘只允许有限次数的写周期。在这种大量数据的情况下很快就会达到极限,由此会导致***故障。另外,分析这样大量的数据需要相应高的计算能力,或者所述分析持续相应长的时间并且使用者必须相应长时间等候其实验结果。
发明内容
本发明基于以下任务,提供一种改善的用于鉴定图像序列中的分析物的方法,借此也可靠地识别具有仅略微高于噪声电平的图像信号的分析物。
本发明的另一任务是提供一种方法,其允许训练具有候选提取模型的机器学习***以鉴别图像序列中的候选信号序列。
本发明的另一任务是提供一种方法,其允许尽量好地相互配准图像序列的图像。
本发明的另一任务是提供一种用于鉴定分析物类型的方法。
本发明的一个方面涉及一种用于鉴定图像序列中的分析物的方法。该图像序列通过在多轮染色中用标记物标记分析物并用相机检测标记物来产生。相机在每轮染色中拍摄该图像序列的一个图像。标记物被选择成分析物图像信号在图像序列范围内在一个图像区中包括染色信号和未染色信号。该方法包括以下步骤:提取图像序列的各自一个图像区的多个信号序列,借助聚类分析(cluster analysis)算法聚类提取的信号序列,其中预定群的数量至少等于待鉴定分析物类型的数量。借助所执行的聚类分析算法,每个信号序列被分配给其中一个群。该方法还包括对于每个群确定群中心,对于每个待鉴定分析物类型基于码本理论序列确定至少一个理论群中心,其中码本对于每个待鉴定分析物类型包括一个理论序列,对于其中每个群中心确定群中心距理论群中心的距离,并且基于该距离将群分配给其中一个分析物类型或背景,以及基于一定群的分配来分配信号序列给分析物类型或背景。
根据本发明,分析物是实事,其在样本内的存在或缺失将被特异性证明并且在其存在情况下将对其存在进行编码。在此,它可以是任何类型的实体,包括蛋白质、多肽、蛋白质或核酸分子(如RNA、PNA或DNA),其也被称为转录物。分析物提供至少一个用于与分析物特异性探针特异性偶联的位点。本发明意义上的分析物也可以包括物体的络合物,例如至少两个单独的核酸、蛋白质或肽分子。在本文的一个实施方式中,分析物排除染色体。在本文的另一实施方式中,分析物排除DNA。在一些实施方式中,分析物可以是编码序列、结构核苷酸序列或结构核酸分子,当其在适当的调控序列的控制下时,其涉及一般通过mRNA翻译成多肽的核苷酸序列。编码序列的边界由5'-末端的翻译起始密码子和3'-末端的转换终止密码子决定。编码序列可以包括但不限于基因组DNA、cDNA、EST和重组核苷酸序列。根据应鉴定哪一类型的分析物,这种方法被称为空间转录组学或多组学。
术语图像信号以下被理解为兹是指用于预定颜色信道的某颜色的图像像点值,或者图像信号包含颜色图的颜色空间的不同基色的值。
根据本发明,分别包括标记物颜色的频谱范围也被称为颜色信道。在颜色信道内被分开的图像是单色图像且对于每个像点作为值或测量值包含在颜色信道的颜色中的像点的上述图像信号。
根据本发明,码本对于每个分析物类型包括一系列标记物,标记物在各自染色轮中偶联至各自分析物类型。
术语信号序列以下被理解兹是指在染色轮范围内的图像区的一系列图像信号。信号序列的图像信号可在一次实验中被记录。但信号序列的图像信号也可以例如为了训练是人工生成的,例如通过合适的模拟或使用生成模型。
在常见的用于鉴定图像序列中的分析物的方法中,首先鉴别图像序列范围内的亮像点,自该系列的亮像点创建一个信号序列并且直接使该信号序列与码本内的信号序列匹配。发明人已经认识到,通过聚类分析算法可以确定群和对应于聚类的群中心,据此可将信号序列分配给对应的理论群中心。通过这种方式,也可以鉴别如下分析物,其图像信号仅略微高于噪声信号。除了获得分析物图像信号的图像区的聚类外,还可能在聚类分析中中出现用于如下图像区的群,其未采集到分析物而是背景。相应地,信号序列可以被分配给一种分析物类型或背景。如果信号序列和所定的群中心的距离过大,则信号序列也可以直接被分配给背景。
各自距离可以是在聚类分析空间内的欧几里德距离,但或者该距离例如也可以取决于群内值分散地被归一化。在确定距离时也可以考虑各自信号序列的熵或距离矢量的熵。
优选地,信号序列的图像信号位于实验特征空间内,理论序列的理论信号位于参考特征空间内。此外,该方法在确定群中心与理论群中心之间距离之前还包括将图像信号从实验特征空间换算到参考特征空间中,其中所述换算尤其在聚类提取的信号序列之后或聚类提取的信号序列之后执行。
由于理论序列的项和信号序列的图像信号位于不同特征空间内,故需要将图像信号从实验特征空间换算到参考特征空间。此外,在参考特征空间内的匹配通常更容易,因为在参考特征空间内具有分析物的图像区的信号序列可容易与背景图像区信号序列分开。因此,信号序列的图像信号从实验特征空间换算到参考特征空间允许所定的群中心与理论群中心之间的简化匹配。
例如,实验特征空间通过在各自染色轮中的图像信号的信号高度得到,其中每个染色轮和进而每个图像还对应分配有所关注的荧光的频谱范围。参考特征空间例如可以是二值空间,在此,理论序列中的每一项或是一个真值、或是一个假值,其说明对应于理论序列的分析物是否在对应于所述项的染色轮中用标记物被标记。根据一个替代方案,参考特征空间通过标记物的各自发光色得到。分析物在不同的杂交轮次中用不同颜色的标记物来标记。每轮杂交中,依据在相应数量的染色轮中的不同标记物颜色的数量分别记录下与所用标记物对应的颜色记录。理论序列于是例如对每轮杂交包括一个项,所述项在此例如说明标记物颜色,或者在某个分析物未标记的情况下表明黑色值例如零或作为黑颜色。
优选地,该信号序列的图像信号和该理论序列的理论信号位于实验特征空间内。该理论序列的理论信号源自理论理论图像序列的至少一个参考记录,其中该参考记录例如来自早期的实验、此时例如仅处理一部分数据的替代的结算方法或采用替代记录方法的实验。
由于在聚类分析中在使群中心与理论群中心匹配时采用基于理论序列的理论信号的参考记录,故可以放弃将实验特征空间变换到参考特征空间,匹配于是还相应简单。
聚类分析算法优选是以下中的一个:k均值聚类,高斯混合模型聚类,GMM、基于核的主分量分析,EM聚类,Leiden聚类,Louvain聚类,决定性分析聚类。
由于例如采用k均值聚类,故以良好效率利用聚类算法。在使用高斯混合模型聚类时,人们在输出中获得后验分布,其在一个矢量中说明各自信号序列相对于高斯混合模型的每个群的所属性。
该方法优选在聚类提取的信号序列之前还包括信号序列的归一化,其中归一化包括以下中的至少一个:在一个图像范围内的图像信号归一化,在图像序列所有图像范围内的图像信号归一化,在信号序列范围内的图像信号归一化。
由于图像信号在整个图像范围内被归一化,故能保证在图像序列的图像中的平均亮度总是一样的。这允许更好地找到或利于聚类分析时的良好性能。同样,在图像序列的所有图像范围内或在信号序列的图像信号范围内的归一化利于在聚类分析中的良好聚类。
图像区优选分别仅包括一个像点、连贯像点的面或图像叠内的连贯体积。
由于图像区或是包括单独像点或连贯像点或图像叠内的连贯体积,故可以依据数据质量或依据所用显微镜的映射尺度单独包括一个图像区或包括多个像点,由此分析物鉴定方法相应灵活。
优选地,包括不止一个的像点的图像区的图像信号被汇总,例如代表图像信号地仅使用一个图像区的平均值、一个图像区的最大值或多个相邻像点的其它代表值。
由于包括多个像点的图像区的图像信号被汇总,故可显著降低聚类分析时计算支出。由于平均值或最大值被用作图像信号,故可更好识别染色信号。
例如可能的是,显微镜的点扩展函数设计成总是将分析物的图像信号映射到多个像点。相应地,人们可以通过在多个像点范围内求平均值或求最大值来更好地识别分析物信号。
该方法最好在借助聚类分析聚类提取的信号序列之前还包括借助主轴变换或奇异值分解的信号序列变换,从而变换后信号序列借助聚类分析被聚类。
由于变换后信号序列借助聚类分析被聚类,故例如可在聚类分析中相应简单分配借助主轴变换或奇异值分解提取的一定背景分量,因为群被更好定位。
优选仅在聚类分析中使用变换后信号序列的分量的子集。
事实表明,在合适变换例如主分量分析中,变换后的数据中的第一分量产生很大变化,但无助于分开分析物。第一分量也可以作为亮度来实现,依据该分量可以归一化其余分量,或者第一分量可以直接省去。由于人们现在省掉第一分量,故可省掉背景修正,由此在进一步分析中节约时间。
本发明的另一方面涉及一种用于训练具有用于从图像序列提取候选信号序列的候选提取模型的训练机器学习***的方法。图像序列通过在多轮染色中用标记物标记分析物并用相机检测标记物来产生。相机在每轮染色中拍摄该图像序列的一个图像。该标记物被选择成分析物图像信号在图像序列范围内在一个图像区内包括染色信号和未染色信号。候选区是如下图像区,在此以高概率获得分析物的图像信号。该方法包括以下步骤:提供标注的数据组并通过调整候选提取模型的模型参数优化目标函数,其中目标函数获得由候选提取模型输出的结果输出和目标输出之间差异,其特征是,该标注的数据组包括候选区的至少一个信号序列以及信号序列对此包括目标输出的背景图像区的信号序列,目标输出说明信号序列是否包括分析物图像信号。
由于候选提取模型利用北京图像区的信号序列以及获得分析物的图像区的信号序列被训练,故候选提取模型可被训练,其在从图像序列中提取的信号序列中高效快速地识别候选信号序列。相应地,候选提取模型的使用加速图像序列数据分析,因为只需针对候选信号序列进行计算很费事的与码本匹配以确定候选信号序列的分析物类型。另外,也可以借助候选提取模型识别候选信号序列,其没有像在现有技术中常见的那样包含很亮的染色信号。
优选地,候选提取模型被训练成依据最少数量的染色信号来鉴别候选信号序列,其中染色信号和未染色信号依据各自信号蓄力的染色信号和/或未染色信号之一与各自信号序列的至少其中另一个染色信号和/或未染色信号的至少一个一定比例被鉴别,和/或候选提取模型被训练成分别依据包括该至少一个一定比例的表征标记(characteristicsignature)鉴别候选信号序列。
发明人已认识到,获得分析物图像信号的图像区的信号序列分别具有各自信号序列的染色信号和/或未染色信号的至少一个一定比例。由此针对该候选信号序列得到表征标记,其包括染色信号和/或未染色信号的至少一个一定比例。依据一定比例可识别信号序列中的染色信号和未染色信号,因此也确定信号序列中的染色信号数量并因而可识别信号序列是否具有最少数量的染色信号。依据一定比例或表征标记,候选提取模型可训练成鉴别图像序列的信号序列中的染色信号和未染色信号及候选信号序列。由于首先所有信号序列中滤出候选区的信号序列,随后使各自信号序列与对应的理论序列匹配以确定各自分析物或各自候选区的分析物类型,故可显著降低在确定候选区的分析物类型时的计算支出,因为必须使明显较少的信号序列匹配于码本。
优选地,候选提取模型是完整折叠网络,其作为具有完整相连层的分类模型以若干图像区的信号序列被训练。在训练之后,分类模型的完整相连层通过折叠层被转移到完整折叠网络中,完整折叠网络可以同时处理图像序列的所有图像区的信号序列。
由于为了训练候选提取模型而采用具有完整相连层的分类模型,在训练中显著降低所需计算能力,故训练可以显著加速,因为分类模型的优化模型参数接着可被用在完整折叠网络中。接着可以在推断中使用完整折叠网络,其又提高网络流量。
优选地,候选提取模型是语义分割模型,且标注的数据组对于图像序列的每个图像包括分割掩膜,其给每个图像区分配一个值,该值说明图像区是否是在其中获得在图像序列范围内的候选信号序列的候选图像区,其中该值例如是一个位,其说明图像区是否是候选区。
由于候选提取模型作为语义分割模型被训练,故可以依据根据语义分割模型所分配的各自图像区类别在跟在候选区鉴别之后的候选区分析物类型鉴定中与类别对应地仅依据该类别使信号序列匹配于码本。
优选地,分割掩膜包括超过两个的类别。例如一个类别是一开始就不找候选信号序列,一个类别是将图像区分配给背景,一个类别是具有在此找到候选信号序列的图像区。
由于分割掩膜包括超过两个的类别,故例如在细胞外的图像区可以直接由模型识别,接着在该图像区中甚至不找候选信号序列,由此该方法被进一步加速,进一步节约计算能力。
候选提取模型最好是图像至图像模型,处理映射是图像至图像映射,标注的数据组中的目标输出或是说明图像区离具有候选信号序列的下一图像区有多远的间隔值,或是说明在图像区中获得候选信号序列的概率的概率值。
由于候选提取模型是图像至图像模型,故可以在依据目标输出鉴别要被用于使信号序列与码本目标序列匹配的信号序列时以简单方式设定一个阈,从而例如在模型推断中首先选择具有尽量小的间隔值或尽量高的概率值的信号序列,接着随增大的间隔值或下降的概率值一直推断,直到所找到的分析物的数量对应于所找到的分析物的预期数量。
标注的数据组为了训练图像至图像模型而优选包括概率图(probability map),在其中标记了带有分析物的像点,并且在带有分析物的像点周围对于周围像点生成一个具有在带有分析物的像点处的最大值的连续下降的连续函数,其说明下降概率。该函数可以是例如在带有分析物的像点处有最大值的高斯函数。
事实表明,在待识别物体近似呈点状时很难可靠训练候选提取模型。通过利用例如高斯钟形函数的训练,训练可被显著改善和稳定。
候选提取模型最好以探测模型形式实现,其输出候选区名单。
由于候选提取模型作为探测模型来实现,故候选提取模型的输出正好在低占位率下只包括很少的数据,因为耗用少量数据。
优选地,标注的数据组借助以下中的至少一个来生成:使用显微镜的代表性背景图像和已知的点扩展函数模拟不同标记物的信号,借助依靠可比较数据被训练过的生成模型生成标注的数据组,拍摄参考图像,其包括至少一个背景图像以及关于每个背景图像包括至少一个在此标记每种待鉴定分析物的图像,执行用于分析物空间鉴定的典型方法。
通过拍摄应对其在进一步过程中空间确定所含的分析物的样本的代表性背景图像以及通过使用代表性背景图像以及显微镜的已知的点扩展函数模拟标记物信号,可以通过简单方式以足够高的精度创建标注的数据组,从而存在与样本对应合适的标注的数据组,可借此训练合适的候选提取模型。
由于生成模型很好地适用于人工创建图像,故人们通过用生成模型生成标注的数据组而以很高效的方式做到创建高质量的标注的数据组。
通过拍摄包括背景图像和对于每个背景包括至少在其中标记每个待鉴定分析物的另一图像的参考图像,可以针对各自背景图像相应创建一个标注的数据组,因为在该至少另一图像中标记所有待鉴定分析物,因此能以简单方式与背景图像区分开。
由于人们在创建标注的数据组之前执行用于分析物空间识别的经典方法,故可创建特别逼真的标注的数据组。标注的数据组的创建于是虽然是计算很密集的,因为经典评估方法是计算很密集的。但由于接着借助经典方法确定的理论序列分别包含来自结果特征空间的记录,故匹配在此非常可靠。
优选地,标注的数据组借助上述的分析物和背景的鉴定方法借助聚类分析算法来生成。
由于前述的分析物鉴定方法借助聚类分析算法给所找到的分析物很靠地分配给一个分析物类型,故可以创建尤其完整的标注的数据组。
该方法优选还包括在输入到候选提取模型之前交换获得分析物的图像区信号序列的项的顺序。
由于在训练时交换获得图像信号分析物的图像区信号序列的项的顺序,故候选提取模型可以与在实验前所确定的码本无关地或与在实验前刚确定的染色轮顺序无关地被训练,候选提取模型仅学会相应与信号蓄力内的图像信号顺序无关地鉴别一定比例或基于该一定比例的表征标记。
目标函数优化优选包括多个训练轮。一轮训练由以下组成:从标注的数据组选择训练数据,依据训练数据确定目标函数,鉴别在候选区周围的预定第一半径内且例如在候选区周围的预定第二半径外的背景区的被错误分类为候选信号序列的信号序列,其中该预定第二半径小于预定第一半径,在下一轮训练中作为训练数据使用所鉴别的错误分配的信号序列还有在下一轮训练中所选的训练数据。另外,被错误识别为在候选区中的信号序列在候选区周围的预定第二半径外,其中该预定第二半径小于预定第一半径。
发明人注意到,因为仅有少量训练数据来自围绕具有分析物的图像区的紧邻周围,故频繁出现将信号序列错误识别为候选信号序列。
因而他们提出来自获得分析物图像信号的图像区周围的预定第一半径的背景区的信号序列被有目的地更频繁训练,以便也训练该模型用于从具有分析物的图像区周围的背景区中正确鉴别信号序列。
通过考虑在大于预定第二半径的半径内的信号序列和不考虑在预定第二半径内的图像区的信号序列,人们可以获得真阳性或假阳性候选信号序列之间的类别边界模糊,因为标记物信号因为显微镜的点扩展函数总是延伸于多个像点范围。
具有候选提取模型的机器学习***的训练优选包括候选提取模型的完整学习或经过预先训练的候选提取模型的变换学习,其中经过预先训练的候选提取模型依据样本类型、实验类型或用户ID从一组预先训练过的候选提取模型中被找到。
由于候选提取模型是预先训练过的候选提取模型,故可显著缩短训练所用总时间,同时由此在识别候选区时高精度训练高度专用的候选提取模型。
优选地,候选提取模型从一组经过预先训练的候选提取模型中选择候选提取模型包括检查该模型是否已经被充分训练并且跳过进一步训练。
由于首先检查经过预先训练的候选提取模型是否对于新数据已被充分调整,故人们能节省进一步的训练。
优选地,标注的数据组所含的信号序列是变换后信号序列,其借助主轴变换或奇异值分解由信号序列生成,其中变换后信号序列被输入候选提取模型以用于训练。
由于变换后信号序列被输入候选提取模型,故例如可借助主轴变换或奇异值分解可简单地从变换后信号序列中消除的一定背景分量近乎通过所述变换已在输入到模型之前被消除,由此可简单地由模型识别染色信号和未染色信号或候选信号序列。
本发明的另一方面涉及一种训练具有用于确定图像序列的图像的配准信息的配准模型的机器学***移信息和回转信息。该方法包括以下步骤:提供标注的数据组,通过调整配准模型的模型参数来优化目标函数,其中该目标函数获得由配准模型输出的结果配准输出与目标配准输出之间差异。该标注的数据组包括至少两个带有配准结构的图像,其中配准结构相对位移和/或倾转且可依据目标配准输出相互配准图像内的配准结构。
在常见的图像配准方法中,首先例如选择很亮的像点,由此得到的点云在分析上借助迭代最米点算法被相互配准。发明人已经发现,人们可以很好地将处理模型例如像神经网络训练用于快速高效地识别图像序列内的反复结构。故本发明所提供的方法允许明显加速图像序列的配准。
目标输出优选直接包括配准信息且配准模型直接被训练以相互配准图像。
由于配准模型被直接训练用于输出配准信息,故配准方法还能被进一步加速,因为完全配准例如可以在图形卡上实行。
标注的数据组优选还包括目标中间输出,其中目标中间输出被用作深度监测信号并反映配准结构的位置信息,目标函数还获得标注的数据组的目标中间输出与配准模型中间层的对应于目标中间输出的中间输出之间差异。
由于训练借助配准模型的中间输出被监测,故训练可以得到稳定且有可能更快速收敛。
优选地,目标配准输出包括配准结构的位置信息,配准模型被训练用于鉴别和定位配准结构并且目标函数获得标注的数据组所含的位置信息与配准模型所输出的位置信息之间差异。
由于配准模型输出配准结构的位置信息,故使用者能容易地控制输出,这使得检查更容易和直观,因此简化了错误分析。此外,关于所识别的配准结构的信息也可被用在评估的进一步过程中。
图像序列优选通过在多轮染色中用标记物标记分析物并用相机检测标记物来产生,其中相机在每轮染色中拍摄图像序列的一个图像,并且标记物被选择成分析物图像信号在图像序列范围内在一个图像区中包括染色信号和未染色信号。
由于在图像序列的图像中许多图像区包括染色信号和未染色信,即相比于背景完全无法识别许多图像区,因为它们在各自轮次中没有用标记物来标记,对于常见算法难以也理智地识别该像点并相互配准。但位移配准模型正好用这种图像序列被训练过,故它也容易识别这种模式且因此从多元组方法中进一步改善图像序列配准。
标注的数据组优选至少包括第一图像和第二图像,其中标注的数据组的第二图像借助增强从第一图像结算,其中增强包括位移、倾转和/或变形(distortion)。
由于配准模型利用带有人工错位的增强图像来训练,故标注的数据组能以简单手段来产生,而不必在先拍摄整个图像序列。故样本的负担降低且处理时间也缩短,因为首先只需拍摄单独一张图像或少量图像。
优选地,增强包括生成多个第二图像,其中第二图像的生成也包括在几个相互配准的图像内生成亮点,其中该亮点仅在其中几个第二图像内产生。
由于人们仅在其中几个第二图像中产生亮点,故人们可以直接训练配准模型以配准具有包含染色信号和未染色信号的信号序列的图像序列,这改善图像序列的图像的配准并且缩短该方法,因为拍摄单独一张图像已经足以作为用于生成标注的数据组的增强的基础。
本发明的另一方面涉及一种用于鉴定图像序列中的分析物的方法,其中图像序列通过在多轮染色中用标记物标记分析物并用相机检测标记物来产生。相机在每轮染色中拍摄该图像序列的一个图像。标记物被选择成分析物图像信号在图像序列范围内在一个图像区中包括染色信号和未染色信号。该方法包括:提取图像序列的各自一个图像区的多个信号序列,从提取的信号序列中滤出候选信号序列,其中候选信号序列的至少其中一个染色信号和/或未染色信号与各自信号序列的至少其中另一个染色信号和/或未染色信号之间的比例是一个表征比例,和/或候选信号序列具有包括该至少一个表征比例的表征标记,因此当该信号序列具有至少一个表征比例和/或表征标记时将该信号序列评定为候选信号序列。若信号序列被鉴别为候选信号序列,则依据候选信号序列分配或鉴定一个分析物类型或者将候选信号序列分配给背景。
如果候选信号序列被分配给一个分析物类型,则根据本发明鉴定候选信号序列的图像区内的分析物。
根据现有技术,在一个图像序列中鉴别以下像点,其具有高于一定阈值的图像信号。阈值分别在局部在图像序列的图像内被确定。发明人已经发现,抛开图像序列内的提供很亮的图像信号的分析物不算,还存在其它分析物,其图像信号仅略微与像点紧邻环境内的图像信号区分开。这种候选信号序列可以依据该染色信号和/或未染色信号的相互一定比例或依据信号序列内的包括至少一个一定比例的表征标记被鉴别。由于候选提取模型已被训练成依据该一定比例识别信号序列内的染色信号和未染色信号或依据包括该至少一个一定比例的表征标记来识别该染色信号和未染色信号,故借助该方法也可以找到样本内的分析物,其尽管在至少其中几轮染色中用标记物做了标记但仅自信号序列其余信号的亮度和周围像点的亮度略微下降。
优选地,滤出候选信号序列借助候选提取模型来完成,其中候选提取模型例如依据样本类型从一组候选提取模型中被找到。
由于可机器学习的候选提取模型被用于鉴别候选信号序列或鉴别分析物区,故能很高效地在突显序列中鉴别分析物区或候选信号序列。
候选提取模型优选被训练成依据各自信号序列的至少其中一个染色信号和/或未染色信号与各自信号序列的至少其中另一个染色信号和/或未染色信号的至少一个一定比例鉴别染色信号和未染色信号,和/或分别依据包括该至少一个一定比例的表征标记来鉴别候选信号序列。
发明人已经发现,获得分析物图像信号的图像区的信号序列分别具有在各自信号序列的染色信号和/或未染色信号之间的至少一个一定比例,从中针对候选信号序列得到包括染色信号和/或未染色信号的至少一个一定比例的表征标记。依据该一定比例,可以识别信号序列中的染色信号和未染色信号,因此也确定信号序列中的染色信号数量。依据该一定比例或表征标记,候选提取模型可被训练成鉴别染色信号和未染色信号以及图像序列的信号序列中的候选信号序列,即,候选提取模型学习识别一定样式。由于首先从全部信号序列中滤出候选区的信号序列,随后使各自信号序列匹配于相应的理论序列以确定各自分析物或各自候选区的分析物类型,故可显著降低在确定候选区的分析物类型时的计算支出,因为需要使少许多的信号序列匹配于码本。
候选提取模型优选是语义分割模型,其给每个图像区分配一个值,该值说明图像区是否获得分析物,其中该值例如说明图像区获得分析物的图像信号的概率或点值,或者该值是说明图像区是否是分析物的图像信号的图像。
由于候选提取模型作为语义分割模型被训练,故可以依据根据语义分割模型所分配的各自图像区类别在跟在候选信号序列鉴别之后分析物类型鉴定中与类别对应地仅依据类别使该信号序列匹配于码本。
优选地,分割掩膜包括超过两个的类别。例如一个类别是一开始不找候选信号序列,一个类别是将图像区分配给背景,一个类别是具有在此找到候选信号序列的图像区。
由于分割掩膜包括多于两个的类别,故例如细胞外的图像区可以直接由模型识别,接着在该图像区中根本无法找到候选信号序列,由此该方法被进一步加速且进一步节约计算能力。
候选提取模型优选是补丁分类器,其借助滑窗方法给每个图像区分配该值。
候选提取模型最好是完整折叠网络或作为具有完整相连层的分类模型以若干图像区的信号序列来训练,其中分类模型在训练后通过用折叠层取代完整相连层被转移到完整折叠网络中,完整折叠网络同时处理图像序列的所有图像区的信号序列。
由于为了训练候选提取模型而采用具有完整相连层的分类模型,故在训练中所需的计算能力显著降低,从而训练可被显著加速,以便分类模型的优化的模型参数随后可被用在完整折叠网络中。接着可以在推断中采用完整折叠网络,其又提高网络流量。
候选提取模型优选是图像至图像模型,其执行图像到图像映射,其给每个图像区分配一个间隔值,间隔值说明图像区离具有候选信号序列的下一图像区有多远,或者其给每个像点分配一个会是具有候选信号序列的图像区的概率。
由于候选提取模型是图像至图像模型,故可以在鉴别要被用于使信号序列与码本的目标信号序列匹配的信号序列时依据目标输出以简单方式设定一个阈,从而例如在模型推断中首先选择具有尽量小的间隔值或尽量高的概率值的信号序列,随后以增大的间隔值或降低的概率值一直推断,直到所找到的分析物的数量对应于所找到的分析物的预期数量。
候选提取模型优选以探测模型形式实现且输出获得分析物图像信号的图像区的名单。
图像坐标在此情况下包括空间和时间分量,因为图像序列具有空间坐标和时间坐标。
由于候选提取模型以探测模型形式实现,故候选提取模型的输出正好在占位率低时仅包含很少量的数据,故耗用数据少。
该方法优选在检查信号序列是否是候选信号序列之前还包括步骤借助主轴变换或奇异值分解的信号序列变换,其中变换后信号序列被用在检查信号序列是否是候选信号序列当中。
由于变换后信号序列被输入候选提取模型中,故例如一借助主轴变换或奇异值分解可简单地从变换后信号序列中消除的一些背景分量可以近乎通过所述变换已在输入模型之前被消除,由此能更简单地由模型识别染色信号和未染色信号或候选信号序列。
图像区最好分别是仅一个像点、连贯像点的面或在图像叠中的连贯体积,其中图像区的图像信号作为张量(tensor)被输入候选提取模型中。
由于人们将多个像点汇总为一个图像区,故人们可以降低信号序列评估时所需的计算能力。而逐像素的评估或许允许将紧挨着的分析物的信号分开,它们在多个像点汇总时将会相互融合。
可相应地依据样本内的预期分析物密度来选择图像区尺寸。在整个图像范围内,图像区的尺寸最好可分别根据在图像区内预期的分析物密度改变。
由于图像区尺寸可依据预期分析物密度来选择,故人们可以根据预期的分析物密度优化所需的计算支出。
根据本发明,在输入信号序列到模型例如处理模型中时可以将一些图像区的信号序列输入到模型中,这是指模型的感受野于是只包括唯一图像区,但或者模型的感受野也可包括相邻图像区的信号序列。模型接着尤其依据感受野内的其它图像区的图像信号或信号序列处理各自图像区的信号序列。这也是指在图像区的图像信号或信号序列的处理中加入空间上下文,在此正好是属于模型的感受野的相邻图像区的图像信号或信号序列。
例如可以基于显微镜点扩展函数来选择感受野中的图像区数量,使得感受野直径不大于、仅略微大于或例如是样本内的点因点扩散函数映射到其上的区域的直径的两倍。例如感受野是3x3、5x5、7x7、9x9、13x13或17x17图像区大小,但如果在染色轮中拍摄图像叠,则感受野也可以是3x3x3、5x5x5、7x7x7、9x9x9、13x13x13或17x17x17图像区大小。
该方法优选包括确定图像区。图像区的确定在此情况下尤其包括当相邻图像区具有候选信号序列时汇总相邻的图像区成一个图像区,其中汇总相邻图像区例如包括非最大值抑制。
通过汇总图像区到图像区并确定图像区信号序列,可以显著降低图像序列评估时的计算支出。
图像区的确定还优选包括检查图像区,其中图像区的检查包括以下中的至少一个:当图像区超出最大尺寸时将图像区分为两个以上的图像区,包括确定用于因划分而出现的每个图像区的图像区信号序列;当图像区分别仅通过几个桥接像点相连时和/或依据图像区的形状可看到在此两个区域相交时将图像区分为两个以上的图像区,包括确定用于因划分而出现的每个图像区的图像区信号序列;基于分析物上下文信息分开图像区,并且当图像区小于最小尺寸或所具有的形状无法可靠被分配给分析物时舍弃图像区。
最大尺寸优选依据预期的分析物密度来选择,从而在高的预期分析物密度的情况下该最大尺寸尽量小,而在低的预期分析物密度的情况下允许较大的最大尺寸。矩阵尺寸可以分别与图像语义分割对应地被选择。
由于人们根据某些标准分开或舍弃图像区,故在检查各自图像区的信号序列是否是候选信号序列时以及在鉴定信号序列的分析物类型时都能显著降低所需计算能力,还可以依据所述分开避免在一个图像区中采集多个、尤其是多个不同的分析物类型。
图像区信号序列的确定优选包括将相邻像点的图像信号汇总成图像区的一个组合图像信号。
图像区的确定优选在检查信号序列是否是候选信号序列之后且在鉴定信号序列的分析物类型之前和/或鉴定信号序列的分析物类型之后进行。
当例如在一个图像区中找到如此多的染色信号以致有可能在图像区中采集到多个候选信号序列时,因为图像区的确定可以在分析物类型鉴定会前和之后而确保例如也在分析物类型鉴定之后还能进行图像区的分开。相应地,图像区的分开允许更好地鉴定信号序列的分析物类型。
该方法优选包括作为分析物上下文信息在图像区确定,时使用所鉴定的分析物类型,其中分析物上下文信息尤其包括:关于依据分析物类型的图像区尺寸的信息,关于样本内的图像区的位置的信息,关于在样本内一定区域或一层内的某些分析物类型共存的信息,关于与样本内位置或图像区相关的预期分析物密度的信息。
由于在确定图像区时尤其采用关于所鉴定的分析物类型的上下文信息,故也可以在信号序列的分析物类型鉴定后总还是修正确定时的修正或确定时的错误。
例如可以想到,某些分析物类型仅出现在样本的某些区域如细胞的某些区域中。如果分析物类型的鉴定现在例如以第一概率表明第一分析物类型并以第二概率表明第二分析物类型,则可以依据上下文信息例如确定分析物肯定未对应于第一分析物类型,即便在所述概率即第一概率高于第二概率时。
优选地,图像区的确定在检查信号序列是否是候选信号序列之后且在分配候选信号序列给分析物类型或背景之前和/或在分配候选信号序列给分析物类型或背景之后进行。
由于不仅在检查之后、也在分配分析物类型之后还检查信号区域,故例如可以在不明确的分析物确定中还改变图像区,以便因此或许改善分析物类型的确定。
依据信号序列的分析物类型的鉴定优选包括从各自信号序列中确定结果位序列,其中给染色信号分配一个真值并给未染色信号分配一个假值,以便获得结果位序列,依据结果位序列鉴定分析物类型,其中将结果位序列与码本的目标位序列相比较,其对于每个待鉴定分析物类型包括至少一个目标位序列。
由于仅被鉴别为候选信号序列的信号序列被转送以鉴定候选信号序列的分析物类型,故在鉴定分析物类型时利用少许多的计算资源。在此情况下,结果位序列中的候选信号序列而二进制化允许与码本的目标位序列的特别简单的匹配。
结果位序列的确定优选借助二进制化模型进行,其例如是分类模型,分类模型被训练用于作为结果输出输出输出位序列,其中结果输出的分配或是如此生硬进行,即,二进制化模型给输入信号序列的染色信号分配该结果位序列中的一个真值,给输入信号序列的未染色信号分配该结果位序列中的假值,或是如此柔和进行,即,二进制化模型输出概率分布,在其中给信号序列的每个图像信号分配一个概率,其说明信号序列的各自图像信号是染色信号的概率。
因为使用分类模型如折叠神经网络,故可以通过很简单的方式生成结果位序列,它们能直接在分类模型的输出中匹配于目标位序列。
该方法优选包括调整灵敏度,其中灵敏度被一直调整,直到所鉴定的分析物数量大致等于预期的分析物数量。
由于在评估时能调整灵敏度参数,故可针对各不同的评估所用方法分别限定灵敏度值,以便由此以简单方式根据预期调整所鉴定的分析物的数量。
灵敏度优选尤其是能以此调设在提取的信号序列中鉴别的候选信号序列的数量的候选提取模型的模型灵敏度或以此在鉴定分析物类型时设定一个自此舍弃作为背景的候选信号序列的阈值的鉴别灵敏度。
由于人们设定模型灵敏度和鉴别灵敏度用于提取的信号序列的评估的不同步骤,故能分别相应更灵敏地安排信号序列的检查或分配给分析物类型。
根据上述的用于鉴定图像序列内分析物的方法的分析物类型的鉴定最好借助聚类分析进行。
由于在鉴定分析物类型时采用聚类分析,故能很细致地在合适的群中心处使所有候选信号序列直观。
用于鉴定图像序列内分析物的方法优选包括基于提取的信号序列生成扩展的标注的数据组和分配信号序列给各自分析物类型或背景,以及至少以生成的扩展的标注的数据组为标注的数据组执行上述机器学习***训练方法。
由于将分析物类型或被鉴别为候选信号序列的信号序列分配给背景借助另一方法进行,则候选提取模型可以在各自分析物类型鉴定或候选信号序列分配给背景之后借助改进的或扩展的标注的数据组被训练,使得其还更好地识别候选信号序列。
图像信号优选位于实验特征空间内,目标位序列的理论图像信号位于参考特征空间内。故该方法在将候选信号序列与码本信号序列比较之前还包括将候选信号序列从实验特征空间换算到参考特征空间中。
该方法在检查该信号序列是否是候选信号序列之前还包括执行该图像序列的图像信号的背景修正的步骤,其中该背景修正的执行包括以下当中的一个或多个:滚球法,过滤例如像礼帽法、同态过滤、低通过滤,其中从信号中抽取低通过滤结果,或者时间过滤,借助图像至图像模型的背景修正,借助混合模型的背景修正,借助平均偏移方法的背景修正,借助主分量分析的背景修正,借助非负矩阵因式分解的背景修正,借助利用非特异于图像序列所有图像区的激光的自体荧光激发的背景修正。
由于该方法包括背景修正,故信号序列的图像信号独立地且因此更好地与背景无关地被分开或例如在聚类分析和匹配时的计算支出降低,因为不必再考虑背景贡献。
信号序列的提取优选包括以下中的至少一个:提取图像序列的所有图像区,提取图像序列的图像区的随机选项,提取该图像序列的图像区的以图像区结构特性加权的选项,例如以对于细胞、胞核、细胞空隙和亮像点的较高概率,只从具有最低图像清晰度的图像区提取图像区,跳过预期没有分析物的图像区。
通过如上所述地巧妙提取图像区,可以显著降低图像序列的图像信号评估时的支出。
该方法还优选包括分析图像序列的图像质量,如果质量不够高则重复拍摄图像序列的其中一个图像,其中该质量例如依据以下中的一个或多个被确定:依据图像相互间的相对信号强度,依据存在于一些图像内的具有高于一定阈值的图像信号的像点,依据所鉴别的分析物的未预期的分布,其中分析物超比例频繁地基于图像序列的其中某个图像被鉴定,依据机器学习的质量评估模型,其针对以下情况被训练,针对图像、分图或像点或图像区来确定质量评估。
由于图像质量被直接分析,故可以已经在实验期间内在拍摄图像时确定图像质量并且相应地重复拍摄,这通常在实验结束后是无法再做到的,因为样本接着不再处于期望状态。故本发明通过分析图像质量做到了分析物确定时的可靠性提升,因为拍摄差的图像可被直接重复。
本发明的另一方面涉及一种借助配准模型确定图像序列的图像的配准信息的方法。配准信息至少包括平移信息和回转信息。配准模型针对在图像中识别配准结构被训练。配准结构是出现在图像中的结构,其可被明确无疑地分配一个位置。该方法包括将图像序列输入配准模型并基于位置信息确定配准的步骤。
由于根据用于确定配准信息的方法采用配准模型来确定配准结构,故可以在图像序列的图像配准时并非仅采用很亮的像点用于配准,相反,配准也可以借助伸长结构进行。这与从现有技术中知道的借助点云的图像配准相比改善图像的连续相互配准。
配准信息的确定最好在一个步骤中进行且配准模型直接输出配准信息。
由于配准模型直接确定图像序列的图像配准,故本发明提供一种很高效的图像配准方法,其完全可以例如在图形卡上实现。
该方法优选还包括滤出图像序列的图像中的配准结构和借助配准模型确定配准结构的位置信息以及提供位置信息给每个图像,其中配准信息的确定基于所定的位置信息进行。
由于配准模型首先确定配准结构的位置信息,配准可以说分两步执行,对于使用者来说可以更容易例如依据所输出的图像验证所定的位置信息。还可以在训练中借助中间输出来监测模型收敛性,由此模型训练变得稳定。
图像序列优选通过在多轮染色中用标记物标记分析物并用相机检测标记物来产生。相继在每轮染色中拍摄图像序列的一个图像。标记物被选择成分析物图像信号在一个图像区内在图像序列范围内包括染色信号和未染色信号,所述染色信号和/或未染色信号具有信号序列的其中一个染色信号和/或未染色与信号序列的至少其中另一个染色信号和/或未染色信号的至少一个一定比例,该信号序列具有包括该至少一个一定比例的表征标记。
由于配准模型以具有包含染色信号和未染色信号的信号序列的图像序列训练过,故配准模型也可以相互配准要相互配准的配准结构并非存在其全部图像中的图像序列的图像。
配准模型优选被训练成将以下结构中的至少一个识别为配准结构且分配位置信息:细胞边缘,细胞器,胞核,细胞骨架,线粒体,具有高于亮度阈的亮度的图像区,由标记物或标记物累加引起的点物,具有最低图像清晰度的结构如边缘,具有一定的、尤其是预定的结构或纹理的图像区,保持框,盖玻璃,样本台,样本夹,波形板/波形器皿,非样本结构。
在现有技术中尤其采用点以在空间分析学方法中相互配准图像序列的图像,但根据本发明的方法可以相互配准大量出现在显微镜图像中的结构。
配准结构的鉴别优选包括语义分割图像序列的图像,配准确定包括配准模型所输出的分割掩膜的相互配准。
由于配准模型能相互配准分割掩膜,故可以相互配准显微镜图像内的大面积的结构,因此配准在面中连续进行。
配准结构的鉴别优选包括确定概率图,其中概率图给每个像点分配一个将会是配准结构的概率,从而位置信息对于每个像点包括将会是配准结构的概率,配准的确定包括图像序列的图像的概率图的相互配准。
由于配准模型输出概率图,故配准可以精确根据所定概率进行,这进一步改善配准时的精度。
配准结构的鉴别优选包括输出一些所鉴别的具有配准结构的像点的位置信息,配准的确定包括相互配准这些像点的位置信息。例如为了配准像点而采用迭代最近点算法。
另外,该方法优选包括借助分类模型分类所鉴别的配准结构,其中该分类模型给所鉴别的配准结构分配一个类别,配准模型根据该类别判断分割掩膜是否输出用于所鉴别的配准结构的概率图和/或一些点的位置信息。
上述用于滤出候选信号序列的方法优选包括根据上述方法确定图像序列图像的图像的配准信息。
由于在滤出候选信号序列时首先借助配准模型来确定配准信息,故图像序列的图像的相互配准可被显著改善,这也显著改善找到候选信号序列。
对于图像序列的图像,最好根据至少其中两个上述的用于确定配准信息的方法确定至少两组不同的配准信息。利用不同组配准信息中的每一组,随后执行候选信号序列的滤出以及分析物类型的鉴定。鉴定分析物类型时的不同结果接着例如与分析物类型预期分布相比较并且选择其结果更好地与预期分布一致的配准。
此外,该方法优选包括使图像序列的图像缩放适配于标注的数据组中的图像的缩放。
由于图像序列的图像在处理之前适配于标注的数据组的缩放,故各自处理模型可以更容易且更好地根据训练过的映射识别各自结构。
附图说明
以下将结合附图所示的例子来详细解释本发明,图示出:
图1示意性示出与根据一个实施方式的用于鉴定图像序列中的分析物的方法连用的***;
图2示意性示出如在鉴定图像序列中分析物前所执行的用于通过在多轮染色中用标记物染色标记物并用相机检测标记物来产生图像序列的方法;
图3示意性示出用于与根据一个实施方式的方法连用的装置;
图4示出如可根据其中多个实施方式使用的处理模型的示意图;
图5示出如在不同实施方式的各不同方法中分析的测量数据的示意图;和
图6示出根据另一实施方式的方法过程的示意图。
附图标记列表
1 分析物数据评估***
2 显微镜
3 控制装置
4 评估装置
5 显微镜图像
6 三脚架
7 物镜转台
8 安装的物镜
9 样本台
10 保持架
11 样本架
12 显微镜相机
13 荧光照明装置
14 透射光照明装置
15 总览相机
16 视野
17 反光镜
18 屏幕
19 图像序列
20 存储器模块
21 信道
22 聚类分析控制模块
23 码本
24 聚类分析模块
25 图像区
26 背景图像区
27 配准控制模块
28 配准模块
29 候选提取控制模块
30 候选提取模块
31 信号序列
32 分配控制模块
33 分配模块
34 输出模块
35 理论位序列
36 分割掩膜
37 完整折叠网络
38 完整相连网络
39 分析物
具体实施方式
分析物数据评估***1的一个实施例包括显微镜2、控制装置3和评估装置4。显微镜2通信连接至评估装置4(例如借助有线连接或无线通信连接机构)。评估装置4可以评估用显微镜2获得的显微镜图像5(图1)。若分析物数据评估***1包括处理模型,则它也被称为机器学习***。
显微镜2是光学显微镜。显微镜2包括三脚架6,其包括其它显微镜部件。其它显微镜部件尤其是带有安装的物镜8的物镜轮换机构或物镜转台7、带有用于保持样本架11的保持框10的样本台9和显微镜相机12。
如果样本被夹入样本架11且物镜8被转动到显微镜光路中,则一个荧光照明装置13可以为了荧光拍摄照亮样本并且显微镜相机12自所夹样本接收作为检测光的荧光并且能按荧光对比度拍摄显微镜图像5。如果显微镜2应被用于透射光显微学,则可采用透射光照明装置14以照明样本。显微镜相机12接收透过所夹样本之后的检测光并且拍摄显微镜图像5。样本可以是任何物体、流体或组织。
可选地,显微镜2包括总览相机15,借此能拍摄样本周围的总览图像。总览图像例如表明样本架10。总览相机15的视野16大于在用显微镜相机12拍摄显微镜图像5时的视野。总览相机15借助反光镜17看向样本架11。反光镜17安置在物镜转台6上且能被选择代替物镜8。
根据此实施方式,控制装置3如图1示意性所示包括屏幕18以及评估装置4。控制装置3设立用于控制显微镜2以拍摄显微镜图像5的图像序列19并在评估装置4的存储器模块20上存储由显微镜相机12拍摄的图像序列19并根据需要在屏幕18上显示。所拍摄的显微镜图像5接着被评估装置4进一步处理。
评估装置4包括通过信道21交换数据的各不同模块。信道21是这些模块之间的逻辑数据连接机构。模块既可设计为软件模块、也可设计为硬件模块。
评估装置4包括存储器模块20。存储器模块20存储由显微镜2拍摄的显微镜图像5并保管要在评估装置4中评估的数据。
评估装置4包括存储器模块20,借此提供和存储图像序列19的图像数据。聚类分析控制模块22从存储器模块20中读取图像序列19的图像数据以及码本23并将图像数据和码本23转送至聚类分析模块24。
聚类分析模块24借助聚类分析算法如K均值聚类、高斯混合模型聚类、GMM、基于核的主分量分析聚类、EM聚类、Leiden聚类、Louvain聚类或决定性分析聚类分析图像数据。聚类分析模块24给图像数据、即图像序列19的各自图像区25或是分配分析物类型,或是将图像区25鉴别为背景图像区26。
在聚类分析之后,聚类分析模块24将分析后的图像数据回输给聚类分析控制模块22,从而聚类分析控制模块22在存储器模块20中存储分析结果。
此外,评估装置4包括配准控制模块27以及配准模块28。配准控制模块27从存储器模块20中读取图像序列19的显微镜图像5并且针对图像序列19的显微镜图像5确定配准信息。
根据一个实施方式,配准信息由配准模型来确定,其例如以神经网络形式实现。配准模型的训练由配准控制模块27控制。在训练期间,配准控制模块27从存储器模块20中读取标注的数据组的一部分数据并将其输入配准模型中。配准控制模块27依据配准模型的输出和标注的数据组中的目标数据确定目标函数并基于所定的目标函数优化配准模型的模型参数。
训练例如借助随机梯度下降法进行。也可采用任何其它训练方法。如果训练结束,则配准控制模块27在存储器模块20中存储配准模型的模型参数。
存储器模块20例如可以包括一组训练后的配准模型,其中配准模型例如依据实验的上下文信息或所研究的样本来定。
在推断期间,配准模块28将配准信息回输给配准控制模块27,其将配准信息存储到存储器模块20中,或是配准模块28将配准信息连同图像序列19一起转送至候选提取控制模块29。
候选提取控制模块29控制候选提取模块30。候选提取模块30设立用于从图像序列19的图像数据中提取图像序列19的各自图像区25的多个信号序列31并从提取的信号序列31中滤出候选信号序列,其中候选信号序列是图像区25的信号序列31,图像区以高概率获得分析物39的图像信号、即信号序列31在部分图像序列19中包括偶联到分析物39的标记物的图像信号。候选提取模块30包括例如候选提取模型,其针对滤出提取的信号序列31中的候选信号序列被训练。
在训练期间,候选提取控制模块29从存储器模块20读取标注的数据组的一部分数据并且将其输入候选提取模块30中。候选提取控制模块29依据候选提取模型的输出和标注的数据组的目标数据确定目标函数并基于所定的目标函数优化候选提取模型的模型参数。
训练例如借助随机梯度下降法进行。也可以采用任何其它训练方法。如果训练结束,则候选提取控制模块29在存储器模块20中存储候选提取模型的模型参数。
在推断期间,候选提取模块30将候选提取模型所输出的候选信号序列转送至分配控制模块32。
分配控制模块32将候选信号序列转送至分配模块33。分配模块33给候选信号序列分配分析物类型,其中分配控制模块32给分配模块33提供候选信号序列还***本23。依据码本23,分配模块33将候选信号序列与码本23的目标位序列相比较并且根据候选信号序列与码本23的目标位序列的重合给候选信号序列分配分析物类型,或者分配模块33将候选信号序列分配给背景。
根据一个实施方式,分配模块33包括分类模型,其以神经网络形式实现且被训练成给候选信号序列分配分析物类型或将候选信号序列分配给背景。
分配模块33在推断期间将分析物类型相对于候选信号序列的分配结果转送至输出模块34。输出模块34在存储器模块20中存储分析结果。
分类模型的训练由分配控制模块32控制。分配控制模块32从标注的数据组读取数据并将其输入分类模型中以用于训练。基于分类模型的输出和标注的数据组所含的目标输出,分配控制模块32计算目标函数并依据目标函数优化分类模型的模型参数。
在训练后,分类模型的模型参数借助分配控制模块32被存储在存储器模块20中。
以下将描述一种用于操作分析物数据评估***1(图4)的方法。
在所述的用于操作分析物数据评估***1的方法中,在一个步骤S1中首先生成标注的数据组。为此首先由显微镜相机12拍摄一个图像序列19。为了拍摄图像序列19,样本内的分析物39在多轮染色中被标记,使得对于获得分析物39的图像信号的图像区25在图像序列19范围内得到一个包括染色信号和未染色信号的信号序列31,其中标记物被选择成对于某个分析物类型的信号序列31与码本23内的分析物类型的理论位序列对应地得到一系列染色信号和未染色信号。
根据本发明,标记物偶联到分析物39且于是用显微相机12来采集。在标记物偶联到分析物39时,各不同的分析物39能用具有不同的荧光染料的标记物来标记,故在偶联之后拍摄许多显微镜图像5,分别与不同的荧光染料数量对应地以不同荧光对比度来拍摄。每次拍摄对应于一个染色轮。在拍摄了显微镜图像5后,标记物又与分析物39解偶。在标记物又与分析物39解偶之后,分析物39可以重新用新标记物来标记。在标记物重新偶联到标记物39时,这一次可以将不同颜色的标记物分别偶联到分析物39。大多数待鉴定分析物39可以在不同轮次的此时标记物偶联到分析物39的一些轮次中甚至完全没有用标记物被标记。从分别与荧光颜色相关的颜色信号和非颜色信号的由此得到的样式中得到针对某分析物39或某分析物类型预期的信号序列31。预期的信号序列31针对所有待鉴定的分析物类型在码本23内被汇总。
在拍摄图像序列19之后,图像序列19的显微镜图像5被相互配准。对此,手续简采用借助配准模块28来实现的经典的配准算法。在经典的配准算法中,在图像序列19的图像中鉴别发亮光的像点,由此得到的点云例如借助ICP算法被相互配准。在配准模块28已经相互配准图像序列19的显微镜图像5之后,相互配准的图像序列19的显微镜图像5借助配准控制模块27被存储到存储器模块20中。
此外,配准控制模块27可以从具有相互配准的s显微镜图像5的图像序列19中创建标注的数据组用于训练一个或多个配准模型。
在图像序列19的配准的显微镜图像5被存储在存储器模块20中之后,聚类分析控制模块22读取图像序列19并将图像序列19转送至聚类分析模块24。此外,聚类分析控制模块22从存储器模块20中读取码本23并将码本23转送至聚类分析模块24。聚类分析模块24借助高斯混合模型聚类完成聚类分析。在聚类分析中首先从图像序列19中提取并聚类信号序列31。
对于每个找到的群,聚类分析模块24确定群中心。此外,聚类分析模块24针对码本23中的理论位序列35确定理论群中心。接着,聚类分析模块24确定群中心与理论群中心之间距离。在混合分布模型如GMM情况下,所确定的后验分布在一个矢量中说明对混合分布模型中的每个群的所属性。故在混合分布模型情况下并非仅确定距离,相反,各自群的距离以及伸展范围的进入后验分布的对应于各自理论群的所属性概率中。
聚类分析模块24随后可以与每个信号序列31对应地给所属的群分配一个分析物类型。除了属于某个分析物类型的群外,在聚类分析中也出现如下群,其配属于背景、即无偶联到分析物的标记物的图像信号的像点。依据后验分布以及信号序列31距各自群的群中心的距离,聚类分析模块24也可以将远离群中心的图像区25的信号序列31分配给背景。为此,在聚类分析模块24中可以设定阈值。
在聚类分析之后,聚类分析模块24将聚类分析结果回输到聚类分析控制模块22。聚类分析控制模块22在存储器模块20中存储聚类分析结果。此外,聚类分析控制模块22创建用于训练候选提取模型的标注的数据组以及用于分配模块训练的标注的数据组。
代替高斯混合模型聚类,聚类分析模块24也可以采用替代的聚类方法或替代的聚类算法,例K均值聚类、基于核的主分量分析聚类、EM聚类、Leiden聚类、Louvain聚类或决定性分析聚类。
在执行聚类分析之前,信号序列31的图像信号还可以被相互归一化,例如图像信号可以在一个显微镜图像5范围内、在整个图像序列19范围内或仅在一个信号序列31范围内被归一化,
根据此实施方式,对于每个像点单独执行聚类分析。但或者也可以针对代表性信号序列31提取连贯像点的面,例如通过求平均值或求最大值进行。
在拍摄图像序列19时在每轮染色中拍摄一个图像叠。也可相应地代替单独像点提取一个信号序列31用于图像叠内像点的连贯体积以用于聚类分析。
提取的信号序列31可作为未处理的图像信号被用在聚类分析中,或者信号序列31例如可以借助主轴变换或奇异值分解被变换,随后利用聚类分析模块24完成聚类分析。
根据此实施方式,码23以理论位序列35集的形式存在。因此理论位序列35和信号序列31存在于不同的特征空间、实验特征空间和参考特征空间内。故在比较群中心与理论群中心前进行信号序列31变换到参考特征空间中。但或者码本23也可连同来自在先实验的参考信号序列存在。在此情况下,参考信号序列和信号序列31位于同一特征空间内且可省掉特征空间变换。
在聚类分析控制模块22已经在存储器模块20中存储用于训练候选提取模型的标注的数据组和用于训练分配模型的标注的数据组之后,训练阶段可以跟踪标注的数据组产生之后。
在第二步骤S2中实行配准模型、候选提取模型以及分配模型的训练。
根据此实施方式,配准模型被训练成在图像序列19的显微镜图像5中鉴别亮点并且输出亮点的位置信息。根据此实施方式,配准结构因此是亮像点。例如配准模型可以针对每个图像序列19的显微镜图像5输出一个位掩膜,在其中标记亮像点。由此得到的点云用经典方法被分析并且输出配准信息至配准控制模块27。配准信息至少包括平移信息和回转信息,其中该平移信息和回转信息分别说明图像相互间的平移或回转,以使彼此要相互配准的图像的某些点云相互重合。
除了平移和回转信息外,配准信息还可以是关于例如线性全局变换的信息,其可由也包含仿射变换(affine Transformationen)和剪切的变换矩阵表示,也可以包括关于局域变换、全局或局域非线性变换和本征相机参数(例如符号修正、相机的数值孔径或颜色孔径)的信息。
根据一个替代方案,配准信息可以分别关于每个图像被输出,或者计算配准后图像且仅存储配准后的图像。如果人们除了图像外还存储配准信息,则这有以下优点,人们还能事后检查配准信息,即便在配准信息存储要求附加存储器时。
根据一个替代方案,配准模型也可以直接确定配准信息。在此情况下,配准模型直接被训练用于相互配准图像序列19的显微镜图像5。这种模型也被称为端到端配准模型。
标注的数据组作为对配准模型的输入相应包括在先拍摄的图像序列19的显微镜图像5以及相应的用经典配准方法已创建的理论位掩膜。
用以训练端到端配准模型的标注的数据组例如包括一组未相互配准的显微镜图像5作为模型输入并且作为目标输出包括一组相互配准的显微镜图像5。或者,标注的数据组可以代替相互配准的显微镜图像5地也包括未相互配准的显微镜图像5以及配准信息。
在训练期间,配准控制模块27读取图像序列19的一部分显微镜图像5,借助目标函数获得配准模型所输出的位掩膜与理论掩膜之间差异并通过调整配准模型的模型参数优化配准模型。训练例如借助随机梯度法分多步进行。
一旦配准控制模块27确定配准模型被充分优化,则配准控制模块27结束配准模型训练并将配准模型的模型参数输入存储器模块20以用于随后应用。
如更前面已述地,配准模型被训练成完成用于图像序列19的图像5的配准,即便在图像序列19中未在所有图像包含有所有亮像点时,因为标记物被选择成在一个分析物39的一个信号序列中在一个图像区25内在图像序列19范围内出现染色信号和未染色信号。
根据一个替代方案,配准模型被训练成语义分割图像序列19的显微镜图像5。如果样本包括生物细胞,则细胞例如具有细胞边缘。配准模型针对输出分割掩膜36被训练,分割掩膜突显细胞边缘(见图2)。根据此替代方案,配准结构于是正好是细胞边缘。
为了能训练配准模型以创建分割掩膜36,标注的数据组必须包括相应分割的显微镜图像5。它们例如可以借助预先训练过的模型或借助其它的语义分割创建方法来手动创建。
对于该替代方案,配准模型对于每个图像序列19的显微镜图像5输出具有突显的细胞边缘的分割掩膜36。接着,能借助经典方法使分割掩膜36重合。经典方法至少输出平移和回转信息用于图像序列19的显微镜图像5。
在训练期间内,配准控制模块27读取图像序列19的一部分显微镜图像5,借助目标函数获得由配准模型输出的分割掩膜36与标注的数据组所含的理论分割掩膜36之间差异,并通过调整配准模型的模型参数优化目标函数。
根据其它替代方案,配准模型也可以针对执行图像到图像映射被训练,其对于图像序列19的每个显微镜图像5输出概率图,概率图说明各自像点是配准结构的概率。例如在DE102018133188A1中描述了一种用于创建这种概率图的方法。
根据其它替代方案,配准结构例如可以是细胞器、细胞核、细胞骨架、线粒体、具有最低图像清晰度的结构例如任何边缘、保持框10、盖玻璃、样本台、9、样本夹、波形器皿/波形板、微滴定板和其它非样本结构。
根据另一替代方案,配准模块28也可以配设有多个配准模型。关于多个配准模型,配准模块28于是还包括分类模型。分类模型给图像序列19的每个像点分配一个类别,根据该类别来选择相应的配准模型用于各自像点。例如具有不清晰边缘的机构更好地适用于借助概率图相互配准。而清晰结构例如像细胞边缘能很好地借助语义分割来识别并且相应地相互配准。
如果配准模块28包括多个配准模型,则每个模型必须分别被独立训练。根据一个替代方案,从其中多个配准模型中可以确定多组配准信息。所述多组配准信息可以在该方法的一个随后步骤中被彼此并行使用以便以各不同配准信息分别例如确定候选信号序列和/或分析物类型。接着依据所获的候选信号序列和/或分析物类型来评定其中哪组配准信息是最佳一组配准信息。
根据另一替代方案,用于训练配准模型的标注的数据组除了未相互配准的显微镜图像5和相互配准的显微镜图像5外还可以包括配准结构的位置信息。配准结构对应于被训练用于输出配准结构位置信息的端到端配准模型的中间层的输出。在随后的层中从一定的位置信息中生成配准信息。配准信息生成的训练接着借助输出层被监测。因此端到端配准模型被训练,在此配准过程分两级进行。
在上述配准模型的训练期间,配准控制模块27也可以分别仅将标注的数据组的图像序列19的部分的显微镜图像5输入各自配准模型中。例如端到端配准模型可以是折叠网络,其针对部分图像被训练,在确定模型参数之后、即在训练之后,折叠网络可以被改写成完整折叠网络37并且提供配准用于图像序列19的全部显微镜图像5。
此外,为了训练配准模型,也可以基于单独拍摄的图像5构建标注的数据组。为此,单独拍摄的以下称为第一显微镜图像5的显微镜图像5通过增强被转移到第二显微镜图像5中。第二显微镜图像的构建的增强例如可以包括位移、倾转或变形。
根据一个替代方案,也可以构建多个第二显微镜图像5,其中分别在初始第一显微镜图像5的相同点补充仅存在于一部分第二显微镜图像5中的亮点。借助如此构建的标注的数据组,配准模型可以直接被训练用于配准具有出现有染色信号和未染色信号的候选信号序列的图像序列19的图像序列19的显微镜图像5。
除了训练该配准模型或其中多个配准模型外,步骤S2还包括训练候选提取模型。
根据此实施方式,候选提取模型针对以下内容被训练,依据染色信号数量鉴别候选信号序列或分别依据包括至少一个一定比例的表征标记鉴别候选信号序列。为了将染色信号与未染色信号区分开,候选提取模型在候选信号序列中知晓染色信号与未染色信号、染色信号与染色信号、未染色信号与染色信号或未染色信号与未染色信号的至少一个一定比例。即,候选信号序列具有各自信号序列的其中一个染色信号和/或未染色信号与各自信号序列31的其中至少另一个染色信号和/或未染色信号的至少一个一定比例。
该一定比例可以是图像信号之间的一定距离、图像信号商、具有比余者更高图像信号的一定数量的图像信号,其中该比例可分别对于归一化的图像信号或未归一化的图像信号被知悉。在现有技术尤其是考虑很亮的像点的图像信号,而发明人已经认识到,获得分析物39的图像信号的像点的信号序列具有带有上述一定比例的图像信号,或者信号序列31分别具有表征标记。在分析上只能困难地定义表征标记,其可能对于各不同分析物类型是不同的,但事实表明神经网络能利用充分训练很好地鉴别表征标记或一定比例。
为了识别候选信号序列中的染色信号数量,标注的数据组必须包括获得分析物39的图像信号的图像区25的信号序列31,其中信号序列31的染色信号和未染色信号具有该一定比例或表征标记。此外,标注的数据组包括背景图像区26的信号序列31。背景图像区26只离散具有染色信号,它们大多归结于未除去的或错误偶联的标记物。
根据第一实施方式,候选提取模型是完整折叠网络37。候选提取模型首先作为是具有完整相连层的完整相连网络38的分类模型以一些图像区25的信号序列31被训练。为此,候选提取控制模块29将标注的数据组的信号序列31输入候选提取模型中。分类模型给信号序列31分配一个类别,其说明信号序列31是否是候选信号序列。候选信号序列是如下信号序列,其或是具有表征标记,或是以高概率具有表征标记或者具有有一定比例的染色信号或未染色信号。
分类模型可以或是二值分类器,例如于是1说明它是候选信号序列,但类别分配也能柔和进行,分类模型对于每个类别输出属于各自类别的概率。
候选提取控制模块29又控制训练,做法是它从标注的数据组读出一部分的信号序列31,将信号序列31提供给分类模型,并且借助目标函数获得分类模型输出与理论输出之间差异。另外,候选提取控制模块29依据分类模型的模型参数来优化目标函数。
如果具有完整相连层的分类模型被训练完,则完整相连层被转变为完整折叠层。所出现的完整折叠网络于是可以作为输入处理完整图像序列19。作为输出,训练完的分类模型或于是转变为完整折叠网络例如输出分割掩膜36,在其中突显所有具有候选信号序列的图像区25(见图2的下侧中心)。
根据一个替代方案,候选提取模型也可以是图像至图像模型,其学习图像至图像映射。在标注的数据组中的目标输出于是或是说明各自图像区25距具有候选图像序列的下一图像区25有多远的间隔值,或是图像区25获得候选图像序列的概率有多高的概率值。
根据另一替代方案,候选提取模型是探测模型。探测模型仅输出获得候选信号序列的图像区25的名单。
根据此实施方式,控制模块22可在确定目标函数后鉴别被错误分类为候选信号序列且源于位于实际获得候选信号序列的图像区25周围的预定第一半径内的图像区25的信号序列31。因为信号序列31是随机从标注的数据值中选择的,故可能的是训练时所用的仅少量的信号序列31位于预定第一半径内。正确分类这种信号序列31因为在用于候选提取模型的各自训练组中数量很少而是困难的。为了改善识别被错误分类为候选信号序列的信号序列31,被错误分类为候选信号序列的信号序列31在随后的训练轮中被自动纳入待训练的数据组中,以增大其在目标函数中的权重。该方法也被称为负样硬挖掘(Hard-Negative-Mining)。
根据一个改动方案,能可选地在负样硬挖掘中没有将位于小于预定第一半径的且紧邻正确获得候选信号序列的图像区25的预定第二半径内的像点的信号序列一并转入随后的训练轮中。根据显微镜2的点扩展函数,标记物信号一般延伸经过多个像点。如果人们现在将位于预定第二半径内的像点的信号序列31也用于负样硬挖掘,则出现类别边界模糊,这是应避免的。
根据另一替代方案,标注的数据组可以代替借助聚类分析控制模块22也利用其它手段来生成。例如不同标记物的信号可以在使用显微镜2的代表性背景图像和已知的点扩展函数的情况下被模拟。码本23于是也加入这种模拟中。或者,也可以针对生成标注的数据组来训练生成模型。因为生成模型很好地适用于生成显微镜图像5,故可以借助生成模型创建很逼真的标注的数据组。此外,也可以拍摄一个或多个参考图像,其包括至少一个背景图像以及关于每个背景图像包括至少一个显微镜图像5,在其中待鉴定分析物39被偶联至标记物,并且在各自图像区25中的标记物荧光信号被采集。若各不同荧光染料用在各不同染色轮中,则还应以每种不同荧光染料标记每种分析物。当然,也可以采用任何已知的经典方法、例如像来自上述专利申请EP2992115B1、WO2020/254519A1和WO2021/255244A1的方法来生成标注的数据组。
根据另一替代方案,可在训练期间内通过在不同候选提取模型中交换信号序列31内的图像信号的顺序训练信号序列31,它们也识别标记物在染色轮中按此所用的其顺序被交换的信号序列31。故可训练信号序列不知论模型。
如也在配准模型训练时,也可以在候选提取模型训练时从一组经过预先训练的模型中选择一个经过预先训练的模型,并且经过预先训练的模型借助变换学习适配于新实验。
除了训练这个配准模型或多个配准模型和候选提取模型外,步骤S2还包括训练分配模型。
根据此实施方式,分配模型直接被训练用于鉴定分析物类型。用于训练分配模型的标注的数据组包括图像序列19的显微镜图像5,其借助聚类分析诶分配给分析物类型。分配模型对于每个候选信号序列说明/输出包含属于各不同待鉴定分析物类型的各自概率的概率分布。分配模型的理论输出分别包括生硬分配给其中一个分析物类型。
分配控制模块32如上已关于配准模型和候选提取模型的训练所述地控制分配模型的训练。
或者,分析物类型的分配也可以分两步进行。对此,首先将候选信号序列二进制化。接着进行与码本23的理论位序列35的匹配。如果分析物类型的分配分两步进行,则代替分配模型地例如必须训练二进制化模型。二进制化模型映射候选信号序列的图像信号、即染色信号和未染色信号到位值、即真和假。在训练二进制化模型时,所记录的信号序列31被映射到位序列。
或者,二进制化模型也可以被设计成其对于候选信号序列内的每个图像信号输出会是染色信号的概率。
候选信号序列的二进制化也可以利用启发做法进行。或者,生成网络也可以执行执行映射到二值空间中。
除了待鉴定的分析物类型外,分析物类型的类别集合还包括代表应被分配给背景的图像区25或候选信号序列的一个类别。这种分配给背景总是在例如与理论位序列的匹配很差时或在分配模型结果对于所有分析物类型表明很差的值时进行。
如果分析物数据评估***1的不同处理模型被训练完,则在步骤S3中可以进行推断,即,可以记录新数据并用分析物数据评估***1的不同处理模型加以分析。
根据第一实施方式,首先拍摄图像序列19的显微镜图像5。对此,根据码本23将不同的标记物偶联到存在于样本内的分析物39,随后拍摄样本的显微镜图像5。根据第一实施方式,在每轮偶联中具有不同颜色、在此是三种颜色即橙色、黄色和绿色的标记物被偶联到分析物39。在偶联之后,在三个染色轮中拍摄三个显微镜图像5,即一轮染色拍一张。每个显微镜图像5按照另一荧光对比度来拍摄,做法是荧光照明装置13以不同的激发波长或不同的滤光镜工作,在此例如是用于激发橙色、黄色和绿色的荧光的波长。相应地,对于在例如以橙色被拍摄的第一轮染色中与染成橙色的标记物偶联的分析物39获得染色信号,而对于与黄色或绿色的标记物偶联的分析物39获得未染色信号。根据此实施方式,分别在第一轮染色中在偶联之后以橙色对比度拍摄一个显微镜图像5,在第二轮染色中在偶联之后以绿色对比度拍摄一个显微镜图像5,在第三轮染色中在偶联之后以绿色对比度拍摄一个显微镜图像5。图3所示的码本23代替理论位序列35地包括以染色轮的颜色对比度被编码的码字。即,分析物A在第一至第三偶联中与染成橙色的标记物偶联,在第四和第五偶联中与绿色标记物偶联。因为分别在第一染色轮中在偶联之后首先以橙色对比度拍摄一个显微镜图像5,故码字中O对应于位序列100,Y对应于位序列中的010,G对应于位序列中的001。相应的分析物A、B和C在图像序列19的显微镜图像5的染色轮R1、R2、R3和R4被标记。
根据一个替代方案,也可以在拍摄图像序列19的显微镜图像5时仅采用一个单独的颜色对比度、两个颜色对比度或超过三个的颜色对比度。图5示意性示出图像序列19的显微镜图像5的部分,其中黑框部分仅包含具有未染色信号的像点,而在白框部分内分别示意性示出具有染色信号的像点。右列内的显微镜图像5以第一颜色对比度来拍摄,左列内的显微镜图像5以第二颜色对比度来拍摄。
在拍摄下图像序列19后,图像序列19被存储在存储器模块20中。配准控制模块27例如独立依次读出图像序列19的显微镜图像5并且将图像序列19的显微镜图像5转送至配准模块28。配准模块28使用配准模型以相互配准图像序列19的显微镜图像5。
训练完的配准模型的输出、即图像序列19的相互配准的显微镜图像5可以从配准模块28被直接转送至候选提取控制模块29。
候选提取控制模块29将数据输入候选提取模块30。候选提取模块30采用根据此实施方式的训练完的候选提取模型以鉴别候选信号序列。
在候选提取模块30已输出候选信号序列之后,所输出的候选信号序列可通过分配控制模块32被送至再处理。
分配控制模块32从候选提取模块30接收候选信号序列并且当相邻的图像区25分别获得候选信号序列时汇总相邻的图像区25成图像区。相邻的图像区25汇总成图像区也包括非最大值抑制。
在分配控制模块32已确定图像区之后,所确定的图像区还接受检查。在检查图像区时,分配控制模块32检查图像区是否例如高出最大尺寸、是否所确定的图像区的形状可推断出在此其中两个图像区应真正相互分开,例如因为在两个图像区之间仅有少量几个桥接像点。此外,分配控制模块32可以在其未达最小尺寸时舍弃图像区。
分配控制模块32对于图像区基于汇总的图像区25的候选信号序列确定图像区信号序列。
接着,图像区信号序列作为候选信号序列被转送至分配控制模块32,以便基于图像区信号序列确定各自分析物类型。
在分配控制模块32中,图像区信号序列转送至分配模块33。
分配模块33利用上述分配模型之一以给候选信号序列或图像区信号序列分配一个分析物类型。如上所述,分析物类型的分配也能表明候选信号序列未匹配于码本23的任何分析物类型且因此属于背景。
上述的用于确定图像区的步骤也还可以在分析物类型分配之后执行。例如码本23对于每个待鉴定分析物类型包括分析物上下文信息,其例如说明与分析物类型相关的图像区的最大尺寸,其例如说明在样本内何处、例如在上述哪个细胞组成部分中可能出现各自分析物类型,或者哪些分析物类型在样本内共存在何处。图像区确定可以相应地考虑该分析物上下文信息且或许汇总或分开分析物区域,根据汇总或分开确定新的图像区信号序列,并且对于重新确定的图像区信号序列触发分析物类型的重新分配。
根据步骤S4将检查借助分配模块33的分配是否表明在候选信号序列处的超过一个的阈值未对应于待鉴定分析物类型中的一个。如果高出该阈值,则对应的候选信号序列被纳入标注的数据组中以训练候选提取模型,且候选提取模型的训练以扩展的标注的数据组重复。
或者,将候选信号序列分配给分析物类型也可以借助聚类分析模块24进行。这例如在标注的数据组为了训练分配模块仅包含很少量的训练数据时是有意义的。另外,步骤S4自然也可以在执行聚类分析之后基于聚类分析结果来执行。如果步骤S4基于聚类分析结果进行,则聚类分析控制模块22提供扩展的标注的数据组。
相似地,还可以在步骤S4例如针对借助不同的配准模型所确定的成组配准信息比较分配模块33的分配结果。如果比较表明其中一组配准信息在分配时获得明显更好的结果,则可以从获得更好结果的这组配准信息中创建标注数据的新数据组用于训练配准模型,配准模型根据上述方法被重新训练。
根据如在此所述的用于操作分析物数据评估***1的方法,不同的处理模型可被连续进一步训练。
根据第二实施方式,分析物数据评估***1仅包括存储器模块20以及配准控制模块27和配准模块28。分析物数据评估***1于是是一种用于配准突显序列19的显微镜图像5的***,显微镜图像是根据上述方法之一拍摄的。
根据第三实施方式,分析物数据评估***1仅包括存储器模块20以及候选提取控制模块29和候选提取模块30。分析物数据评估***1于是是一种用于处理图像序列19的图像数据的***,以便提供处理后的图像数据、即图像序列19的候选信号序列用于进一步分析。例如第三实施方式的分析物数据评估***1可以存储提取的候选信号序列且删除其余的非候选信号序列以空出存储器空间。
根据第四实施方式,分析物数据评估***1仅包括存储器模块20以及分配控制模块32和分配模块33。在第四实施方式中,分析物数据评估***1是一种用于鉴别用于候选信号序列的分析物类型的***。

Claims (70)

1.一种用于借助聚类分析来鉴定图像序列(19)中的分析物(39)的方法,其中,所述图像序列(19)通过在多轮染色中利用标记物标记所述分析物(39)并且利用相机(12)检测所述标记物来产生,所述相机(12)在每轮染色中拍摄所述图像序列(19)的一个图像(5),所述标记物被选择成使得分析物(39)的图像信号在一个图像区(25)内在所述图像序列(19)的范围内包括染色信号和未染色信号,所述方法包括:
-提取所述图像序列(19)的各自一个图像区(25)的多个信号序列(31),
-借助聚类分析算法来聚类被提取的信号序列(31),其中,预定群的数量至少等于待鉴定的分析物类型的数量并且每个信号序列(31)被分配给其中一个群,
-对于每个所述群确定群中心,
-对于每个待鉴定的分析物类型基于码本(23)的理论序列确定至少一个理论群中心,其中,所述码本(23)对于每个待鉴定的分析物类型包括一个理论序列,
-对于每个群中心,确定该群中心距理论群中心的距离,和
-基于所述距离将群分配给其中一个分析物类型或背景,和
-基于一定群的分配来分配信号序列(31)给分析物类型或背景。
2.根据权利要求1所述的方法,其中,所述信号序列(31)的所述图像信号位于实验特征空间内,并且所述理论序列的理论信号位于参考特征空间内,并且所述方法在确定群中心与理论群中心之间的距离之前还包括:
-将所述图像信号从所述实验特征空间换算到所述参考特征空间中,其中,所述换算尤其在聚类提取的信号序列(31)之前或聚类提取的信号序列(31)之后执行。
3.根据权利要求1所述的方法,其中,所述信号序列(31)的所述图像信号和所述理论序列的理论信号位于实验特征空间内,并且所述理论序列的理论信号是参考记录,其中,所述参考记录例如源自以下:
-早期实验,
-此时例如仅处理一部分数据的替代结算方法,或
-采用替代记录方法的实验。
4.根据前述权利要求1至3中任一项所述的方法,其中,被用在聚类分析中的群算法选自以下:
-K均值聚类,
-高斯混合模型聚类GMM,
-基于核心的主分量分析,
-EM聚类,
-Leiden聚类,
-Louvain聚类,
-决定性分析聚类,
-层次迪利克雷过程,
-DBSCAN,
-平均偏移,
-Kernel密度估算,和
-独立分量分析。
5.根据前述权利要求1至4中任一项所述的方法,其中,所述方法在聚类被提取的信号序列(31)之前还包括所述信号序列(31)的归一化,其中,所述归一化包括以下中的至少一个:
-在一个图像范围内的图像信号归一化,
-在所述图像序列(19)的所有图像(5)范围内的图像信号归一化,或者
-在一个信号序列(31)的范围内的图像信号归一化。
6.根据前述权利要求1至5中任一项所述的方法,其中,所述图像区(25)例如分别仅包括一个像点、连贯像点的面或像点叠中的连贯体积。
7.根据权利要求6所述的方法,其中,包括超过一个的像点的图像区(25)的图像信号被汇总,例如作为图像信号代表地输入多个相邻像点的平均值或最大值。
8.根据前述权利要求1至7中任一项所述的方法,其中,所述方法在借助聚类分析来对提取的所述信号序列(31)进行聚类之前还包括借助主轴变换或奇异值分解来变换所述信号序列(31)的步骤,并且变换后的信号序列(31)借助聚类分析被聚类,其中,例如仅在所述聚类分析中采用变换后的所述信号序列(31)的分量的一个子集。
9.一种用于训练具有用于从图像序列(19)提取候选信号序列的候选提取模型的训练机器学习***(1)的方法,其中,所述图像序列(19)通过在多轮染色中利用标记物标记分析物(39)并且利用相机(12)检测所述标记物来产生,所述相机(12)在每轮染色中拍摄所述图像序列(19)的一个图像(5),所述标记物被选择成使得所述分析物(39)的图像信号在一个图像区(25)内在所述图像序列(19)的范围内包括染色信号和未染色信号,所述方法包括:
-提供标注的数据组,和
-通过调整所述候选提取模型的所述模型参数优化目标函数,其中,所述目标函数获得由所述候选提取模型输出的结果输出和目标输出之间的差异,
其特征是,所述标注的数据组包括图像区(25)的获得分析物(39)的图像信号的至少一个信号序列(31)以及图像区(25)的获得背景图像信号的信号序列(31),关于每个所述信号序列(31)包括说明所述信号序列(31)是否包括分析物(39)的图像信号的目标输出。
10.根据权利要求9所述的方法,其中,所述候选提取模型针对依据最少数量的染色信号鉴别候选信号序列被训练,其中,所述染色信号和所述未染色信号依据各自信号序列(31)的其中一个染色信号和/或未染色信号与各自信号序列(31)的至少其中另一个染色信号和/或未染色信号的至少一个一定比例被鉴别,和/或所述候选信号序列分别依据包括所述至少一个一定比例的表征标记被鉴别。
11.根据权利要求9或10所述的方法,其中,所述候选提取模型是完整折叠网络(37),其作为具有完整相连层的分类模型以一些图像区(25)的信号序列(31)被训练过,并且所述分类模型在被训练后通过用折叠层取代完整相连层被转移到所述完整折叠网络(37),所述完整折叠网络能同时处理所述图像序列(19)的所有图像区(25)的所述信号序列(31)。
12.根据权利要求9或10所述的方法,其中,所述候选提取模型是语义分割模型,并且所述标注的数据组对于所述图像序列(19)的每个图像(5)包括一个分割掩膜(36),所述分割掩膜给每个所述图像区(25)分配一个值,所述值说明所述图像区(25)是否是在此获得关于所述图像序列(19)的候选信号序列的候选图像区,其中,所述值例如是一个位,其说明所述图像区(25)是否是候选区。
13.根据权利要求9或10所述的方法,其中,所述候选提取模型是图像至图像模型,并且处理映射是图像至图像映射,并且所述标注的数据组中的所述目标输出或是说明所述图像区(25)距具有候选信号序列的下一图像区(25)有多远的间隔值,或是说明在所述图像区(25)中获得了候选信号序列的概率的概率值。
14.根据权利要求9或10所述的方法,其中,所述候选提取模型以探测模型形式实现并且输出获得候选信号序列的所述图像区(25)的名单。
15.根据前述权利要求9至14中任一项所述的方法,其中,所述标注的数据组是借助以下步骤中的至少一个生成的:
-使用所述显微镜(2)的代表性背景图像和已知的点扩展函数模拟不同标记物的信号,
-借助依靠可比较数据被训练过的生成模型来生成所述标注的数据组,
-拍摄参考图像,所述参考图像包括至少一个背景图像以及关于每个所述背景图像包括至少一个在此标记每个待鉴定分析物(39)的图像,
-执行用于分析物空间鉴定的经典方法。
16.根据前述权利要求9至15中任一项所述的方法,其中,所述标注的数据组是借助根据权利要求1至8中任一项所述的方法生成的。
17.根据前述权利要求9至16中任一项所述的方法,所述方法还包括交换获得所述图像区(25)的分析物(39)的图像信号的信号序列的图像信号的顺序,随后输入到所述候选提取模型中。
18.根据前述权利要求9至17中任一项所述的方法,其中,所述目标函数的优化包括多轮训练,一轮训练包括:
-从标注的数据组中选择训练数据,
-依据所述训练数据确定目标函数,
-鉴别在候选区周围的预定第一半径内且例如在所述候选区周围的预定第二半径外的背景区的被错误分类为候选信号序列的信号序列(31),其中,所述预定第二半径小于所述预定第一半径,
-在下一轮训练中作为训练数据使用所鉴别的错误分配的所述信号序列(31)还有在下一轮训练中所选的训练数据。
19.根据前述权利要求9至18中任一项所述的方法,其中,具有候选提取模型的机器学习***(1)的训练或是表示候选提取模型的完整学习,或是表示经过预先训练的所述候选提取模型的转变学习,其中,依据样本类型、实验类型或用户ID从一组经过预先训练的候选提取模型中找寻经过预先训练的候选提取模型。
20.一种具有用于确定图像序列(19)的图像(5)的配准信息的配准模型的机器学***移信息和回转信息,所述方法包括:
-提供标注的数据组,
-通过调整所述配准模型的模型参数来优化目标函数,其中,所述目标函数获得由所述配准模型输出的结果配准输出与目标配准输出之间的差异,
其特征是,所述标注的数据组包括至少两个具有配准结构的图像(5),其中,所述配准结构相对移动和/或倾转并且所述图像(5)中的所述配准结构能依据所述目标配准输出被相互配准。
21.根据权利要求20所述的方法,其中,所述目标输出直接是配准信息并且配准模型直接被训练以相互配准所述图像(5)。
22.根据权利要求21所述的方法,其中,所述标注的数据组还包括目标中间输出,其中,所述目标中间输出被用作深度监测信号并且呈现所述配准结构的位置信息,并且所述目标函数还获得所述标注的数据组的目标中间输出与所述配准模型的中间层的对应于所述目标中间输出的中间输出之间的差异。
23.根据权利要求20所述的方法,其中,所述目标配准输出包括配准结构的位置信息,并且所述配准模型被训练用于鉴别和定位所述配准结构,并且所述目标函数获得所述标注的数据组所含的位置信息与由所述配准模型输出的位置信息之间的差异。
24.根据前述权利要求20至23中任一项所述的方法,其中,所述图像序列(19)通过在多轮染色中利用标记物标记分析物(39)并且利用相机(12)检测所述标记物来产生,所述相机(12)在每轮染色中拍摄所述图像序列(19)的一个图像(5),所述标记物被选择成使得所述分析物(39)的图像信号在一个图像区(25)内在所述图像序列(19)的范围内包括染色信号和未染色信号。
25.根据前述权利要求20至24中任一项所述的方法,其中,所述标注的数据组包括增强的图像(5),其中,所述标注的数据组的第二图像(5)借助增强从第一图像(5)中算出,其中,所述增强包括位移、倾转和/或变形。
26.一种用于鉴定图像序列(19)中的分析物(39)的方法,其中,所述图像序列(19)通过在多轮染色中利用标记物标记分析物(39)并且利用相机(12)检测所述标记物来产生,所述相机在每轮染色中拍摄所述图像序列(19)的一个图像(5),所述标记物被选择成使得分析物(39)的图像信号在一个图像区(25)内在所述图像序列(19)的范围内包括染色信号和未染色信号,所述方法包括:
-提取所述图像序列(19)的各自一个图像区(25)的多个信号序列(31),
-从提取的信号序列(31)中滤出候选信号序列,其中,候选信号序列的至少其中一个染色信号和/或未染色信号与各自信号序列的至少其中另一个染色信号和/或未染色信号之间的比例是一个表征比例,和/或所述候选信号序列具有包括所述至少一个表征比例的表征标记,从而当所述信号序列(31)具有至少一个表征比例和/或表征标记时,所述信号序列被评定为候选信号序列,以及
-将所述候选信号序列分配给一个分析物类型或背景。
27.根据权利要求26所述的方法,其中,候选信号序列的滤出借助候选提取模型执行,其中,例如依据样本类型、实验类型或用户ID从一组候选提取模型中找寻所述候选提取模型。
28.根据权利要求27所述的方法,其中,所述候选提取模型针对如下被训练,即,依据各自信号序列(31)的其中一个染色信号和/或未染色信号与各自信号序列(31)的至少其中另一个染色信号和/或未染色信号的至少一个一定比例来鉴别所述染色信号和所述未染色信号和/或分别依据包括所述至少一个一定比例的表征标记来鉴别所述候选信号序列。
29.根据权利要求27或28所述的方法,其中,所述候选提取模型是语义分割模型,所述语义分割模型给每个图像区(25)分配一个说明所述图像区(25)是否获得分析物(39)的值,其中,所述值例如说明所述图像区(25)是分析物图像区的概率或点值,或者所述值是一个说明所述图像区(25)是否是分析物图像区的位。
30.根据权利要求29所述的方法,其中,所述候选提取模型是补丁分类器并且借助滑窗方法给每个图像区(25)分配所述值。
31.根据前述权利要求27至30中任一项所述的方法,其中,所述候选提取模型是完整折叠网络(27)并且作为具有完整相连层的分类模型以一些图像区(25)的信号序列(31)被训练过,并且所述分类模型在训练后通过用折叠层取代完整相连层被转移到所述完整折叠网络(37),其中,在所述完整折叠网络(37)中同时处理所述图像序列(19)的所有图像区(25)的所述信号序列(31)。
32.根据权利要求27所述的方法,其中,所述候选提取模型是图像至图像模型并且执行图像至图像映射,其给每个图像区(25)分配说明所述图像区(25)距具有候选信号序列的下一图像区(25)有多远的间隔值,或者给每个像点分配成为具有候选信号序列的图像区(25)的概率。
33.根据权利要求27所述的方法,其中,所述候选提取模型以探测模型的形式实现并且输出具有候选信号序列的图像区(25)的名单。
34.根据前述权利要求26至33中任一项所述的方法,其中,所述方法在检查所述信号序列(31)是否是候选信号序列之前还包括借助主轴变换或奇异值分解的所述信号序列(31)变换的步骤,并且变换后信号序列被用在检查所述信号序列(31)是否是候选信号序列时,其中,例如在聚类分析中仅采用变换后信号序列的分量的子集,例如第一分量最好被省掉或第一分量和最后分量或第一分量和最后两个分量被省掉。
35.根据前述权利要求26至34中任一项所述的方法,其中,所述图像区(25)例如分别仅包括一个像点、连贯像点的面或图像叠中的连贯体积,并且例如作为张量被输入候选提取模型。
36.根据前述权利要求26至35中任一项所述的方法,所述方法还包括图像区的确定,所述图像区的确定包括:
-当相邻的图像区(25)具有候选信号序列时将相邻的图像区(25)汇总成一个图像区,其中,相邻的图像区(25)的汇总例如包括非最大值抑制。
37.根据权利要求36所述的方法,其中,图像区的确定还包括:所述图像区的检查,其中,所述图像区的检查包括以下中的至少一个:
-当所述图像区超出最大尺寸时将所述图像区分为两个以上的图像区,包括确定用于因划分而出现的每个图像区的图像区信号序列,
-当所述图像区分别仅通过几个桥接像点相连时或者依据所述图像区的形状可看到在此两个区域相交时将所述图像区分为两个以上的图像区,包括确定用于因划分而出现的每个图像区的图像区信号序列,
-基于分析物上下文信息分开所述图像区,其中,所述分析物上下文信息例如包括:关于依据所述分析物类型的图像区的尺寸的信息,关于样本内的图像区的位置的信息,关于在样本内一定区域或一层内的某些分析物类型共存的信息,关于与样本内位置或图像区(25)相关的预期分析物密度的信息;
-当图像区小于最小尺寸或所具有的形状无法可靠被分配给分析物(39)时舍弃图像区。
38.根据权利要求36或37所述的方法,其中,图像区的确定还包括基于图像区的对应的候选信号序列确定图像区信号序列,并且将所述候选信号序列分配给分析物类型或背景依据所述图像区信号序列进行。
39.根据前述权利要求36至38中任一项所述的方法,其中,图像区的确定在检查所述信号序列(31)是否是候选信号序列之后并且在分配所述候选信号序列给分析物类型或背景之前和/或在分配所述候选信号给分析物类型或背景之后执行。
40.根据前述权利要求36至39中任一项所述的方法,所述方法还包括:
-在确定所述图像区时采用所鉴别的分析物类型作为分析物上下文信息,其中,依据所述分析物上下文信息尤其包括:
-关于依据所述分析物类型的图像区的尺寸的信息,
-关于样本内的分析物类型的位置的信息,或者
-关于某些分析物类型共存的信息。
41.根据前述权利要求26至40中任一项所述的方法,其中,依据所述信号序列(31)的分析物类型的鉴定包括:
-从所述信号序列(31)中确定结果位序列,其中,给所述染色信号分配一个真值并且给所述未染色信号分配一个假值以获得所述结果位序列,
-依据所述结果位序列鉴定所述分析物类型,其中,将所述结果位序列与对于每个待鉴定的所述分析物类型包括至少一个目标位序列的码本(23)的目标位序列相比较。
42.根据权利要求41所述的方法,其中,结果位序列的确定借助二进制化模型来执行。
43.根据权利要求42所述的方法,其中,所述二进制化模型是分类模型,其中,所述分类模型作为被训练成作为结果输出而输出一个输出位序列,其中,所述结果输出的分配或是生硬进行,做法是所述处理模型给所述结果信号序列的所述染色信号分配所述结果位序列中的一个真值,给所述未染色信号分配所述结果位序列中的一个假值,或者所述结果输出的分配柔和进行,做法是所述处理模型输出概率分布,在其中每个信号序列的每个图像信号分配一个概率值,其说明图像信号是染色信号的概率。
44.根据前述权利要求26至40中任一项所述的方法,其中,依据所述信号序列的分析物类型的鉴定包括:
-将所述候选信号序列输入到分配模型中,
-输出所述候选信号序列的分析物类型,其中,分析物类型的输出或是生硬进行,此时给每个候选信号序列正好分配一种分析物类型,或是柔和进行,此时对于每个候选信号序列输出包括配属于不同分析物类型的分配的概率分布。
45.根据前述权利要求26至44中任一项所述的方法,所述方法还包括灵敏度调整,其中,借助所述灵敏度能够将所鉴别的分析物(39)的数量调整为适配于预期数量的待鉴定的分析物(39)。
46.根据权利要求45所述的方法,其中,所述灵敏度调整尤其包括:
-调整候选提取模型的模型灵敏度,能借助所述模型灵敏度调设在提取的所述信号序列(31)中所鉴别的候选信号序列的数量,或者
-调整鉴别灵敏度,能借助所述鉴别灵敏度在鉴别所述分析物类型时设定一个阈值,自所述阈值起将舍弃作为背景的候选信号序列。
47.根据前述权利要求26至40中任一项所述的方法,其中将候选信号序列分配给分析物类型或背景根据前述权利要求1至8中任一项的方法进行,其中,仅提取所鉴别的候选信号序列。
48.根据前述权利要求26至47中任一项所述的方法,所述方法还包括:
-基于提取的信号序列(31)生成扩展的标注的数据组并且将所述信号序列(31)分配给分析物类型或背景,和
-至少以扩展的标注的数据组作为标注的数据组来执行根据权利要求7至15中任一项所述的机器学习***训练方法。
49.根据前述权利要求26至48中任一项所述的方法,其中,所述信号序列(31)的图像信号位于实验特征空间中并且所述目标位序列的理论图像信号位于参考特征空间中,并且所述方法在利用所述码本(23)的所述理论位序列(35)比较所述信号序列(31)之前还包括:将所述信号序列(31)的所述图像信号从所述实验特征空间换算到所述参考特征空间中。
50.根据前述权利要求26至49中任一项所述的方法,其中,所述方法在检查所述信号序列(31)是否是候选信号序列之前还包括执行所述图像序列(19)的图像信号的背景修正的步骤,其中,所述背景修正的执行包括以下当中的一个或多个:
-滚球法,
-过滤例如像礼帽法、同态过滤、低通过滤,其中,从信号中抽取低通过滤结果,或者时间过滤,
-借助图像至图像模型的背景修正,
-借助混合模型的背景修正,
-借助平均偏移方法的背景修正,
-借助主分量分析的背景修正,
-借助非负矩阵因式分解的背景修正,或
-借助利用非特异于所述图像序列(19)的所有图像区(25)的激光的自体荧光激发的背景修正。
51.根据前述权利要求1至8和26至50中任一项所述的方法,其中,所述信号序列的提取包括以下中的至少一个:
-提取所述图像序列(19)的所有图像区(25),
-提取所述图像序列(19)的图像区(25)的随机选项,
-提取所述图像序列(19)的所述图像区(25)的以所述图像区(25)的结构特性加权的选项,例如以对于细胞、胞核、细胞空隙和亮像点的较高概率,
-只从具有最低图像清晰度的图像区(25)提取图像区(25),
-跳过预期没有分析物(39)的图像区(25)。
52.根据前述权利要求1至8和26至51中任一项所述的方法,所述方法还包括:
-分析所述图像序列(19)的所述图像(5)的质量,
-如果所述质量不够高,则重复拍摄所述图像序列(19)的其中一个所述图像(5),其中所述质量例如依据以下中的一个或多个来确定:
-所述图像(5)相互间的相对信号强度,
-依据存在于一些图像(5)内的具有高于一定阈值的图像信号的像点,
-所鉴别的所述分析物(39)的未预期的分布,其中,所述分析物(39)超比例频繁地基于所述图像序列(19)的其中某个图像(5)被鉴定,
-机器学习的质量评估模型,所述质量评估模型针对以下情况被训练,针对图像(5)、分图或像点确定质量评估。
53.一种借助配准模型确定图像序列(19)的图像(5)的配准信息的方法,其中,所述配准信息至少包括平移信息和回转信息,所述配准模型被训练成在所述图像(5)中识别配准结构,并且所述配准结构是出现在所述图像(5)中的能明确无疑地给其分配位置的结构,所述方法包括:
-将所述图像序列(19)输入所述配准模型中,
-确定所述配准信息。
54.根据权利要求53所述的方法,其中,所述配准信息的确定由所述配准模型直接在一个步骤中执行。
55.根据权利要求53所述的方法,所述方法还包括:
-鉴别所述图像序列(19)的所述图像(5)内的配准结构并且借助所述配准模型确定所述配准结构的位置信息,
-提供所述位置信息给每个所述图像(5),其中,所述配准的确定基于位置信息进行。
56.根据权利要求55所述的方法,其中,配准结构的鉴别包括所述图像序列(19)的所述图像(5)的语义分割,并且所述配准的确定包括由所述配准模型输出的分割掩膜(36)的相互配准。
57.根据权利要求55或56所述的方法,其中,所述配准结构的所述鉴别包括确定概率图,其中,所述概率图给每个像点分配一个会是配准结构的概率,因此,所述位置信息对于每个像点包括会是配准结构的概率,并且所述配准的确定包括所述图像序列(19)的所述图像(5)的所述概率图相互配准,其中,在所述概率图中所述分析物(39)的所述图像区(25)具有最大值并且所述概率始终下降,例如像高斯钟形曲线,从而在所述分析物(39)的所述图像信号的图像区(25)内获得的空间积分正好例如是常数如1。
58.根据权利要求55至57中任一项所述的方法,其中,配准结构的鉴别包括输出一些所鉴别的带有配准结构的像点的位置信息,并且所述配准的确定包括这些像点的所述位置信息的配准,例如借助迭代下一点算法。
59.根据前述权利要求55至58中任一项所述的方法,其中,所述配准模型作为中间层的中间输出而输出所述位置信息并且依据所述位置信息计算所述配准信息。
60.根据权利要求55至59中任一项所述的方法,所述方法还包括借助分类模型分类所鉴别的配准结构,其中,所述分类模型给所鉴别的配准结构分配一个类别,配准模型依据所述类别判断是否输出分割掩膜(36)、概率图和/或一些点的位置信息用于所鉴别的配准结构。
61.根据前述权利要求53至60中任一项所述的方法,其中,所述图像序列(19)通过在多轮染色中利用标记物标记分析物(39)并且利用相机(12)检测标记物来产生,所述相机在每轮染色中拍摄所述图像序列(19)的一个图像(5),所述标记物被选择成分析物(39)的图像信号在一个图像区(25)内在所述图像序列(19)的范围内包括染色信号和未染色信号,所述染色信号和所述未染色信号具有所述信号序列(31)的其中一个染色信号和/或未染色信号与所述信号序列(31)的至少其中另一个染色信号和/或未染色信号的至少一个一定比例,并且分析物(39)的所述信号序列(31)具有包括所述至少一个一定比例的表征标记。
62.根据前述权利要求53至60中任一项所述的方法,其中,所述配准模型针对以下情况被训练,作为配准结构识别以下结构中的至少一个结构并且必要时分配位置信息:
-细胞边缘,
-细胞器,
-胞核,
-细胞骨架,
-线粒体,
-具有高于亮度阈值的亮度的图像区(25),
-由标记物或标记物累加引起的点物,
-具有最低图像清晰度的结构如边缘,
-图像区(25),所述图像区(25)具有一定的尤其是预定的结构或纹理,
-保持框(10),
-盖玻璃,
-样本台(9),
-样本夹,
-波形板/波形器皿,或
-非样本结构。
63.根据前述权利要求26至52中任一项所述的方法,所述方法还包括图像序列(19)的多个图像(5)的配准信息的确定。
64.根据权利要求63所述的方法,其中,至少两组不同的配准信息根据至少两种不同的借此执行不同组的配准信息的方法被确定,并且在所述分析物(39)鉴定之后从至少两个结果中选择一个最好的结果用于鉴定分析物(39),其中,所述结果的评估例如依据所述分析物(39)的预期分布被评估。
65.根据权利要求64所述的方法,其中,所述至少两组不同的配准信息例如根据根据权利要求53至62的方法中的两种方法被确定。
66.根据前述权利要求9至65中任一项所述的方法,所述方法还包括:
-使所述图像序列(19)的所述图像(5)的缩放适配于用于训练所述处理模型的标注的数据组内的图像(5)的缩放。
67.一种用于评估图像序列(19)的图像(5)的评估装置(4),所述评估装置(4)尤其被设计成分析物数据评估***(1),包括用于实行根据前述权利要求中任一项所述的方法的装置。
68.一种分析物数据评估***(1),所述分析物数据评估***(1)包括根据权利要求67所述的评估装置(4),尤其包括图像产生装置如显微镜(2)。
69.一种计算机程序产品,所述计算机程序产品包括指令,所述指令在计算机运行程序时促使计算机执行根据前述权利要求1至66中任一项所述的方法,所述计算机程序产品尤其是计算机可读存储介质。
70.一种分析物数据评估***(1),所述分析物数据评估***(1)包括评估装置(4),其中,所述评估装置(4)包括处理模型,所述处理模型按照根据前述权利要求9至19中任一项所述的方法被训练成从图像序列(19)中提取候选信号序列(31),尤其包括图像产生装置如显微镜(2)。
CN202311595009.7A 2022-11-28 2023-11-27 用于鉴定图像序列中的分析物的方法 Pending CN118096640A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102022131444.8A DE102022131444A1 (de) 2022-11-28 2022-11-28 Verfahren zum Identifizieren von Analyten in einer Bildfolge
DE102022131444.8 2022-11-28

Publications (1)

Publication Number Publication Date
CN118096640A true CN118096640A (zh) 2024-05-28

Family

ID=91026810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311595009.7A Pending CN118096640A (zh) 2022-11-28 2023-11-27 用于鉴定图像序列中的分析物的方法

Country Status (3)

Country Link
US (1) US20240177351A1 (zh)
CN (1) CN118096640A (zh)
DE (1) DE102022131444A1 (zh)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5817462A (en) 1995-02-21 1998-10-06 Applied Spectral Imaging Method for simultaneous detection of multiple fluorophores for in situ hybridization and multicolor chromosome painting and banding
DE10063112A1 (de) 2000-12-18 2002-06-20 Bayer Ag Verfahren zur Erhöhung der klinischen Spezifität bei der Detektion von Tumoren und ihren Vorstufen durch simultane Messung von mindestens zwei verschiedenen molekularen Markern
DE10222779A1 (de) 2002-05-16 2004-03-04 Carl Zeiss Jena Gmbh Verfahren und Anordnung zur Untersuchung von Proben
CA2491692C (en) 2002-07-08 2010-12-07 Amersham Biosciences Uk Limited Reagents and a method for saturation labelling of proteins
DE102005022880B4 (de) 2005-05-18 2010-12-30 Olympus Soft Imaging Solutions Gmbh Trennung spektral oder farblich überlagerter Bildbeiträge in einem Mehrfarbbild, insbesondere in transmissionsmikroskopischen Mehrfarbbildern
US10267808B2 (en) 2010-03-08 2019-04-23 California Institute Of Technology Molecular indicia of cellular constituents and resolving the same by super-resolution technologies in single cells
GB201007055D0 (en) 2010-04-28 2010-06-09 Vib Vzw Method and apparatus for the imaging of a labelled sample
JP2012122852A (ja) 2010-12-08 2012-06-28 Olympus Corp 画像処理装置、画像処理方法および画像処理プログラム
US10457980B2 (en) 2013-04-30 2019-10-29 California Institute Of Technology Multiplex labeling of molecules by sequential hybridization barcoding
CN103559724A (zh) 2013-10-31 2014-02-05 苏州相城常理工技术转移中心有限公司 一种高粘连度细胞环境下的多细胞同步跟踪方法
EP3472351B1 (de) 2016-06-15 2020-10-28 Ludwig-Maximilians-Universität München Einzelmolekülnachweis bzw. -quantifizierung durch dna-nanotechnologie
US11385179B2 (en) 2017-04-13 2022-07-12 Hoffmann-La Roche, Inc. Target molecule density determination in a fluorescence image
CN107845085B (zh) 2017-09-19 2020-08-18 浙江农林大学 一种心肌细胞核粘连区域分离与分组的方法及***
EP3498865B1 (de) 2017-12-14 2020-10-07 Ludwig-Maximilians-Universität München Einzelmolekülnachweis bzw. -quantifizierung durch dna-nanotechnologie in mikro-wells
JP7228917B2 (ja) 2018-01-02 2023-02-27 キングス カレッジ ロンドン 局在化顕微鏡法のための方法及びシステム
WO2019204661A1 (en) 2018-04-18 2019-10-24 Altius Institute For Biomedical Sciences Methods for assessing specificity of cell engineering tools
DE102018133188A1 (de) 2018-12-20 2020-06-25 Carl Zeiss Microscopy Gmbh Abstandbestimmung einer probenebene in einem mikroskopsystem
EP3754028A1 (en) 2019-06-18 2020-12-23 Apollo Life Sciences GmbH Method of signal encoding of analytes in a sample
US11703454B2 (en) 2020-01-03 2023-07-18 Korea Advanced Institute Of Science And Technology Method and apparatus for multiplexed imaging of spectrally-similar fluorophores
IL274811B (en) 2020-05-20 2021-05-31 Yeda Res & Dev Spatial information is developed for the analysis of individual cells
EP4168575A1 (en) 2020-06-18 2023-04-26 Resolve BioSciences GmbH Multiplex method for detecting different analytes in a sample

Also Published As

Publication number Publication date
US20240177351A1 (en) 2024-05-30
DE102022131444A1 (de) 2024-05-29

Similar Documents

Publication Publication Date Title
EP3486836B1 (en) Image analysis method, apparatus, program, and learned deep learning algorithm
CN111448582B (zh) 用于单通道全细胞分割的***和方法
US10706535B2 (en) Tissue staining quality determination
EP1922695B1 (en) Method of, and apparatus and computer software for, performing image processing
CN113574534A (zh) 使用基于距离的相似性标签的机器学习
EP3053138B1 (en) Systems and methods for adaptive histopathology image unmixing
US10169878B2 (en) System and method for segmentation of three-dimensional microscope images
WO2014087689A1 (ja) 画像処理装置、画像処理システム及びプログラム
CN112823352B (zh) 碱基识别方法、***和测序***
WO2011034596A1 (en) High-throughput biomarker segmentation utilizing hierarchical normalized cuts
CN110264454A (zh) 基于多隐藏层条件随机场的***组织病理图像诊断方法
Marcuzzo et al. Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging
CN112289381B (zh) 基于图像构建测序模板的方法、装置和计算机产品
CN118096640A (zh) 用于鉴定图像序列中的分析物的方法
WO2020037571A1 (zh) 基于图像构建测序模板的方法、装置和计算机程序产品
US20240177505A1 (en) Method and apparatus for determining a signal composition of signal series from an image series
CN118096788A (zh) 用于分配图像序列的图像区给结果类别的方法和装置
WO2020037574A1 (zh) 基于图像构建测序模板的方法、碱基识别方法和装置
EP4379676A1 (en) Detection system, detection apparatus, learning apparatus, detection method, learning method and program
CN115049579A (zh) 融合多波段光谱特征的抗干扰目标识别方法
Milli Improving recall of In situ sequencing by self-learned features and classical image analysis techniques
CN118098354A (zh) 准备用于分析物鉴定的数据的方法和装置
CN114581708A (zh) 医学图像中的目标识别的模型训练装置及识别装置
Mousavi Automated classification of homologous human chromosomes using digital fluorescence microscopy images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication