CN101329289A - 用于图像中物体对准的***及方法 - Google Patents

用于图像中物体对准的***及方法 Download PDF

Info

Publication number
CN101329289A
CN101329289A CNA200810125256XA CN200810125256A CN101329289A CN 101329289 A CN101329289 A CN 101329289A CN A200810125256X A CNA200810125256X A CN A200810125256XA CN 200810125256 A CN200810125256 A CN 200810125256A CN 101329289 A CN101329289 A CN 101329289A
Authority
CN
China
Prior art keywords
target
group
target group
collection
object set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200810125256XA
Other languages
English (en)
Inventor
陆鹏
郑明�
廖国春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN101329289A publication Critical patent/CN101329289A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/46NMR spectroscopy
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N24/00Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects
    • G01N24/08Investigating or analyzing materials by the use of nuclear magnetic resonance, electron paramagnetic resonance or other spin effects by using nuclear magnetic resonance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/46NMR spectroscopy
    • G01R33/4633Sequences for multi-dimensional NMR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/46NMR spectroscopy
    • G01R33/465NMR spectroscopy applied to biological material, e.g. in vitro testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R33/00Arrangements or instruments for measuring magnetic variables
    • G01R33/20Arrangements or instruments for measuring magnetic variables involving magnetic resonance
    • G01R33/44Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
    • G01R33/48NMR imaging systems
    • G01R33/54Signal processing systems, e.g. using pulse sequences ; Generation or control of pulse sequences; Operator console
    • G01R33/56Image enhancement or correction, e.g. subtraction or averaging techniques, e.g. improvement of signal-to-noise ratio and resolution
    • G01R33/5608Data processing and visualization specially adapted for MR, e.g. for feature analysis and pattern recognition on the basis of measured MR data, segmentation of measured MR data, edge contour detection on the basis of measured MR data, for enhancing measured MR data in terms of signal-to-noise ratio by means of noise filtering or apodization, for enhancing measured MR data in terms of resolution by means for deblurring, windowing, zero filling, or generation of gray-scaled images, colour-coded images or images displaying vectors instead of pixels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

提供了用于将目标组中的目标对准的***及方法。目标组具有处于多个图像中相应图像中的目标。对于第一目标组中的各个目标,构造相应目标集包括各个目标,由此构造多个目标集。在目标集与目标组中的目标之间计算相似度度量以向目标集分配目标。然后改进目标集以将目标组中的目标对准。

Description

用于图像中物体对准的***及方法
关联申请的交叉引用
本发明主张于2008年6月21日递交的美国专利申请号11/820,939的优先权,通过引用将其全部内容包含于本说明书中。
技术领域
本发明涉及用于自动对准图像中的物体(例如两维核磁共振光谱中的高峰)的处理、设备、媒体以及信号。
背景技术
在计算机显示、物体识别以及图像分析方面,图像中的物体匹配(也被称为图像对准)已经成为非常重要的课题。匹配方法的性能取决于特征的特性以及所使用的匹配措施。可以进行图像中的物体匹配的一种应用是核磁共振(NMR)光谱的分析,并且在上述光谱中将等量高峰彼此对准。
NMR光谱通常包括由表示样本的分子特征的物体构成的一维或多维图像。样本的分子特征的示例包括但不限于在样本中特定代谢物或其他分子的存在。在医学应用中,利用NMR光谱学(NMR)以分析复合生物样本并将它们相互进行比较已经有较长的历史。例如,利用NMR由个体(individual)代谢组(metabonomics)产生的内源代谢物的比较代谢物轮廓(profiling)已经被用在对阿霉素及interleukin-2疗法的反应的早期预测中。参见Ewens等,2006,Cancer Res.66,5419。很多利用NMR的代谢组学研究是基于一维1H NMR,其具有较少的样本获取时间,并易于分析。但是,来自复合生物样本的1H NMR的较高的光谱聚集(spectralcongestion)对可被唯一地辨认并量化的代谢物的数量造成限制。
近来,二维1H-13C NMR被用来分析酵母代谢组中全球代谢改变。参见Peng,2007,Metabolic Engineering 9,8-20。因为几乎全部内源代谢物均包含碳,故第二13C NMR维提供了大大拓宽的光谱范围(~200parts/million),并且使得能够分离并准确识别很多沿1H NMR尺寸聚集成单个物体的代谢物。但是,比较NMR代谢物轮廓需要在多个光谱上对准表示相同代谢物的物体(高峰)。天然1H-13C NMR对此产生了一些挑战。首先,在多个样本或复制体中表示相同的代谢物的目标的位置在二维1H-13C NMR光谱中并不固定。因为在各个测量光谱时实验条件不可能百分之百完全相同,故总会观察到微小的位置偏移。实验条件(例如pH)微小的改变也会造成目标偏移。即使对于相同样本的复制体,上述偏移也不可避免。第二,这些偏移并不成体系。在光谱中各个目标的偏移的方向及程度并不相同。目标在光谱的不同区域中可以不同程度向不同方向偏移。此外,并非全部代谢物均存在于全部样本中,因此希望获得将微小信号但不会将其相邻重要信号与表示相同代谢物的目标对准的能力。
因此,因为以上原因,对比多维NMR代谢物轮廓存在常规的问题:将图像中的目标对准。在NMR中,目标是在NMR光谱中出现的高峰。诸如NMR代谢物轮廓的很多图像会存在可被采用以对准图像中目标的特性。例如,尽管NMR光谱的目标偏移在全球范围内并不一致,但相同光谱的较小区域内的目标却呈现出类似的偏移图案,其中这些目标朝向类似方向以类似程度偏移。因此,在不同光谱上的局部图案通常可以匹配。用于将图像中的目标对准的常规处理方法并未令人满意地采用匹配的局部偏移的这些图案。因此,业界所需的是利用匹配的局部偏移的图案,用于在多个图像中对准目标的改进的处理、设备、媒体以及信号。
发明内容
提供了用于将多个图像中的目标对准的改进的处理,设备,介质及信号。用于将多个图像中的目标对准的改进的处理,设备,介质及信号可被用于诸如二维NMR光谱的N维图像中的常规点对准问题。有利的是,该用于将多个图像中的目标对准的改进的处理,设备,介质及信号利用了匹配局部偏移的模式。
一个实施例提供了用于对准多个目标组中诸如高峰的目标的方法。每一个上述目标组分别包括在多个图像中的相应图像(例如,NMR光谱)中发现的目标。例如,多个图像可以是多个二维NMR光谱,其中每一个光谱分别具有包括各个光谱(或者光谱中高峰的选择子组)中全部高峰的相应目标组。该方法包括为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集。由此,在该初始阶段,多个目标集包括用于特定(第一)目标组中各个独特目标的一个目标集。换言之,因为每一个目标组均对应于图像,故在此初始阶段,多个目标集包括用于特定图像(与第一目标组对应的图像)中各个独特目标的一个目标集。然后,为所述多个目标组中目标组中的各个目标每一者分别计算多个相似度度量。每一个上述相似度度量均处于(i)所述各个目标与(ii)所述多个目标集中目标集中目标之间。上述计算的目的在于确定要将各个目标置于哪一个目标集。当两个条件满足时将各个目标增加至多个目标集中的第一目标集。首先,所述各个目标与所述多个目标集中的第一目标集中的目标之间的所述相似度度量必需优于所述各个目标与所述多个目标集中任何另一目标集中的目标之间的所述相似度度量时。其次,所述各个目标与所述第一目标集中的目标之间的坐标差异必需低于阈值。否则,如果不满足这些条件,则生成新的目标集并将各个目标集增加至所述新生成的目标集。为所述多个目标组中剩余各个目标组重复将目标分配至目标集的处理。以此方式,处于同一目标集中的目标被视为彼此对应。由此将所述多个目标组中的目标对准。
当第一目标与第二目标表示两个目标组中相同可视量时,将第一目标组中的第一目标与第二目标组中的第二目标对准。例如,当第一与第二目标对准(相关)时,如果第一目标表示存在或缺乏特定代谢物,则第二目标也表示存在或缺乏特定代谢物。当然,第一目标可表示在与第二目标不同的生物样本中存在或缺乏特定代谢物而仍然与第二目标对准。因此,对本发明中目标之间的相关性的对准或识别是分配操作。对于多个目标组(每一个均包括多个目标),本发明的***及方法确定多个目标中哪些目标相同(表示相同可视量)。对于目标组中的多个目标,解决该问题的方法是对准处理。当完成该对准处理时,将目标组中的特定目标视为相互对准(相关)。
在一些实施例中,目标集或目标组中各个目标的特征在于第一维值X及第二维值Y。在一些实施例中,第一维值X对应于碳(13C)原子的核磁共振,而第二维值Y对应于氢(1H)原子的核磁共振,并且当
|C2-C1|<BC,并且
|H2-H1|<BH时,
各个目标与第一目标集中目标之间的所述坐标差异低于阈值,其中:
C2是用于各个目标的第一维指标;
C1是用于第一目标集中目标的第一维指标;
H2是用于各个目标的第二维指标;
H1是用于第二目标集中目标的第二维指标;
BC是第一维阈值极限值;而
BH是第二维阈值极限值。
在一些实施例中,所述多个图像中的各个图像分别是二维图像。在一些实施例中,所述多个图像中的各个图像分别是N维图像,其中,N等于1或更大。在一些实施例中,当
|C1 2-C1 1|<B1
|C2 2-C2 1|<B2
...
|CN 2-CN 1|<BN
各个目标与第一目标集中目标之间的所述坐标差异低于阈值,其中:
C1 2是用于各个目标的第i维指标;
C1 1是用于第一目标集中目标的第i维指标;而
B1是第i维阈值极限值。
在一些实施例中,所述多个图像中的各个图像分别是二维图像。在一些实施例中,所述多个图像中的图像是二维1H-13C核磁共振光谱,并且所述图像中的所述目标是所述二维1H-13C核磁共振光谱中的高峰。在一些实施例中,所述多个图像中的图像是二维核磁共振(NMR)光谱,三维NMR光谱,或者四维NMR光谱,并且所述图像中的所述目标是所述二维,三维,或者四维NMR光谱中的高峰。在一些实施例中,所述多个图像中的图像是二维异核或同核磁共振光谱,并且所述图像中的所述目标是所述二维异核或同核磁共振光谱中的高峰。在一些实施例中,所述多个目标组中的目标组包括50个目标,200个目标,1000个目标或者10000个目标。
在一些实施例中,所述多个图像包括1H-13C核磁共振光谱,并且其中,根据以下公式
sim ( P → i , P → j ) = - { dist ( P → i , P → j ) } 2 = - { ( C i - C j ) 2 + λ ( H i - H j ) 2 } ,
来计算所述目标与多个目标集中目标集中的目标之间的相似度度量,其中
Figure A20081012525600242
是各个目标
Figure A20081012525600243
与目标集中目标
Figure A20081012525600244
之间的相似度度量;
Ci是目标
Figure A20081012525600245
13C维中的坐标;
Cj是目标
Figure A20081012525600246
13C维中的坐标;
Hi是目标1H维中的坐标;
Hj是目标
Figure A20081012525600248
1H维中的坐标;而
λ是标准化常数。
在一些实施例中,当所述目标与所述靶目标集之间的相似度度量大于所述靶目标组中任何其他目标与所述靶目标集之间的所述相似度度量时,所述目标与所述靶目标集之间的所述相似度度量具有所述最佳相似度得数。
在一些实施例中,所述方法还包括对在所述多个目标集中分配目标进行优化。例如,一种优化方法包括:(i)在所述多个目标集中选择目标集的子组合;(ii)从被分配至目标集的所述子组合的所述多个目标组中的目标组选择目标的子组合;(iii)为目标的所述选择子组合与目标集的所述选择子组合的每一个可能的目标-目标集组合分别计算相似度得数;并且(iv)根据在步骤(iii)中实现所述最佳相似度得数的所述目标-目标集组合来将所述目标组中的目标的所述选择子组合重新分配至目标集的所述选择的子组合中的目标集。在一些实施例中,为所述多个目标组中每一个目标组重复步骤(ii),(iii)及(iv)。在一些实施例中,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv)。在一些实施例中,在所述多个目标集中目标集的给定不同子组合,为所述多个目标组中各个目标组重复步骤(ii),(iii)及(iv)。
在一些实施例中,重复步骤(i),(ii),(iii)及(iv)数次,并且其中,每一次重复步骤(i),(ii),(iii)及(iv)均是为所述多个目标集中目标集的不同子组合。
在一些实施例中,所述优化方法还包括:(v)为所述多个目标组中的各个目标组重复步骤(ii),(iii)及(iv);(vi)确定在步骤(v)之前是否用于目标功能的值已经相对于用于所述目标功能的值改进。如果所述目标功能已经改进时,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv)。如果所述目标功能尚未改进时,结束所述优化步骤。在一些实施例中,可选地表示为F(对准策略)的所述目标功能是:
F(对准策略)=∑f(目标集k)
             K=1,多个目标集中的全部目标集
其中,
Figure A20081012525600251
             目标集k中的全部对<i,j>
在一些实施例中,所述多个图像包括1H-13C核磁共振光谱,并且其中
sim ( P &RightArrow; i , P ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( C i - C j ) 2 + &lambda; ( H i - H j ) 2 } , 其中
Ci是目标集k中目标
Figure A20081012525600262
13C维中的坐标;
Cj是目标集k中目标13C维中的坐标;
Hi是目标集k中目标
Figure A20081012525600264
1H维中的坐标;
Hj是目标集k中目标
Figure A20081012525600265
1H维中的坐标;而
λ是标准化常数。
在一些实施例中,所述多个图像包括二维光谱,并且其中
sim ( P &RightArrow; i , P ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标
Figure A20081012525600267
在X维中的坐标;
Xj是目标集k中目标
Figure A20081012525600268
在X维中的坐标;
Yi是目标集k中目标
Figure A20081012525600269
在Y维中的坐标;
Yj是目标集k中目标在Y维中的坐标;而
λ是标准化常数。
在一些实施例中,所述多个图像包括二维光谱,并且其中
Figure A200810125256002611
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标
Figure A200810125256002613
在X维中的坐标;
Xj是目标集k中目标在X维中的坐标;
Yi是目标集k中目标
Figure A200810125256002615
在Y维中的坐标;
Yj是目标集k中目标
Figure A200810125256002616
在Y维中的坐标;而
λ是标准化常数。
在一些实施例中,所述多个图像包括二维光谱,并且其中
Figure A20081012525600271
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标在X维中的坐标;
Xj是目标集k中目标
Figure A20081012525600274
在X维中的坐标;
Yi是目标集k中目标
Figure A20081012525600275
在Y维中的坐标;
Yj是目标集k中目标在Y维中的坐标;
λ是标准化常数;
correlationij是界定的相邻目标
Figure A20081012525600277
与目标
Figure A20081012525600278
之间的关系;
γ是关系项correlationij的权重;
Ii是目标
Figure A20081012525600279
的记录强度;
Ij是目标
Figure A200810125256002710
的记录强度;而
η是(Ii-Ij)2的权重。
在一些实施例中,利用贪心查找算法、动态查找或者贪心查找与动态查找的组合来执行对所述多个目标集中目标分配的优化。在一些实施例中,所述多个目标组中目标组中的目标对应与代谢物。
在一些实施例中,所述多个图像是在第一实验条件下获取的复制光谱,所述方法还包括使用所述多个目标集来将所述多个图像组合为单一第一平均光谱。在一些实施例中,为不同第二多个图像重复上述方法,其中,所述不同第二多个图像是在第二实验条件下获取的复制光谱,所述方法还包括使用所述多个目标集来将所述不同第二多个图像组合为单一第二平均光谱。在一些实施例中,第一实验条件是缺乏摄动(例如,未暴露至siRNA或药物)而第二实验条件是存在摄动(例如,暴露至siRNA或药物)。在一些实施例中,使用第一平均光谱及第二平均光谱而非用于形成第一平均光谱及第二平均光谱的制动品来执行对准方法。
在一些实施例中,所述方法还包括将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集。在一些实施例中,所述方法还包括根据所述多个目标集中的目标分配来将所述多个图像对准。在一些实施例中,所述方法还包括将所述多个对准图像输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个对准图像。
另一实施例提供了一种设备,用于将多个目标组中的目标对准。所述多个目标组中的每一个目标组分别包括在多个图像中相应图像中的所述目标。所述设备包括中央处理单元;以及存储器,其连接至所述中央处理单元。所述存储器包括用于访问所述多个目标组的命令。所述存储器还包括图像比较模块,用于执行任何上述方法。例如,在一些实施例中,图像比较模块为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集。此外,在上述实施例中,图像比较模块为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量。每一个上述相似度度量均处于(i)所述各个目标与(ii)所述多个目标集中目标集中目标之间。当(i)所述各个目标与所述多个目标集中的第一目标集中的目标之间的所述相似度度量优于所述各个目标与所述多个目标集中任何另一目标集中的目标之间的所述相似度度量时并且(ii)所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值,所述各个目标被增加至所述第一目标集。否则,将包括所述各个目标的新目标集增加至所述多个目标集。所述图像比较模块还包括用于为多个目标组中各个剩余目标组重复计算步骤的命令。处于相同目标集中的目标被视为相互对应。在一些实施例中,图像比较模块还包括用于执行以下步骤的命令:将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集。
本发明的另一方面提供了一种设备,用于将多个目标组中的目标对准,所述多个目标组中的每一个目标组分别包括在多个图像中相应图像中的所述目标。所述设备包括:中央处理单元;以及存储器,其连接至所述中央处理单元。所述存储器包括:用于访问所述多个目标组的装置;用于为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集的装置;以及用于为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量的装置。每一个相似度度量均处于(i)所述各个目标与(ii)所述多个目标集中目标集中目标之间。当(i)所述各个目标与所述多个目标集中的第一目标集中的目标之间的所述相似度度量优于所述各个目标与所述多个目标集中任何另一目标集中的目标之间的所述相似度度量时并且(ii)所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值,所述各个目标被增加至所述第一目标集。否则,将包括所述各个目标的新目标集增加至所述多个目标集。在一些实施例中,存储器还包括用于为所述多个目标组中剩余各个目标组重复用于计算的装置,由此使所述靶目标集增加的装置。在一些实施例中,所述存储器还包括用于将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集的装置。
另一实施例提供了一种设备,用于将存储在计算机可读存储介质中的多个目标组中的目标对准。所述存储介质包括:用于访问所述多个目标组的第一多个二进制值;用于为了所述多个目标组中第一目标组中的各个目标每一者分别构造包含所述第一目标组中所述各个目标,由此构造多个目标集的第二多个二进制值。存储介质包括用于为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量的第三多个二进制值。多个相似度度量中每一个相似度度量均处于(i)所述各个目标与(ii)所述多个目标集中目标集中目标之间。当所述各个目标与所述多个目标集中的第一目标集中的目标之间的所述相似度度量优于所述各个目标与所述多个目标集中任何另一目标集中的目标之间的所述相似度度量时并且(ii)所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值,所述各个目标被增加至所述第一目标集。否则,将包括所述各个目标的新目标集增加至所述多个目标集并且各个目标被增加至多个目标集。存储介质包括用于为所述多个目标组中剩余各个目标组重复计算的第四多个二进制值,其中,处于同一目标集中的目标被视为彼此对应。在一些实施例中,所述存储介质还包括用于将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集的第五多个二进制值。
另一实施例提供了一种方法,用于将多个目标组中的目标对准。所述多个目标组中每一个目标组分别包括多个图像中相应图像中的多个目标。多个目标组中每一者中的各个目标分别被初始标记为未处理。所述方法包括以下步骤:(A)为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集。如下所述,在常规实施例中,额外目标集被增加至多个目标集。该方法还包括(B)为所述多个目标组中目标组中的各个目标每一者分别计算所述各个目标与所述多个目标集中目标集中目标之间的相似度度量,由此计算多个相似度度量。当所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值,将靶目标组中具有与靶目标集最佳相似度得数的目标增加至靶目标集并标记为已处理。否则,当所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值,将缺失目标增加至靶目标集。缺失目标是对包括伪目标的目标集上施加处罚的伪目标。该方法还包括(C)为所述多个目标组中剩余各个目标组重复所述计算步骤(B),由此增加靶目标集。该方法还包括(D)为所述多个目标集中剩余各个目标集重复所述计算步骤(B),其中将各个目标集设计为靶目标集。在常规实施例中,所述方法还包括:(E)执行以下步骤:(i)对于在所述多个目标组中被标记为未处理的靶目标,构造目标集;并且(ii)为了所述靶目标集分配目标集为“靶目标集”并执行步骤(B)及(C);以及(F)重复步骤(E)直至在所述多个目标组中的任何目标组中没有剩余的被标记为未处理的目标。将要理解的是,在用于步骤(E)的情况来构造目标集的目标集的阈值距离内,“缺失目标”将被增加至多个目标集中与不包含未处理目标的目标组对应的各个目标集。处于同一目标集内的目标被视为相互对应。
附图说明
图1示出了根据本发明一个方面的设备。
图2示出了根据本发明一个方面的目标组数据结构。
图3示出了根据本发明一个方面用于产生初始对准策略的一种方法。
图4示出了根据本发明一个方面用于利用贪心法(greedy)搜索运算法则来改进初始对准策略的方法。
图5示出了根据揭示的***及方法的一个方面利用贪心法搜索运算法则进行估算的替代对准策略。
图6是利用揭示的***及方法与其他图像对准的示意图像。
图7示出了根据本发明一个方面用于产生初始对准策略的另一种方法。
在附图中多个视图中,类似的参考标号表示对应的部件。
具体实施方式
图1示出了用于在多个目标组中对准目标的示例性***,多个目标中的每一个目标组分别包括在多个图像中对应图像中的目标。该***优先地是具有以下组件的计算机***10:
中央处理器22;
主非易失性存储单元14,例如硬盘驱动,用于存储软件及数据,存储控制器12控制存储单元14;
***存储器36,优选为高速随机访问存储器(RAM),用于存储***控制程序、数据以及应用程序,包括从非易失性存储单元14载入的程序及数据,***存储器36还可包括只读存储器(ROM);
用户界面32,包括一个或更多输入装置(例如,键盘28)以及显示器26或其他输出装置;
用于连接至任何有线或无线通信网络34(例如,诸如互联网的广域网)的网络界面卡或其他通信电路20;
用于将***的上述元件互连的内部总线30;以及
向上述元件供电的电源24。
计算机10的运行主要受到由中央处理单元22执行的操作***40的控制。操作***40可存储在***存储器36中。除了操作***40之外,在常规应用中,***存储器36包括:
用于控制对揭示的***及方法所使用的各种文件及数据结构进行访问的文件***42;
图像存放区44,包括多个图像46(例如,NMR光谱),其中每一个图像46分别包括待对准的目标(例如,高峰或其他特征);
图像处理器模块48,用于分析图像46并从各个图像46提取对应的包含各个图像46中目标列表的目标组50;
图像对比模块52,用于对准在目标组50中的目标;
多个目标集合54,每一个目标集合54分别用于在全部或部分图像46中出现的对应目标;以及
可选集合过滤模块56,用于查找目标集合中满足一个或更多预定标准的目标。
如图1所示,计算机10包括软件程序模块及数据结构。存储在计算机10中的数据结构包括图像存放区44、图像46、目标组50以及目标集合54。每一个这些数据结构可分别包括任何形式的数据结构,包括但不限于平ASCII或二进制文件,Excel展开页、相关数据库(SQL)或者在线分析处理(OLAP)数据库(MDX以及/或其变形)。
在一些实施例中,每一个上述数据结构分别是单数据结构。在其他实施例中,上述数据结构事实上包括多个可以或无需全部由同一计算机10管理的数据结构(例如,数据库、文件、档案)。例如,在一些实施例中,图像存放区44以及存放区内的图像46被存储在计算机10上以及/或通过广域网或互连网34可以计算机10访问的一个或更多计算机上。因此,在一些实施例中,上述数据结构中任一者分别可以是(i)存储在计算机10上,(ii)存储在计算机10与其他例如通过广域网34可被计算机10访问的计算机(图1中未示出)的组合上,或者(iii)全部被远程存储在一个或更多其他例如通过广域网或互连网34可被计算机10访问的计算机(图1中未示出)上。
在上述数据结构的情况下,希望的是也可将图1中所示的多个模块布置在一个或更多远程计算机上。例如,在一些实施例中,采用揭示的方法作为网络服务。在上述实施例中,图像处理模块48、图像比较模块52以及/或目标过滤模块56可设置在经由网络34与计算机10通信的客户端计算机上。在一些实施例中,例如,图像比较模块52可以是交互式网页。
着眼于此,只要数据结构及软件模块可通过网络34被其他电子装置相互访问,任何将图1所示的数据结构及软件模块设置在一个或更多计算机上方法均落入本发明的范围。因此,本发明涵盖了较广的计算机***。
现已揭示了示例性计算机***。现参考图3,描述用于将图像中的目标对准的示例性处理方法。
步骤302。在步骤302中,获得多个图像46。图像46是包括目标的任何数据结构。在常规应用中,各个图像46将具有一组目标,以下称为目标组50。此外,通常,在多个图像中的一个图像46中的目标与在多个图像中的其他图像46中的目标存在对应关系。例如,在一些实施例中,图像是在不同时间点从机体取样的样本的核磁共振(NMR)图像,而图像,高峰中的单个目标表示样本中的代谢物。因此,第一NMR图像会存在在第一生物样本中用于第一代谢物的高峰,而第二NMR图像会存在在第二生物样本中用于完全相同的第一代谢物的高峰。在上述示例中,因为两个高峰均表示同一代谢物,故用于第一NMR图像中的第一代谢物的高峰对应于用于第二生物样本中完全相同代谢物的高峰。业界现存的问题是,由于在光谱被测量的实验条件下包含微小改变的各种因素(样本的pH等)的原因,用于第一代谢物的高峰的坐标会在光谱与光谱之间发生偏离。
在一些实施例中,多个图像中的各个图像46分别是二维核磁共振(NMR)光谱,三维NMR光谱或者四维NMR光谱,而多个图像中的目标是在二维、三维或者四维NMR光谱中的高峰。在一些实施例中,多个图像中的图像46分别是2D核奥佛好塞提高及交换(NOESY)光谱、二维J解析(2D-J)光谱、共核2D相关(COSY)光谱、2D旋转回声相关(SECSY)光谱、继相干转换(RELAYED-COSY)光谱、1H-15N COSY光谱、1H-31P COSY光谱、113Cd-1H COSY光谱、旋转框架NOE(ROESY)光谱、总相关(TOCSY)光谱、异核单量子相关(HSQC)光谱、异核多量子相关(HMQC)光谱、异核多键相关(HMBC)光谱、二维异核相关(HETCOR)光谱、双量子过滤相关(DQFC)光谱或者二维INADAQUATE光谱。
实际上,本发明的图像46并不限于“可视”图像。本发明范围内的图像46可以是包括生成可视图像的充分信息的数据集。例如,在NMR光谱的情况下,图像46可以是用于产生NMR光谱的数据而非NMR光谱自身。在本发明的方法中,可以与NMR光谱自身相同的方式来管理上述数据作为图像46。
在一些实施例中,在待对准的多个图像中,存在2个或更多图像、5个或更多图像、10个或更多图像或者100个或更多图像。在一些实施例中,存在2至1000个图像或者少于500个图像需要对准。在一些实施例中,图像46是一维NMR光谱、二维NMR光谱、三维NMR光谱、四维NMR光谱或者可被用于生成任何上述光谱的数据。在一些实施例中,图像46是二维光谱,或者通过处理方法(包括但不限于,质谱分析法、X射线晶体照相法、天文天空俯瞰以电泳法)而非NMR获得的生成二维光谱所需的数据。在一些实施例中,图像是根据一些改变特性(例如波长、质量或者能量)依序分离并布置的发射物或波的分量的阵列。在一些实施例中,在步骤302获得的多个图像被存储在图1所示的图像存放区44中。
在一些实施例中,多个图像中的一些图像表示从一种物种获取生物样本的测量值,而多个图像中的其他图像则表示从另一种物种获取生物样本的测量值。在一些实施例中,多个图像中的一些图像表示从受到摄动(perturbation)之前的机体获取生物样本的测量值,而多个图像中的其他图像则表示从受到摄动之后的机体获取生物样本的测量值。
摄动可以是环境型或是遗传型。环境摄动的示例包括但不限于将机体暴露至实验化合物、变应原、疼痛、热或冷环境。环境摄动的其他示例包括日常饮食(例如,高脂日常饮食或低脂日常饮食)、缺乏睡眠、隔离以及量化自然环境影响(例如,吸烟、节食、锻炼)。遗传摄动的示例包括但不限于使用基因剔除法,引入对预定基因或基因产品的限制,N-乙基-N-亚硝基脲(ENU)变异发生,对基因的siRNA剔除,或者量化物种的多个成员显示的特征。
在一些实施例中,摄动是暴露至药物或小分子。可被用于上述摄动的小分子的非限制性示例包括但不限于满足Lipinski五规则的那些分子:(i)氢键给体数目小于5(例如,OH及NH组);(ii)氢键受体数目小于10(例如,N及O);(iii)分子量小于500道尔顿;并且(iv)脂水分配系数(LogP)小于5。之所以称为“五规则”是因为四个条件中三个条件均涉及数字5。参见,Lipinski,1997,Adv,Drug Del,Rev,23,3,通过引用将其全部内容包含在本说明书中。在一些实施例中,还加入了Lipinski五规则之外的条件。例如,在一些实施例中,小分子具有五个或更少芳族环,四个或更少芳族环、三个或更少芳族环或者两个或更少芳族环。在一些实施例中,小分子是具有分子量小于2000道尔顿的有机化合物。
步骤304。在步骤304,对多个图像进行处理以识别多个目标组50,每一个目标组50分别包括在多个图像中相应图像46中的目标200。在一些实施例中,多个图像是NMR光谱而目标组中的目标是从其获得目标组的NMR光谱的高峰。在一些实施例中,高峰是NMR光谱中预设范围内的局部最大值。在光谱是二维1H-12C NMR光谱的情况下,高峰例如可以分别是对于质子及碳尺寸由百万分之0.03(ppm)及0.4ppm限定的局部最大值。可以使用常规处理从相应图像获得目标组。例如,在图像是NMR光谱的实施例中,可以使用诸如Topspin(Bruker,Billerica,Massachussetts)、VNMR(Varian,Palo Alto,Califoria)以及NMRPipe(Delaglio el al.,1995,J.Biomol.NMR.6,277-293)的常规程序(每一个都通过应用被包含于本说明书中)来处理光谱。此外,还可使用诸如Sparky Assignment and Integration Software package(UCSF,San FranciscoCalifornia)、ANSIG(Kraulis,1989,J.Magn.Reson.24,pp627-633;Kraulis等,1994,Biochemistry 33,pp 3515-3531)、NMRView(OneMoon Scientific,Inc.,Newark,New Jersey)以及XEASY(Bartels等,1995,Journal of Biomolecular NMR 6,1-10)(每一个都通过应用被包含于本说明书中)的常规光谱分析程序来将处理后NMR光谱中的高峰分配至样本中的单个分子成分,根据其使用诸如对次序特定共振分配的高峰选择及支持、交叉高峰分配、交叉高峰积分以及用于动态处理的比率恒定判定的技术来测量出光谱。在一些实施例中,通过计算机10的图像处理器模块48(图1)来执行上述处理。
在方法示例中,对根据从C57鼠株获得的生物样本得到的三个二维NMR光谱的情况进行考虑。参考图1,三个二维NMR光谱是图像46的示例。一个上述二维NMR光谱的示例在图6中示出。在完成步骤302及304时,将生成三个目标组50,每一个分别包含在三个二维NMR光谱其中一个光谱中发现的高峰。用于从生物样本的三个复本获得的实际NMR光谱的示例性目标组50在表1至3中给出。根据图6,在这些表中,“w1”是第一维中NMR光谱中的目标(高峰)的坐标,“w2”是第二维中NMR光谱中的目标(高峰)的坐标,而“intensity(强度)”是目标的强度。在一些实施例中使用了上述强度。实际上,用于实际NMR光谱的目标组包含并未列入以下表中的很多其他目标。
表1.用于第一二维NMR光谱的目标组
Figure A20081012525600391
表2.用于第二二维NMR光谱的目标组
Figure A20081012525600401
表3.用于第三二维NMR光谱的目标组
Figure A20081012525600411
下述步骤使用诸如表1-3中所示的目标组来对准目标,并最终在一些实施例中对准通过其提取目标组的图像。
在完成步骤304时,生成多个目标组,每一个目标组用于多个图像中的每一个图像。但是,上述常规处理并未提供令人满意的将一个目标组50中的目标与另一目标组50中的目标对准的策略。因为各个目标组50分别表示图像46,以上所述的这种常规处理不能提供将图像46彼此对准的令人满意的对准策略。
一种对准策略是为一组图像分配相应目标对的策略:如果假定成对目标表示同一可观察量(observable)(例如,假定两个不同NMR光谱中的成对高峰表示两个不同生物样本中相同的代谢物),则视为这对目标相互对应(因此对准)。对准策略遵循两个原则。首先,“对应”分配是传递性的:如果目标1与目标2对应并且目标1与目标3对应,则目标2与目标3对应。其次,如果成对目标由来自同一图像46的两个不同目标构成,则将其视为不对应,因为在单一图像46中不同目标被视为表示不同可观察量(例如,不同代谢物)。
上述对准策略原则意味着图像46中的任何目标200均不能被视为对应(对准)于另一图像中的两个目标。清楚的是,目标总是与其自身对应,此外,如果目标1对应于目标2,则目标2对应于目标1。因此,数学上,可将上述对应分配视为等同分配。图3中的剩余步骤示出了用于生成初始对准策略的方法。图4所示的步骤示出了用于改进对准策略的方法。图7示出了用于生成初始对准策略的另一种方法,然后例如可利用图4所示的方法来对其进行改进。通过一些实施例中的图像比较模块52来执行图3,4及7中所示的步骤或者这些步骤的逻辑等同物或组合。
步骤306。在步骤306中,构造目标组。目标组是通过对准策略与相同可观察量(例如,代谢物或其他化合物等)对准的全部目标的组。目标组满足两个原则。首先,如果将两个目标视为“对应”,则其处于同一目标组中。其次,将单一目标组中的任意两个目标均视为“对应”。因此,根据该原则以及涉及上述对准策略的原则,目标组中的每一个目标均需来自不同图像。
通过在多个目标组中选择被称为第一目标组的目标组来开始步骤306。该第一目标组包含多个图像中图像中的目标。可以选择多个目标组中的目标组,由此可以选择多个图像中的任何图像。然后,为第一目标组中的各个目标生成目标集。因此,如果与多个图像中的图像对应的目标组包含50个目标,则生成50个目标集。例如,如果与第一目标组对应的图像是NMR光谱,则目标组中的目标是高峰且为NMR光谱中的各个高峰分别生成目标集。如果在与第一目标组对应的NMR光谱中存在五十个高峰,则为每一个高峰均生成一个总共五十个目标集。
步骤306的净结果是形成多个目标集。在步骤306结束时,在多个目标组中选择的单一第一目标组中存在各个目标的目标集。在此阶段,每一个目标集分别包括来自选择的第一目标组的恰好一个目标。
步骤308。在后续步骤中,检查每一个剩余目标组中的目标以将其分配至目标集。在优选实施例中,每一个目标集分别包括相同数量的目标。因此,为了说明目的,在图3所示的处理中使用计数器作为确定各个目标集包括相同数量的目标的方法。在步骤308,因为每一个现存目标集当前包括一个目标,故将该计数器设定为1。
步骤310。在步骤310中,选择另一目标组。在步骤310中选择的目标组是为了检查之前尚未被选择的任意目标组。当第一次执行步骤310时(即,步骤310的初次执行),仅检查了一个目标组,即步骤306中描述的第一目标组。但是,当算法继续进行并重复步骤310时(即,步骤310的后续执行),优选地需要注意确保之前尚未通过步骤310的处理被检查的目标组在每一次重新执行步骤310时被选择。
步骤312。步骤312是结束于步骤322的循环的起始。执行循环312-322以检查在第一次执行步骤310时选择的目标组中全部目标。在步骤312,在该目标组中选择各个目标。当重复步骤312时(即,步骤312的后续执行),步骤312从在先前执行步骤312时之前尚未从目标组中选择的目标组选择目标。
步骤314。步骤314确定将在最后一次执行步骤312中选择的目标布置于哪一个目标集。通过计算多个相似度度量来实现以上目的。每一个相似度度量在(i)于最后一次执行步骤312时选择的各个目标与(ii)在多个目标集中的目标集中的目标之间实现。因此,如果存在五十个目标集,则将要计算五十个相似度度量。每一个相似度度量将在待分配珠目标(在最后一次执行步骤312时选择)与多个目标集中目标集中的目标之间实现。
考虑目标集包括一个目标
Figure A20081012525600441
的情况。一种计算目标集中目标
Figure A20081012525600442
与在步骤312最后一次执行时选择的各个目标(表示为
Figure A20081012525600443
)之间的相似度度量的方法是计算
Figure A20081012525600444
Figure A20081012525600445
之间欧几里得距离的负乘方:
sim ( p &RightArrow; i , p &RightArrow; j ) = - { dist ( p &RightArrow; i , p &RightArrow; j ) } 2
考虑目标集包括多个目标 P = { P &RightArrow; 1 , . . . , P &RightArrow; j } 的情况。一种计算目标集中目标P与在步骤312最后一次执行时选择的各个目标
Figure A20081012525600448
之间的相似度度量的方法是计算
Figure A20081012525600449
与P之间欧几里得距离的负乘方:
sim ( p &RightArrow; i , P ) = - &Sigma; j = 1 J { dist ( p &RightArrow; i , p &RightArrow; j ) } 2
在替代实施例中,可以使用除了欧几里得距离之外的其他度量来计算
Figure A200810125256004411
例如,曼哈坦距离、Chebychev距离、矢量之间的角度、相关距离、标准欧几里得距离、Mahalanobis距离、Pearson相关系数的乘方、或者Minkowski距离。例如可以使用SAS(Statistics Analysis SystemsInstitute,Cary,)或S-Plus(Statistical Sciences,Inc.,Seattle,Washington)来计算上述度量。上述度量在Draghici,2003,Data Analysis Tools for DNAMicroarrays,Chapman&Hall,CRC Press London,chapter 11中进行了描述,为此通过引用将其全部内容包含于本说明书中。
相似度度量的确切的表达式取决于待对准的图像的特性。例如,考虑图像是二维1H-13C NMR的情况。在这种情况下,基于欧几里得距离的类似度度量可被构造为:
sim ( p &RightArrow; i , P ) = - &Sigma; j = 1 J { dist ( p &RightArrow; i , p &RightArrow; j ) } 2 = &Sigma; j - { ( C i - C j ) 2 + &lambda; ( H i - H j ) 2 }
因为碳与质子尺寸的等级不同,故在对质子尺寸中的坐标(Hi-Hj)2乘以标准化系数λ以使距离测量不产生偏差。
步骤316。在步骤316,确定哪一个目标集可实现最佳得数(scoring)相似度度量。在一些实施例中,特别是那些使用上述负欧几里得距离的实施例,最佳得数相似度度量是最接近零的相似度度量。进行检验以判定分配至目标集的各个目标
Figure A20081012525600452
与最佳得数目标集中的各个目标之间的坐标差异是否低于阈值。例如,考虑最佳得数目标集包括单一目标
Figure A20081012525600453
的情况。进一步假定目标的特征为第一维度值X以及第二维度值Y。在这里,当
|X2-X1|<T1,并且
|Y2-Y1|<T2时,
各个目标
Figure A20081012525600454
与最佳得数目标集中的目标之间的坐标差异低于阈值,其中:
X2是用于各个目标
Figure A20081012525600455
的第一维指标;
X1是用于最佳得数目标集中目标
Figure A20081012525600456
的第一维指标;
Y2是用于各个目标
Figure A20081012525600457
的第二维指标;
Y1是用于最佳得数目标集中目标
Figure A20081012525600461
的第二维指标;
T1是第一维阈值极限值;而
T2是第二维阈值极限值。
如果任何距离检验失败,则不将各个目标
Figure A20081012525600462
增加至最佳得数目标集。
在一个示例中,多个图像是二维1H-13C NMR图像而且第一维值X用于碳(C)而第二维值Y用于氢(H),并且当
|C2-C1|<BC,并且
|H2-H1|<BH时,
各个
Figure A20081012525600463
与最佳得数目标集中的目标
Figure A20081012525600464
之间的坐标差异低于阈值,其中:
C2是用于各个目标
Figure A20081012525600465
的第一维指标;
C1是用于最佳得数目标集中目标
Figure A20081012525600466
的第一维指标;
H2是用于各个目标
Figure A20081012525600467
的第二维指标;
H1是用于最佳得数目标集中目标的第二维指标;
BC是第一维阈值极限值;而
BH是第二维阈值极限值。
在一些实施例中,BC是百万分之10(PPM)或更小,9PPM或更小,8PPM或更小,7PPM或更小,6PPM或更小,5PPM或更小,4PPM或更小,3PPM或更小,2PPM或更小,1PPM或更小,或者0.5PPM或更小。在一些实施例中,BH是百万分之10(PPM)或更小,9PPM或更小,8PPM或更小,7PPM或更小,6PPM或更小,5PPM或更小,4PPM或更小,3PPM或更小,2PPM或更小,1PPM或更小,或者0.5PPM或更小。
在一些实施例中,多个图像中的每一个图像分别是N维图像,其中N为1,2,3,4,5,6,7,9,10或大于10。在这些实施例中,当
|C1 2-C1 1|<B1
|C2 2-C2 1|<B2
...
|CN 2-CN 1|<BN
各个
Figure A20081012525600471
与最佳得数目标集中的目标之间的坐标差异低于阈值,其中:
C1 2是用于各个目标
Figure A20081012525600472
的第i维指标;
C1 1是用于最佳得数目标集中目标的第i维指标;而
B1是第i维阈值极限值。
如果这N个距离检验失败,则不将各个目标
Figure A20081012525600473
增加至最佳得数目标集。
以上给出的用于判定各个目标
Figure A20081012525600474
的坐标以及最佳得数目标集中的目标的坐标是否低于阈值的示例并未处理目标集包括多个目标的情况。存在两种不同方法来处理上述情况。在一种方法中,目标集中全部目标的坐标被一起平均以形成表示目标集中全部目标的平均值的目标
Figure A20081012525600475
然后在各个目标
Figure A20081012525600476
与平均目标
Figure A20081012525600477
之间执行距离检验。在另一种方法中,在各个目标与最佳得数目标集中的各个目标之间执行以上给出的独立的距离检验。如果这些距离检验中的任何检验失败,则不将各个目标
Figure A20081012525600479
增加至最佳得数目标集。
步骤318。如果不满足各个目标
Figure A200810125256004710
与最佳得数目标集中的目标之间的距离原则(316-否),则生成用于各个目标
Figure A200810125256004711
的新目标集,并将各个目标
Figure A200810125256004712
置于目标集中。当计数器N等于一并且已经为在最后一次执行步骤310时选择的目标组中的全部目标完成312-322循环时,可在任何给定目标集中的目标的最大数量在此阶段将为二。但是,如果在312-322循环的任何一次反复中执行步骤318,则一些目标集将仅包括一个目标。因此,为了有助于确保各个目标集分别包括相同数量的目标,将“缺失目标”增加至由步骤318生成的目标集54。例如,当N=1时,将一个“缺失目标”增加至由步骤318生成的目标集54,使得由步骤318生成的各个目标集54分别包括两个目标:来自在最后一次执行步骤310时选择的目标组的一个目标以及一个“缺失目标”。缺失目标是具有以下特性的伪目标:
sim(缺失目标,实际目标)=sim(实际目标,缺失目标),
sim(缺失目标,实际目标)=预定缺失处罚,
sim(实际目标,缺失目标)=预定缺失处罚,并且
sim(缺失目标,缺失目标)=预定缺失处罚。
预定缺失特性的值取决于应用,并被选择以处罚在目标集中引入缺失目标。
当已经重复了循环312-324达数次时,即N较大时,更大数量的“缺失目标”被增加至在数次执行步骤318时生成的目标集54。例如,当N为5时在步骤318生成目标集54时,五个“缺失目标”(伪或无效目标)被增加至目标集54使得目标集具有总共六个目标,即来自在最后一次执行步骤310时选择的目标的一个目标以及五个“缺失目标”。
步骤320。如果满足各个目标
Figure A20081012525600481
与最佳得数目标集54中的目标之间的距离原则(316-是),则将各个目标
Figure A20081012525600482
置于目标集54中。但是,仅将来自任何给定目标组50的一个目标置于给定目标集54中。因此,如果来自在最后一次执行步骤310中选择的目标组的目标已经被置于特定目标集54中,则各个目标
Figure A20081012525600491
与特定目标集中的目标之间的相似度或者被忽略,或者不被计算,以确保特定目标集54不会被视为最佳得数目标集。以此方式,仅将来自给定目标组50的一个目标置于给定目标集54中。
步骤322。在步骤322中,进行在最后一次执行步骤310时选择的目标组50中的全部目标是否已经被分配至目标集54的判定。如果是否(322-否),则处理控制返回至步骤312,并且为在最后一次执行步骤310时选择的目标组50中的另一目标重复循环312-322。当在最后一次执行步骤310时选择的目标组50中的全部目标已经被分配至目标集54时(322-是),处理控制进行至步骤324。
步骤324。当已经将选择的目标组50中的全部目标都分配至目标集时进行至步骤324。在优选实施例中,这里计算得到的对准策略取决于每一个分别包括相同数量目标的目标集54。但是,包括循环312-322的上述处理并不能确保每一个目标集54均包括相同数量的目标。例如,在每一次重复循环312-322时,可在不存在目标的步骤306中生成目标集54。因此,在步骤324,每一个未被分配来自在最后一次执行步骤310时选择的目标组的目标的目标集54被分配“缺失”目标。当然,存在其他方法来利用“缺失”(伪)目标来确保目标集54进位舍入,使得各个目标集54具有相同数量的目标。这里描述的包括使用计数器的方法仅起说明多种方法其中一种的作用,利用这些方法,可通过具有少于最大数量目标的伪“缺失”目标的后填目标集54来生成每一个均具有相同数量的目标的多个目标集54。在替代方法中,在执行步骤318及324时不使用计数器或增加伪“缺失”目标,可以在已经检查了全部目标集54之后,紧在生成初始对准策略之前增加上述伪“缺失”目标。在该替代方法中,检查目标集54以确保包括在任意一个目标集中的目标的最大数量。不存在最大数量目标的目标集54被后填伪“缺失”目标直至它们确实具有最大数量的目标。
步骤326及328。在步骤326,进行是否已经通过重复循环310-324而检查了多个目标组中的各个目标集54的判定。如果是否(326-否),则处理控制返回至选择多个目标组50中另一目标组50的步骤310,并为新的目标组重复循环310-324。如果已经通过重复循环310-324检查了多个目标组中的各个目标集54(326-是),则输出包括多个目标集的初始对准策略(步骤328)。在一些实施例中,该输出步骤仅表示在存储器36及/或数据存储器14中瞬时存储了目标集54,或者在通过广域网34或一些其他形式的网络可由计算机10访问的一些其他存储器中存储了目标集54。在一些实施例中,多个目标集被输出至使用者界面装置、计算机可读存储介质、存储器、或者本地或远程计算机***,或者显示了多个目标集。
在一些实施例中,在存储器36中存储初始对准策略作为多个目标集54。在一些实施例中,每一个目标集54分别表示一个可观察量,其在样本中被测量并表明其自身为多个图像中的目标。例如,在一些实施例中,每一个目标集54分别表示在一组生物样本中的一些或全部中存在的代谢物,通过其测量得到多个图像。现参考图2,示出了根据一个实施例的目标集54的其他细节。在完成图3所示的处理时,示例性目标集54将包括多个目标200。目标集54中的每一个目标200均来自不同目标组50,因此来自多个图像中的不同图像46。目标集54中的各个目标200应当表示相同可视量。例如,如果目标200-1是表示第一图像46中的特定代谢物的测量值,则从目标200-2至200-Z每一者均应是表示另一图像46中相同代谢物的测量值的高峰。
如图2所示,在一些实施例中,目标集54存储关于目标集中各个目标200的特定信息,例如,从哪一个源图像46发现的目标200,源图像中的目标的中心、有效中心或者最大限度部分的坐标204、图像中的可选目标强度206,以及(可选地)提供图像中目标形状208的量的一个或更多特性。
图3所示的处理生成包括多个目标集54的初始对准策略。如图2所示,在完成图2所示的处理时,各个目标集54分别包括来自不同图像46的多个目标200。在给定目标集54中的每一个上述目标200分别表示测量数据中的相同可视量。当目标集54中的目标200确实表示测量数据中的相同可视量时,就讲目标200相互“对应”。如果与特定目标集中的第二目标类似,特定目标集54中的第一目标200不表示相同可视量(例如,代谢物)则第一与第二目标相互不对应,并且应当从目标集54中去除一个目标。
如果图像表示样本中代谢物的NMR测量值,则在对准策略中给定目标集54中的各个目标200可以是由相同代谢物生成的NMR光谱高峰。可在其中发现给定代谢物的生物样本的各个图像中表示该NMR光谱高峰。
参考图7,提供了用于生成初始对准策略的替代方法。分别以与图3中的步骤302及304相同的方法来执行步骤702及704。在步骤706中,每一个目标组50中的各个目标均被标记为未处理。
步骤708。在步骤708,选择多个目标组中的第一目标组50,并且对于第一目标组50中的各个目标构造包括各个目标的目标集54,由此构造多个目标集54。例如,考虑存在100个目标组50的情况。从100个目标组50中选择第一目标组50。假定第一目标组50包括50个目标。对于第一目标组50中50个目标中的各个目标,生成包含各个目标的目标集54。
步骤710。在步骤710中,选择多个目标集54中的靶目标集54。在上述第一目标组50包括50个目标的示例中,步骤710限定了选择在步骤708中生成的50个目标集54的其中一个。
步骤712。在步骤712中,在步骤704中识别的多个目标组50中的靶目标组50被选择。
步骤714。在步骤714中,选择其在最后一次执行步骤712时被选择的目标组50中的未处理目标,其具有与在最后一次执行步骤710时被选择的靶目标集54最佳的相似度得数。在为了给定靶目标集54第一次重复循环714-722时,靶目标集54将仅包括来自目标组50的目标。因此,在为了给定靶目标集54第一次执行步骤714时,步骤714涉及确定靶目标集54中的单一目标与靶目标组50中的各个未处理目标之间的相似度。但是,为多个靶目标组50中的各个靶目标组50重复步骤714。假定已经通过循环714-722处理了当前的n-1目标组50,由此,靶目标集54具有n-1各目标,或者实际目标,或者“缺失”目标: P = { P &RightArrow; 1 , P &RightArrow; 2 , . . . , P &RightArrow; n - 1 } . 然后,在步骤712中选择第n个目标组50并且识别该仍未处理并具有与靶目标集P最大(最佳)相似度的第n靶目标组50中的目标
Figure A20081012525600522
对于第n个目标组50中的任何目标
Figure A20081012525600523
sim ( p &RightArrow; , P ) = &Sigma; i = 1 n - 1 sim ( p &RightArrow; , p &RightArrow; j ) , 其中
Figure A20081012525600525
在组 { P &RightArrow; 1 , P &RightArrow; 2 , . . . , P &RightArrow; n - 1 } 中。
步骤716-720。在步骤716中,进行靶目标组50中具有与在步骤714中识别的靶目标集P最佳的相似度得数的未处理目标
Figure A20081012525600527
是否兼容的判定。例如,考虑靶目标集包括单一目标
Figure A20081012525600528
的情况。进一步假定的特征为第一维值X及第二维值Y。在这里,当
|X2-X1|<T1,并且
|Y2-Y1|<T2时,
在步骤714中识别的未处理目标与靶目标集之间的坐标差异低于阈值,其中:
X2是用于未处理目标
Figure A20081012525600531
的第一维指标;
X1是用于靶目标集中目标
Figure A20081012525600532
的第一维指标;
Y2是用于未处理目标
Figure A20081012525600533
的第二维指标;
Y1是用于靶目标集中目标
Figure A20081012525600534
的第二维指标;
T1是第一维阈值极限值;而
T2是第二维阈值极限值。
如果任何距离检验失败(716-否),则不将未处理目标
Figure A20081012525600535
增加至靶目标集54,而是将“缺失高峰”增加至靶目标集54(步骤718)。如果满足两个距离检验(716-是),则将未处理目标
Figure A20081012525600536
增加至靶目标集54(步骤720),并将未处理目标标记为已处理。
在一个示例中,多个图像是二维1H-13C NMR图像,并且第一维值X用于碳(C)而第二维值Y用于氢(H),并且当
|C2-C1|<BC,并且
|H2-H1|<BH时,
在步骤714中识别的未处理目标与靶目标集
Figure A20081012525600539
之间的坐标差异低于阈值,其中:
C2是用于未处理目标的第一维指标;
C1是用于靶目标集中目标
Figure A200810125256005311
的第一维指标;
H2是用于未处理目标
Figure A20081012525600541
的第二维指标;
H1是用于靶目标集中目标的第二维指标;
BC是第一维阈值极限值;而
BH是第二维阈值极限值。
在一些实施例中,BC是百万分之10(PPM)或更小,9PPM或更小,8PPM或更小,7PPM或更小,6PPM或更小,5PPM或更小,4PPM或更小,3PPM或更小,2PPM或更小,1PPM或更小,或者0.5PPM或更小。在一些实施例中,BH是百万分之10(PPM)或更小,9PPM或更小,8PPM或更小,7PPM或更小,6PPM或更小,5PPM或更小,4PPM或更小,3PPM或更小,2PPM或更小,1PPM或更小,或者0.5PPM或更小。
以上给出的用于判定在步骤714中识别的未处理目标的坐标以及靶目标集54中的目标的坐标是否低于阈值的示例并未处理靶目标集54包括多个目标的情况。在已经为多个目标组50重复循环712-722之后,因为未处理目标或者“缺失”目标会在每一次重复时间循环712-722时被增加至靶目标集54,故靶目标集54会包括多个目标。存在至少两种不同方法来处理上述情况。在一种方法中,靶目标集54中的全部目标的坐标被一起平均以形成表示靶目标集54中全部目标的平均值的目标
Figure A20081012525600544
然后在靶目标组50中的各个目标
Figure A20081012525600545
与平均目标之间执行距离检验。在另一种方法中,在靶目标组50中的各个目标
Figure A20081012525600547
与靶目标集54中的各个目标之间执行上述独立的距离检验。在一些实施例中,如果任何距离检验失败,则将在步骤714中识别的目标
Figure A20081012525600548
增加至靶目标集(716-否)。
步骤722。在步骤722中,进行为了应当被分配至在最后一次执行步骤710时选择的靶目标集54的目标,多个目标组50中的全部目标组50是否已经被检查的判定。如果是(722-是),则控制进行至步骤724。如果否(722-否),则控制返回至步骤712,在此选择另一靶目标组50并重复循环712-722。
步骤724。在步骤724,进行是否已经通过以上识别处理(循环712-722)检查了多个目标集54中的全部目标集54的判定。如果否(724-否),则处理控制返回至步骤710,在此选择多个目标集54中的另一靶目标集54,并为靶目标集54重复循环712-722。如果已经通过重复循环712-722检查了多个目标集54中的各个目标集54(724-是),则控制进行至步骤726。
步骤726。在步骤726,进行是否已经将全部目标组中的全部目标标记为已处理的判定。如果否(726-否),则控制进行至步骤728,如果是(726-是),则控制进行至步骤730。
步骤728。在步骤728,为了多个目标组中一个目标组的未处理目标,将目标集54增加至多个目标集,并且将未处理目标布置在新生成目标集中并标记为已处理。将新生成目标集设计为靶目标集,并且控制进行至步骤712,使得靶目标集可具来自目标组(而非是未处理目标的源头的目标组)的相应目标。
步骤730。在步骤730中,输出包括多个目标集54的初始对准策略。在一些实施例中,该输出步骤仅表示在存储器36及/或数据存储器14中或者在一些其他通过广域网34或一些其他形式的网络可被计算机10访问的存储器中瞬时存储多个目标集54。在一些实施例中,该输出步骤仅表示使目标集54到达执行图4所示的那些步骤的目标集优化器。在一些实施例中,将多个目标集54输出至使用者界面装置、计算机可读存储介质、存储器、或者本地或远程计算机***,或者显示多个目标集54。
图3及图7示出了用于生成初始对准策略的两种方法。本领域的技术人员将理解用于生成初始对准策略的等同方法以及所有这些方法均落入本发明的范围内。例如,参考图7,在步骤708,在该方法中在此阶段无需构造多个目标集。相同,一旦选择了第一目标组,就可为第一目标组中的各个目标重复循环712-722,并且在为各个目标初次重复循环712-722期间可以构造用于第一目标组中各个目标的目标集。可以通过为第一目标组中各个目标重复循环710-722来构造多个目标集。然后,可以为任何依旧被标记为未处理的目标组中的目标生成新的目标集,并为新目标集重复循环712-722。然后可以持续为未处理目标构造新的目标集以及重复循环712-722的步骤的处理直至在多个目标组中的任何目标组中均已不存在未处理目标。
为其中初始对准策略包括至少一个目标集(其中在至少一个目标集中的一些目标相互不对应)的状态提供用于改进初始对准策略的方法。在图4中示出了改进上述对准策略的示例方法。在图4所示的步骤中,存储对准策略作为多个目标集54。
步骤402。在步骤402中,选择来自对准策略(多个目标集)的目标集54的子组合。在一些实施例中,选择了来自对准策略的三个目标集。在一些实施例中,从对准策略中选择四个目标集,五个目标集,六个目标集,七个目标集,八个目标集,九个目标集,或十个目标集。在实践中,可在步骤402选择高达全对准策略(在步骤328输出)自身中目标集54的数量的任意数量的目标集。对在选择的目标集的子组合中目标200的分配以及将目标200向不同目标集54的可能的再分配的检验通过以下详述的循环404-412中的步骤进行。
步骤404。在步骤404中,选择多个目标组中的目标组50。在常规实施例中,在执行步骤404时不对给定目标组50进行二次选择直至在先前执行步骤404时已经在多个目标组中选择了全部目标组50。例如,在一些实施例中,如果已经在先前执行步骤404时选择了一次目标组50-1并且已经在先前执行了步骤404时已经选择了其他目标组50-N,则不适合在步骤404中选择目标组50-1。在一些实施例中,在选择的目标组不同于在最后一次执行步骤404时选择的目标组的情况下,在多个目标组中随机或伪随机地选择目标组50而不考虑是否在执行步骤404时已经选择了同一目标组50。例如,在该具体实施例中,在第i次重复步骤404时,如果第i-1次重复步骤404,则不能在步骤404选择目标组50-1。但是,可在第i+1次重复步骤404时选择目标组50-1。
步骤406。在步骤406中,对在步骤404中设计的来自目标组50的目标200(在最后一次执行步骤402中界定的目标集的子组合中)的子组合进行识别。例如,考虑来自在最后一次执行步骤402中选择的多个目标集的目标集54的子组合是目标集A,B及C的情况。进一步假定在最后一次执行步骤404时选择的目标组是目标组50-1。然后,根据该示例,在步骤406中从目标组50-1选择的目标的子组合是目标组50-1中在对准策略中已经被分配至目标集A,B及C的那些目标。如图5所示,假定在初始对准策略中,目标X在目标集A中,目标Y在目标集B中,而目标Z在目标集C中。当然,目标集A,B及C也将具有其他来自其他图像的目标组的目标,但仅可使用在最后一次执行步骤404时选择的目标组来在步骤406中形成替代对准策略。因此,作为步骤406的结果,选择了数量N的目标集,并为N个目标集每一个选择N个目标。将理解的是,图5仅列出了在步骤328的初始对准策略中目标集(集A,B及C)的子组合,并且步骤328的初始对准策略通常具有比图5中列出的目标集的子组合更多的目标集(例如,50个或更多)。
步骤408。在步骤402中,在多个目标集中选择目标集54(例如,目标集A,B及C)的子组合。在步骤404,选择多个目标组中的目标组50。在步骤406,从在步骤404中选择的目标组中选择目标200(其被分配至在步骤402中选择的目标集54的子组合)(例如,目标X,Y及Z)的子组合。在步骤408,为来自步骤406的目标的选择子组合以及来自步骤402的目标集的选择的子组合的各个可能目标-目标集计算相似度得数。
如图5所示,在三个目标及三个目标集的情况下,总共存在六个不同目标-目标集组合,原始策略以及五个替代对准策略。为这些替代对准策略的每一个计算相似度得数。在一些实施例中,如下计算相同度得数:
Figure A20081012525600581
如图5所示,每一个考虑的目标集54均具有多个目标200。在步骤406中,为了重新配置全部可能目标-目标集组合以生成替代对准策略,来识别特定目标组50中的这些目标200。将在步骤406中未识别的目标200在这些替代对准策略的每一个中保持固定不变。例如,参考图5,在步骤406中选择目标X,Y及Z,由此其被重新配置为全部可能的替代对准策略,而并未在步骤406中识别目标H,J及K,因为其并非来自在最后一次执行步骤404时识别的目标组。
在一些实施例中:
Figure A20081012525600591
该目标函数实质上是用于全部目标集的目标对之间的相似度测量值。在这里,
Figure A20081012525600592
Figure A20081012525600593
分别是第i个目标及第j个目标,
Figure A20081012525600594
Figure A20081012525600595
Figure A20081012525600596
之间的相似度测量值。例如,在上述实施例中,图5中所示的用于初始对准策略的相似度得数是:
Figure A20081012525600597
Figure A20081012525600598
= sim ( X , H ) + sim ( Y , J ) + sim ( Z , K )
此外,在上述实施例中,图5中示出的相似度得数替代对准策略1是:
Figure A200810125256005910
Figure A200810125256005911
= sim ( X , H ) + sim ( Z , J ) + sim ( Y , K )
在一些实施例中,多个图像46包括1H-13C核磁共振光谱,并且在对准策略中用于目标集54中给定目标对
Figure A200810125256005913
Figure A200810125256005914
使用以下等式进行计算:
sim ( P &RightArrow; i , P &RightArrow; j ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) 2 = - { ( C i - C j ) 2 + &lambda; ( H i - H j ) 2 } , 其中
Ci表示目标13C维中的坐标;
Cj表示目标
Figure A200810125256005917
13C维中的坐标;
Hi表示目标1H维中的坐标;
Hj表示目标1H维中的坐标;而
λ是标准化常数。
在一些实施例中,通过首先考虑用于碳及质子尺度的上限来确定λ。例如,可以通过手动对准表示两个已知代谢物(在二维NMR光谱中相互紧邻)的两个基准目标集来估计用于碳及质子尺度的上限。可以假定用于一个目标集中的目标的碳尺度的坐标根据统一分配[Ctrue-RC,Ctrue+RC]被独立地绘制,其中Ctrue是用于相应代谢物的碳尺度中的实际坐标,而RC是目标可在碳尺度中偏移的最大范围,其可以无误差形式根据基准数据来估计。然后将用于碳尺度的上限BC界定为2RC。可以类似的方法来计算用于质子尺度的上限BH。然后将标准化常数λ估计为{BC/BH}2
在一些实施例中,多个图像46包括二维光谱,并且在对准策略中用于目标集54中给定目标对
Figure A20081012525600601
Figure A20081012525600602
使用以下等式进行计算:
sim ( P &RightArrow; i , P &RightArrow; j ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi表示目标
Figure A20081012525600604
在X维中的坐标;
Xj表示目标
Figure A20081012525600605
在X维中的坐标;
Yi表示目标
Figure A20081012525600606
在Y维中的坐标;
Yj表示目标
Figure A20081012525600607
在Y维中的坐标;而
λ是标准化常数。
在上述实施例中,利用用于平衡X维及Y维的适当方法来确定λ。应当理解,当多个图像46包括三维光谱,四维光谱以及更高阶光谱时,可以使用类似的距离度规,其中将其他项增加至距离度规(或其他形成的用于计算相似度的度规)以处理其他维度。此外,可以使用其他类似度规来在步骤408计算相似度,包括但不限于曼哈坦距离、Chebychev距离、矢量之间的角度、相关距离、标准欧几里得距离、Mahalanobis距离、Pearson相关系数的乘方、或者Minkowski距离。例如可以使用SAS(Statistics Analysis Systems Institute,Cary,)或S-Plus(Statistical Sciences,Inc.,Seattle,Washington)来计算上述度量。上述度量在Draghici,2003,Data Analysis Tools for DNA Microarrays,Chapman&Hall,CRC PressLondon,chapter 11中进行了描述,为此通过引用将其全部内容包含于本说明书中。
在一些实施例中,多个图像46包括二维光谱,并且在对准策略中用于目标集54中给定目标对
Figure A20081012525600611
Figure A20081012525600612
使用以下等式进行计算:
Figure A20081012525600613
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi表示目标
Figure A20081012525600615
在X维中的坐标;
Xj表示目标
Figure A20081012525600616
在X维中的坐标;
Yi表示目标
Figure A20081012525600617
在Y维中的坐标;
Yj表示目标
Figure A20081012525600618
在Y维中的坐标;而
λ是标准化常数。
在上述实施例中,使用用于平衡X维与Y维的合适方法来确定λ。
在一些实施例中,多个图像46包括二维图像(例如,光谱),并且在对准策略中用于目标集54中给定目标对
Figure A20081012525600619
Figure A200810125256006110
使用以下等式进行计算:
Figure A200810125256006111
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi表示目标
Figure A200810125256006113
在X维中的坐标;
Xj表示目标
Figure A200810125256006114
在X维中的坐标;
Yi表示目标
Figure A20081012525600621
在Y维中的坐标;
Yj表示目标
Figure A20081012525600622
在Y维中的坐标;
λ是标准化常数;
correlationij是界定的相邻目标与目标
Figure A20081012525600624
之间的关系;
γ是关系项correlationij的权重;
Ii是目标
Figure A20081012525600625
的记录强度;
Ij是目标的记录强度;而
η是(Ii-Ij)2的权重。
当可使用复制图像时,上述实施例特别有用。复制图像是在完全相同的一组实验条件下获得的图像。在一些实施例中,对上述复制图像进行平均以形成每一个均表示两个或更多复制图像的多个图像。例如,考虑存在四个图像A,B,C及D的情况,其中A是B的复制图像而C是D的复制图像。在此情况下,A与B可以被平均以形成图像AB而C与D可以被平均以形成图像CD。然后使用图3及图4所示如上所述的方法来对准图像AB与CD。
在一些实施例中,界定了在其原始图像中包围了各个目标的相邻区域。参考图2,将这些相邻区域存储为用于目标集54中的各个目标200的一个或更多可选目标形状208。然后,使用相邻关系来测量成对高峰之间的形状相似度,其中correlatioij
Figure A20081012525600627
Figure A20081012525600628
相邻界定的之间的关系。在一些实施例中,correlationij
Figure A20081012525600629
Figure A200810125256006210
相邻界定的之间的Pearson关系系数。可以使用常规方法来分别确定
Figure A200810125256006211
Figure A200810125256006212
的记录强度Ii与Ij。通常,在目标200是图像46中的高峰的情况下,上述方法可呈现出高峰所包围的面积或体积。
在一些实施例中,确定γ以平衡位置差异及形状差异。在一些实施例中,使用距离乘方的平均值与关系的平均值之间的比率作为对γ的估计值以使关系项与距离乘方的标度可进行比较。通过随机选取较大数量(例如,10,000)的目标对计算两个平均值,使得任何一对目标均来自不同图像并且其在两个维度上的位置差处于预定上限内。在一些实施例中,η被界定为位置偏移的标准偏差与对准的复制图像(例如,上述示例中的AB及CD图像)中全部目标的记录强度的标准偏差的比率,否则η是零。
步骤410。在步骤410中,基于可实现最佳相似度得数的目标-目标集组合对准策略,选择的目标的子组合被重新分配至选择的目标集的子组合中的目标集。例如,参考图5,如果对准策略2可实现最佳得数,则将目标X重新分配至目标集B并将目标Y重新分配至目标集A。继续参考图5,另一方面,如果初始对准策略可实现最佳得数,则目标X保持在目标集A中而将目标Y保持在目标集B中。
步骤412。在步骤412中,进行对于全部对准策略(多个目标组)中各个目标组,在最后一次执行步骤402中识别的目标集的子组合是否已经被估计的判定。例如,参考图5,条件(412-是)将不会满足,直至对于与图像1对应的目标组执行了步骤404而对与图像2对应的目标组另一次执行了步骤404。如果对于全部对准策略中的各个目标组,在最后一次执行步骤402中识别的目标组的子组合还未被估计(412-否),则控制进行至步骤404,其中在多个目标组中选择了另一目标组。例如,参考图5,在一次重复(执行)步骤404时,与图像1对应的目标组可被选择,而在另一次重复步骤404时,与图像2对应的目标组可被选择。当为了在步骤402中选择的目标集的给定子组合已经在执行步骤404时选择了全部目标组(412-是),则处理控制进行至步骤414。
步骤414。在步骤414中,进行在循环404-414期间是否存在任何目标被重新分配至不同目标集的判定。如果是(414-是),则通过循环404-412重新检查目标组。例如,参考图5,假定对于图像1接收了替代对准策略1。然后,当到达决定414时,在执行步骤404之后就再次检查用于图像1的目标组以及用于图像2的目标组。该模式持续直至对于在步骤402选择的目标集的给定子组合,不存在对于用于图像1的目标组或用于图像2的目标组被接收的替代对准策略。当在执行循环404-414期间目标还未被重新分配至不同目标集时(414-否),处理控制进行至步骤416。
步骤416。在步骤416中,进行用于完成对准策略的目标功能是否已经改进的判定。用于完成对准策略的目标功能如下:
Figure A20081012525600641
其中
Figure A20081012525600642
可利用上述任何方法来计算。如果目标功能在最后第N次重复循环402-416时得到改进(其中在不同实施例中N为1,2,3,4,5,6或更大的值)(416-是),则处理控制返回至步骤402,在此从多个目标集中选择目标集的新子组合。如果目标功能在最后第N次重复循环402-416时还未改进(416-否),则其最终形式的目标集被输出作为最终对准策略。在一些实施例中,最终输出策略的输出表示在存储器36及/或数据存储器14中,或者在可通过计算机10经由广域网34被访问的一些其他存储器中瞬时存储包括最终对准策略的目标集54。在一些实施例中,包括最终输出策略的多个目标集被输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示多个目标集。
图4中示出的处理是贪心查找算法的示例。在替代实施例中,采用查找算法的改变示例。例如,在一些实施例中,步骤416持续至返回至步骤402的循环直至已经在全部对准策略中从多个目标集M选择了N个目标集的各个可能子组合,其中N被保持为常量(例如,N=3)并且N<M。因此,例如在一些实施例中,在全部对准策略中存在10个目标集54,并且步骤416循环返回至步骤402直至已经在10个目标集54的全部组中选择了3个目标集54的各个子组合。在一些实施例中,在从每一次重复步骤402时选择的目标集的子组合中的目标集的数量是固定数,例如3个目标集54。在其他实施例中,允许在每一次重复步骤402时选择目标集的子组合中的目标集的数量发生改变。例如,在一些实施例中,在一个重复步骤402时,选择了五个目标集54,而在另一次重复步骤402时,选择了四个目标集54。在另一实施例中,无论在重复循环402-416固定次之后目标功能是否被改进,均实现条件416-否。例如,在一些实施例中,无论在循环402-416已经被重复超过两次,超过十次,超过100次,超过1000次,超过十万次,或者超过一百万次之后目标功能仍然被改进,均实现条件416-否。任何这些替代查找实施例均是贪心查找算法的形式。
实际上,可以使用任何贪心查找算法(即,遵循试图发现全球最佳且在每一阶段实现局部最佳选择的问题解决后启发的任何算法)来改进初始对准策略328。图4揭示的算法仅提供了一种上述算法的示例。在Cormenel al.,1990,Introduction to Algorithms Chapter 17“Greedy Algorithms”p.329;Cormen,2001,Introduction to Algorithms,Chapter 16;Gutin等,2002,DiscreteApplied Mathematics 117,81-86;Bang-Jensen等,2004,Discrete Optimization1,121-127;以及Bendall and Margot,2006,Discrete Optimization 3,288-298中有对贪心算法的其他介绍,因为其揭示了贪心算法,这里通过引用将其包含于本说明书中。
在一些实施例中,使用动态查找而非贪心查找算法来改进初始对准策略328而非图4中的处理。在一些实施例中,使用动态查找与贪心查找算法之间的混合来改进初始对准策略328而非图4中的处理。在Cormen等,2001,Introduction to Algorithms,2nd ed.MIT Press&McGraw-Hill,chpt.15:32369;Stokey等,1989,Recursive Methods in Economic Dynamics,Harvard Univ.Press;Bertsekas,2000,Dynamic Programming and OptimalControl,2nd ed.Athena Scientific,Vols.1and 2;以及Giegerich等,2004,Science ofComputer Programming,Vol 51,3:215-263中揭示了可以使用的示例性动态方法,因为其揭示了动态查找,这里通过引用将其包含于本说明书中。动态编程(动态查找)使用了(i)重叠子问题,(ii)最佳子结构,以及(iii)记忆。动态编程通常采用上下法或下上法这两种方法中一种方法。在上下法中,问题被分隔为子问题,且这些子问题被解决且方案被记忆,以防需要再次解决这些问题。这是递归与记忆的组合。在下上法中,可能需要的全部子问题被预先解决,然后被用于建立对更大问题的解决方案。
一些实施例利用通常各个实验条件涉及多次复制的情况。在上述实施例中,策略是首先将各个条件的复制下的目标对准。可以使用上述图3及图4所示的方法来实现此目的,其中各个图像是在相同实验条件下所取的复制品。然后,为各个条件生成平均图像。最后,使用上述图3及图4所示的方法在全部实验条件上将平均图像对准,其中各个图像分别是来自多个复制品的平均图像。在一些实施例中,对开在复制品中表示相同可视量(例如,代谢物)的目标,还考虑跟踪并被用于以上述方法对准目标的信号强度。在一些实施例中,各个实验条件分别是不同摄动,或者不存在上述摄动,其中在测量样本之前样本被暴露或不被暴露。
实施例
易受醋氨酚导致肝中毒影响的不同纯系株
对于遗传分析,对16个纯系小鼠株受在单次腹腔内施加300mg/kg剂量醋氨酚的肝中毒的影响性进行了评估。公知将剂量会造成鼠的肝中毒。在施药后24小时期间,评估血清丙胺酸转氨酶(ALT)、发病率以及肝组织化学作为肝中毒的症状。在不同实验中观察到不同的中毒严重程度。但是,在接收上述剂量的醋氨酚之后,15个株重复地出现了肝中毒。除了血清ALT的升高之外,暴露至醋氨酚也导致上述15个株的鼠的较高死亡率。但是,SJL株被重复地抵抗防止出现药致肝中毒。在暴露至醋氨酚之后,SJL鼠没有死亡,且其在血清ALT方面的升高小且短暂的多。
为了揭示这些株相互之间差异的遗传方面的原因,执行对从抗体(SJL)以及三个选择的敏感(C57BL6,DBA/2以及SMJ)株获得的肝脏内药物引入反应的详细组织化学、转录以及体内胶质分析。在进行了醋氨酚处理四十八小时之后,在来自三个敏感株的鼠中出现至少60%的死亡率,而全部SJL鼠均存活。此外,上述三个敏感株具有不同的发病模式。在施药后,C57B6鼠在六小时内出现100%的死亡率,而在施药后,SMJ及DBA/2株的死亡分别出现在24小时及48小时。对肝脏组织部分的组织学检查确认了生物化学及发病率分析。来自SJL的肝脏组织具有相对较小的药物引入伤害。但是,从三个敏感株获得的肝脏组织却显示非常严重的小叶中心坏死。
对醋氨酚的肝毒素剂量的不同受影响性可能是因为产生的导致肝中毒的反应醌代谢物比率不同。但是,之前已经说明了抗体SJL株在醋氨酚处理之后生成与敏感C57B6株相同量的肝醋氨酚蛋白加合物。此外,肝基因表达图显示醋氨酚处理在SJL鼠中引起与三个敏感株中相同(或更大)水平的DNA损伤。作为DNA损害反应的指标(Ddit3,Dnajb1,以及Gadd45ga)的三个不同基因表达水平在全部四个株中被增大至相同程度。因此,肝中毒剂量的醋氨酚导致形成蛋白加合物,并激活抗体SJL鼠中的DNA损伤反应达到与易受影响株相同的程度。这意味着影响对有毒代谢物的宿主反应的遗传差异的构成基础在于对醋氨酚引起的肝中毒的易受影响的株具体差异。此外,在敏感株中仅单一株在反应方面具有抵抗力且可变的事实表明多于一个遗传因素会影响纯系株中的抵抗力。
对醋氨酚导致内源代谢物以及基因表达变化的分析
在抗体(SJL)以及三个敏感株(DBA,SMJ以及C57)株暴露至醋氨酚0,3及6小时之后对肝脏中内源代谢物以及基因表达变化进行检查以对有助于抵抗醋氨酚导致肝中毒的路径以及基因进行识别。利用1H-13C二维NMR分析来显示内源代谢物的轮廓。通过此方法量化并分析超过400个代谢物高峰,并使用主要成份分析(PCA)(Duda,2001,PatternClassification,John Wiley&Sons,Inc.,pp.568-569)来识别将敏感株与三个抗体株区别开的代谢物高峰。在药物处理之后三个小时获得的代谢物轮廓将抗体SJL鼠与三个敏感株区别开。
因此,对将抗体株的反应与三个敏感株在施药后零及三小时区别开的高峰内的代谢物进行识别。九个内源代谢物高峰在抗体SJL株中具有独特的丰富图案,其在质量及数量上与三个敏感株区别开。使用具有净化化合物的共振分配及确认实验,对上述九个高峰中八个的性质进行确认。三个高峰被分配至谷胱甘肽。与其对醋氨酚导致肝中毒的抵抗性一致,SJL是在醋氨酚给药之后三个小时唯一维持其肝谷胱甘肽浓度的株,肝谷胱甘肽水平在三个敏感株中显著下降。其他五上代谢物高峰被分配给丙胺酸、乳酸盐以及三甲铵乙内酯。同时使用微阵列(microarray)来分析在之前(零小时)及醋氨酚给药之后三小时从这四个株获得的肝脏中的基因表达。使用预先确定的选择标准(重影改变(fold-change)>2并且p值<0.01),抗体SJL株具有224个基因,其表达图案与在处理之后小时间三个敏感株中的基因完全不同。上述较大数量的不同表达基因限制了通过其自身分析基因表达数据的实用性。但是,对基因表达以及代谢物数据的集成分析提出了需要考虑的更严格的一组路径及基因。在基因存在数据库中仅功能注解了这些不同表达的基因的二十个作为涉及代谢物。此外,在路径中仅有三个基因(Pdk4,G6pc以及Bhmt2)涉及被代谢物数据识别出的四个内源代谢物。
畜牧业及药物治疗
从Jackson实验室(Bar Harbor,ME)获得七至八周大的雄鼠并在使用前进行额外一周的环境适应。对以下16个纯系株鼠进行了研究:SJL,LGJ,BALB/cJ,DBA/2J,A/J,AKR/J,A/HeJ,129/SvJ,B 10.D2-H2/oSNJ,C57BL/6J,NZW/LaCJ,NZB/BInJ,MRL/MpJ,C3H/HeJ,LP/J,SM/J。鼠在无病原体环境中容纳,并被随意供应食物及水达12小时以及12小时光照:黑暗周期直至实验使用。在各个实验之前,一夜之间(超过十六小时)从动物处取回食物以统一的耗尽肝谷胱甘肽储备。全部鼠均被给予单次300mg/kg剂量的新近制备的悬浮在PBS(pH 7.4)中的醋氨酚(Voigt Global DistributionInc.)腹膜内施药,并被允许在处理之后自由进食及进水。通过CO2吸入使鼠安乐死以在施药之后零、三、以及六个小时获取血液样本及肝脏组织。对于醋氨酚致死的发生,对剩余鼠进行48小时监控。血液样本通过心脏穿刺提取并被置于EDTA涂层试管中,且血浆样本通过离心分离。在Marshfield Clinic实验室(Marshfield,Wisconsin)对丙氨酸转氨酶(ALT)活性进行测量。肝脏组织被立即移除并切为两部分。较小部分在缓冲***中被固定,通过标准组织学技术被处理,利用苏木精及曙红染色,并为了获得肝脏损伤的组织学证明而被检查。剩余部分在液氮中被突然冷冻,并被存储在-80℃用于基因表达及代谢物分析。
代谢物提取,NMR分析以及数据处理
冷冻肝脏组织(~500mg)与液氮一起被研磨成粉并被立即投入15ml的67%MeOH/33%水的***液中。组织通过三次冷冻及融化被细胞溶解,充分混合,然后在4℃以12,000xg的离心力经过30分钟处理。通过在500μl D2O(Cambridge Isotope Laboratories,Inc.)中快速抽真空并重新悬浮来干燥上清液。然后通过10-kDa切断过滤器(Microcon YM-10,Millipore)来离心过滤样本以去除沉淀蛋白质。滤液被冻干并溶解在包含1mM钠-3-(3-甲基甲硅烷)-2,2,3,4-tetradeuteriopropionate(TSP;Sigma-Aldrich)的200μl D2O中,这是NMR分析的内部标准。
利用具有z轴脉冲场梯度的3mm Nalorac微探针,NMR光谱以300°K记录在以1H 599.99MHz频率及13C 150.87MHz频率工作的Bruker Avance600MHz摄谱仪上。使用1D质子光谱,2D质子相关光谱COSY,以及2D 1H-13C单键相关HSQC光谱来分配共振。定量代谢物分析中使用的高峰从使用用于一致性选择的z轴脉冲场梯度获得的2D 1H-13CHSQC光谱中选取。使用16至64scans/FID以及用于1H以及13C维的256个点获取光谱,并且总光谱获取时间从2.75至11小时。NMR分配通过获取具有净化化合物的样本的光谱来确认。
2D-NMR光谱利用Topspin(Bruker,Billerica,Masschussetts)来处理,并利用Sparky Assignment and Integration Softeare package(UCSF,SanFrancisco California)来帮助来进行解释。结合图1至图5在以上描述的算法被用来将与不同光谱中出现的与相同代谢物对应的高峰对准。简言之,以两步来实现对准。在第一步骤中,对准用于相同株的复制品并使用对准的串的平均值来为株生成代表光谱(representative spectrum)。然后将代表光谱对准以完成对NMR数据的最终对准。然后使用以下标准来过滤对准高峰串:(1)代谢物高峰出现在从不同株及时间点获得的超过四个样本中;(2)高峰的最大强度大于十;(3)最大与最小强度的重影改变大于五;(4)因为其高度重叠,故排除具有光谱区域(13C:1-81;1H:3.3-4.3)的高峰。然后以其ANOVA p-值来将符合这些标准的高峰分级。
替代实施例及引用参考文献
本说明书中引述的全部参考文献通过引用,为了各种目的,将其全部内容包含在本说明书中。
这里揭示的各种方法,计算机程序产品以及计算机可选地进一步包括用于将结果输出(例如,输出至监视器,使用者,计算机可读介质,例如,存储介质或远程计算机)的步骤或命令。
可以计算机程序产品应用本发明,其包括嵌入计算机可读存储介质中的计算机程序机构。此外,可在一个或更多计算机或计算机***中应用本发明的任何方法。此外,可在一个或更多计算机产品中应用本发明的任何方法。本发明的一些实施例提供了编码命令或具有命令以执行这里揭示的任何或全部方法的计算机***或计算机程序产品。上述方法/命令可被存储在CD-ROM,DVD,磁盘存储产品,或者任何其他计算机可读数据或程序存储产品上。上述方法也可被嵌入固定存储器,例如ROM,一个或更多可编程芯片,或者一个或更多特定用途集成电路(ASIC)。上述固定存储器可被定位在服务器,802.11访问点,802.11无线桥/站,移动电子装置或者其他电子装置上。在计算机程序产品中编码的上述方法也可经由互连网或其他方式,通过数字地或在载波上传递计算机数据信号(其中嵌入软件模块),电子式地分布。

Claims (55)

1.一种方法,用于将多个目标组中的目标对准,所述多个目标组中每一个目标组分别包括多个图像中相应图像中的多个目标,其中,在所述多个目标组中的每一个目标组中的所述每一个目标初始分别被标记为未处理,所述方法包括以下步骤:
(A)为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集;
(B)为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量,其中
当所述目标与所述靶目标集之间的坐标差异低于阈值时,所述靶目标组中具有与所述靶目标集最佳相似度得数的所述目标被增加至所述靶目标集,并被标记为已处理;否则,
当所述目标与所述靶目标集之间的坐标差异不低于阈值时,将却失目标增加至所述靶目标集;
(C)为所述多个目标组中剩余各个目标组重复所述计算步骤(B),由此使所述靶目标集增加;并且
(D)为所述多个目标集中剩余各个目标集重复所述计算步骤(B),其中,所述各个目标集被设计为所述靶目标集,其中,处于同一目标集中的目标被视为彼此对应,由此将所述多个目标组中的目标对准。
2.根据权利要求1所述的方法,其中,所述多个目标组中目标组的所述多个目标中的各个目标的特征在于第一维值X及第二维值Y。
3.根据权利要求1所述的方法,其中,所述第一维值X用于碳(C)而所述第二维值Y用于氢(H),并且其中,当
|C2-C1|<BC,并且
|H2-H1|<BH时,
在步骤(B)中所述靶目标组中具有与所述靶目标集的所述最佳相似度得数的所述目标与所述靶目标集之间的所述坐标差异低于阈值,其中:
C2是用于所述靶目标组中具有与所述靶目标集的所述最佳相似度得数的所述目标的第一维指标;
C1是用于所述靶目标集的第一维指标;
H2是用于所述靶目标组中具有与所述靶目标集的所述最佳相似度得数的所述目标的第二维指标;
H1是用于所述靶目标集的第二维指标;
BC是第一维阈值极限值;而
BH是第二维阈值极限值。
4.根据权利要求1所述的方法,其中,所述多个图像中的各个图像分别是二维图像。
5.根据权利要求1所述的方法,其中,所述多个图像中的各个图像分别是N维图像,其中,N等于1或更大。
6.根据权利要求5所述的方法,其中,当
|C1 2-C1 1|<B1
|C2 2-C2 1|<B2
.
.
.
|CN 2-CN 1|<BN
在步骤(B)中所述靶目标组中具有与所述靶目标集的所述最佳相似度得数的所述目标与所述靶目标集之间的所述坐标差异低于阈值,其中:
C1 2是用于所述靶目标组中具有与所述靶目标集的所述最佳相似度得数的所述目标的第i维指标;
C1 1是用于所述靶目标集的第i维指标;而
B1是第i维阈值极限值。
7.根据权利要求1所述的方法,其中,所述多个图像中的各个图像分别是二维图像。
8.根据权利要求1所述的方法,其中,所述多个图像中的图像是二维1H-13C核磁共振光谱,并且所述图像中的所述目标是所述二维1H-13C核磁共振光谱中的高峰。
9.根据权利要求1所述的方法,其中,所述多个图像中的图像是二维核磁共振(NMR)光谱,三维NMR光谱,或者四维NMR光谱,并且所述图像中的所述目标是所述二维,三维,或者四维NMR光谱中的高峰。
10.根据权利要求1所述的方法,其中,所述多个图像中的图像是2D核奥佛好塞提高及交换(NOESY)光谱、二维J解析(2D-J)光谱、共核2D相关(COSY)光谱、2D旋转回声相关(SECSY)光谱、继相干转换(RELAYED-COSY)光谱、1H-15N COSY光谱、1H-31P COSY光谱、113Cd-1H COSY光谱、旋转框架NOE(ROESY)光谱、总相关(TOCSY)光谱、异核单量子相关(HSQC)光谱、异核多量子相关(HMQC)光谱、异核多键相关(HMBC)光谱、二维异核相关(HETCOR)光谱、双量子过滤相关(DQFC)光谱或者二维INADAQUATE光谱。
11.根据权利要求1所述的方法,其中,所述多个图像中的图像是二维异核磁共振光谱,并且所述图像中的所述目标是所述二维异核磁共振光谱中的高峰。
12.根据权利要求1所述的方法,其中,所述多个图像中的图像是二维同核磁共振光谱,并且所述图像中的所述目标是所述二维同核磁共振光谱中的高峰。
13.根据权利要求1所述的方法,其中,所述多个目标组中的目标组包括50个目标。
14.根据权利要求1所述的方法,其中,所述多个目标组中的目标组包括200个目标。
15.根据权利要求1所述的方法,其中,所述多个图像包括1H-13C核磁共振光谱,并且其中,根据以下公式
sim ( P &RightArrow; i , P ) = - &Sigma; j = 1 J { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - &Sigma; j = 1 J { ( C i - C j ) 2 + &lambda; ( H i - H j ) } 2 ,
来计算在步骤(B)中计算的所述目标与所述靶目标集 P = { P &RightArrow; 1 , . . . , P &RightArrow; j } 之间的相似度度量,其中
Ci是目标13C维中的坐标;
Cj是目标
Figure A2008101252560006C4
13C维中的坐标;
Hi是目标
Figure A2008101252560006C5
1H维中的坐标;
Hj是目标
Figure A2008101252560006C6
1H维中的坐标;而
λ是标准化常数。
16.根据权利要求1所述的方法,其中,当所述目标与所述靶目标集之间的相似度度量大于所述靶目标组中任何其他目标与所述靶目标集之间的所述相似度度量时,所述目标与所述靶目标集之间的所述相似度度量具有所述最佳相似度得数。
17.根据权利要求1所述的方法,其中,当所述目标与所述靶目标组之间的相似度度量大于所述靶目标组中任何其他目标与所述靶目标集之间的所述相似度度量时,所述目标与所述靶目标集之间的所述相似度度量具有所述最佳相似度得数。
18.根据权利要求1所述的方法,所述方法还包括对在所述多个目标集中分配目标进行优化。
19.根据权利要求18所述的方法,其中,所述优化步骤包括:
(i)在所述多个目标集中选择目标集的子组合;
(ii)从被分配至目标集的所述子组合的所述多个目标组中的目标组选择目标的子组合;
(iii)为目标的所述选择子组合与目标集的所述选择子组合的每一个可能的目标-目标集组合分别计算相似度得数;并且
(iv)根据在步骤(iii)中实现所述最佳相似度得数的所述目标-目标集组合来将所述目标组中的目标的所述选择子组合重新分配至目标集的所述选择的子组合中的目标集。
20.根据权利要求19所述的方法,其中,为所述多个目标组中每一个目标组重复步骤(ii),(iii)及(iv)。
21.根据权利要求19所述的方法,其中,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv)。
22.根据权利要求21所述的方法,其中,在所述多个目标集中目标集的给定不同子组合,为所述多个目标组中各个目标组重复步骤(ii),(iii)及(iv)。
23.根据权利要求19所述的方法,其中,重复步骤(i),(ii),(iii)及(iv)数次,并且其中,每一次重复步骤(i),(ii),(iii)及(iv)均是为所述多个目标集中目标集的不同子组合。
24.根据权利要求23所述的方法,其中,为所述多个目标集中目标集的各个不同子组合,为所述多个目标组中的各个目标组重复步骤(ii),(iii)及(iv)。
25.根据权利要求19所述的方法,所述方法还包括:
(v)为所述多个目标组中的各个目标组重复步骤(ii),(iii)及(iv);
(vi)确定在步骤(v)之前是否用于目标功能的值已经相对于用于所述目标功能的值改进;并且
当所述目标功能已经改进时,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv);并且
当所述目标功能尚未改进时,结束所述优化步骤(E)。
26.根据权利要求25所述的方法,其中,表示为F(对准策略)的所述目标功能是:
F(对准策略)=∑f(目标集k)
             K=1,多个目标集中的全部目标集
其中,
Figure A2008101252560008C1
目标集k中的全部对<i,j>
27.根据权利要求26所述的方法,其中,所述多个图像包括1H-13C核磁共振光谱,并且其中
sim ( P &RightArrow; i , P ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( C i - C j ) 2 + &lambda; ( H i - H j ) 2 } , 其中
Ci是目标集k中目标13C维中的坐标;
Cj是目标集k中目标
Figure A2008101252560008C4
13C维中的坐标;
Hi是目标集k中目标
Figure A2008101252560008C5
1H维中的坐标;
Hj是目标集k中目标
Figure A2008101252560009C1
1H维中的坐标;而
λ是标准化常数。
28.根据权利要求26所述的方法,其中,所述多个图像包括二维光谱,并且其中
sim ( P &RightArrow; i , P ) = - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标
Figure A2008101252560009C3
在X维中的坐标;
Xj是目标集k中目标
Figure A2008101252560009C4
在X维中的坐标;
Yi是目标集k中目标
Figure A2008101252560009C5
在Y维中的坐标;
Yj是目标集k中目标
Figure A2008101252560009C6
在Y维中的坐标;而
λ是标准化常数。
29.根据权利要求26所述的方法,其中,所述多个图像包括二维光谱,并且其中
Figure A2008101252560009C7
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标
Figure A2008101252560009C9
在X维中的坐标;
Xj是目标集k中目标
Figure A2008101252560009C10
在X维中的坐标;
Yi是目标集k中目标
Figure A2008101252560009C11
在Y维中的坐标;
Yj是目标集k中目标
Figure A2008101252560009C12
在Y维中的坐标;而
λ是标准化常数。
30.根据权利要求26所述的方法,其中,所述多个图像包括二维光谱,并且其中
Figure A2008101252560010C1
其中, - { dist ( P &RightArrow; i , P &RightArrow; j ) } 2 = - { ( X i - X j ) 2 + &lambda; ( Y i - Y j ) 2 } , 其中
Xi是目标集k中目标
Figure A2008101252560010C3
在X维中的坐标;
Xj是目标集k中目标
Figure A2008101252560010C4
在X维中的坐标;
Yi是目标集k中目标
Figure A2008101252560010C5
在Y维中的坐标;
Yj是目标集k中目标
Figure A2008101252560010C6
在Y维中的坐标;
λ是标准化常数;
correlationij是界定的相邻目标
Figure A2008101252560010C7
与目标
Figure A2008101252560010C8
之间的关系;
γ是关系项correlationij的权重;
Ii是目标的记录强度;
Ij是目标
Figure A2008101252560010C10
的记录强度;而
η是(Ii-Ij)2的权重。
31.根据权利要求18所述的方法,其中,利用贪心查找算法、动态查找或者贪心查找与动态查找的组合来执行对所述多个目标集中目标分配的优化。
32.根据权利要求1所述的方法,其中,所述多个目标组中目标组中的目标对应与代谢物。
33.根据权利要求1所述的方法,其中,所述多个图像是在第一实验条件下获取的复制光谱,所述方法还包括使用所述多个目标集来将所述多个图像组合为单一第一平均光谱。
34.根据权利要求1所述的方法,其中,为不同第二多个图像重复步骤(A)至(C),其中,所述不同第二多个图像是在第二实验条件下获取的复制光谱,所述方法还包括使用所述多个目标集来将所述不同第二多个图像组合为单一第二平均光谱。
35.根据权利要求34所述的方法,其中,重复步骤(A)至(C)以将所述第一平均光谱与所述第二平均光谱对准。
36.根据权利要求1所述的方法,所述方法还包括将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集。
37.根据权利要求1所述的方法,所述方法还包括根据所述多个目标集中的目标分配来将所述多个图像对准。
38.根据权利要求37所述的方法,所述方法还包括将所述多个对准图像输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个对准图像。
39.一种设备,用于将多个目标组中的目标对准,所述多个目标组中的每一个目标组分别包括在多个图像中相应图像中的所述目标,所述设备包括:
中央处理单元;以及
存储器,其连接至所述中央处理单元,所述存储器包括:
用于访问所述多个目标组的命令;
图像比较模块,所述图像比较模块包括用于执行以下步骤的命令:
(A)为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集;
(B)为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量,其中
当所述目标与所述靶目标集之间的坐标差异低于阈值时,所述靶目标组中具有与所述靶目标集最佳相似度得数的所述目标被增加至所述靶目标集,并被标记为已处理;否则,
当所述目标与所述靶目标集之间的坐标差异不低于阈值时,将却失目标增加至所述靶目标集;
(C)为所述多个目标组中剩余各个目标组重复所述计算步骤(B),由此使所述靶目标集增加;以及
(D)为所述多个目标集中剩余各个目标集重复所述计算步骤(B),其中,所述各个目标集被设计为所述靶目标集,其中,处于同一目标集中的目标被视为彼此对应,由此将所述多个目标组中的目标对准。
40.根据权利要求39所述的设备,其中,所述比较模块还包括用于执行以下步骤的命令:
(E)将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集。
41.一种设备,用于将多个目标组中的目标对准,所述多个目标组中的每一个目标组分别包括在多个图像中相应图像中的所述目标,所述设备包括:
中央处理单元;以及
存储器,其连接至所述中央处理单元,所述存储器包括:
(A)用于访问所述多个目标组的装置;
(B)用于为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集的装置;
(C)用于为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量的装置,其中
当所述目标与所述靶目标集之间的坐标差异低于阈值时,所述靶目标组中具有与所述靶目标集最佳相似度得数的所述目标被增加至所述靶目标集,并被标记为已处理;否则,
当所述目标与所述靶目标集之间的坐标差异不低于阈值时,将却失目标增加至所述靶目标集;
(D)用于为所述多个目标组中剩余各个目标组重复用于计算(C)的装置,由此使所述靶目标集增加的装置;以及
(E)用于为所述多个目标集中剩余各个目标集重复用于计算(C)的装置的装置,其中,所述各个目标集被设计为所述靶目标集,其中,处于同一目标集中的目标被视为彼此对应,由此将所述多个目标组中的目标对准。
42.根据权利要求41所述的设备,其中,所述存储器还包括:
(F)用于将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集的装置。
43.一种设备,用于将存储在计算机可读存储介质中的多个目标组中的目标对准,所述存储介质包括:
(A)用于访问所述多个目标组的第一多个二进制值;
(A)用于为了所述多个目标组中第一目标组中的各个目标每一者分别构造包含所述第一目标组中所述各个目标,由此构造多个目标集的第二多个二进制值;
(B)用于为所述多个目标组中靶目标组中的各个未处理目标每一者分别计算所述多个目标集中的靶目标集与所述各个目标之间的相似度度量,由此计算多个相似度度量的第三多个二进制值,其中
当所述目标与所述靶目标集之间的坐标差异低于阈值时,所述靶目标组中具有与所述靶目标集最佳相似度得数的所述目标被增加至所述靶目标集,并被标记为已处理;否则,
当所述目标与所述靶目标集之间的坐标差异不低于阈值时,将却失目标增加至所述靶目标集;
(C)用于为所述多个目标组中剩余各个目标组重复计算(C)的装置,由此使所述靶目标集增加的第四多个二进制值;以及
(D)用于为所述多个目标集中剩余各个目标集重复计算(C)的第五多个二进制值,其中,所述各个目标集被设计为所述靶目标集,其中,处于同一目标集中的目标被视为彼此对应,由此将所述多个目标组中的目标对准。
44.根据权利要求43所述的设备,其中,所述存储介质还包括:
(F)用于将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集的第六多个二进制值。
45.一种方法,用于将多个目标组中的目标对准,所述多个目标组中每一个目标组分别包括多个图像中相应图像中的多个目标,所述方法包括以下步骤:
(A)为所述多个目标组中第一目标组中的各个目标中每一者分别构造包含所述第一目标组中的所述各个目标的相应目标集,由此构造多个目标集;
(B)为所述多个目标组中目标组中的各个目标每一者分别计算(i)所述各个目标与(ii)所述多个目标集中目标集中目标之间的相似度度量,其中
当所述各个目标与所述多个目标集中的第一目标集中的目标之间的所述相似度度量优于所述各个目标与所述多个目标集中任何另一目标集中的目标之间的所述相似度度量并且(ii)所述各个目标与所述第一目标集中的目标之间的坐标差异低于阈值时,所述各个目标被增加至所述第一目标集,否则,
将包括所述各个目标的新目标集增加至所述多个目标集;并且
(C)为所述多个目标组中剩余各个目标组重复所述计算步骤(B),其中,处于同一目标集中的目标被视为彼此对应,由此将所述多个目标组中的目标对准。
46.根据权利要求45所述的方法,其中,所述方法还包括对在所述多个目标集中分配目标进行优化。
47.根据权利要求46所述的方法,其中,所述优化步骤包括:
(i)在所述多个目标集中选择目标集的子组合;
(ii)从被分配至目标集的所述子组合的所述多个目标组中的目标组选择目标的子组合;
(iii)为目标的所述选择子组合与目标集的所述选择子组合的每一个可能的目标-目标集组合分别计算相似度得数;并且
(iv)根据在步骤(iii)中实现所述最佳相似度得数的所述目标-目标集组合来将所述目标组中的目标的所述选择子组合重新分配至目标集的所述选择的子组合中的目标集。
48.根据权利要求47所述的方法,其中,为所述多个目标组中每一个目标组重复步骤(ii),(iii)及(iv)。
49.根据权利要求47所述的方法,其中,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv)。
50.根据权利要求49所述的方法,其中,在所述多个目标集中目标集的给定不同子组合,为所述多个目标组中各个目标组重复步骤(ii),(iii)及(iv)。
51.根据权利要求47所述的方法,其中,重复步骤(i),(ii),(iii)及(iv)数次,并且其中,每一次重复步骤(i),(ii),(iii)及(iv)均是为所述多个目标集中目标集的不同子组合。
52.根据权利要求51所述的方法,其中,为所述多个目标集中目标集的各个不同子组合,为所述多个目标组中的各个目标组重复步骤(ii),(iii)及(iv)。
53.根据权利要求47所述的方法,所述方法还包括:
(v)为所述多个目标组中的各个目标组重复步骤(ii),(iii)及(iv);
(vi)确定在步骤(v)之前是否用于目标功能的值已经相对于用于所述目标功能的值改进;并且
当所述目标功能已经改进时,为所述多个目标集中目标集的不同子组合重复步骤(i),(ii),(iii)及(iv);并且
当所述目标功能尚未改进时,结束所述优化步骤(E)。
54.根据权利要求45所述的方法,所述方法还包括将所述多个目标集输出至使用者界面装置,计算机可读存储介质,存储器,或者本地或远程计算机***,或者显示所述多个目标集。
55.根据权利要求1所述的方法,所述方法还包括:
(E)执行以下步骤:
(i)对于在所述多个目标组中被标记为未处理的靶目标,将靶目标集增加于所述多个目标集,其中,所述靶目标被增加至所述靶目标集并被标记为已处理;并且
(ii)为了所述靶目标集重复步骤(B)及(C);并且
(F)重复步骤(E)直至在所述多个目标组中的任何目标组中没有剩余的被标记为未处理的目标。
CNA200810125256XA 2007-06-21 2008-06-23 用于图像中物体对准的***及方法 Pending CN101329289A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/820,939 2007-06-21
US11/820,939 US7869664B2 (en) 2007-06-21 2007-06-21 Systems and methods for alignment of objects in images

Publications (1)

Publication Number Publication Date
CN101329289A true CN101329289A (zh) 2008-12-24

Family

ID=39829047

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200810125256XA Pending CN101329289A (zh) 2007-06-21 2008-06-23 用于图像中物体对准的***及方法

Country Status (6)

Country Link
US (1) US7869664B2 (zh)
EP (1) EP2006703A3 (zh)
JP (1) JP2009036758A (zh)
CN (1) CN101329289A (zh)
CA (1) CA2635179A1 (zh)
SG (1) SG148964A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436670A (zh) * 2010-09-29 2012-05-02 株式会社日立制作所 计算机***、以及位置对准方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009089274A2 (en) * 2008-01-07 2009-07-16 New York University Methods, system, and computer-accessible medium for assessment of glycosaminoglycan concentration in vivo by chemical exchange saturantion transfer
JP5472891B2 (ja) * 2008-01-21 2014-04-16 株式会社東芝 医用画像処理装置
JP5438029B2 (ja) * 2008-01-31 2014-03-12 コーニンクレッカ フィリップス エヌ ヴェ 短軸遅延強調心臓mriの自動三次元セグメント化
US20100034444A1 (en) * 2008-08-07 2010-02-11 Helicos Biosciences Corporation Image analysis
CN101673312B (zh) * 2008-09-08 2012-12-19 鸿富锦精密工业(深圳)有限公司 特征元素对齐方法
JP5115568B2 (ja) * 2009-11-11 2013-01-09 カシオ計算機株式会社 撮像装置、撮像方法、及び撮像プログラム
TWI428581B (zh) * 2010-12-13 2014-03-01 Ind Tech Res Inst 辨識光譜的方法
ITFI20110150A1 (it) * 2011-07-22 2013-01-23 Anna Pelagotti Metodo e apparato per la tessitura di modelli tridimensionali con immagini bidimensionali
US20140280141A1 (en) * 2013-03-14 2014-09-18 Morpho Detection, Inc. Method and system for grouping and classifying objects in computed tomography data
GB2515284B (en) * 2013-06-17 2020-07-22 Micromass Ltd A mass spectrometer, control system and methods of operating and assembling a mass spectrometer
EP3254130B1 (en) * 2015-02-06 2018-10-03 Koninklijke Philips N.V. Automatic grouping of magnetic resonance images
JP7086630B2 (ja) * 2018-02-09 2022-06-20 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
US10890640B2 (en) * 2019-03-18 2021-01-12 Uih America, Inc. Systems and methods for signal representation determination in magnetic resonance imaging
CN113449122B (zh) * 2021-07-09 2023-01-17 广州浩传网络科技有限公司 一种三维场景图的解说内容生成方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873052A (en) * 1996-11-06 1999-02-16 The Perkin-Elmer Corporation Alignment-based similarity scoring methods for quantifying the differences between related biopolymer sequences
US20020099702A1 (en) 2001-01-19 2002-07-25 Oddo Anthony Scott Method and apparatus for data clustering
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US7263220B2 (en) * 2003-02-28 2007-08-28 Eastman Kodak Company Method for detecting color objects in digital images
JP4355281B2 (ja) * 2004-12-13 2009-10-28 株式会社インテックシステム研究所 ピーク抽出方法およびピーク抽出装置
JP2007147459A (ja) * 2005-11-28 2007-06-14 Kazusa Dna Kenkyusho 情報処理装置、プログラム、及びコンピュータ読み取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436670A (zh) * 2010-09-29 2012-05-02 株式会社日立制作所 计算机***、以及位置对准方法
CN102436670B (zh) * 2010-09-29 2013-11-06 株式会社日立制作所 计算机***、以及位置对准方法

Also Published As

Publication number Publication date
US7869664B2 (en) 2011-01-11
SG148964A1 (en) 2009-01-29
US20080317307A1 (en) 2008-12-25
EP2006703A3 (en) 2010-10-20
JP2009036758A (ja) 2009-02-19
CA2635179A1 (en) 2008-12-21
EP2006703A2 (en) 2008-12-24

Similar Documents

Publication Publication Date Title
CN101329289A (zh) 用于图像中物体对准的***及方法
Wu et al. Peak alignment of urine NMR spectra using fuzzy warping
CN107003375A (zh) 磁共振指纹数据收集和分析***
Zhang et al. Identifying DNA‐binding proteins based on multi‐features and LASSO feature selection
Yamada et al. InterSpin: Integrated supportive webtools for low-and high-field NMR analyses toward molecular complexity
Percival et al. Univariate and multivariate statistical approaches to the analysis and interpretation of NMR-based metabolomics datasets of increasing complexity
Hibbert et al. An introduction to Bayesian methods for analyzing chemistry data: Part II: A review of applications of Bayesian methods in chemistry
Augustijn et al. HR-MAS NMR applications in plant metabolomics
U Zacharias et al. Current experimental, bioinformatic and statistical methods used in nmr based metabolomics
Dumas et al. Selection of biomarkers by a multivariate statistical processing of composite metabonomic data sets using multiple factor analysis
Li et al. COLMARq: a web server for 2D NMR peak picking and quantitative comparative analysis of cohorts of metabolomics samples
Ito et al. Improved prediction of carbonless NMR spectra by the machine learning of theoretical and fragment descriptors for environmental mixture analysis
US20020173920A1 (en) Method of molecular structure recognition
Zhang et al. Self-consistent metabolic mixture analysis by heteronuclear NMR. Application to a human cancer cell line
US20230335228A1 (en) Active Learning Using Coverage Score
CN111048145B (zh) 蛋白质预测模型的生成方法、装置、设备和存储介质
Xu et al. Sample consensus model and unsupervised variable consensus model for improving the accuracy of a calibration model
Kim et al. Controlling the false discovery rate for feature selection in high‐resolution NMR Spectra
CN111383708B (zh) 基于化学基因组学的小分子靶标预测算法及其应用
Damberg et al. Automated analysis of large sets of heteronuclear correlation spectra in NMR-based drug discovery
Keyes et al. Automated compound verification using 2D‐NMR HSQC data in an open‐access environment
Kaiser et al. Metabolic profiling
Kabir et al. Single model quality estimation of protein structures via non-negative tensor factorization
Song et al. Optimized splitting of mixed-species RNA sequencing data
Han et al. HycDemux: a hybrid unsupervised approach for accurate barcoded sample demultiplexing in nanopore sequencing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20081224