JP2004501358A - 最適な境界を有する平滑化された多角形を使用して散布図中のクラスタを識別するシステム - Google Patents
最適な境界を有する平滑化された多角形を使用して散布図中のクラスタを識別するシステム Download PDFInfo
- Publication number
- JP2004501358A JP2004501358A JP2001582503A JP2001582503A JP2004501358A JP 2004501358 A JP2004501358 A JP 2004501358A JP 2001582503 A JP2001582503 A JP 2001582503A JP 2001582503 A JP2001582503 A JP 2001582503A JP 2004501358 A JP2004501358 A JP 2004501358A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- data
- boundary
- bins
- density estimate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 68
- 238000000034 method Methods 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 6
- 210000004027 cell Anatomy 0.000 description 31
- 238000004458 analytical method Methods 0.000 description 11
- 238000000684 flow cytometry Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 208000030507 AIDS Diseases 0.000 description 5
- 210000004698 lymphocyte Anatomy 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 210000000265 leukocyte Anatomy 0.000 description 3
- 238000002922 simulated annealing Methods 0.000 description 3
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000000149 argon plasma sintering Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000007660 Residual Neoplasm Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000004395 cytoplasmic granule Anatomy 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1456—Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N2015/1006—Investigating individual particles for cytology
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N15/1404—Handling flow, e.g. hydrodynamic focusing
- G01N2015/1413—Hydrodynamic focussing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/10—Investigating individual particles
- G01N15/14—Optical investigation techniques, e.g. flow cytometry
- G01N2015/1477—Multiparameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Dispersion Chemistry (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
Description
本発明は、35 U.S.C.§119(e)の下で、2000年5月11日出願のDwayne Yount他の「Hardware and Electronics Architecture for a Flow Cytometer」という名称の米国仮特許出願第60/203515号、2000年5月11日出願のMichael Lock他の「Cluster Finder Algorithm for Flow Cytometer」という名称の米国仮特許出願第60/203590号、2000年5月11日出願のMichael Goldberg他の「User Interface and Network Architecture for Flow Cytometer」という名称の米国仮特許出願第60/203585号、および2000年5月11日出願のJohn Cardott他の「Digital Flow Cytometer」という名称の米国仮特許出願第60/203577号の恩典を主張する。それぞれの前記仮特許出願の全ての内容は参照によって本明細書に組み込まれる。
【0002】
(関連出願との相互参照)
関連する内容が、1999年7月2日出願のPierce O.Nortonの「Apparatus and Method for Verifying Drop Delay in a Flow Cytometer」という名称の同時係属米国特許出願第09/346692号、1999年11月23日出願のKenneth F.Uffenheimer他の「Apparatus and Method for Processing Sample Materials Contained in a Plurality of Sample Tubes」という名称の同時係属米国特許出願第09/447804号、および本出願と同日に出願されたDwayne Yount他の「A System and Method for Providing Improved Event Reading and Data Processing Capabilities in a Flow Cytometer」という名称の同時係属米国特許出願(代理人整理番号P−5098)に開示されている。これらのそれぞれの出願の全ての内容は参照によって本明細書に組み込まれる。
【0003】
(発明の背景)
発明の分野
本発明は一般に、2次元散布図上のクラスタ(cluster)の位置を決定する方法に関する。この方法は、表示された一群の粒子が1つのデータクラスタ中に閉じ込められる散布図(scatter plot)上の位置不定の幾何学的な少なくとも1つの境界面の位置を自動的に定義することによって実施される。境界面は、少なくとも1つの細胞クラスタの周囲の複数の頂点によって定義される多角形の形状を有する。本発明はさらに、2次元密度推定値を使用してクラスタを生成し、それによってデータをビン(bin)に分割してヒストグラムを作り、ビンの計数を平滑化にかけることに関する。次いでビンをそれぞれのクラスタに割り当てる。それによってクラスタは密度推定値の谷によって分離される。
【0004】
関連技術の説明
フローサイトメトリ(flow cytometry)、すなわち流動している液体流中の細胞、核、染色体、その他の粒子などの物体(「物体」)の測定および/または分離は研究室および臨床検査室における有用な分析ツールとして十分に確立されている。フローサイトメトリの背後にあるさまざまな原理、技法および装置の議論はJohn L.Haynesの論文「Principles of Flow Cytometry」、Cytometry Supplement 3:7−17(1988)に出ている。この論文の開示は参照によって本明細書に組み込まれる。特定の特性を有する物体を分析するための従来のフローサイトメトリ装置は基本的に、装置の分析または計数機能に関連づけられたオリフィス(orifice)を通過するときに物体を集中させるシース(sheath)を形成する液体流から成る。この種の分析は通常、1種または数種のマーカを用いて物体を標識し、次いでこのような1種または数種のマーカの有無を調べることを含む。白血球、腫瘍細胞、微生物などの細胞の場合には、マーカは、細胞表面の分子または細胞質中の分子を標的とすることができる。細胞の物理的特性の検討ならびに特定のマーカの有無を使用して、細胞が属する集団を識別することができる。そのため、物体を分析し分類するフローサイトメトリにかなりの関心が集まっている。サイズ、細胞質の顆粒、特定の抗原の提示などのさまざまな化学的および物理的特性に基づいて物体を高速に分析および/または分類して、何万もの物体を集めることができる。
【0005】
フローサイトメトリは、サンプル中の異なる細胞型を識別しこれらを区別するために多パラメータデータを使用する周知の方法を含む。例えばサンプルは、血液、リンパ液、尿などのさまざまな生物学的流体から採取し、または結腸、肺、***、腎臓、肝臓などの硬組織の細胞の懸濁液から得ることができる。フローサイトメータ中では、細胞が、懸濁した状態でほぼ一度に1つずつ、1つまたは複数の感知領域を通過する。それぞれの感知領域ではそれぞれの細胞がエネルギー源によって照明される。エネルギー源は一般に、レーザ(例えばHe/Neまたはアルゴン)、適当なフィルタを備えた水銀アークランプなどによって提供されるような、単一波長の光を発射する照明手段を含む。単一の感知領域を有するフローサイトメータで一般に使用される放射波長は488nmの光である。
【0006】
感知領域と直列に接続された光電子増倍管(「PMT」)などの複数の光収集手段を使用して、細胞が感知領域を通過しエネルギー源によって照明されたときにそれぞれの細胞を通過した光(一般に前方光散乱と呼ばれる)、感知領域を通過する細胞の流れの方向に対して直角に反射した光(一般に直角または側方光散乱と呼ばれる)、および蛍光マーカで標識されている場合には細胞から放射された蛍光を記録する。前方光散乱(「FSC」)、直角または側方光散乱(「SSC」)および蛍光放射(「FL1」、「FL2」など)はそれぞれ、それぞれの細胞(またはそれぞれの「事象」)に対して別個のパラメータを含む。したがって例えば、2つの異なる蛍光マーカで標識された細胞から2つ、3つ、4つまたはそれ以上のパラメータを収集(および記録)することができる。フローサイトメータはさらに、コンピュータなどのデータ収集、分析/記録手段を含み、そこでは複数のデータチャネルが、感知領域を通過したときにそれぞれの細胞によって放射された光散乱および蛍光に対するそれぞれのPMTからのデータを記録する。この分析システムの目的は細胞を分類し計数することである。システム内では、それぞれの細胞がディジタル化された一組のパラメータ値として提示される。一般に、現行の分析法では、リアルタイムで集められたデータ(または後の分析のために記録されていたデータ)を、見やすくするために2次元空間にプロットする。
【0007】
このようなプロットは「散布図」または「ドットプロット」と呼ばれ、白血球に対して記録された光散乱データから描かれたドットプロットの典型的な例が米国特許第4987086号の図1に示されている。この特許の開示はその全体が参照によって本明細書に組み込まれる。前方光散乱に対して直角光散乱をプロットすることによって、全血から分離された白血球集団の中の顆粒球、単球およびリンパ球を区別することができる。例えば光散乱を使用してリンパ球だけを電子的に(または手動で)「ゲーティング(gating)」し、発光波長の異なる蛍光色素で標識した適当なモノクローナル抗体を使用することによって、リンパ球集団中の細胞型(例えばヘルパーT細胞と細胞傷害性T細胞)を区別することができる。米国特許第4727020号、4704891号、4599307号、4987086号および6014904号には、フローサイトメータを含むさまざまな構成要素の配置、一般的な使用原理、ならびに血液サンプル中の細胞集団を区別するために細胞をゲーティングする1つの方法が記載されている。これらの特許の開示はその全体が参照によって本明細書に組み込まれる。
【0008】
特に興味を持たれるのは、AIDSを引き起こすウイルス、HIVに感染した患者の細胞の分析である。CD4+リンパ球がHIV感染およびAIDSに重要な役割を果たしていることはよく知られている。例えば、感染者から採取した血液サンプル中のCD4+Tリンパ球の数を数えると、この病気の進行の目安が得られる。細胞数が1立方ミリメートルあたり200未満であることは、患者がセロポジティブ(seropositive)からAIDSに進行したことを指示する。CD4+Tリンパ球に加えてCD8+Tリンパ球も計数されており、その比CD4:CD8もAIDSの理解に使用されている。
【0009】
どちらの場合も患者から全血サンプルを得る。CD3(汎Tリンパ球マーカの1種)、CD4およびCD8に対するモノクローナル抗体は蛍光染料で直接に、または間接的に標識される。これらの染料は、互いから区別可能な発光スペクトルを有する。このような染料の例は米国特許第4745285号の例1に記載されている。この特許の開示はその全体が参照によって本明細書に組み込まれる。標識された細胞は次いでフローサイトメータに流し、データを記録する。データの分析はリアルタイムで実行し、または後の分析のためにリストモードで記憶することができる。
【0010】
分析された2次元空間のデータは離散的な細胞集団を与えるが、ドットプロットはたいてい複数のクラスタの投影を表示する。その結果、クラスタ間の見かけの重複領域に含まれる細胞を区別することがしばしば難しい。このような場合には、細胞を間違ったクラスタに分類してしまうことがあり、これが、不正確な集団の計数および割合が報告される一因となる可能性がある。例えばHIV感染患者の血液では、T細胞を過大にCD4+に含めてしまうと、臨床医はその患者がまだAIDSに進行していないと考えることとなり、本来ならおこなっていたかもしれない治療をやめてしまう可能性がある。白血病などの癌では、治療後に残留腫瘍細胞が骨髄に残る可能性がある。これらの残留した細胞は非常に低い頻度で存在し(すなわちそれらの存在はまれであり、したがって大きなサンプル中でのそれらの出現は「まれな事象」である)、したがってそれらの検出および分類は困難かつ重要である。
【0011】
この問題を解決する1つの周知の方法は、サイズ、形状および方向は固定だが位置は不定の幾何学的境界面から成る重力アトラクタ(gravitational attractor)、およびそれによって境界面が自体を最適に配置して多パラメータ事象のクラスタを包囲する計算エンジンに依存する。複数のアトラクタが、同じデータストリームまたは記録されたデータ分布内の複数の事象クラスタを同時に分類する。その戦略は、識別しかつ/または分類する1集団につき1つのアトラクタを割り当てることである。この方法は米国特許第5627040号に記載されている。この特許の開示はその全体が参照によって本明細書に組み込まれる。しかしこの方法にはいくつかの限界がある。例えば、境界面のサイズ、形状および方向が固定のため、いくつかの細胞は間違ったクラスタに分類され、または境界の外側に配置される可能性があり、したがってこれが、不正確な集団の計数および割合パーセンテージが報告される一因となる可能性がある。そのため、細胞のクラスタをより正確に区別し、したがって細胞をより正確に識別しかつ/またはより正確に異なる集団に分類する方法が求められている。
【0012】
(発明の概要)
本発明は、(例えばフローサイトメトリによって得た)2次元データサンプルを分析してその中のクラスタの位置を決定し、クラスタの周囲の境界を定義するように動作可能なクラスタ発見アルゴリズムを提供する。
【0013】
本発明の一態様によれば境界は多角形であり、ユーザによる対応するデータの操作を容易にするためクラスタ発見アルゴリズムは、多角形の頂点の数を減らすことによって境界を単純化する。
【0014】
本発明の他の態様によればクラスタ発見アルゴリズムは、それぞれのデータ点を処理するのではなく、データのヒストグラムを生成し、次いでヒストグラムの平滑化された密度推定値を生成することによってクラスタ境界の識別を最適化する。
【0015】
本発明の他の態様によれば、ヒストグラムを使用することによってデータに適用された格子構造が、密度推定値中のピークおよび谷部の位置の決定、したがってデータ中のクラスタの識別ならびにクラスタの境界の決定を容易にする。
【0016】
本発明の一実施形態によれば、2次元データ中のクラスタを識別する方法が提供される。この方法は、(1)x軸およびy軸、ならびに選択された数のx方向のビンおよび選択された数のy方向のビンを有する格子を特徴とする2次元ヒストグラムを生成することを含み、データがn対の点(xi,yi),i=1,...,nを含み、ヒストグラムがデータ点よりも少ない数のビンを含み、さらに、(2)ビンに基づいて密度推定値を決定すること、および(3)データ中の少なくとも1つのクラスタを識別することを含む。この方法はさらに、(例えばガウス核推定量アルゴリズム(Gaussian kernel estimator algrithm)を使用することによって)平滑化された密度推定値を生成することを含むことができる。本発明の方法では、クラスタの周囲の境界を(例えば多角形として)識別し、これを単純化する(例えば多角形の頂点の数が減少し、同時に最初に定義された境界がほぼ同じ領域を取り囲むようにする)ことができる。
【0017】
本発明の他の実施態様によれば、密度推定値中の谷部によって他のビンから分離されたヒストグラム中の一群のビンを含むクラスタが識別される。ビンは、それぞれのビンの傾きを隣接するビンの傾きと比較することによって識別することができる。推定値中のピークに対応するビンにはそれぞれのクラスタ識別コードを割り当て、1つのピークに関連したビンには対応するクラスタ識別コードを割り当てることができる。したがって境界位置の決定は、それぞれのビンを分析して隣接するビンが同じクラスタ識別コードを持っているかどうかを判定することによって最適化される。データを有する隣接するビンがないビン、または同じクラスタ識別コードを持った隣接するビンがないビンは、境界を決定するための外点として使用される。
【0018】
本発明の他の実施形態によれば、本明細書に記載の方法を実現するクラスタ発見アルゴリズムがプログラム可能な処理装置によって実現される。ディスプレイが、複数のクラスタの視覚的な指示を提供する。処理装置は、ユーザ入力装置を介して選択されたときにディスプレイ上の複数クラスタのうちの1つのクラスタの境界をユーザを提供するように動作可能である。処理装置はさらに、ユーザ入力装置を介して生成されたユーザコマンドに応答してクラスタの境界を変更することができる。処理装置は、第1のデータセットをゲーティングした後にテンプレートを生成することによってバッチ処理を容易にする。テンプレートは、対応するクラスタの位置を決定するための他の関連データセットの処理を容易にする。
【0019】
本発明のさまざまな目的、利点および新規の特徴は、以下の詳細な説明を添付図面を参照して読むことによってより容易に理解されよう。
【0020】
(好ましい実施形態の詳細な説明)
本発明の一実施形態によれば、フローサイトメトリによって得たデータの散布図などの事象データに対して使用することができるクラスタ発見アルゴリズム(cluster finder algorithm)20が提供される。クラスタ発見アルゴリズム20を図1に示し、以下で詳細に説明する。クラスタ発見アルゴリズム20は、2次元データセットを使用する本質的に任意の応用とともに使用できることを理解されたい。
【0021】
クラスタ発見アルゴリズム20は、プログラム可能なディジタルコンピュータ(図12)によって実行されるソフトウェアコードの形態で実現されることが好ましい。クラスタ発見アルゴリズム20を実現する処理装置は処理すべきデータを例えば、散布図中の点(x,y)に対応する2つの数値欄を有する表を含む電子ファイルを通して受け取ることができる。例示的な散布図を図2に示す。図2に示した例示的なデータを本発明に従って処理し、例示のためこれを図3〜12に関して以下で説明する。
【0022】
図1によれば、クラスタ発見アルゴリズム20は以下の段階を含む。
【0023】
1.データから2次元密度推定値を生成する
2.密度推定値中のクラスタの位置を決定する
3.クラスタの周囲の境界を決定する
4.クラスタの境界を扱いやすい多角形に単純化する
【0024】
段階1.データから2次元密度推定値を生成する
クラスタ発見アルゴリズム20を使用するためにはサンプルセットまたはデータセットが必要である。先に述べたとおり、クラスタ発見アルゴリズム20はサイズnの2次元データ、すなわちn対の点(xi,yi)、i=1,...,nから成るサンプルに対して機能する。このようなデータは一般に、図2に示した散布図などの2次元散布図中に表示される。
【0025】
図1のブロック22に指示されているようにアルゴリズム20は、このようなデータから2次元密度推定値を生成することから開始される。密度推定値は、それに従ってデータが生成された一般に不明の確率密度関数の推定値である。密度推定値はこの2次元データに第3の次元zを追加する。zの値は、(x,y)データ対の度数または密度によって変化する。得られた密度推定値は、図3に示した3次元プロットとして視覚化することができる。図3のグラフ中のピークはzの値が大きいことに対応し、これらのピークは(x,y)データ対の度数が大きい領域に見られる。図3のグラフ中の谷部および低い平らな領域、すなわちzが小さい場所は、(x,y)データ対がまばらにしかない場所に対応する。
【0026】
密度推定の理論および手順は一般に知られているが、クラスタ発見アルゴリズム20はガウス核推定量(Gaussian kernel estimator)を好ましく使用する。さらに、本発明に基づくガウス核推定量の実現はその従来の使用とは全く異なる。本発明の一態様によれば、まず最初にデータ(例えば図2の散布図中のデータ)を「ビン」に分割してデータの2次元ヒストグラムを作成し、その後になめらかな密度推定値を生み出す。図1のブロック22に示したこの段階のこの態様はアルゴリズム20の実行時間を相当に短縮し、ユーザへのリアルタイムフィードバックを可能にする。
【0027】
2次元ヒストグラムを作成するためには、データ範囲全体にまたがる図4に示すような格子30をx−y平面中に構築する。格子30は、x方向とy方向とで異なる数の分割領域またはビン32を有することができる。すなわち格子はx方向にm個のビン、y方向にp個のビンを有する。次いで、m×p個のそれぞれのビンに含まれるデータ点の数を数える。ビンの位置および得られたカウント数は2次元ヒストグラムを構成し、通常は図5に示すようなグラフとして視覚化される。
【0028】
データをビンに分割すると、密度推定値を生み出すのに必要な段階の数が減ることによってアルゴリズムの速度が増大するので有利である。大部分の密度推定方法は、データセット中のあらゆるデータ点に対して多数の演算を使用する。フローサイトメトリのサンプルを分析するときにはこれがかなりの負担となる。フローサイトメトリサンプルのデータセットは一般に数万、しばしば十万を超えるデータ点を含むからである。本発明の密度推定方法は好ましくは、サンプルの大きさが増大しても変わらないm×p個のヒストグラムビンの計数だけに対して演算する。例えば例示のためにm=p=64である場合、本発明に基づく密度推定値は、たとえサンプルが数十万のデータ点を含んでいるとしても64×64=4096個のビン計数に対して演算を使用する。
【0029】
データをビンに分割して2次元ヒストグラムを作成したら、なめらかな密度推定値を得るために、ビン計数にガウスフィルタアルゴリズム(Gaussian filter algorithm)を適用することができる。高速フーリエ変換(FFT)などの他のルーチンを使用することもできるが、競合するどの方法よりも高速なので、Ian T.YoungとLucas J.van Vlietが提案しているアルゴリズム(「Recursive Implementation of the Gaussian Filter in Signal Processing」44:139−151(1995)。この論文の開示は参照によって本明細書に組み込まれる)などのガウスフィルタアルゴリズムが好ましい。2次元ヒストグラムのそれぞれの列のビン計数にフィルタを適用して、図5に示したヒストグラムを平滑化したものを作成する。このフィルタ方程式の詳細については、アルゴリズム20の全ての段階を説明した後で説明する。
【0030】
段階2.密度推定値中のクラスタの位置を決定する
図1のブロック24に示されたこの段階では、段階1(ブロック22)で得た密度推定値の高さに従ってx,yデータ平面を相互排除領域またはクラスタに分割する。段階1では、m×p格子を用いて密度推定値を生成し求めたことを想起されたい。段階2(ブロック24)では、この格子のビンをそれぞれ1つのクラスタに割り当てる。例えば、数字1で標識された図6のビン32は全て同じクラスタに割り当てられる。図6の他の数字で標識されたビンについても同様である。なお、ビンは全ていずれかのクラスタに割り当てられるが、分かりやすくするために図6では最も目立ったクラスタだけにラベルが付けられていることを理解されたい。
【0031】
格子ビン32へのクラスタメンバーシップ(cluster membership)の割当ては、Koonst,W.L.G.,and Fukunaga,K.、「A Nonparametric Valley−Seeking Technique for Cluster Analysis」、IEEE Transactions on Computers 21(2):171−178(1972)に記載されているアルゴリズム(以下Koonst and Fukunagaのアルゴリズムと呼ぶ)を本発明の一態様に従って修正したアルゴリズムを使用して実施する。この論文の開示は参照によって本明細書に組み込まれる。Koonst and Fukunagaのアルゴリズムは、密度推定値を求める時点まで特定の構造を仮定せず、したがって数千を超えるデータ点に対しては非実用的と言える低速のアルゴリズムである。ここで説明する本発明に基づく修正は、段階1でデータに適用した格子構造によって得られる利点を最大限に活かすために実施したものである。本発明に従って使用されるこれらの修正は、Koonst and Fukunagaのアルゴリズムの実行速度をかなり向上させ、非常に大きなデータセットであってもクラスタ化を極めて迅速に実施することを可能にする。
【0032】
「良好」なクラスタ化は、図3および7の密度推定値中の一般に34で指示された谷部によって他のクラスタから分離された複数のビンを関連づけることを含む。例えば、図7でクラスタ2に割り当てられたビンとクラスタ3に割り当てられたビンとの間の境界は密度推定値中の谷部34と一致している。他のクラスタに対しても同じことが言え、このことは図7に示したクラスタ化が良好であることを示唆している。
【0033】
1次元データで密度推定値中の谷部を見つけることは比較的に単純な作業だが、2次元以上のデータセットではより複雑になる。本発明によればこの作業は、データ点をその点よりも「高い位置(アップヒル)」にある近傍の点にリンクすることによって実施される。言い換えると、データセット中のそれぞれの点(xi,yi)に対して、アルゴリズム20は、その点の近傍のそれぞれの点、すなわち点(xi,yi)から半径rの範囲内にある他の全ての点で求めた密度推定値の高さに注目する。点(xi,yi)から半径rの範囲内にある全てのデータ点の集合をS={xj,yj},j=1,...s,とする。次に、Sの中のそれぞれの点で求めた密度推定値と点(xi,yi)で求めた密度推定値との間の密度推定値の傾きを計算する。
【0034】
【数1】
【0035】
上式で、zkは、点(xk,yk)で求めた密度推定値の高さである。次いで、最も高い正のgの値を有するS中の点に(xi,yi)をリンクする。言い換えると(xi,yi)を、密度推定値に基づいてその近傍のその点よりも高い位置にあり最も傾きの大きい点にリンクする。自体よりも高い位置に近傍の点がないデータ点は密度推定値の局所的なピーク(図3および7の一般に36で指示されたピーク)の頂上にあり、このような点は他のどの点にもリンクされない。
【0036】
この方法を説明するため図8に示した1次元の例を考える。ドットは、一連の1次元の点で求めた密度推定値の高さを表す。xの付いた点をクラスタに割り当てるため、アルゴリズム20は両側の点の集合に注目する。矢印は、近傍のそれぞれの点の傾きを表す。上向きの矢印は正の傾きに対応し、矢印の長さは傾きの大きさに比例する。すぐ右側の点が最も大きな正の傾きを有するため、xの付いた点はこの点にリンクされる。この場合、アルゴリズム20は妥当な結果を得る。点xは、密度推定値の谷部34の右側の他の点に関連づけられる。第2の例を図9に示す。図9では、xを中心にした密度推定値の局所的なピーク36があるため、点xが、正の傾きを有する近傍の点を持たない。したがって点xはルートとなる。このことは、他の点が点xにリンクされることはあるが、点xが他の点に対してアップヒルリンクを持つことはないことを意味する。
【0037】
先に述べたとおり、段階1でデータおよび密度推定値に適用した格子構造の利点を活かすために、基本であるKoonst and Fukunagaのアルゴリズムを本発明に従って修正した。本発明とKoonst and Fukunagaの基本的なアルゴリズムとの主な違いは、本発明では、格子中の任意の点の近傍が空間的に固定されているためそれらが既知であることである。一方、より一般的なKoonst and Fukunagaのアプローチでは、あらゆる点の近傍の点を探索機構によって見つけなければならない。この要件は、大きなデータセットに対して計算的に極端に重いものである。第2の違いは、Koonst and Fukunagaのアルゴリズムがデータセット中のそれぞれの点にクラスタラベルを割り当てるのに対して、本発明は、格子中のビンにラベルを割り当てることである。この場合もやはり、大きなデータセットに対して計算効率が向上する。例えば100,000個のデータ点から成るサンプルでは、Koonst and Fukunagaのアプローチは100,000のそれぞれのデータ点にラベルを割り当てるが、本発明のアルゴリズムは、格子中の64×64=4096のビンにラベルを割り当てるだけである。クラスタ割当て段階(図1のブロック24)の好ましい実施形態についてはアルゴリズム20の全ての段階を説明した後で説明する。
【0038】
段階3.クラスタの周囲の境界を決定する
次に、それぞれのクラスタの境界ノードを決定する方法を説明する。特定のクラスタラベルを有するそれぞれの格子点またはビン32について、同じラベルを有する他の全てのノードを調べて、問題の格子点が内点なのかまたは境界点であるのかを判定する。内点(interior point)は、同じクラスタラベルを有する近傍格子点を全ての側に有する点であり、外点(exterior point)は、異なるクラスタラベルを有しまたはクラスタラベルを持たない1つまたは複数の近傍格子点を有する点である。
【0039】
上で決定されたクラスタ境界点が全て、明瞭な幾何学的方法で境界を定義するというわけではない。本発明によれば、それらを再配列して図10に示すように連続的に定義された境界を形成する。この作業は、W.H.Press, S.A.Teukolsky, W.T.Vetterling, and B.P.Flannery、「Numerical Recipes in Fortran, Second Edition」、Cambridge University Press、436−448(1992)に記載されているシミュレートアニーリング(simulated annealing)などの従来の一般的な数値解析法を使用して実施されている。この著作の開示は参照によって本明細書に組み込まれる。しかしこれらの一般的なプロセスは本発明の実現に対して非常に効率が悪い。
【0040】
本発明のアルゴリズム20は、段階1に関して先に説明したように密度推定値がビンに基づいていることを利用する。アルゴリズム20は、例えば図4を参照して説明した格子に沿ってビンからビンへと規則正しく進行する。まず最初に、それぞれの境界点に対して近傍の境界点の表を確立する。アルゴリズム20が進行するときに、この表を調べて格子のビンに沿ってとるべき経路を決定する。
【0041】
処理された大部分のデータ点は近傍点を2つだけ有する。この場合、表の調査は単純な判断プロセスである。しかし、データ点が2つ以上の近傍点を有するとこのプロセスはより複雑になる。その点に対して1つの近傍点を任意に選択し、プロセスを終わりまで実行する。最後に表をチェックして、見落とした点がないかどうかを確認する。もしなければ、アルゴリズム20は次のクラスタに進む。ある場合には、アルゴリズム20は引き返し、複数の選択点で以前に試みたものではない別の点を選択し、プロセスを再び最後まで実行する。満足のいく結果が達成されるまで、例えば最終的な境界点の見逃しが所定の割合に収まるまで、このプロセスを続ける。以前に述べたとおり、処理時間に関してアルゴリズム20は、シミュレートアニーリングなどの従来から利用されてきた一般的な数値解析法よりもかなり高速である。
【0042】
段階4.クラスタ境界を扱いやすい多角形に単純化する
図10から分かるように段階3で決定された境界38はデータ格子30中のビン32の輪郭に沿っている。このことは境界が、多くの小さな段を有するはしご状のギザギザした形状になりやすいことを意味する。さらに、段階3で説明した判断は、格子を横断してビンごとに規則正しく実施されるので、それが横切るそれぞれのビンに対して境界は少なくとも1つの頂点を含む。そのため境界は一般に多数の頂点を有する。例えば、64×64格子上に生み出される境界は数十個の頂点を含む可能性がある。
【0043】
段階4の目的は、段階3で生み出された境界38を単純化し、境界がより少ない数の頂点を使用してほぼ同じ幾何学的領域を取り囲むようにすることにある。この目的は、D.H Douglas and T.K.Peukerによって開発されたライン単純化技法(line simplification technique)を利用して達成することが好ましい(D.H Douglas and T.K.Peuker、「Algorithms for the Reduction of the Number of Points Required to Represent a Digitized Line or its Caricature」、The Canadian Cartographer 10(2):112−122(1973)。この論文の開示は参照によって本明細書に組み込まれる)。ただし他の技法を使用することもできる。この技法は、地図製作法(cartography)分野の研究者によって長年にわたって改良が加えられており、アルゴリズム20によって実現される好ましいバージョンは「The Douglas−Peuker Line Simplification Algorithm」、Society of University Cartographers(SUC)Bulletin、22(1):17−25(1988)という表題のJ.D.Whyatt and P.R.Wadeの研究に基づく。この論文の開示は参照によって本明細書に組み込まれる。
【0044】
図11に、この境界単純化段階の結果を示す。図11に示すとおり境界38はその形状が図10のそれよりも単純化され、かつより少ない数の頂点を含む。頂点の数が少ないことによってユーザは、アルゴリズム20が生み出した境界を簡単に操作することができる。言い換えると、クラスタ境界が単純であると、クラスタ境界の形状を大幅に調整するのにもユーザは1つまたは2つの頂点を操作するだけで済む。反対に、クラスタ境界が多数の頂点から成る場合には、境界の形状を大幅に変更するのにユーザはより多くの頂点を操作することが必要となろう。
【0045】
段階1でなめらかな密度推定値を生み出すのに使用したガウスフィルタの詳細
ガウスフィルタを実現するのに使用したアルゴリズムはIan T.Young and Lucas J.van Vlietの論文「Recursive implementation of the Gaussian filter」、Signal Processing 44(1995)139−151から得た。この論文の開示は参照によって本明細書に組み込まれる。
【0046】
このアルゴリズムはガウスフィルタの再帰的実現(recursive implementation)を使用する。この実現は、高速フーリエ変換(FFT)、ガウス密度関数のサンプルを用いた離散化されたデータの簡単な畳込み、均一なフィルタ核を用いた多重畳込みなどの従来の他の方法よりも高速である。
【0047】
このアルゴリズムでは以下の式を以下の説明のとおりに使用する。
式1:
0.5≦σ<2.5 q=3.97156−4.14554(1−0.26892σ)1/2
σ≧2.5 q=0.98711σ−0.96330
式2:
b0=l.57825+2.44413q+1.4281q2+0.422205q3
b1=2.44413q+2.85619q2+1.26661q3
b2=1.4281q2+1.26661q3
b3=0.422205q3
式3−正規化定数:
順方向フィルタと逆方向フィルタは同じ正規化定数Bを有する。ここで、
B=1−(b1+b2+b3)/b0
である。
【0048】
まず最初に入力データを、差分方程式4の記述のとおりに順方向のフィルタに掛ける。次いで、この結果の出力(以下w[n]と称する)を差分方程式5に従って逆方向のフィルタに掛ける。
【0049】
式4−順方向フィルタ:
w[n]=Bin[n]+(b1w[n−1]+b2w[n−2]+b3w[n−3])/b0
式5−逆方向フィルタ:
out[n]=Bw[n]+(b1out[n+1]+b2out[n+2]+b3out[n+3])/b0
【0050】
ターゲットとする平滑化パラメータsigma0が選択されると、アルゴリズム20は、帰納的フィルタの5つの係数の値を求める手順を実行する。この手順は、xおよびy次元の閉じた代数方程式を次のように解くことを含む。最初に式1を利用して係数qを求める。次に、係数b0、b1、b2およびb3の値を式2に従って計算する。3番目に式3によってBを決定する。この時点までに全てのフィルタ係数が決定されており、式4を用いて順方向フィルタを実現することができる。最後に、式5を利用して逆方向フィルタを実現する。以上の全ての段階を実行すれば、所望の平滑化された密度推定値が得られる。
【0051】
段階2における密度推定値中のクラスタの発見
概要:
A.密度推定値中の異常値を排除する
B.ヒストグラム中の全てのクラスタを見つけ出し、それぞれのビンに、それが属するクラスタのIDラベルを付与する
C.任意選択で小さなクラスタを排除する
【0052】
A.異常値の排除
異常値の排除は、選択した値CUTFRACT1に密度推定値中の最大値を掛けたものよりもその密度推定値が小さい全てのビンを削除することによって実施する。CUTFRACT1として使用する値は実験的に決めることができ、好ましくは0.03である。ただし他の値を使用することもできる。例えばアルゴリズム20は以下の段階を実行することができる。
1)密度推定値中の全てのビンを反復して、ヒストグラム中の最大密度値であるmaxDensityを決定する
2)最小密度しきい値minThreshold、例えばminThreshold=CUTFRACT1*maxDensityを計算する
3)minThresholdよりも小さい計数を有するビンを0にセットする
【0053】
B.クラスタの発見
アルゴリズム20は続いて以下の段階を実行することができる。
1)格子上で求めたなめらかな密度推定値から開始する
2)スティーペストアセントアルゴリズム(steepest ascent algorithm)を使用してそれぞれの格子点の親を見つける
a)注:実際の傾きの計算は、そのためのコストおよび時間を節約することができる平方根演算とすることができる。これはアルゴリズム20が、ある1つの傾きが他の傾きよりも大きいかどうかを判定するだけでよいからである。したがって平方根がとられない場合、必要な情報は、傾きの平方を比較することによって得る。
b)現在のノードが周囲のノードよりも低くない場合には、現在のノードが親ノードであるかどうかを判定する。
c)現在のノードが親ノードである場合、これはすなわち、新たなクラスタが発見されたことを指示する。新たなクラスタにはクラスタIDが割り当てられ、新たなクラスタは親を持たないとマークされる(親ID=self)。
3)それぞれのルートに、それが属するクラスタのIDラベルを付与する
4)全てのルートの位置が決定されたときに、所与のルートにリンクされた全ての点に同じラベルを与える
a)それぞれのノードについてその親ノードのIDを取得する。
b)親を持たないノードに到達するまでその親ノードのIDを再帰的に見つける(例えばそのノードはクラスタの真のピークである)。
c)そのノードのラベルをクラスタIDとする。そのクラスタIDを現在のノードのラベルとして割り当てる。
【0054】
C.小クラスタの排除(任意選択)
密度推定値中のホワイトスペース(white space)およびリプル(ripples)(これによって分類されないいくつかの格子ビンが生じる可能性がある)の影響を打ち消すために、任意選択で、非常に小さなクラスタを破棄することができる。アルゴリズム20は次のように機能する。
1)累積密度によってクラスタをソートする。
2)密度推定値の合計密度を計算する。
3)合計密度の選択値CUTFRACT2よりも小さいクラスタを排除する。CUTFRACT2の値は前もって実験的に決定しておくことができ、好ましくは0.05である。
4)ノードのラベルを付け直す(前の段階で排除されたクラスタのラベルを破棄する)
【0055】
プログラムされた装置
図12を参照すると、クラスタ発見アルゴリズム20は、処理装置42および記憶装置44を備えたプログラムされた装置40中で実現することができる。フローサイトメータなどのデータ源46からのデータ点のサンプルは例えば記憶装置44に記憶することができる。処理装置42は、そこからユーザ入力を受け取るユーザインタフェース48およびディスプレイ50に接続することができる。ディスプレイ50は、散布図および密度推定値、ならびにアルゴリズム20に従って生成された(例えば図2〜7に示す)クラスタ情報および境界情報をユーザに提供する画面を生成することができる。ディスプレイ50はさらに、散布図およびクラスタを選択的に見るためのメニューおよび他の画面オプションをユーザに提供する画面を生成することができる。例えば、ユーザは、散布図中のデータ点のクラスタをクリックすることができ、アルゴリズム20は、その特定のクラスタの周囲の境界を処理し表示することができる。ユーザはアルゴリズム20に、発見された全てのクラスタの境界を同時に処理し表示するよう要求することができる。ユーザは、密度推定値に関して先に説明したシグマパラメータを変更して、境界をよりきつく、またはよりゆるくすることができる。
【0056】
自動データ分析
以前のセクションで説明したプロセスは、単一のデータセットを処理する文脈で論じたものである。しかし、臨床または実験室条件ではしばしば、複数のデータセットを(例えばバッチ処理によって)連続して処理する必要があることがある。バッチ処理が適当である場合の例には、(i)異なるドナーからの複数のサンプルを分析し比較する必要がある臨床試験、および(ii)例えば結果を平均して1つの全体的な評価を得るために同じサンプルに対する複数の測定を含む研究、が含まれる。ただしこれらに限定されるわけではない。
【0057】
残念ながらこれらの両方のシナリオではクラスタ集団のゲーティングを一般に手動で、すなわち手作業で実施している。手作業によるデータゲーティングはわずらわしく、極めて時間集約的であり、かつ、技術者によって経験が極端に異なるためにしばしば誤差が生じやすい。
【0058】
本発明は、複数のデータセットのバッチ処理を以下の方法で自動化する。まず最初にユーザが、以前のセクションで説明した対話プロセスを使用して代表的な単一のデータファイルをゲーティングする。クラスタ発見アルゴリズム20はこの代表的なゲートの位置をテンプレートとして記憶する。次いでこのテンプレートを、分析する次のデータセットの「シード(seed)」として使用する。この方式は、次のデータセット中の所望のクラスタの位置(例えばシード点)を選択するためにユーザがポインティングデバイスを再び手動で使用する必要を排除する。次いで、以前のデータセットのトリガ「シード」に基づいてこれらのゲートを再計算して、新たなデータセットに対してカスタムなゲートとする。次いでこのカスタム再計算によって形成されたクラスタを新たな分析ファイルとして保存する。同様に残りのデータセットも、バッチ実行の始めに形成された最初のテンプレートに基づいて自動的にゲーティングされる。
【0059】
この全体プロセスを利用して本発明は、最初の代表的データセットに対してユーザが選択する最初のゲート以外はユーザと対話することなしに、同じようにして得られたデータのデータベース全体を自動的にゲーティングすることができる。したがって、本発明のバッチ処理態様を利用した実験室によって生産性の大幅な増大が実現される。主たる研究者が自身の実験室で使用するそれぞれのアッセイ(assay)に対して複数のテンプレートを開発することができる。このような処置は、同じ実験室の技術者間に存在する可能性があるゲーティングスタイルの多様性を排除する。さらに、正しいテンプレートが予め形成されている限り、技術者はもはや、特定のアッセイをゲーティングするエキスパートである必要はない。
【0060】
以上に本発明の例示的ないくつかの実施形態を詳細に説明したが、本発明の新規の教示および利点から大きく逸脱することなくこれらの例示的な実施形態の多くの修正が可能であることを当業者は容易に理解しよう。したがってそのような修正は全て、前記特許請求の範囲に定義されている本発明の範囲に含まれるものである。
【図面の簡単な説明】
【図1】
散布図中のクラスタを識別するための本発明の一実施形態に基づく操作シーケンスを示すフローチャートである。
【図2】
2次元散布図の一例である。
【図3】
本発明の一実施形態に基づく処理によって得られた図2の散布図の密度推定値の3次元プロットである。
【図4】
図2の散布図上に提供された、本発明の一実施形態に基づく格子を示す図である。
【図5】
図2の散布図のデータの2次元ヒストグラムである。
【図6】
クラスタメンバーシップを指示するためにラベルが付けられた、図2の散布図の本発明の一実施形態に基づく格子を示す図である。
【図7】
本発明の一実施形態に基づく図2の散布図の等高線プロットである。
【図8】
本発明の一実施形態に基づくクラスタメンバーシップの割当てを示すグラフである。
【図9】
本発明の一実施形態に基づくクラスタメンバーシップの割当てを示すグラフである。
【図10】
図7に示したクラスタを取り囲む、本発明の一実施形態に基づく多角形境界を示す図である。
【図11】
図10に示したクラスタ境界に適用された本発明の一実施形態に基づくライン単純化の効果を示す図である。
【図12】
本発明の一実施形態に基づいて構築された装置のブロック図である。
Claims (33)
- 2次元データ中のクラスタを識別する方法であって、
x軸およびy軸、ならびに選択された数のx方向のビンおよび選択された数のy方向のビンを有する格子を特徴とする2次元ヒストグラムを生成すること
を含み、
前記データがn対の点(xi,yi),i=1,...,nを含み、前記ヒストグラムが前記点よりも少ない数のビンを含み、
さらに、
前記ビンに基づいて密度推定値を決定すること、および
選択された密度基準を満たす複数の点を含む前記データ中の少なくとも1つのクラスタを識別すること
を含むことを特徴とする方法。 - 前記決定段階が、平滑化された密度推定値を生成することを含むことを特徴とする請求項1に記載の方法。
- 前記平滑化された密度推定値が、ガウス核推定量アルゴリズムを使用して生成されることを特徴とする請求項2に記載の方法。
- 前記少なくとも1つのクラスタの周囲の境界を決定することをさらに含むことを特徴とする請求項1に記載の方法。
- 前記境界が、複数の頂点を特徴とする多角形であり、方法がさらに、前記頂点の数が減少し、同時に前記境界がほぼ同じ領域を取り囲むように前記境界を処理することを含むことを特徴とする請求項4に記載の方法。
- 前記データが複数のクラスタを含み、前記密度推定値が、ピークおよび谷部を示す3次元プロットによって特徴づけられ、前記識別段階が、前記密度推定値中の谷部の位置を決定し、少なくとも1つの前記谷部によって他のクラスタから分離された前記複数のそれぞれのクラスタを識別することを含むことを特徴とする請求項1に記載の方法。
- 前記識別段階がさらに、それぞれの前記ビンの傾きを隣接する前記ビンの傾きと比較することを含むことを特徴とする請求項6に記載の方法。
- 前記識別段階がさらに、
どの前記ビンが、前記複数のクラスタのそれぞれのピークに対応するかを前記傾きを使用して決定すること、
前記ピークに対応する前記ビンにそれぞれのクラスタ識別コードを割り当てること、および
1つの前記ピークに関連したそれぞれの前記ビンに、対応する1つの前記クラスタ識別コードを割り当てること
を含むことを特徴とする請求項7に記載の方法。 - 前記少なくとも1つのクラスタの周囲の境界を決定することをさらに含むことを特徴とする請求項8に記載の方法。
- 境界を決定する前記段階が、それぞれの前記ビンを分析して、隣接する前記ビンが同じ前記クラスタ識別コードを有するかどうかを判定することを含み、前記データを有しまたは同じ前記クラスタ識別コードを有する隣接する前記ビンを持たない場合に、前記ビンが外点として分類されることを特徴とする請求項9に記載の方法。
- 前記境界が、複数の頂点を特徴とする多角形であり、方法がさらに、前記頂点の数が減少し、同時に前記境界がほぼ同じ領域を取り囲むように前記境界を処理することを含むことを特徴とする請求項10に記載の方法。
- 複数の点を含む2次元データ中のクラスタを識別する方法であって、
前記データに基づいて密度推定値を生成すること、
選択された密度基準を満たす複数の点を含む前記データ中の少なくとも1つのクラスタを識別すること、および
前記少なくとも1つのクラスタの周囲の境界を決定すること
を含むことを特徴とする方法。 - 前記生成段階が、平滑化された密度推定値を生成することを含むことを特徴とする請求項12に記載の方法。
- 前記平滑化された密度推定値が、ガウス核推定量アルゴリズムを使用して生成されることを特徴とする請求項13に記載の方法。
- 前記境界が、複数の頂点を特徴とする多角形であり、方法がさらに、前記頂点の数が減少し、同時に前記境界がほぼ同じ領域を取り囲むように前記境界を処理することを含むことを特徴とする請求項12に記載の方法。
- 前記データがn対の点(xi,yi),i=1,...,nを含み、前記生成段階が、
前記点よりも少ない数のビンを含む2次元ヒストグラムを生成すること、および
前記ビンに基づいて前記密度推定値を決定すること
を含むことを特徴とする請求項12に記載の方法。 - 2次元データ中のクラスタを識別する装置であって、
処理装置と、
クラスタ発見アルゴリズムを記憶するための、前記処理装置に結合された記憶装置と
を備え、
前記処理装置が、前記クラスタ発見アルゴリズムに従って、x軸およびy軸、ならびに選択された数のx方向のビンおよび選択された数のy方向のビンを有する格子を特徴とする2次元ヒストグラムを生成するようにプログラム可能であり、前記データがn対の点(xi,yi),i=1,...,nを含み、前記ヒストグラムが前記点よりも少ない数のビンを含み、前記処理装置がさらに、前記ビンに基づいて密度推定値を決定し、選択された密度基準を満たす複数の点を含む前記データ中の少なくとも1つのクラスタを識別するようにプログラム可能である
ことを特徴とする装置。 - 前記処理装置が、平滑化された密度推定値を生成するようにプログラム可能であることを特徴とする請求項17に記載の装置。
- 前記処理装置が、前記平滑化された密度推定値を生成するガウス核推定量アルゴリズムを実現するようにプログラム可能であることを特徴とする請求項18に記載の装置。
- 前記処理装置が、前記少なくとも1つのクラスタの周囲の境界を決定するようにプログラム可能であることを特徴とする請求項17に記載の装置。
- 前記境界が、複数の頂点を特徴とする多角形であり、前記処理装置が、前記頂点の数が減少し、同時に前記境界がほぼ同じ領域を取り囲むよう前記境界を処理するようにプログラム可能であることを特徴とする請求項20に記載の装置。
- 前記データが複数のクラスタを含み、装置がさらに、前記処理装置に接続されたユーザ入力装置およびディスプレイを備え、前記ディスプレイが、前記複数のクラスタの視覚的な指示を提供し、前記処理装置が、前記ユーザ入力装置を介して選択されたときに前記複数のクラスタのうちの1つのクラスタの前記境界をユーザに提供するように動作可能であることを特徴とする請求項21に記載の装置。
- 前記処理装置が、前記ユーザ入力装置を介して生成されたユーザコマンドに応答して少なくとも1つの前記複数のクラスタの前記境界を変更するように動作することを特徴とする請求項22に記載の装置。
- 前記2次元データが第1のデータセットを表し、前記処理装置が、第2のデータセットのバッチ処理を実行するように動作し、前記処理装置が、前記第1のデータセット中の前記少なくとも1つのクラスタに対応するテンプレートを前記記憶装置に記憶し、前記テンプレートを使用して前記第2のデータセット中のクラスタの位置決定を容易にすることを特徴とする請求項17に記載の装置。
- 2次元データ中のクラスタを識別する装置であって、
処理装置と、
クラスタ発見アルゴリズムを記憶するための、前記処理装置に結合された記憶装置と
を備え、
前記処理装置が、前記クラスタ発見アルゴリズムに従って、前記データに基づいて密度推定値を生成し、選択された密度基準を満たす複数の点を含む、前記データ中の少なくとも1つのクラスタを識別し、前記少なくとも1つのクラスタの周囲の境界を決定するようにプログラム可能である
ことを特徴とする装置。 - 前記処理装置が、平滑化された密度推定値を生成するようにプログラム可能であることを特徴とする請求項25に記載の装置。
- 前記処理装置が、前記平滑化された密度推定値を生成するガウス核推定量アルゴリズムを実現するようにプログラム可能であることを特徴とする請求項26に記載の装置。
- 前記データがn対の点(xi,yi),i=1,...,nを含み、処理装置が、前記点よりも少ない数のビンを含む2次元ヒストグラムを生成し、前記ビンに基づいて前記密度推定値を決定するようにプログラム可能であることを特徴とする請求項25に記載の装置。
- 複数の点を含む2次元データ中のクラスタを識別するコンピュータプログラム製品であって、
コンピュータ可読媒体と、
前記コンピュータ可読媒体上に記憶され、前記データに基づいて密度推定値を生成し、選択された密度基準を満たす複数の点を含む、前記データ中の少なくとも1つのクラスタを識別し、前記少なくとも1つのクラスタの周囲の境界を決定するクラスタ発見モジュールと
を備えることを特徴とするコンピュータプログラム製品。 - 前記クラスタ発見モジュールが平滑化された密度推定値を生成することを特徴とする請求項29に記載のコンピュータプログラム製品。
- 前記平滑化された密度推定値が、ガウス核推定量アルゴリズムを使用して生成されることを特徴とする請求項30に記載のコンピュータプログラム製品。
- 前記境界が、複数の頂点を特徴とする多角形であり、前記クラスタ発見モジュールが、前記頂点の数が減少し、同時に前記境界がほぼ同じ領域を取り囲むよう前記境界を処理するように動作可能であることを特徴とする請求項29に記載のコンピュータプログラム製品。
- 前記データがn対の点(xi,yi),i=1,...,nを含み、前記クラスタ発見モジュールが、前記点よりも少ない数のビンを含む2次元ヒストグラムを生成し、前記ビンに基づいて前記密度推定値を決定するように動作可能であることを特徴とする請求項29に記載のコンピュータプログラム製品。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US20357700P | 2000-05-11 | 2000-05-11 | |
US20351500P | 2000-05-11 | 2000-05-11 | |
US20358500P | 2000-05-11 | 2000-05-11 | |
US20359000P | 2000-05-11 | 2000-05-11 | |
PCT/US2001/015199 WO2001085914A2 (en) | 2000-05-11 | 2001-05-11 | System for identifying clusters in scatter plots using smoothed polygons with optimal boundaries |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004501358A true JP2004501358A (ja) | 2004-01-15 |
Family
ID=27498502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001582503A Pending JP2004501358A (ja) | 2000-05-11 | 2001-05-11 | 最適な境界を有する平滑化された多角形を使用して散布図中のクラスタを識別するシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US6944338B2 (ja) |
EP (2) | EP2565826B1 (ja) |
JP (1) | JP2004501358A (ja) |
WO (1) | WO2001085914A2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007526469A (ja) * | 2004-03-03 | 2007-09-13 | ユニバーシダド デ サラマンカ | 流体血球計算測定を使用する最小疾患レベルを監視するのに使用される腫瘍性細胞中の異常表現型の多次元検出方法 |
JP2012502266A (ja) * | 2008-09-05 | 2012-01-26 | ホリバ アベイクス エスアーエス | 生体データの分類、可視化並びに探索の方法及び装置 |
JP2014106161A (ja) * | 2012-11-28 | 2014-06-09 | Horiba Ltd | 血液細胞に関するスキャッターグラムの表示装置、表示方法、および、該表示装置を有する血液分析装置 |
JP2016525678A (ja) * | 2013-05-17 | 2016-08-25 | ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company | フローサイトメトリにおける効率的なコンター及びゲーティング |
WO2021010670A1 (ko) * | 2019-07-12 | 2021-01-21 | 주식회사 딥바이오 | 자동 경계화를 이용한 데이터 처리 방법 및 시스템 |
JP7468524B2 (ja) | 2018-12-20 | 2024-04-16 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7468310B2 (ja) | 2020-11-19 | 2024-04-16 | 株式会社島津製作所 | 表面分析装置 |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997040385A1 (en) | 1996-04-25 | 1997-10-30 | Bioarray Solutions, Llc | Light-controlled electrokinetic assembly of particles near surfaces |
US6421121B1 (en) * | 2000-02-10 | 2002-07-16 | Micro Imaging Technology | Method and apparatus for rapid particle identification utilizing scattered light histograms |
EP1311839B1 (en) | 2000-06-21 | 2006-03-01 | Bioarray Solutions Ltd | Multianalyte molecular analysis using application-specific random particle arrays |
US9709559B2 (en) | 2000-06-21 | 2017-07-18 | Bioarray Solutions, Ltd. | Multianalyte molecular analysis using application-specific random particle arrays |
US7262063B2 (en) | 2001-06-21 | 2007-08-28 | Bio Array Solutions, Ltd. | Directed assembly of functional heterostructures |
ES2712173T3 (es) | 2001-10-15 | 2019-05-09 | Bioarray Solutions Ltd | Análisis multiplexado de loci polimórficos mediante consulta simultánea y detección mediada por enzimas |
EP1495433B1 (de) | 2002-04-16 | 2014-03-05 | Evotec AG | Verfahren zur untersuchung chemischer und/oder biologischer proben mittels partikelbildern |
US7526114B2 (en) | 2002-11-15 | 2009-04-28 | Bioarray Solutions Ltd. | Analysis, secure access to, and transmission of array images |
KR100810058B1 (ko) * | 2003-06-10 | 2008-03-05 | 에이디이 코포레이션 | 멀티-채널 데이터의 그래픽 표현을 이용하여 기판의표면에서 발생하는 결함을 분류하는 방법 및 시스템 |
US8321136B2 (en) * | 2003-06-12 | 2012-11-27 | Cytyc Corporation | Method and system for classifying slides using scatter plot distribution |
US7927796B2 (en) | 2003-09-18 | 2011-04-19 | Bioarray Solutions, Ltd. | Number coding for identification of subtypes of coded types of solid phase carriers |
NZ546072A (en) | 2003-09-22 | 2009-08-28 | Bioarray Solutions Ltd | Surface immobilized polyelectrolyte with multiple functional groups capable of covalently bonding to biomolecules |
JP2007521017A (ja) | 2003-10-28 | 2007-08-02 | バイオアレイ ソリューションズ リミテッド | 固定化捕捉プローブを用いる遺伝子発現分析法の最適化 |
WO2005045060A2 (en) | 2003-10-29 | 2005-05-19 | Bioarray Solutions, Ltd. | Multiplexed nucleic acid analysis by fragmentation of double-stranded dna |
US7382370B2 (en) * | 2004-07-07 | 2008-06-03 | The United States Of America As Represented By The Secretary Of The Navy | System and method for smoothing and compression of polyline data |
US7567714B2 (en) * | 2004-07-07 | 2009-07-28 | The United States Of America As Represented By The Secretary Of The Navy | System, method and apparatus for clustering features |
US7315637B2 (en) * | 2004-07-16 | 2008-01-01 | Bioarray Solutions Ltd. | Image processing and analysis of array data |
PL1771729T3 (pl) | 2004-07-27 | 2016-02-29 | Beckman Coulter Inc | Poprawa zdolności dyskryminacji w cytometrii przepływowej przy użyciu transformacji geometrycznej |
US7848889B2 (en) | 2004-08-02 | 2010-12-07 | Bioarray Solutions, Ltd. | Automated analysis of multiplexed probe-target interaction patterns: pattern matching and allele identification |
US8486629B2 (en) | 2005-06-01 | 2013-07-16 | Bioarray Solutions, Ltd. | Creation of functionalized microparticle libraries by oligonucleotide ligation or elongation |
US7299135B2 (en) | 2005-11-10 | 2007-11-20 | Idexx Laboratories, Inc. | Methods for identifying discrete populations (e.g., clusters) of data within a flow cytometer multi-dimensional data set |
US8214157B2 (en) * | 2006-03-31 | 2012-07-03 | Nodality, Inc. | Method and apparatus for representing multidimensional data |
US20070248943A1 (en) * | 2006-04-21 | 2007-10-25 | Beckman Coulter, Inc. | Displaying cellular analysis result data using a template |
US20080071488A1 (en) * | 2006-08-17 | 2008-03-20 | Lecroy Corporation | Method and apparatus for evaluating data |
WO2008022341A2 (en) * | 2006-08-18 | 2008-02-21 | The Regents Of The University Of California | Seeding method for k-means clustering and other clustering algorithms |
CN101226190B (zh) * | 2007-01-17 | 2013-07-03 | 深圳迈瑞生物医疗电子股份有限公司 | 流式细胞术的自动分类方法和装置 |
US7983490B1 (en) | 2007-12-20 | 2011-07-19 | Thomas Cecil Minter | Adaptive Bayes pattern recognition |
EP2105863B1 (en) * | 2008-03-28 | 2017-09-13 | Cytognos, S.L. | Method and system for the automatic classification of events acquired by a flow cytometer |
US20090269800A1 (en) * | 2008-04-29 | 2009-10-29 | Todd Covey | Device and method for processing cell samples |
US8140300B2 (en) * | 2008-05-15 | 2012-03-20 | Becton, Dickinson And Company | High throughput flow cytometer operation with data quality assessment and control |
US20100014741A1 (en) * | 2008-07-10 | 2010-01-21 | Banville Steven C | Methods and apparatus related to gate boundaries within a data space |
US20100030719A1 (en) * | 2008-07-10 | 2010-02-04 | Covey Todd M | Methods and apparatus related to bioinformatics data analysis |
US9183237B2 (en) | 2008-07-10 | 2015-11-10 | Nodality, Inc. | Methods and apparatus related to gate boundaries within a data space |
WO2010006303A2 (en) * | 2008-07-10 | 2010-01-14 | Nodality, Inc. | Methods and apparatus related to management of experiments |
US8000940B2 (en) | 2008-10-08 | 2011-08-16 | Beckman Coulter, Inc. | Shape parameter for hematology instruments |
US20100115435A1 (en) * | 2008-10-10 | 2010-05-06 | Ronald Aaron Mickaels | Extended classification space and color model for the classification and display of multi-parameter data sets |
US9034257B2 (en) | 2008-10-27 | 2015-05-19 | Nodality, Inc. | High throughput flow cytometry system and method |
US8581927B2 (en) * | 2008-11-04 | 2013-11-12 | Beckman Coulter, Inc. | Multidimensional particle analysis data cluster reconstruction |
US8417012B2 (en) * | 2008-11-04 | 2013-04-09 | Beckman Coulter, Inc. | Non-linear histogram segmentation for particle analysis |
US20100204973A1 (en) * | 2009-01-15 | 2010-08-12 | Nodality, Inc., A Delaware Corporation | Methods For Diagnosis, Prognosis And Treatment |
TWI396106B (zh) * | 2009-08-17 | 2013-05-11 | Univ Nat Pingtung Sci & Tech | 以格子為導向之資料分群方法 |
US8688760B2 (en) | 2010-02-18 | 2014-04-01 | Becton, Dickinson And Company | Determining population boundaries using radial density histograms |
US9679401B2 (en) | 2010-03-30 | 2017-06-13 | Hewlett Packard Enterprise Development Lp | Generalized scatter plots |
TWI453613B (zh) * | 2011-05-17 | 2014-09-21 | Univ Nat Pingtung Sci & Tech | 網格式資料分群方法 |
US20140201339A1 (en) * | 2011-05-27 | 2014-07-17 | Telefonaktiebolaget L M Ericsson (Publ) | Method of conditioning communication network data relating to a distribution of network entities across a space |
CN103608664B (zh) | 2011-06-24 | 2016-09-07 | 贝克顿·迪金森公司 | 吸收光谱扫描流动血细胞计数 |
CN102331393A (zh) * | 2011-07-08 | 2012-01-25 | 无锡荣兴科技有限公司 | 一种对人体血液中细胞进行自动分类计算的方法 |
WO2013022878A2 (en) * | 2011-08-09 | 2013-02-14 | Yale University | Quantitative analysis and visualization of spatial points |
US9002656B2 (en) | 2011-10-17 | 2015-04-07 | Daxor Corporation | Automated total body albumin analyzer |
CN102507417B (zh) * | 2011-11-29 | 2014-04-09 | 长春迪瑞医疗科技股份有限公司 | 一种粒子自动分类方法 |
CN103364324A (zh) * | 2012-03-27 | 2013-10-23 | 嘉善加斯戴克医疗器械有限公司 | 一种用于血液细胞分析仪的自适应分类计算方法 |
US10274412B2 (en) | 2012-11-16 | 2019-04-30 | Beckman Coulter, Inc. | Flow cytometry data segmentation result evaluation systems and methods |
US9446159B2 (en) | 2013-10-03 | 2016-09-20 | Becton, Dickinson And Company | Flow cytometer biosafety hood and systems including the same |
US20170013484A1 (en) * | 2014-02-17 | 2017-01-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Service failure in communications networks |
US9945848B2 (en) | 2014-04-14 | 2018-04-17 | Becton, Dickinson And Company | Reagent calibration system and method |
CN106537114B (zh) | 2014-04-21 | 2019-06-21 | 贝克顿·迪金森公司 | 用于可调地密封流式细胞仪样品操作室的滑移带密封盒 |
SG10201507049XA (en) * | 2014-09-10 | 2016-04-28 | Agency Science Tech & Res | Method and system for automatically assigning class labels to objects |
CN104359821A (zh) * | 2014-11-04 | 2015-02-18 | 深圳市帝迈生物技术有限公司 | 一种散点图的粒子分类统计方法和***及血液细胞分析仪 |
US10616219B2 (en) | 2014-12-11 | 2020-04-07 | FlowJo, LLC | Single cell data management and analysis systems and methods |
US10876953B2 (en) | 2015-07-15 | 2020-12-29 | Becton, Dickinson And Company | System and method for label selection |
US9830720B2 (en) | 2015-09-02 | 2017-11-28 | Becton, Dickinson And Company | Graphics control during flow cytometry event gating |
CN106326923B (zh) * | 2016-08-23 | 2019-03-12 | 福州大学 | 一种顾及位置重复和密度峰值点的签到位置数据聚类方法 |
CN106501160A (zh) * | 2016-09-08 | 2017-03-15 | 长春迪瑞医疗科技股份有限公司 | 一种粒子分类方法及粒子分类装置 |
WO2018151680A1 (en) * | 2017-02-15 | 2018-08-23 | Agency For Science, Technology And Research | Methods and devices for identifying population clusters in data |
WO2018217933A1 (en) | 2017-05-25 | 2018-11-29 | FlowJo, LLC | Visualization, comparative analysis, and automated difference detection for large multi-parameter data sets |
US11029242B2 (en) | 2017-06-12 | 2021-06-08 | Becton, Dickinson And Company | Index sorting systems and methods |
US10593082B2 (en) | 2017-07-18 | 2020-03-17 | Becton, Dickinson And Company | Dynamic display of multi-parameter quantitative biological data |
CN110770571B (zh) | 2017-07-18 | 2022-09-20 | 贝克顿·迪金森公司 | 多参数定量生物学数据的动态交互显示 |
WO2019018129A1 (en) | 2017-07-18 | 2019-01-24 | Becton, Dickinson And Company | DYNAMIC INTERACTIVE DISPLAY OF QUANTITATIVE BIOLOGICAL DATA WITH MULTIPLE PARAMETERS |
JP6926838B2 (ja) * | 2017-08-31 | 2021-08-25 | 富士通株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN108897068B (zh) * | 2018-04-20 | 2020-11-13 | 南京大学 | 气象台站面密度度量方法 |
US10883912B2 (en) | 2018-06-04 | 2021-01-05 | Becton, Dickinson And Company | Biexponential transformation for graphics display |
US11428692B2 (en) | 2018-07-11 | 2022-08-30 | Visiongate, Inc. | Specimen enrichment for optical tomography cell analysis |
WO2020072383A1 (en) | 2018-10-01 | 2020-04-09 | FlowJo, LLC | Deep learning particle classification platform |
AU2020207365A1 (en) | 2019-01-11 | 2021-06-03 | Becton, Dickinson And Company | Optimized sorting gates |
WO2020205089A1 (en) | 2019-04-02 | 2020-10-08 | Becton, Dickinson And Company | Compensation editor |
US20200333330A1 (en) | 2019-04-21 | 2020-10-22 | Becton, Dickinson And Company | Cytometric bead array analysis |
US11704918B2 (en) * | 2019-07-10 | 2023-07-18 | Becton, Dickinson And Company | Reconfigurable integrated circuits for adjusting cell sorting classification |
CN113076773A (zh) * | 2020-01-03 | 2021-07-06 | 广州汽车集团股份有限公司 | 目标检测聚类方法、***、计算机设备及可读存储介质 |
US20210230583A1 (en) | 2020-01-29 | 2021-07-29 | Becton, Dickinson And Company | Barcoded wells for spatial mapping of single cells through sequencing |
EP4097448A4 (en) | 2020-01-31 | 2023-08-23 | Becton, Dickinson and Company | METHODS AND SYSTEMS FOR ADJUSTING A LEARNING GRID TO RECEIVE FLOW CYTOMETER DATA |
CN115867971A (zh) | 2020-05-18 | 2023-03-28 | 贝克顿·迪金森公司 | 用于检测数据中的异质性的分辨率指数及其使用方法 |
CN115170820B (zh) * | 2022-05-13 | 2023-08-01 | 中铁西北科学研究院有限公司 | 一种应用于数据曲线过渡阶段的特征提取及界限识别方法 |
WO2024137527A1 (en) | 2022-12-19 | 2024-06-27 | Becton, Dickinson And Company | Sorting method using barcoded chambers for single cell workflow |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01308964A (ja) * | 1988-06-07 | 1989-12-13 | Toa Medical Electronics Co Ltd | 二次元分布分画方法 |
JPH0242357A (ja) * | 1988-08-02 | 1990-02-13 | Omron Tateisi Electron Co | 細胞分析装置 |
JPH03194444A (ja) * | 1989-12-22 | 1991-08-26 | Hitachi Ltd | 粒子解析装置及び血球カウンタ |
JPH03229152A (ja) * | 1990-02-02 | 1991-10-11 | Omron Corp | 細胞分析装置 |
JPH05149863A (ja) * | 1991-11-27 | 1993-06-15 | Toa Medical Electronics Co Ltd | 粒子計数方法 |
JPH09218147A (ja) * | 1996-02-09 | 1997-08-19 | Toa Medical Electronics Co Ltd | 分布データ計測装置 |
JPH11345225A (ja) * | 1998-02-19 | 1999-12-14 | Chem Computing Group Inc | 離散型の定量的構造活性相関を決定する方法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4207554A (en) * | 1972-08-04 | 1980-06-10 | Med-El Inc. | Method and apparatus for automated classification and analysis of cells |
US4599307A (en) | 1983-07-18 | 1986-07-08 | Becton, Dickinson And Company | Method for elimination of selected cell populations in analytic cytology |
US4661913A (en) | 1984-09-11 | 1987-04-28 | Becton, Dickinson And Company | Apparatus and method for the detection and classification of articles using flow cytometry techniques |
US5314824A (en) | 1984-12-24 | 1994-05-24 | Caribbean Microparticles Corporation | Method of setting up a flow cytometer |
US4727020A (en) | 1985-02-25 | 1988-02-23 | Becton, Dickinson And Company | Method for analysis of subpopulations of blood cells |
CA1296622C (en) | 1986-08-12 | 1992-03-03 | Jeffrey E. Anderson | Method and apparatus for automated assessment of the immunoregulatory status of the mononuclear leukocyte immune system |
US4745285A (en) | 1986-08-21 | 1988-05-17 | Becton Dickinson And Company | Multi-color fluorescence analysis with single wavelength excitation |
US4704891A (en) | 1986-08-29 | 1987-11-10 | Becton, Dickinson And Company | Method and materials for calibrating flow cytometers and other analysis instruments |
US4987086A (en) | 1987-11-30 | 1991-01-22 | Becton, Dickinson And Company | Method for analysis of subpopulations of cells |
US5018088A (en) * | 1989-10-02 | 1991-05-21 | The Johns Hopkins University | Adaptive locally-optimum detection signal processor and processing methods |
US5784162A (en) * | 1993-08-18 | 1998-07-21 | Applied Spectral Imaging Ltd. | Spectral bio-imaging methods for biological research, medical diagnostics and therapy |
US5991028A (en) * | 1991-02-22 | 1999-11-23 | Applied Spectral Imaging Ltd. | Spectral bio-imaging methods for cell classification |
US5548661A (en) * | 1991-07-12 | 1996-08-20 | Price; Jeffrey H. | Operator independent image cytometer |
WO1993005478A1 (en) | 1991-08-28 | 1993-03-18 | Becton, Dickinson & Company | Gravitational attractor engine for adaptively autoclustering n-dimensional data streams |
US5776709A (en) | 1991-08-28 | 1998-07-07 | Becton Dickinson And Company | Method for preparation and analysis of leukocytes in whole blood |
US5465321A (en) * | 1993-04-07 | 1995-11-07 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Hidden markov models for fault detection in dynamic systems |
US5365472A (en) | 1993-11-26 | 1994-11-15 | The United States Of America As Represented By The Secretary Of The Navy | Non-linear resistive grid kernel estimator useful in single feature, two-class pattern classification |
US5572597A (en) * | 1994-03-29 | 1996-11-05 | Loral Corporation | Fingerprint classification system |
US5757954A (en) * | 1994-09-20 | 1998-05-26 | Neopath, Inc. | Field prioritization apparatus and method |
US5528494A (en) * | 1994-10-06 | 1996-06-18 | B. F. Goodrich Flight Systems, Inc. | Statistically based thunderstorm cell detection and mapping system |
US6148096A (en) * | 1995-09-15 | 2000-11-14 | Accumed International, Inc. | Specimen preview and inspection system |
US5768413A (en) | 1995-10-04 | 1998-06-16 | Arch Development Corp. | Method and apparatus for segmenting images using stochastically deformable contours |
US6014904A (en) * | 1996-05-09 | 2000-01-18 | Becton, Dickinson And Company | Method for classifying multi-parameter data |
US5989835A (en) * | 1997-02-27 | 1999-11-23 | Cellomics, Inc. | System for cell-based screening |
US6246972B1 (en) | 1996-08-23 | 2001-06-12 | Aspen Technology, Inc. | Analyzer for modeling and optimizing maintenance operations |
US5999639A (en) * | 1997-09-04 | 1999-12-07 | Qualia Computing, Inc. | Method and system for automated detection of clustered microcalcifications from digital mammograms |
US6226409B1 (en) | 1998-11-03 | 2001-05-01 | Compaq Computer Corporation | Multiple mode probability density estimation with application to sequential markovian decision processes |
US6317517B1 (en) * | 1998-11-30 | 2001-11-13 | Regents Of The University Of California | Statistical pattern recognition |
US6372506B1 (en) * | 1999-07-02 | 2002-04-16 | Becton, Dickinson And Company | Apparatus and method for verifying drop delay in a flow cytometer |
US6687395B1 (en) * | 1999-07-21 | 2004-02-03 | Surromed, Inc. | System for microvolume laser scanning cytometry |
-
2001
- 2001-05-11 EP EP12194384.9A patent/EP2565826B1/en not_active Expired - Lifetime
- 2001-05-11 US US09/853,037 patent/US6944338B2/en not_active Expired - Lifetime
- 2001-05-11 EP EP01939015A patent/EP1295243A4/en not_active Withdrawn
- 2001-05-11 JP JP2001582503A patent/JP2004501358A/ja active Pending
- 2001-05-11 WO PCT/US2001/015199 patent/WO2001085914A2/en active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01308964A (ja) * | 1988-06-07 | 1989-12-13 | Toa Medical Electronics Co Ltd | 二次元分布分画方法 |
JPH0242357A (ja) * | 1988-08-02 | 1990-02-13 | Omron Tateisi Electron Co | 細胞分析装置 |
JPH03194444A (ja) * | 1989-12-22 | 1991-08-26 | Hitachi Ltd | 粒子解析装置及び血球カウンタ |
JPH03229152A (ja) * | 1990-02-02 | 1991-10-11 | Omron Corp | 細胞分析装置 |
JPH05149863A (ja) * | 1991-11-27 | 1993-06-15 | Toa Medical Electronics Co Ltd | 粒子計数方法 |
JPH09218147A (ja) * | 1996-02-09 | 1997-08-19 | Toa Medical Electronics Co Ltd | 分布データ計測装置 |
JPH11345225A (ja) * | 1998-02-19 | 1999-12-14 | Chem Computing Group Inc | 離散型の定量的構造活性相関を決定する方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007526469A (ja) * | 2004-03-03 | 2007-09-13 | ユニバーシダド デ サラマンカ | 流体血球計算測定を使用する最小疾患レベルを監視するのに使用される腫瘍性細胞中の異常表現型の多次元検出方法 |
JP4768706B2 (ja) * | 2004-03-03 | 2011-09-07 | ユニバーシダド デ サラマンカ | 流体血球計算測定を使用する最小疾患レベルを監視するのに使用される腫瘍性細胞中の異常表現型の多次元検出方法 |
JP2012502266A (ja) * | 2008-09-05 | 2012-01-26 | ホリバ アベイクス エスアーエス | 生体データの分類、可視化並びに探索の方法及び装置 |
JP2014106161A (ja) * | 2012-11-28 | 2014-06-09 | Horiba Ltd | 血液細胞に関するスキャッターグラムの表示装置、表示方法、および、該表示装置を有する血液分析装置 |
JP2016525678A (ja) * | 2013-05-17 | 2016-08-25 | ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company | フローサイトメトリにおける効率的なコンター及びゲーティング |
US10753848B2 (en) | 2013-05-17 | 2020-08-25 | Becton, Dickinson And Company | Efficient contours and gating |
JP7468524B2 (ja) | 2018-12-20 | 2024-04-16 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2021010670A1 (ko) * | 2019-07-12 | 2021-01-21 | 주식회사 딥바이오 | 자동 경계화를 이용한 데이터 처리 방법 및 시스템 |
JP7468310B2 (ja) | 2020-11-19 | 2024-04-16 | 株式会社島津製作所 | 表面分析装置 |
Also Published As
Publication number | Publication date |
---|---|
US6944338B2 (en) | 2005-09-13 |
WO2001085914A3 (en) | 2002-04-04 |
EP2565826A1 (en) | 2013-03-06 |
EP2565826B1 (en) | 2019-11-06 |
US20020029235A1 (en) | 2002-03-07 |
WO2001085914A2 (en) | 2001-11-15 |
EP1295243A2 (en) | 2003-03-26 |
EP1295243A4 (en) | 2010-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6944338B2 (en) | System for identifying clusters in scatter plots using smoothed polygons with optimal boundaries | |
EP2252889B1 (en) | Method and system for analysis of flow cytometry data using support vector machines | |
US10289802B2 (en) | Spanning-tree progression analysis of density-normalized events (SPADE) | |
US6014904A (en) | Method for classifying multi-parameter data | |
US9880155B2 (en) | System, method, and article for detecting abnormal cells using multi-dimensional analysis | |
US20160169786A1 (en) | Automated flow cytometry analysis method and system | |
CN110023759B (zh) | 用于使用多维分析检测异常细胞的***、方法和制品 | |
US10503756B2 (en) | Cluster processing and ranking methods including methods applicable to clusters developed through density based merging | |
JP2007132921A (ja) | フローサイトメーター多次元データセット内のデータの離散母集団(例えば、クラスター)を識別する方法 | |
Kamentsky | Cytology automation | |
KR20230144555A (ko) | 진단적 중요도의 순서대로 세포 및 조직을 동적으로 우선순위를 매기고 조직화하며 표시하는 시스템 및 방법 | |
EP3230887A1 (en) | Automated flow cytometry analysis method and system | |
Azad et al. | Immunophenotype discovery, hierarchical organization, and template-based classification of flow cytometry samples | |
CN102144153B (zh) | 用于分类、显示并探查生物数据的方法和装置 | |
CN115078227A (zh) | 分析方法以及分析装置 | |
US12046331B2 (en) | System, method, and article for detecting abnormal cells using multi-dimensional analysis | |
Abdallah et al. | Using Bayesian inference to measure the proximity of flow cytometry data | |
Van Gassen | Development of machine learning techniques for flow cytometry data | |
Salzman et al. | Expert system for flow cytometry data analysis: a preliminary report |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080512 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101028 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120203 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120706 |