JP2023544647A - 多次元時系列データのためのデータ圧縮 - Google Patents

多次元時系列データのためのデータ圧縮 Download PDF

Info

Publication number
JP2023544647A
JP2023544647A JP2023537885A JP2023537885A JP2023544647A JP 2023544647 A JP2023544647 A JP 2023544647A JP 2023537885 A JP2023537885 A JP 2023537885A JP 2023537885 A JP2023537885 A JP 2023537885A JP 2023544647 A JP2023544647 A JP 2023544647A
Authority
JP
Japan
Prior art keywords
data
local region
local
previous
region data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023537885A
Other languages
English (en)
Inventor
クレッター,ドロン
Original Assignee
プロテイン・メトリクス・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プロテイン・メトリクス・エルエルシー filed Critical プロテイン・メトリクス・エルエルシー
Publication of JP2023544647A publication Critical patent/JP2023544647A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • H03M7/3071Prediction
    • H03M7/3075Space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/153Multidimensional correlation or convolution
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本明細書に説明されるのは、疎の多次元順序付き系列データを圧縮するためのコンピュータ実装方法である。特に、それらを実施するためのこれらの方法および装置(ソフトウェアを含む)は、分光データを効率的に圧縮するのに特によく適している場合がある。

Description

関連出願の相互参照
[0001]本特許出願は、参照により本明細書に全体が組み込まれる、2020年8月31日出願の「DATA COMPRESSION FOR MULTIDIMENSIONAL TIME SERIES DATA(多次元時系列データのためのデータ圧縮)」という名称の米国仮特許出願第63/072,890号に対する優先権を主張するものである。
参照による組み込み
[0002]本明細書内で述べられるすべての刊行物および特許出願は、各々個々の刊行物または特許出願が参照により組み込まれるように具体的かつ個々に示される場合と同程度まで、それらの全体が参照により本明細書に組み込まれる。
[0003]本明細書に説明されるのは、質量分析法、顕微鏡法および蛍光顕微鏡法における分光分析データ、ならびに病理組織データなど(これらに限定されるものではないが)大きな多次元データセットを圧縮するためのシステムおよび方法である。
[0004]生物学、化学、天文学、物理学、地質学、および物体追跡など、理工学の多くの領域において、大量の分光分析データがしばしば収集および格納される。技術が進歩するにつれて、デジタル顕微鏡および質量分析センサを用いてますます高いレベルの詳細部を捕捉するための感度および能力が増大し、獲得され得るデータの量が、それに応じて増加する。例えば、質量分析は、数時間以内に、最大で30GB以上のサイズになり得る単一のデータセットを頻繁に生成する。現在利用可能な機器を使用すると、10のデータ点および10の質量強度値を伴う10の質量分析データセットが容易に取得され得、結果として4TBの生ファイルサイズをもたらす。
[0005]同様に、現代の明視野顕微鏡機器は、顕微鏡ガラス上の組織の薄い5ミクロン片の全スライド多重画像をスキャンすることができ、最大120,000×50,000画素のフルカラー画像を生成し、結果として各組織片ごとに6GBの生ファイルサイズをもたらす。組織は、手術、生検、または剖検によって取り出され、薄片へとスライスされ、目的とする下層の細胞および生物学的構造を視覚化できるようにするために1つまたは複数の顔料によって染色され、背景の定着薬とは区別される。このような顕微鏡画像は、がんを含む疾患検出および監視のために、ならびに積極的な疾患研究および効果的な疾患バイオマーカの識別のために、臨床医学において日常的に使用される。
[0006]医用画像の分野において、組織片全体は、各約1~5ミクロンの多くの薄片へとスライスされ得、各組織片は、デジタル顕微鏡を使用してスキャンされ、結果として生じる画像は、閲覧者が、一度に1片ではなく、組織全体を3次元でまとめて視覚化および調査することを可能にする画像のスタックを作成するために互いの上に層化される。この技術は、Zスタックとして知られる。典型的な直径5~10ミリメートルの単一の腫瘍は、所望のスライス分解および切断ブレード厚さに応じて、数千の組織片を提供し得る。1000片では、結果として生じるZスタックファイルサイズは、6TBもの大きさになり得る。
[0007]単一の顕微鏡画像、またはZスタックは、単一の時間点における組織状態の静止視野のみを提供する。研究者および疾病病理学者は、多くの場合、どのように所与の薬物または治療が経時的に組織に影響を及ぼすか、およびどのくらいの間、薬物が、身体から取り除かれる前に、組織内で効果的なままであるかについて関心がある。動的な挙動を理解するために、複数の画像が経時的に取られ、映画のフレームのように、時間的に連続して層化される。閲覧者は、次いで、従来のビデオプレイヤーを使用して、経時的に画像シーケンス再生を見ることができる。ここでも、時系列データの結果として生じるファイルサイズは、人間の目による時系列データのスムーズな観察に必要な、1秒あたり30再生フレーム以上で捕捉されるときは特に、非常に大きくなる。
[0008]蛍光顕微鏡法の分野において、試料は、特定の波長の励起光によって照明され、これにより、試料内に自然に存在するか、または特定のタンパク質、生物学的細胞構造体、もしくは複合抗体への結合により特にもたらされるかのいずれかである蛍光色素分子に、光を、通常は異なる波長で放出させ、この放出光が、画像として顕微鏡により捕捉される。
[0009]現代の多重化蛍光顕微鏡の近年の進歩は、現在、複数の属性を同時に視覚化するために、各々が異なる波長を放出し、各々が異なる細胞構造体または生物学的特性に結合する蛍光色素分子染料のセットを用いることができる。例えば、1つのタイプの蛍光染料は、細胞核にのみ結合し得るが、別の染料は、外側の細胞膜に結合し得、さらに第3のタイプの染料は、がん細胞にのみ結合するために使用され得る。
[0010]各染料が異なる波長を使用することから、多重化蛍光顕微鏡は、典型的には、各染料につき1つ、互いの上に層化される(垂直方向が異なる染料を反映することを除き、Zスタックと同様の)一連の画像を出力する。蛍光顕微鏡法は、疾病検出および予防のために、ならびに臨床医学およびバイオマーカ発見において、日常的に使用される。Alexa FlourシリーズおよびCy5染料など、市販の染料は容易に入手可能である。所与の実験における染料の数は、最大10個の染料またはそれ以上など、様々であり得る。共焦点蛍光顕微鏡は、典型的には、各染料に約3GB、合計で最大30GBファイルサイズの複数のスタック画像からなる大きいファイルを生成する。
米国特許第7397961号明細書 米国特許第8023750号明細書 米国特許第9385751号明細書
[0011]データセットのサイズが増加すると、これらのより大きいデータセットを迅速かつ効率的に管理する(例えば、格納、転送、および分析する)ことがそれに応じて困難になる。本明細書に説明されるのは、これらの問題に対処するシステムおよび方法である。
[0012]本明細書に説明される装置および方法は、分光分析データを取り扱うときに特に重大である大量のデータを格納および転送する必要性に対処する。この問題への従来の手法は、データサイズ全体を低減するために、圧縮のいくつかの手段をデータに適用しなければならなかった。本明細書に説明される方法および装置(例えば、システム)は、最大で330倍もの高忠実度画像圧縮を提供する。これらの技術は、多次元分光分析(例えば、質量分析)、多次元撮像データセットなどの多次元データセットを含む極端に大きいデータセットに適用され得る。処理および圧縮されたデータセットは、高倍率(例えば、撮像データセットでは最大40Xの倍率)で見たとき元のデータ/画像とほとんど区別ができない高忠実度で復元され得る。提案された方法は、このタイプのデータを格納および転送する費用の大幅な減少、ならびに、画像のオンデマンド処理および閲覧を含む、著しくより速い処理時間を結果としてもたらし得る。
[0013]既存の圧縮方法は、大きな多次元分光分析データを取り扱うことにおいてあまり効果的ではない。本明細書で使用される場合、大きいデータセットは、非圧縮形式で1GB超(例えば、10GB超、50GB超、100GB超、1~100GBなど)を有するものを含み得る。本明細書に説明される方法および装置は、高い度合いの圧縮が達成されるにもかかわらず、元のデータセットからの忠実度の著しい損失を防ぎ得る。BZIP2、LZW、およびZIPなどの無損失圧縮方法が、一般的に使用されるが、これは主に、元のデータが情報のいかなる損失もなしに完全に復元され得るからである。しかしながら、無損失圧縮で獲得され得る圧縮の量は、通常限られており、典型的には、分光分析データでは2未満であり、場合によっては、結果として生じる圧縮ファイルサイズは、特定の無損失圧縮方法に応じて、拡大して元のファイルよりも大きくなることさえある。
[0014]多くの状況において、限られた量の損失に耐えることができるシステムにおいて不可逆圧縮方法を使用することは、多くの場合容認される。この文脈における不可逆圧縮とは、復元されたデータが、解凍後、圧縮に入力される元のデータと全く同じではない場合がある圧縮方法を指す。復元されたデータと元のデータとの間の絶対差、すなわち復元誤差、が十分に小さい限り、いくつかのシステムにおいて、その状況は容認され得る。しかしながら、損失が許されると、誤差の主観的性質に起因して、結果の精度を補償することは、多くの場合困難である。不可逆圧縮方法は、従来、データ内に本質的な冗長性が存在する状況において、例えば、肉眼では局部近傍における高周波数変動を区別することができない、デジタルおよび携帯電話カメラ画像処理において、適用されており、故に、高周波数成分をフィルタアウトすることがノイズを低減するための手段として望ましい。
[0015]放射線またはx線検出器および分光計、加速度計、質量分光計、顕微鏡および蛍光顕微鏡、ならびに病理組織撮像素子を含むがこれらに限定されない、多くのセンサおよび分析器は、可能な限り高い精度を保持するために、バイナリおよび倍精度浮動小数点値を使用してデータを収集および格納する。そのようなセンサを使用して獲得される大きいデータセットは、多くの場合、既存の従来の圧縮システムを利用して認識され効果的に圧縮され得る繰り返しパターンを含まない。倍精度浮動小数点数、および、さもなければ既存の従来の方法による圧縮には適さない高ダイナミックレンジ、例えば、最大で64ビット/画素の整数データ、からなる大きいデータセットを圧縮することができる方法およびシステムが必要とされている。本明細書に説明される方法および装置によって対処される基本原理は、データの圧縮であるが、本明細書において説明および特許請求される特定の実施形態は、疎の多次元順序付き系列データの大きいセット、および特に、分光分析データの大きいセットが直面する固有の問題に合うように調整される特定の様式でこの広範な原理を適用し得る。
[0016]疎の多次元順序付き系列データからの個々のデータ系列は、他のデータ系列とは独立して圧縮され得る。しかしながら、特に質量分析法および顕微鏡法を含む、多くの状況では、高レベルの相関が、後続のデータ系列の中に頻繁に存在し得る。
[0017]本明細書に説明されるデータ(例えば、多次元時系列データ)を圧縮するための方法およびシステムは、いくつかのデータ系列を一緒に圧縮することを含む、以前に説明された圧縮方法に勝る利点を有し得る。一度に、例えば、同時または順次に、2つ以上のデータ系列を圧縮すること、および異なるデータセット内のデータ同士の関係(例えば、相関)を使用することによって、第1または現在のデータ系列内の相関部分が、1つまたは複数の以前に処理されたデータ系列から予測され得、以て、相関部分は、現在の系列データから予測部分を減算することによって除去され得る。この手法の利点は、現在の系列データのために符号化および伝送されなければならないデータの量を著しく低減することにある。符号化情報の量におけるこのような低減は、相関した現在の系列データごとに、著しくより高い圧縮を提供する。
[0018]解凍中、現在のデータ系列の相関部分は、元のコンテンツを復元するために、同様の様式で以前のデータ系列から生成され、現在の解凍データ系列に自動的に追加され得る。したがって、相関部分は、符号化ストリーム内にいかなる追加のビットも要求することなく完全に復元され得る。
[0019]1つまたは複数のデータ系列を一緒に圧縮することは、系列データ全体を一度に圧縮することに限定されない。各々の所与の系列データは、重複または非重複ローカルデータ領域へと分割され得、これにより、相関のレベルが、現在の系列データおよび1つまたは複数の以前の系列データの対応するローカル領域の間で演算され得る。特に、これらの方法およびシステムは、現在の系列データ内の現在のローカル領域と1つまたは複数の以前の系列データ内の同じローカル領域との相関のレベルを識別し得る(本明細書における使用のため)。例えば、現在のローカル領域内の相関したローカルピークのセットは、1つまたは複数の以前の系列データのローカル領域内の対応するピークのセットから予測され得る。
[0020]それらを実施するためのこれらの方法およびシステムのいずれかは、著しいレベル(例えば、しきい値レベル)の相関が現在の系列データと1つまたは複数の以前の系列データのローカル領域との間に存在するときにのみ、相関部分を除去し得る。これは、弱い相関レベルではあまり信頼性の高くない予測および除去ステップにおけるノイズおよび丸め誤差の導入を防ぎ得るか、またはこれを低減し得る。
[0021]相関予測が特定のローカル領域で使用され他では使用されないとき、解凍時間中、デコーダに、ローカル領域ごとに、相関予測復元を適用するように、場合によっては適用しないように指示するために、追加のビットを圧縮ストリームに導入することが役立ち得る。例えば、各ローカル領域あたりの、追加のビットは、圧縮ファイルサイズを増加させ得、圧縮を低減し得る。
[0022]さらに本明細書に説明されるのは、圧縮を損なうことなく、各ローカル領域あたりのそのような追加のビットの必要性を除去または低減するための方法およびシステムである。現在の系列データと1つまたは複数の以前の系列データとの相関のレベルは、演算され、所与のしきい値と比較され得る。現在のローカル領域における相関レベルが所与のしきい値に等しいか、これを超える場合、予測アルゴリズムが、相関レベルを予測してそこから現在の系列データを減算するために適用され得る。そうではなく、現在のローカル領域における計算された相関レベルが所与のしきい値を下回る場合、予測は適用されない。本プロセスは、ローカル領域ごとに順に繰り返され得、相関部分の存在を自動的に検出し、各ローカル領域において、著しいレベルの相関が存在するときはいつでも、いかなる追加のビットも圧縮ストリームに導入することなく、相関部分を除去する。
[0023]解凍時、各ローカル領域内の相関のレベルは、再度、復元されたデータから演算され得る。現在のローカル領域における相関レベルが所与のしきい値に等しいか、またはこれを超える場合、現在のデータ系列の相関部分は、元のコンテンツを復元するために、同様の様式で以前のデータ系列から生成され、現在の解凍されるデータ系列に自動的に追加され得る。したがって、相関部分は、符号化ストリーム内にいかなる追加のビットも要求することなく完全に復元され得る。
[0024]例えば、これらのデータ圧縮方法およびシステムは、質量分析(MS)データに特に有用であり得る。故に、これらの変形のいずれかにおいて、データは、多次元質量分析系列データを含み得、データは、インデックス付きデータセットを含み、各インデックス付きデータセットは、保持時間インデックスを表すインデックス(n)、インデックスnにおける質量/電荷m/zを表す第1の変数(x)、および機器によって観察されるイオンフラグメントの強度または数を表す第2の変数(y)を含む。
[0025]いくつかの変形において、データは、多次元質量分析系列データであり得、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、保持時間インデックスを表すインデックス(n)、インデックスnにおける質量/電荷m/zを表す第1の変数(x)、機器によって観察されるイオンフラグメントの強度または数を表す第2の変数(y)、およびイオン移動度ドリフト管を通って進むイオンの観察されたイオン移動度を表す第3の変数(z)を含む。
[0026]特に多次元撮像データを含む、任意の他のタイプの多次元データが、これらの方法およびシステムによって処理され得る。例えば、いくつかの変形において、データは、多次元明視野顕微鏡画像系列データであり得、データは、インデックス付きデータセットを含み得、各インデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)、および顕微鏡によって捕捉される画素強度を表す第1の変数(x)を含む。
[0027]例えば、データは、多次元明視野顕微鏡画像系列データであり得、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)、第1の色成分の強度を表す第1の変数(x)、第2の色成分の強度を表す第2の変数(y)、および画像の第3の色成分の強度を表す第3の変数(z)を含む。一般性を失うことなく、任意の数の変数、例えば、任意の数の色成分が使用され得ること、および成分は、例えば、標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であり得るということに留意されたい。
[0028]いくつかの変形において、データは、多次元多重化蛍光顕微鏡系列データであり得、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の所与のローカル領域内のインデックス(n)画素インデックス、特定の蛍光染料層を表す第2のインデックス変数(k)、第1の色成分の強度を表す第1の変数(x)、第2の色成分の強度を表す第2の変数(y)、および画像の第3の色成分の強度を表す第3の変数(z)を含む。述べられるように、任意の数の変数(例えば、次元)が、一般性を失うことなく、含まれ、使用され得る。例えば、蛍光顕微鏡データでは、変数の数は、色成分の任意の数であり得、成分は、例えば、標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であり得る。
[0029]例えば、データは、多次元多重化蛍光顕微鏡系列データであり得、第1、第2、および第3の色成分は、フルカラー画像であり、各画像の色は、互いの上にいくつかの複数の染料からの情報を層化することによって複雑な細胞またはバイオマーカ相互作用を可視化するために、顕微鏡オペレータによって人工的に割り当てられる疑似カラーである。例えば、DAPI(4’,6-ジアミジノ-2-フェニルインドール)は、蛍光顕微鏡法、フローサイトメトリ、および染色体着色において核対比染色として一般的に使用される青色蛍光DNA着色剤である一方、Alexa Four546は、様々な細胞ラベリングおよび検出のために最適化され得る明るい黄色の染料である。各染料の観察された蛍光発光は、単色像として表現され、これにより、顕微鏡オペレータは、典型的には、各単色像に特定の色を割り当て、互いの上に疑似カラー化された画像を層化することによって複数の染料の相互作用を一緒に同時に視覚化するために、DAPIの場合は、色のパレットから選択される特定の色合いの青色を、またAlexa Four546の場合は、これも色のパレットから選択される特定の色合いの黄色をなど割り当てて、典型的な多重化蛍光顕微鏡画像を形成し得る。
[0030]本明細書に説明される方法およびシステムは、例えば、インデックス付きデータセットを伴って使用され得、各インデックスインデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)を含み、これにより、系列データ全体は、N個の重複または非重複ローカル領域へと分割され、各ローカル領域は、後続画素の長さからなり、圧縮は、各ローカル領域に順に適用される。
[0031]いくつかの変形において、データは、インデックス付きデータセットを含み、各インデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)を含み、これにより、系列データ全体は、N個の重複または非重複ローカル領域へと分割され、各ローカル領域は、特定の幅および高さの矩形局部近傍からなり、圧縮は、各ローカル領域に順に適用される。
[0032]本明細書に説明される方法および装置(例えば、システム)は、以前には可能ではなかった様式で、データの疎の多次元順序付き系列を著しく圧縮し得る。例えば、ファイルサイズの約2~3倍の低減しか提供しない場合がある、「ZIP」ファイル圧縮など、質量分析(MS)データのための標準ファイル圧縮と比較して、本明細書に説明される圧縮方法は、ファイルサイズの300倍低減を結果としてもたらし得る。
[0033]簡便性のため、本明細書に説明されるデータセットは、前モチーフ圧縮(PM圧縮)または前相関領域(PCR)圧縮のいずれかと称され得る。
[0034]例えば、疎の多次元順序付き系列データを圧縮するためのコンピュータ実装方法は、多次元順序付き系列データを複数のローカル領域へと分割するステップであって、各ローカル領域内のデータは、1つまたは複数のインデックス付きデータセットを含み、各インデックス付きデータセットは、画像の所与のローカル領域内のインデックス(n)、およびインデックス(n)によってインデックス化される1つまたは複数の変数を含む、ステップと、インデックス(n)、現在のローカル領域データ、および少なくとも1つの以前のローカル領域データの関数として、1つまたは複数の変数の各々を計算する予測因子を識別するステップと、しきい値を超える相関のレベルが現在のローカル領域データと以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、少なくとも1つの以前のローカル領域データに基づいて減算することによって現在のローカル領域データを調節するステップと、最適倍率を含む調節された現在のローカル領域データを、圧縮ストリーム内へ符号化するステップと、を含み得る。
[0035]多次元順序付き系列データは、任意のタイプのデータ、特に撮像および/または分光データであり得る。データは、複数の重複ローカル領域、または複数の非重複ローカル領域へと分割され得る。
[0036]これらの方法(またはそれらを実施するための装置)のいずれかは、現在のローカル領域と以前のローカル領域との相関レベルを演算し得る。例えば、MSデータでは、相関レベルは、現在のローカル領域データと前記少なくとも1つの以前のローカル領域データとの間に存在する一連の類似ピークから演算され得る。類似ピークの連続サブセットは、類似ピークのサブセットからのピークの大半が、ほぼ同じ質量/電荷比、後続のピーク間の間隔から決定されるような、ほぼ同じ電荷状態、およびavergineモデルに一致する類似ピーク強度存在度分布のうちの1つまたは複数を有する場合に、類似とみなされ得る。
[0037]一般に、圧縮ストリームは、最善の倍率(本明細書では等価に、最適化された倍率または最適倍率とも称される)と一緒に、上に説明されるような修正されたローカル領域を含み得る。最適化倍率は、典型的には、一連のピークについてローカル領域サブセットにつき1つの値を含み得る(ピーク値あたりの個々の倍率に対立するものとして)。
[0038]以前のローカル領域(本明細書では前のローカル領域またはテンプレート領域とも称され得る)は、エンコーダとデコーダとの間の合意によって設定され得る。いくつかの変形において、以前のローカル領域は、スキャン順に以前のローカル領域(例えば、ラスタースキャン順にすぐ左側の領域)に対応するように設定され得る。別の変形において、以前のローカル領域は、本明細書に説明されるように、(a)すぐ左、(b)すぐ上、または(c)すぐ上かつ左(斜め)のうちの1つであり得る。いくつかの変形において、エンコーダは、3つすべてを検査し得、最も高い相関レベルを有するものを選択し得る。デコーダは、データ自体から以前のローカル領域を決定し得る(例えば、それは、コンテンツを復元した後、3つすべての可能な領域を検査し得る)か、それは、圧縮ストリーム内で符号化される以前のローカル領域の識別情報を提供され得る。いくつかの変形において、以前のローカル領域は、上記の(a)、(b)、および(c)などの平均であり得る。故に、一般に、エンコーダおよびデコーダは、同じ参照された以前のローカル領域を使用する。
[0039]例えば、エンコーダおよびデコーダは共に、上記の(a)に説明されるように、現在のローカル領域のすぐ左にある領域を以前のローカル領域として使用するように設定され得る。これは、特定の圧縮結果を提供し得る。いくつかの変形において、圧縮は、例えば、上記の(a)、(b)、または(c)に対応する、現在のローカル領域からすぐ左、上、および/または斜めの1つの以前のローカル領域(またはその組み合わせ)を選択することによって増加され得る。エンコーダが2つ以上を見ている(例えば、それは、これらの領域a、b、および/またはcの3つすべてを見ることができる)変形において、それは、これらの領域のうちの1つにおいて、これらの領域の他のものと比較してより高い相関を見出し得る。述べられるように、所与の実装形態において、エンコーダおよびデコーダは、例えば、これらの前ローカル領域(a、b、および/またはc)のうちの1つまたは複数を常に使用する、同じ(例えば、固定の)方法に設定され得る。
[0040]いくつかの実装形態において、ヘッダ(例えば、1バイトのヘッダ)が、例えば、現在のローカル領域からすぐ左、すぐ上、および/またはすぐ上かつ左(例えば、斜め)の前ローカル領域を示すことなど、利用可能な方法の予め規定されたリストの中から、使用されるべき特定の前ローカル領域を特定するために使用され得る。故に、エンコーダ(このヘッダを符号化し得る)は、例えば、特定のヘッダバイト内にコードを送信することによって、予め規定された前ローカル領域のうちのどれを使用すべきかを、デコーダ(このヘッダを読み出し得る)に伝え得る。
[0041]さらに本明細書に説明されるのは、疎の多次元順序付き系列データを圧縮するためのシステムである。これらのシステムは、命令が格納された非一時的なコンピュータ可読媒体を含み得、該命令は、プロセッサによって実行されるとき、プロセッサに、本明細書に説明される方法のいずれかを実施させる。例えば、命令が格納された非一時的なコンピュータ可読媒体は、多次元順序付き系列データを複数のローカル領域へと分割することであって、各ローカル領域内のデータは、1つまたは複数のインデックス付きデータセットを含み、各インデックス付きデータセットは、画像の所与のローカル領域内のインデックス(n)、およびインデックス(n)によってインデックス化される1つまたは複数の変数を含む、分割することと、インデックス(n)、現在のローカル領域データ、および少なくとも1つの以前のローカル領域データの関数として、1つまたは複数の変数の各々を計算する予測因子を識別することと、しきい値を超える相関のレベルが現在のローカル領域データと以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、少なくとも1つの以前のローカル領域データに基づいて減算することによって現在のローカル領域データを調節することと、最適倍率を含む調節された現在のローカル領域データを、圧縮ストリーム内へ符号化することと、を行うように構成され得る。
[0042]述べられるように、さらに本明細書に説明されるのは、本明細書に説明される圧縮データ(例えば、疎の多次元順序付き系列データ)のいずれかを解凍する方法である。例えば、本明細書に説明されるのは、圧縮データファイルまたはストリームから疎の多次元順序付き系列データを解凍するためのコンピュータ実装方法であり、本方法は、圧縮データファイルまたはストリームを受信するステップと、圧縮データファイルまたはストリームから調節されたローカル領域データを復号するステップであって、復号した調節されたローカル領域データは、復元されるべき標的ローカル領域に対応する、ステップと、最適倍率によってスケーリングされる予測ローカル領域ピークを生成するために、調節されたローカル領域データを1つまたは複数の以前のローカル領域と比較することによって、圧縮データファイルまたはストリームから予測因子倍率を復号するステップと、復元されたローカル領域データを提供するために、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加するステップと、復元されたローカル領域データを出力するステップと、を含む。
[0043]例えば、圧縮データファイルまたはストリームから疎の多次元順序付き系列データを解凍するためのコンピュータ実装方法は、圧縮データファイルまたはストリームを受信するステップと、圧縮データファイルまたはストリームから調節されたローカル領域データを復号するステップであって、復号した調節されたローカル領域データは、復元されるべき標的ローカル領域に対応する、ステップと、調節されたローカル領域データからのピークのサブセットを識別するために、調節されたローカル領域データを、調節されたローカル領域データからオフセットされる1つまたは複数の以前のローカル領域データと比較すること、および予測ローカル領域ピークを生成するために、圧縮データファイルまたはストリームから抽出される最適倍率によってピークのサブセットをスケーリングすることによって、圧縮データファイルまたはストリームから予測因子倍率を復号するステップと、復元されたローカル領域データを生成するために、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加するステップと、復元されたローカル領域データを出力するステップと、を含む。
[0044]さらに本明細書に説明されるのは、プロセッサによって実行されるとき、プロセッサに、本明細書に説明されるコンピュータ実装方法のいずれかを実施させる命令が格納された非一時的なコンピュータ可読媒体、および/またはこれらの非一時的なコンピュータ可読媒体を含むシステムである。
[0045]これらの方法および装置(例えば、システム、媒体など)のいずれかは、データを符号化するために使用されるエンコードを適用するデコーダを使用して、ローカル領域データおよび予測因子倍率を調節することを含み得る。
[0046]述べられるように、予測因子倍率を復号するステップは、調節されたローカル領域データからのピークのサブセットを識別するために、調節されたローカル領域データを、調節されたローカル領域データからオフセットされる1つまたは複数の以前のローカル領域と比較すること、および予測ローカル領域ピークを生成するために、最適倍率によってピークのサブセットをスケーリングすることを含み得る。
[0047]一般に、これらの方法および装置は、いつ予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加するべきかを動的に決定し得る(閾値化を使用して)。例えば、復元されたローカル領域データを提供するために、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加するステップは、調節されたローカル領域データと1つまたは複数の以前のローカル領域との相関がしきい値レベルを超えるとき、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加し、そうでなければ、復元されたローカル領域データを復号した調節されたローカル領域データに設定することを含む。いくつかの例において、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加するステップは、調節されたローカル領域データと1つまたは複数の以前のローカル領域との相関レベルを演算し、相関レベルがしきい値を超えるときにのみ、予測ローカル領域ピークおよび復号した調節されたローカル領域データを一緒に追加し、そうでなければ、復元されたローカル領域データを復号した調節されたローカル領域データに設定することを含む。
[0048]符号化のように、一般に、復号は、圧縮データストリームが受信されると、圧縮データストリームを連続的に使用することによって行われ得るか、または、圧縮データファイルを受信した後、および場合によっては、圧縮データファイルを格納した後に行われ得る。故に、いくつかの例において、圧縮データファイルまたはストリームの一部分のみが復元される。いくつかの例において、圧縮データファイルまたはストリームを受信することは、圧縮データストリームを受信すること、およびストリームが受信されると(同時に)処理することを含む。
[0049]さらに、これらの方法または装置のいずれかは、圧縮データファイルまたは圧縮データストリームの一部分を復号するために使用され得る。例えば、これらの方法または装置のいずれかは、圧縮データファイルまたは圧縮データストリームをその全体において復元するために復号、追加、および出力ステップを反復的に繰り返し得る。
[0050]これらの方法のいずれかは、圧縮データファイルまたはストリームから最適倍率を取得するステップをさらに含み得る。最適倍率は、圧縮データファイルまたは圧縮データストリーム内の予め決定された、またはマークされた場所において、圧縮データファイルストリーム内で符号化され得る。
[0051]これらの方法または装置(例えば、システム)のいずれかは、複数の現在のローカル領域を順次に処理するために、復号するステップおよび調節されたローカル領域データ、ならびに予測ローカル領域ピークおよび復号されたローカル領域データを追加するステップをさらに含み得る。
[0052]本明細書に説明される方法および装置の特徴および利点のより良好な理解は、例証的な実施形態を明記する以下の詳細な説明、および添付の図面を参照して得られるものとする。
[0053]多次元データ圧縮方法の一例を例証するブロック図の一例を示す図である。 [0054]本明細書に説明される方法を使用して圧縮され得るMSデータの一例を例証する図であり、図2では、MSデータは、インデックス付き系列データのセットを示す現在のローカル領域データを示し、各インデックス付き系列データは、インデックス(n)、第1の変数(x)(この例では、質量/電荷比、m/z)、および第2の変数(y)(この例では、所与のm/zを有するイオンフラグメントの強度存在度数)からなり、水平軸は、質量/電荷比であり、垂直軸は、強度イオンフラグメント数である、図である。 [0055]インデックス付き系列データのセットを示す対応する以前のローカル領域データの例を示す図であって、各インデックス付き系列データは、インデックス(n)、第1の変数(x)(質量/電荷比、m/z)、および第2の変数(y)(所与のm/zを有するイオンフラグメントの強度存在度数)からなる、図である。 [0056]図2からの現在のローカル領域データと図3内の特定の以前のローカル領域データとの相関データのセットの例を示す図であって、データのうちのいくつかのみ、図2内のピークのうちのいくつかが、図3内のピークのうちのいくつかと相関し、図2および図3内の他のピークは相関せず、一般に、相関したピークは、機器精度以内で、ほぼ同じ質量/電荷比m/z値;特定の電荷状態を確認する、後続のピーク間のほぼ等しい間隔;および平均化モデルに概して従うべきである観察された強度分布など、特定の特性を共通して有さなければならず、図3からのデータは、単に例証の目的のために、図2からのデータに対して離れてわずかにシフトして描写されるが、実際には、ピークは、典型的に約1ppmの機器m/z精度以内で、互いのほぼ上に位置することに留意されたい、図である。 [0057]図4内の予測される相関データの減算後の、調節された現在のローカル領域データの例を示す図であり、調節されたデータは、図4に示されるように元の現在のローカル領域ピーク(図2)からの予測される相関した以前のピーク(図3)の減算後の、剰余(丸で囲まれた)からなり、非相関の現在のローカル領域ピーク(両側の)は、調節されず、調節の結果は、点線450によって強調され、図2および図5を比較することによって見ることができるような、はるかにより小さい剰余405との高強度ピーク(図2に示されるような)の置き換えであり、調節されたデータは、圧縮ストリーム内へ符号化される、図である。 [0058]経時的に典型的な質量分析データの3次元(3D)溶出プロファイルの一例を示す図であって、各イオンフラグメントは、典型的な釣鐘型の曲線を呈し、各曲線の強度は、開始時は低く、その後次第に上昇して頂点に達し、その後次第にゼロまで下がり、時間分および頂点強度高さは、フラグメント組成に基づいて変化し得、検出器までの経路上の共溶出イオンフラグメントの間には何らかの重複が存在し得る、図である。 [0059]全イオン電流(TIC)としても知られる、経時的な、質量/電荷比m/z軸上での統合後の、図6内の例となる「典型的な」質量分析データの観察された2次元溶出プロファイルを示す図であって、全イオン電流は、溶出プロファイルエンベロープ、任意の所与の時間における個々の曲線の最大値、に比例し、イオンが帯電しているため、検出器電流の直接測定は、溶出エンベロープに比例し、溶出エンベロープの最小点は、1つのイオンフラグメント種から別のものへのクロスオーバー遷移時点t2、t3、t4を規定する、図である。 [0060]未処理で示される(非常に大きいファイルサイズ、例えば、1.764GBを有する)病理組織データセットを形成する画像の小さい領域の一例を例証する図である。 [0061]本明細書に説明される方法を使用して圧縮および復元される、図8Aのデータセットを例証する図である。 [0062]本明細書に説明されるように、多次元データセットのすべてまたは一部分を復元する(例えば、解凍する)方法の一例のブロック図を概略的に例証する図である。 [0063]本明細書に説明される方法および/または装置を使用した、圧縮ストリーム内の多次元データセットの一部分の直接アクセスを例証する図である。 [0064]図11Aは、本明細書に説明されるように圧縮され得るデータセットの別の例を示す図であって、データセット全体を表す画像を示す、図である。 図11Bは、本明細書に説明されるように圧縮され得るデータセットの別の例を示す図であって、データセットの部分領域(領域「B」)の拡大図を示す、図である。 [0065] 図12Aは多次元明視野顕微鏡画像データに対応する、未圧縮の多次元データセットの一例を例証する図である。 [0066]図12Bは、本明細書に説明されるような方法を使用した圧縮および従来のJPEG圧縮の品質を比較する図であって、本明細書に説明される方法を使用して圧縮および復元されている図12Aの多次元明視野顕微鏡画像データの拡大部分(領域Z)を示す、図である。図12Cは、本明細書に説明されるような方法を使用した圧縮および従来のJPEG圧縮の品質を比較する図であって、高圧縮比でJPEG圧縮を使用して圧縮および復元されている、図12Aの同じ領域の拡大画像を示す、図である。
[0067]本明細書に説明されるのは、疎の多次元順序付き系列データおよび具体的には分光データを圧縮するためのコンピュータ実装方法である。これらの方法は、概して、多次元順序付き系列データを受信するステップであって、データは、重複または非重複ローカル領域に分割され、各ローカル領域内のデータは、インデックス付きデータセットを含み、各インデックス付きデータセットは、画像の所与のローカル領域内のインデックスを表すインデックス(n)、第1の変数(x)、任意選択の第2の変数(y)、任意選択の第3の変数(z)、および任意選択の追加の変数(例えば、多重化蛍光顕微鏡の場合)を含む、ステップと、インデックス(n)および少なくとも1つまたは複数の以前のローカル領域データの関数として、各第1の変数(x)、各追加の変数(例えば、多重化蛍光顕微鏡の場合、第2の変数(y)、および第3の変数(z)など)を計算する予測因子を規定するステップと、予め規定されたしきい値よりも大きい、高レベルの相関が現在と以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、1つまたは複数の以前のローカル領域データに基づいて減算することによって、現在のローカル領域データを調節するステップと、(d)最適倍率を含む調節された現在のローカル領域データを、圧縮ストリーム内へ符号化するステップと、を含み得る。
[0068]一般に、本明細書に説明される方法および装置は、高い強度変化を伴う比較的少ない画素、およびより低い強度変化を伴う多くの画素を含み得る、MSデータおよび病理組織撮像データなど、ログ密度データ分布を有する疎のデータセットに特によく適している(しかしながら、これに限定されない)。本明細書に説明される方法および装置は、高圧縮阻止アーチファクトを回避することを含む、データの詳細(例えば、撮像詳細)を損なうことのない高圧縮比、および/または量子化を達成し得る。これらの方法および装置は、最大64ビットのダイナミックレンジまたはそれ以上を用いて使用され得る。これらの方法および装置は、高速の、例えば、オンザフライの(または局所的な)解凍のために使用され得、画像が取られているときを含め、圧縮画像のストリーミングを可能にし得る。
[0069]図1は、本明細書に説明されるような圧縮方法の一例のブロック図を示す。多次元入力データ205は、順序付き系列データからなり、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、インデックス(n)、少なくとも1つの変数、第1の変数(x)、任意選択の第2の変数(y)、任意選択の第3の変数(z)などを含む。任意選択の変数の数は、入力次元性によって決定され得る。
[0070]1つの例において、データは、多次元質量分析データで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、現在のローカル領域内のインデックスを表すインデックス(n)、観察された質量/電荷比m/zを表す第1の変数(x)、および機器によって観察されるイオンフラグメント存在度の観察された強度または数を表す第2の変数(y)を含む。別の例において、データは、多次元質量分析系列データで構成され、データは、インデックス付きデータセットからなり、各インデックスインデックス付きデータセットは、現在のローカル領域内のインデックスを表すインデックス(n)、観察された質量/電荷比m/zを表す第1の変数(x)、機器によって観察されるイオンフラグメント存在度の観察された強度または数を表す第2の変数(y)、およびイオン移動度ドリフト管を通って進むイオンの観察されたイオン移動度を表す第3の変数(z)を含む。
[0071]さらに別の例において、データは、多次元明視野顕微鏡画像データ、または全スライド顕微鏡撮像データで構成され、データは、インデックス付きデータセットを含み、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、および顕微鏡によって捕捉される画像画素の観察された強度を表す第1の変数(x)を含む。さらに別の例において、データは、多次元明視野顕微鏡画像系列データで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、第1の色成分の強度を表す第1の変数(x)、第2の色成分の強度を表す第2の変数(y)、および画像の第3の色成分の強度を表す第3の変数(z)を含む。一般性を失うことなく、変数の数は、任意の数の色成分であり得ること、および成分は、例えば、標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であり得るということに留意されたい。
[0072]さらに別の例において、データは、単色顕微鏡画像データの画像スタックで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、および変数(x、y、z)のセットを含み、各変数は、画像スタックの特定の画像層における画像画素の観察された強度を表す。例えば、一片の組織が、特定の方向に沿って、約1~5マイクロメートル離して、薄い切片へとスライスされ得る。各々の薄い切片は、別個に処置および処理され、結果として生じる画像は、組織全体の視覚化を提供するために、画像層として互いの上に積層される。本技術の一般名称は、Zスタックとして知られる。
[0073]さらに別の例において、データは、カラー顕微鏡画像データの画像スタックで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、ならびに第1、第2、および第3の変数(x、y、z)のセットを含み、セット内の各々の第1、第2、および第3の変数は、画像スタック、またはZスタックの特定の画像層における画像画素の観察された色強度を表す。一般性を失うことなく、変数の数は、任意の数の色成分であり得ること、および成分は、例えば、標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であるということに留意されたい。
[0074]さらに別の例において、入力データは、単色顕微鏡画像データの時系列で構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、および第1の変数(x、y、z…)のセットを含み、各変数は、シーケンスの特定の時間点における画像画素の観察された強度を表す。例えば、一片の組織は、経時的に薬物摂取または吸収のレベルについて監視され得る。顕微鏡画像のシーケンスが経時的に取られ、結果として生じる画像は、映画のフレームのように、時間的に連続して層化される。閲覧者は、次いで、従来のビデオプレイヤーを使用して、経時的に画像シーケンス再生を見ることができる。
[0075]1つの例において、入力データは、カラー顕微鏡画像データの時系列で構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、ならびに第1、第2、および第3の変数(x、y、z)のセットを含み、セット内の各々の第1、第2、および第3の変数は、シーケンスの特定の時間点における画像画素の第1、第2、および第3の色成分の観察された強度を表す。一般性を失うことなく、変数の数は、任意の数の色成分であり得ること、および成分は、(例えば)標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であり得るということに留意されたい。
[0076]別の例において、データは、多重化マルチチャネルカラー蛍光顕微鏡データで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、および少なくとも1つまたは複数の変数(x、y、z…)を含み、各変数は、画像画素位置における特定の蛍光染料または着色剤の観察された強度を表す。変数の数は、使用されている異なるチャネルまたは染料の数を反映する。特定の多重化蛍光顕微鏡画像は、異なる色の特別な染料または着色剤の組み合わせを使用して、最大10またはそれ以上の複数の染料を伴い得、染料または着色剤の各々は、細胞部分境界、薬物レベル濃度、内部生体状態、または陽性の生物学的マーカを識別することが意図される。
[0077]別の例において、データは、多次元多重化蛍光顕微鏡系列データで構成され、データは、インデックス付きデータセットからなり、各インデックス付きデータセットは、画像の現在のローカル領域内の画像画素のインデックス(n)、特定の蛍光染料層を表す第2のインデックス変数(k)、第1の色成分の強度を表す第1の変数(x)、第2の色成分の強度を表す第2の変数(y)、および画像の第3の色成分の強度を表す第3の変数(z)を含む。一般性を失うことなく、変数の数は、任意の数の色成分であり得ること、および成分は、(例えば)標準RGBまたはYCbCr輝度-クロミナンス表現など、規定の色空間の任意の色成分であり得るということに留意されたい。
[0078]さらに別の例において、データは、多次元多重化蛍光顕微鏡系列データで構成され、第1、第2、および第3の色成分は、フルカラー画像であり、各画像の色は、互いの上にいくつかの複数の染料からの情報を層化することによって複雑な細胞またはバイオマーカ相互作用を可視化するために、色のパレットから顕微鏡オペレータによって人工的に選択される。例えば、DAPI(4’,6-ジアミジノ-2-フェニルインドール)は、蛍光顕微鏡法、フローサイトメトリ、および染色体着色において核着色剤として一般的に使用される青色蛍光DNA着色剤である一方、Alexa Four546は、様々な細胞ラベリングおよび検出のために最適化され得る明るい黄色の染料である。各染料の観察された蛍光発光は、単色像として捕捉され、これにより、顕微鏡オペレータは、各単色像に特定の色を割り当て、互いの上に疑似カラー化された画像を層化することによって複数の染料の相互作用の組み合わせを同時に視覚化するために、例えば、DAPIの場合は、色のパレットから選択される特定の青色を、またAlexa Four546の場合は、これも色のパレットから選択される特定の黄色をなど割り当てて、典型的な多重化蛍光顕微鏡画像を形成し得る。
[0079]データは、インデックス付きデータセットで構成され得、各インデックスインデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)を含み、これにより、系列データ全体は、N個の重複または非重複ローカル領域へと分割され、各ローカル領域は、後続の画素の長さからなり、圧縮は、各ローカル領域に順に適用される。
[0080]いくつかの変形において、データは、インデックス付きデータセットで構成され得、各インデックスインデックス付きデータセットは、画像の所与のローカル領域内の画素インデックスを表すインデックス(n)を含み、これにより、系列データ全体は、N個の重複または非重複ローカル領域へと分割され、各ローカル領域は、特定の幅および高さの矩形局部近傍からなり、圧縮は、各ローカル領域に順に適用される。
[0081]多次元入力データは、N個の重複または非重複ローカル領域のセットへと分割され得、これらは、一度に1つのローカル領域で、ラスタースキャン順に、連続して処理され得る。ローカル領域は、インデックス付きセットの連続グループなどのインデックス付きデータセットの局部近傍、またはインデックス付きセットの矩形領域に関して規定され得、ローカル領域のすべてのメンバは、互いに密接している。
[0082]本明細書に説明される圧縮方法の一例のブロック図は、図1に示される。図1は、本明細書に説明される方法の少なくとも1つの変形を実施することが確証される提案された多次元データ圧縮システムの単に一例を例証するブロック図を示す。図1において、インデックス付きデータセットを含み得るデータ210の現在のローカル領域は、機器入力データ205から受信され、各インデックス付きデータセットは、インデックス(n)、第1の変数(x)、任意選択の追加の変数(例えば、第2の変数(y)、および第3の変数(z)など)を含む。現在のローカル領域210データは、圧縮ストリーム内へ符号化されるべき現在のデータ片であり得る。
[0083]入力データ205がZスタックまたは時系列データからなるとき、入力データは、データの複数の層を含み、各層は、Zスタック内の特定の組織スライス画像層、または時系列データの特定の時間点画像層に対応する。図1の二重矩形表記は、データ内の複数層の存在を示す。
[0084]現在のローカル領域データ210が処理および符号化されると、ローカル領域データは、例えば、以前のローカル領域データ)としての後の使用のためにメモリ内(例えば、循環バッファ内)に保持され、必要とされなくなると最終的に破棄され得る。現在のローカル領域210に距離が最も近い1つまたは複数の以前のローカル領域220のデータは、メモリ(例えば、循環バッファ)から取得され得る。これは、現在のローカル領域範囲と同じ質量/電荷比(第1の変数x)範囲を有する、1つまたは複数の以前のスキャンの対応するローカル領域データであり得る。またはそれは、例えば、現在のローカル領域のすぐ左、現在のローカル領域のすぐ上、もしくは現在の領域のすぐ上かつ左の、隣接矩形ローカル領域データであり得る。すべての以前のデータは、メモリ(例えば、循環バッファ)内に利用可能に保持され得、ローカル領域ごとに容易にアクセスされ得る。
[0085]この方法は、次いで、以下により詳細に開示されるように、ピーク位置および強度を比較し、一般的なavergineモデルに従う強度分布を用いて、各々がほぼ均一に離間したピークのサブセットに対応する高強度同位体パターンの1つまたは複数の連続サブセットを探すことによって、現在のローカル領域データ210と以前の1つまたは複数のローカル領域データ220との相関230のレベルを演算し得る。
[0086]2つ以上の以前のローカル領域(「前ローカル領域」)が使用されるとき、いくつかの以前のローカル領域のデータは、ノイズの多いデータの場合、信号対ノイズ比を改善するために、一緒に平均化され得る。代替的に、各々の以前のローカル領域間の相関のレベルは、いくつかの以前のローカル領域のうちのどれが現在のローカル領域データと最も高い相関を有するかを決定するために、個々に演算され得、この情報は次いで、最も高い相関または他の基準を有する1つの以前の領域を、使用するべき好ましい以前のローカル領域として選択するために後で使用される。
[0087]例えば、これらの方法または装置のうちのいずれかは、現在のローカル領域ごとに、(1)現在のローカル領域の左、(2)現在のローカル領域のすぐ上、および(3)現在の領域のすぐ上かつ左、という3つの以前のローカル領域について相関のレベルを個々に計算することを含み得る。3つの以前のローカル領域のうちの1つ、現在のローカル領域に対して最も高い相関を有するものは、次いで、すべての後続処理において使用するために以前のローカル領域として選択され得る。
[0088]現在と以前のローカル領域データとの相関230の演算されたレベルは、予め規定されたしきい値240と比較され得る250。相関230のレベルが、しきい値240よりも高いか、これに等しい場合、予測因子260が有効化される。そうではなく、相関230のレベルがしきい値240よりも低い場合、予測因子260は使用されず、マルチプレクサ270出力はゼロへと強いられる。
[0089]予測因子260は、有効化されるとき、以前のローカル領域データに基づいてローカル領域データの相関部分を予測することを試みる。以前のローカル領域データの相関部分は、現在のローカル領域データの対応する相関部分にできる限り一致するように最適倍率を用いてスケーリングされる。
[0090]例えば、以前のローカル領域データの相関ピークは各々、同じ倍率によってスケーリングされ得る。予測因子260出力は、予測因子が有効化されるときに有効化されるマルチプレクサ270を通って、加算ノード280へと渡される。最適スケーラ値もまた、領域あたりに1つの倍率で、圧縮ストリーム内へ符号化される。
[0091]相関230の演算されたレベルが、しきい値240よりも高い、またはこれに等しいとき、現在のローカル領域データは、加算ノード280を通じて、予測因子260出力265を減算することによって、調節され、結果は、元のローカル領域データの代わりに、圧縮ストリーム内へ符号化される。この調節は、本質的に、できる限り以前のローカル領域データから予測され得るデータの相関部分を取り除く。以前および現在のローカル領域が互いに密接しているため、それらは頻繁に、類似データを含み、これは大抵の場合、確実に予測され得る。調節後、不完全な予測の剰余のみがデータ内に残る。剰余は、元のデータよりも数桁小さい場合がある。
[0092]本明細書に説明される方法および装置の提案された方法の、既存の特許に勝る主要な利点は、既存の技術(例えば、米国特許第7397961号明細書、米国特許第8023750号明細書を参照)においては、各ローカル領域が独立して圧縮され得ることである。したがって、各ローカル領域の相関部分は、各ローカル領域において順に、何度も繰り返し符号化される。これは、圧縮ストリーム内の多数の繰り返し可能なビットを消費する。対照的に、本明細書に説明される方法および装置は、第1のローカル領域に遭遇した際に、データの相関部分のみを一度だけ符号化する。これ以降、相関部分を再度送る必要性はなく、予測部分とは異なる剰余のみが圧縮ストリーム内に符号化される。これは、ローカル領域ごとに符号化されるべき情報の量における実質的低減を提供し、以て、優れた圧縮結果をもたらす。
[0093]相関230の演算されたレベルがしきい値240よりも低いとき、以前のローカル領域のコンテンツは、現在のローカル領域データに類似するものとされない場合があり、予測の品質は劣化し始め得、極端な場合、現在のローカル領域データ内にランダム予測を注入することによって、ノイズおよびわずかな不安定性を追加することを結果としてもたらし得る。発生を防ぐため、比較器250出力は、予測因子をオフにし、マルチプレクサ270出力をゼロへ強いることによって、現在のローカル領域データに対するいかなる調節も無効にする。次いで、エンコーダは、既存の特許に開示されるように、元の未修正の現在のローカル領域データを代わりに使用する。エンコーダ290は、例えば、ウェーブレット圧縮、LZW圧縮、DCT圧縮、ハフマン符号化などの任意の他の圧縮技術と共に使用されるようなPMまたはPCR圧縮を含む圧縮アルゴリズム(無損失または不可逆のいずれか)など、任意の適切な符号化を使用し得る。圧縮の形態の一例は、米国特許第9385751号明細書に説明され、その全体が参照により本明細書に組み込まれる。
[0094]述べられるように、バッファは、循環バッファであってもよい。循環バッファは、手順の開始時にゼロデータに初期化され得る。これは、演算された相関レベル230がしきい値240を下回ること、およびエンコーダが以前のローカル領域データが利用可能になるまで未修正の最初のいくつかのローカル領域データを使用すること(最初のいくつかの現在のローカル領域については、以前のローカル領域データがまだ利用可能でないため)を確実にし得る。
[0095]図2~図5は、現在のローカル領域系列データと以前のローカル領域データとの相関のレベルを決定するプロセスの一例、および本明細書に開示されるように、圧縮における著しい改善を提供するために、符号化ストリーム内の情報の量を実質的に低減するための予測因子の使用を例証する。質量分析データが、これらの例において方法を例証するために使用されるが、これらの技術および装置がこれらの方法に限定されないことを理解されたい。実際、これらの方法は、本明細書に説明されるように、他の多次元順序付き系列データセットのために使用され得る。
[0096]図2は、インデックス付き系列データ403および404のセットを示す、質量分析データの「典型的な」現在のローカル領域データの一例を単に示し、各インデックス付きデータは、インデックス(n)、この例では質量/電荷比m/zである第1の変数(x)、およびこの例では所与のm/zを有するイオンフラグメントの強度存在度数である第2の変数(y)からなる。図2内の水平軸は、質量/電荷比であり、垂直軸は、強度イオンフラグメント数である。
[0097]図2に示されるように、プロット420は、質量分光計によって記録される典型的な順序付き系列データを示す。記録されたデータは、質量対電荷比(m/z)の関数としての荷電イオンの相対的な強度存在度の、1つのスペクトルの一部分を表す。この図内の水平軸は、質量/電荷比(m/z)であり、垂直軸は、観察された強度値、または相対的なイオン存在度を示す。本明細書に説明されるように圧縮され得る順序付きの系列データの他の例は、顕微鏡データ、多重化蛍光顕微鏡データ、および、水平軸が時間軸、または、場合によっては、波長もしくは周波数軸である任意のデータを含み得る(が、これらに限定されない)。
[0098]典型的な質量分析実験において、試料(固体、液体、または気体であり得る)、例えば、一片の細胞組織または一滴の血液は、電子流または他の手段によって蒸発し、その結果として、試料がイオン化され、電磁場が印加されて、荷電イオンを加速させ、それらの質量/電荷比に従ってそれらを分離させる。同じ質量/電荷比のイオンは、同じ偏向量を経験することになる。最後に、イオンは、荷電粒子を検出することができる検出器によって検出される。結果は、通常、質量/電荷比の関数としての検出されたイオンの相対的な存在度のスペクトルとして表示される。次いで、試料の分子組成が、既知の元素質量と組み合わせて、特徴的なフラグメンテーションパターンから識別され得る。
[0099]各実験において、質量分光計は、多くのそのようなスペクトルを経時的に生成することができ、結果として大量のデータをもたらす。プロファイルモードでの典型的な出力は、1つの単一実験から数十あるいは数百GBものデータを容易に超えることができる(1GB=1024×1024Kバイト)。質量分光計は、遺伝子およびアミノ酸ペプチド鎖を配列するため、ならびに化合物の分子組成を決定するため、ならびにがんにおけるグリコシル化の変化などの異常疾患パターンを識別するため、ゲノミクスおよびプロテオミクスにおいて使用され得る。
[0100]各質量分光計スキャンは、順序付き系列データからなり、データは、特定のm/z位置における変化する強度の一連のピーク403および404からなる。420におけるピークのシーケンスの各々は、一対の倍精度浮動小数点数(x,y)からなり、y値は、観察された強度存在度、または特定のピークの振幅であり、x値は、観察された質量/電荷比m/zである。例えば、一対の倍精度浮動小数点数(341.2,160.0)によって表されるように、第2のピークの強度存在度は、約160.0であり、約341.2m/zの質量/電荷比において観察される。荷電イオンは、イオントラップに閉じ込められ、特定の時間に放出され、その際、それらは、電磁場の影響下で検出器の方へ進み、経時的に一連のm/zおよびイオン存在度値として観察される。メタデータおよび実験セットアップ情報を除き、記録されるほぼすべてのデータは、インデックス付きの対の倍精度浮動小数点数のシーケンスからなる。
[0101]質量分析データの各スキャンは、(x,y)倍精度ピークの可変数からなり、機器は、通常、目的とする所与の最小および最大m/z値の間、例えば、m/z=100~m/z=5000ダルトンの、質量対電荷値の所与の範囲内のピークを記録するようにプログラムされる。最小および最大m/z値は、通常、同じレベルスペクトルに属するすべてのスキャンについて変化しないままである。最小m/z値よりも低い、または最大m/z値よりも大きいm/z値を伴う、所与の質量対電荷範囲外のいかなるピークも、破棄される。
[0102]スキャン範囲全体(例えば、m/z=100~m/z=5000ダルトン)は、次いで、N個の重複または非重複ローカル領域へと分割され得、スキャンの一部分を表す各ローカル領域は、一度に1つ、順次処置される。例えば、100~5000ダルトンの範囲全体は、各々700ダルトンの範囲を有する7つの非重複ローカル領域へと分割され得る。上で述べられるように、これらの異なる重複または非重複領域の数(N)および/またはサイズは、任意の適切な様式で設定され得、また、例えば、範囲のサイズ、あるいは、予め決定される、ユーザ定義の、および/または自動的もしくは半自動的に調節する数および/またはサイズに基づき得る。図2内のプロット420は、100~800ダルトンの質量/電荷比の範囲を有する、所与のスキャンの第1のローカル領域からのデータの例を示す。
[0103]この例では、100~5000ダルトンの質量/電荷比範囲全体は、各々が700ダルトン質量/電荷比の範囲スパンを有する、7つの非重複ローカル領域からなる。しかしながら、実際には、後続のローカル領域間にいくらかの重複を有することが望ましい場合があり、各ローカル領域のスパンは、5%から最大50%程度の重複で、両側において特定の量だけ、例えば、両側において100~150ダルトンだけ延長される。重複は、ローカル領域境界に沿ったアーチファクトを作成することなく、ローカル領域間のスムーズな遷移を提供し得る。加えて、重複は、著しく高い強度ピークがちょうどローカル領域境界に位置するときなど、極限ケースを除外するのに有用であり得、極限ケースでは、小さい丸み誤差さえもローカル領域境界の反対側をまたいで位置をシフトし得、故に、それは現在の領域に常に一定して含まれるわけではなく、そのことが、予測になんらかの不安定性をもたらし得る。したがって、しばしば、不安定性および小さいアーチファクトを防ぐためには、ローカル領域スパンを両側で延長することによって、いくらかの重複を含むことが好ましい。
[0104]図3内のプロット410は、現在のスキャンデータの前の直近の時間において機器によって捕捉される、対応する以前のスキャンデータの、100~800ダルトンの質量/電荷比の範囲を有する、第1のローカル領域データの例を示す。インデックス付き系列データ401および402のセットを含む対応する以前のローカル領域データの例を示す図3において、各インデックス付きデータは、インデックス(n)、第1の変数(x)(質量/電荷比m/z)、および第2の変数(y)(所与のm/zを有するイオンフラグメントの強度存在度数)を含む。水平軸は、質量/電荷比であり、垂直軸は、強度イオンフラグメント数である。現在のスキャンおよび以前のスキャンは時間的に密接して取られるため、イオン含有量は、ある程度類似している可能性が高く、共通して少なくともいくつかの類似ピークを有する可能性が高い。プロット410データは、特定のm/z位置における変化する強度の一連のピーク401および402からなる。
[0105]図2および図3のピークを比較すると、図2の現在のローカル領域内の一連の404ピークが、図3の以前のローカル領域内の一連のピーク402に類似していることを容易に認めることができる。ピークは、ほぼ同じm/z位置(機器許容レベル以内、これは、特定の機器において1ppmまで非常に正確であり得る)、および類似の強度パターンを有するように見え、強度は、典型的には、m/zよりも精度が低い。加えて、現在のローカル領域420内には多くのピーク403、および以前のローカル領域410内には他のピーク401が存在し、これらは明らかに整列しない。無相関のピークが互いの1ppm質量/電荷比内にたまたま入る可能性は極端に小さい。
[0106]一連のピーク402および404の間の一致のさらなる確認は、各ピーク連続内のピークの間隔および数によって得られ得る。同位体連続では、後続のピーク間の間隔は、ほぼ一定であり、分子の電荷状態を示す。ピークの数および同位体ピークの強度分布は、一般的に、観察された分子の元素組成に基づくavergineモデルに従う。故に、同じ全体的な質量、間隔、および強度分布パターンを有する一連のピーク402および404の類似性は、同じ分子が両方のスキャンにおいて観察されるという強い兆候を提供する。
[0107]相関のレベルは、現在と以前のローカル領域との間に存在する一連の類似ピークから演算され得る。例えば、ピーク402および404は、ピークの大半が、(1)機器精度限界以内で、ほぼ同じ質量/電荷比m/z、(2)後続のピーク間のほぼ等しい間隔から決定されるような同じ電荷状態、および(3)avergineモデルに一致する類似のピーク強度存在度分布、のうちの1つまたは複数を有する場合に、類似とみなされる。加えて、検討中のピークの各々は、ランダムな低強度ノイズピークに対する誤トリガーを防ぐために、機器信号対ノイズフロアを十分に上回る著しい強度のものでなければならない。これらの因子の組み合わせは、別個の同位体分解されたパターンと一緒に、相関レベルのロバストかつ非常に信頼性の高い尺度を提供し得る。他のシステムにおいて、相関は、強度、波長、相対的な間隔/位置などの類似の特徴に基づき得る。
[0108]現在と1つまたは複数の以前のローカル領域との相関の結果として生じるレベルは、次いで、しきい値と比較され得る。しきい値は、予め決定され得るか、計算され得る。相関のレベルがしきい値よりも大きいか、これに等しい場合、予測因子が、以前のローカル領域データに基づいて、現在のローカル領域データを調節するために使用されて、現在のデータを符号化する前に情報の量を低減する。そうではなく、相関のレベルがしきい値よりも小さい場合、予測は使用されず、現在のローカル領域データは、調節なしに直接符号化されるが、それは、低い相関レベルが関連の弱いピークを示し得るためであり、これは、確実に予測されるものとされない場合があり、おそらくは、より多くのノイズを追加し、圧縮を低減するという結果をもたらす。相関レベルしきい値は、しきい値を超えるときに著しい圧縮改善を確実にするように注意深く選択される。
[0109]予測因子は、相関のレベルがしきい値を満たすか、これを超えるとき、1つまたは複数の対応する以前のローカル領域データから現在のローカル領域データを予測するために使用され得る。2つ以上の対応する以前のローカル領域データの使用は、データを平均化することによってピーク信号対ノイズ比を改善し、ピーク強度における変動を低減し、概して予測品質を改善することができる。しかしながら、これは、追加のスキャンの複数の以前のローカル領域データを格納するためにより多くのメモリを必要とするという代償を伴い得る。
[0110]図4は、プロット430に示される、以前のローカル領域データから現在のローカル領域の相関部分を予測する方法の一例を例証する。
[0111]図4において、例証図は、現在のローカル領域データ410(例えば、図3に示されるような)と以前のローカル領域データ420(図2に示されるような)との相関データのセットを示す。図2内のピーク404など、データのうちのいくつかのみが、図3内のピーク402と相関する。図2および図3内の他の無相関ピーク403および401は破棄されている。相関したピークは、例えば、図2~図4に示されるMSデータにおいて、共通して特定の特性を有さなければならず、相関したピークは、(1)機器精度以内で、ほぼ同じ質量/電荷比m/z値、(2)特定の電荷状態を確認する、後続のピーク間のほぼ等しい間隔、および(3)avergineモデルに概して従うべきである観察された強度分布を示す。データ402は、単に例証の目的のために、データ404から離れてわずかにシフトして描写されるが、実際には、ピーク402は、典型的に約1ppmの機器m/z精度許容以内で、404のほぼ上に位置することに留意されたい。
[0112]図4内のプロット430に示されるように、高レベルの相関402および404を有するピークのみが、以前および現在のローカル領域データからそれぞれ保持される。図3の以前のローカル領域データまたは図2の現在のローカル領域データのいずれかからのすべての無相関ピーク401および403は、破棄されている。予測因子は、相関した以前のローカル領域ピークを、相関した現在のローカル領域ピークのセットに一致するように、すなわちこれを予測するように、できる限り近くに持ってくるために最適倍率を計算する。個々のピーク強度は、それほど正確ではなく、一般的にはスキャン間である程度逸脱し、すべての高相関ピークをまとめて完璧に整列させることは、一般的には不可能であるということに留意されたい。
[0113]いくつかの変形において、最適倍率は、(1)高相関ピーク強度のうちの少なくとも1つに一致すると同時に、(2)すべての他の高相関ピーク強度の間の差の合計を最小限にし、(3)個々の高相関ピーク強度差がゼロより大きいか、これに等しくなければならないことを確実にするように選択され得る。いくつかの変形において、倍率は、すべての他の高相関ピーク強度間の差の合計を最小限にするように選択され得る。いくつかの変形において、倍率は、すべての他の高相関ピーク強度の間の差の合計を最小限にし、かつ、各々個々の高相関ピーク強度差がゼロより大きいか、これに等しくなければならないことを確実にするように選択され得る。
[0114]1つの例による予測は、図4のプロット430に例証される。述べられるように、高相関ピークのみが示される。現在のローカル領域の相関ピーク404は、スケーリングされずに、図2と全く同じように、実線で示される。予測因子は、点線で示される以前の高相関ローカル領域ピーク402(図3)を、現在の404ピークにできる限り一致するようにスケーリングする。この例における最適倍率は、左から3番目の402ピークが、対応する現在の第3の404ピーク強度と同じ高さにスケーリングされるときである。左から1番目、2番目、および4番目の他の402ピークは、第3のピークと同じ量だけスケーリングされるが、一般に、それらの対応する404ピーク強度と正確には一致しない可能性が高い。プロット430内の404および402ピークは、例証の目的のために意図的に横並びに描写されるが、実際には、それらは、約1ppmの機器精度許容以内で、互いに極めて近接している可能性が高いということに留意されたい。
[0115]最適しきい値は、この例では左から3番目のピークの強度を一致させることによって獲得され得ることがプロット430から理解されるものとする。すべての他の402強度(例えば、左から1番目、2番目、および4番目のピーク)は、他のスケーリングされた402ピークの各々について、それらの対応する404ピーク強度よりも低い。これは、404ピークと対応するスケーリングされた402ピークとの間の個々の差が常に、条件(3)に従って、ゼロよりも大きいか、またはこれに等しいことを確実にする。本手順および/または装置が、この例では左から3番目以外のいかなるピークの強度も一致させる場合、第3の402ピークは、その対応する404ピークよりも高くなるようにスケーリングされ、少なくとも、第3の404ピークと対応するスケーリングされた402ピークとの差は、マイナスになり、以て、本方法における条件(3)を無効にする。条件(3)は、質量分析強度データが、典型的にはマイナスになることができないプラスのイオン存在度数を表すため、予測剰余が、予測強度の減算後、プラスに留まることを確実にするのに有用である。
[0116]データがプラスまたはマイナスのいずれかであることが許される、データが浮動小数点表示を使用する顕微鏡データである別の変形においては、より厳しい最適倍率が、上記の条件(1)および(3)を除去すること、ならびに個々の404ピーク強度および対応するスケーリングされた402ピーク強度との差が、プラスの値またはマイナスの値のいずれかを前提とすることを可能にすることによって見出され得る。
[0117]故に、予測因子は、以前のローカル領域内の相関したピーク402の強度に基づいて、現在のローカル領域404内の高相関ピークのサブセットを予測するために単一の倍率を利用し得る。最適倍率は、解凍中の使用のため、各ローカル領域につき単一の値で、圧縮ストリーム内へ符号化され得る。ローカル領域データは、次いで、符号化の前に、予測された相関したピーク402を現在のローカルデータから減算することによって調節される。この結果の例は、図5のプロット440に示される。
[0118]図5は、図4に示されるデータを使用した予測される相関データ430の減算後の、調節された現在のローカル領域データの例を示す。調節されたデータは、図4に示されるように元の現在のローカル領域ピーク404からの予測される相関した以前のピーク402の減算後の、剰余405からなる。非相関の現在のローカル領域ピーク403は、調節されない。調節の結果は、点線450によって強調され、図2および図5を比較することによって見ることができるような、はるかにより小さい剰余405との高強度ピーク404の置き換えである。調節されたデータは、次いで、任意の適切な圧縮技術を使用して圧縮ストリーム内へ符号化され得る。例えば、「PMI圧縮」について説明する米国特許第9385751号明細書を参照されたい。
[0119]減算後のローカル領域データは、無相関ローカル領域ピーク403(図2)、および、以前のローカル領域データに基づいて予測強度を減算した後に残っている相関ピークの剰余強度405を含み得る。この差は、プロット420(図2)内の元のローカル領域データを図5のプロット440内の調節されたローカル領域データと比較することによって明らかになる。図2内の背の高い高強度ピーク404の群は、楕円450によって強調されるような、強度剰余405のかなりより小さい群によって置き換えられている。強度の大きさの差は、典型的な質量分析データにおいては最大数桁に及ぶほど大きい場合がある。剰余405強度の結果として生じる大きさは、予測精度に依存し、これは、このタイプのデータにはかなりよくあるように、分子が機器上で繰り返しスキャンされるのにかなり効果的であり得る。
[0120]この例では、予測剰余405は、元の高強度ピーク404ではなく、圧縮ストリーム内へ符号化されている。予測が効果的であるとき、405ピークの結果として生じる強度は、非常に小さく、これが圧縮における著しい改善につながる。
[0121]解凍中、以前のローカル領域データは、現在の領域データが処理される前に、すでに復元されている。同一の予測因子が、次いで、復号された倍率によって以前のローカル領域の相関ピークをスケーリングし、それらを現在のローカル領域データに追加し直すために使用され得る。調節された現在のローカル領域データは、次いで、403ピークおよび405剰余からなる調節された現在のローカル領域データを復元するために、解凍される。以前のローカル領域のスケーリングされた予測ピークは、次いで、元のローカル領域データ420(例えば、図2に示されるような)を復元するために、調節された現在のローカル領域データに追加され得る。
[0122]所与のしきい値よりも小さいことが示されるような、相関のレベルが弱い場合、予測は使用されず、ローカル領域データは、データを調節することなく、そのまま符号化される。
[0123]図6は、経時的に典型的な質量分析データの3次元溶出プロファイルを示す。各イオンフラグメントは、典型的な釣鐘型の曲線を呈する。強度は、開始時は低く、その後次第に上昇して頂点に達し、その後次第にゼロまで下がる。時間分および頂点強度高さは、フラグメント組成に基づいて変化し得る。検出器までの経路上の共溶出イオンフラグメントの間には何らかの重複が存在し得る。
[0124]図6を参照すると、プロット510は、液体クロマトグラフィを用いた質量分析機器内のイオンフラグメントの典型的な溶出プロファイルを例証する。フラグメント化されたイオンは、イオントラップ内に保持され、それらの質量/電荷比m/zに従って検出器の方へ特定の順に放出される。例えば、まずイオンフラグメント501がやがて放出されることになり、その後にイオンフラグメント502、次いで503が続き、最終的に504が、プロット510において最後に放出される。
[0125]各イオンフラグメントの典型的な溶出プロファイルは、近似ガウス曲線である。観察された強度は、開始時は低く、その後、より多くの分子がフラグメント化されるにつれて次第に増加し、溶出プロファイルの中央において頂点に達し、次いで減少して戻る。各分子501~504の時間分および頂点強度は、各分子の組成に基づいて様々であり得る。任意の所与の時間点において検出器によって観察されるような結合信号は、図7のプロット520に示される。
[0126]図7は、全イオン電流(TIC)としても知られる、経時的な、質量/電荷比m/z軸上での統合後の、図6に示されるものなどの典型的な質量分析データの観察された2次元溶出プロファイルを示す。全イオン電流は、溶出プロファイルエンベロープ、任意の所与の時間における個々の曲線501~504の最大値、に比例する。イオンが帯電しているため、検出器電流の直接測定は、典型的には、溶出エンベロープに比例する。溶出エンベロープの最小点は、1つのイオンフラグメント種から別のものへのクロスオーバー遷移時点t2、t3、t4を規定する。
[0127]図7のプロット520から理解され得るように、1つのタイプのイオンフラグメントが、大半の時間にわたって優勢である。イオンフラグメント501は、t1からt2まで優勢である。最初、イオンフラグメント501のみの純粋な濃度が存在するが、終了時間t2に向かって、イオンフラグメント502の量が次第に増加し、時間t2において、それはイオンフラグメント501に等しい量に達し、501はもはや優位に立たない。イオンフラグメント502は、時間t2からt3まで優位に立つ、というように続く。各イオン群は、イオン群の頂点近くで強力に優位に立ち、時間t1、t2、t3、およびt4においては、遷移点により近い混合スペクトルの度合いを強めていく。
[0128]典型的な質量分光計ランは、1~2時間かかるが、任意の特定のイオンフラグメント501~504の典型的な溶出持続時間は、実験および目的の分子の特定の材料組成に応じて数分から最大25分程続き得る。ますます、質量分析機器は、感度または分解能を失うことなく、1秒あたり100スキャンよりも高い、高速でスキャンを捕捉することができる。これは、後続スキャンが、溶出イオンフラグメントが1つのタイプから別のタイプへ遷移する間のいくつかの小間隔を除き、大部分は、機器ラン全体を通じて非常に類似している可能性が高いことを意味する。本明細書に説明される提案された方法および装置は、以前のデータから相関した現在のローカル領域データを高精度で首尾よく予測し、各スキャンを独立して圧縮することによって可能であるものよりもはるかに高い圧縮を達成し得る。故に、各スキャンの独立圧縮の場合にあるように、各後続スキャンの同様のコンテンツを何度も繰り返し符号化することに多くのビットを費やす代わりに、相関部分は、開始時に一度のみ圧縮され得、後続スキャンにおいては、剰余変化のみが、存在する場合に、無相関ピークと一緒に、圧縮ストリーム内へ符号化され、本明細書に説明される方法および装置による圧縮における著しい増加をもたらす。
[0129]本明細書に説明される方法(ユーザインタフェースを含む)のいずれかは、ソフトウェア、ハードウェア、またはファームウェアとして実装され得、プロセッサ(例えば、コンピュータ、タブレット、スマートフォンなど)によって実行され得る命令のセットを格納する非一時的なコンピュータ可読媒体として説明され得、該命令は、プロセッサによって実行されるとき、プロセッサに、表示すること、ユーザと通信すること、分析すること、パラメータ(タイミング、周波数、強度などを含む)を修正すること、決定すること、警告すること、または同様のことを含むが、これらに限定されないステップのいずれかを制御実施させる。
[0130]図8A~8Bは、本明細書に説明されるように圧縮されるデータ(図8B)と比較した未圧縮データ(図8A)からの撮像(病理組織)データの横並びの比較の一例を例証する。この例では、画像の小さい部分が、本技術の高忠実度を示すために、元々捕捉された画像と比較して、40xの倍率で示される。2つの画像は、この高倍率レベルでさえ、視覚的に区別不可能である。元の(図8A)ファイルサイズは、およそ1764MB(メガバイト)であり、例えば、15.9MBの圧縮ファイルサイズへと、本明細書に説明されるように圧縮された(111:1の圧縮比)。例えば、元のデータは、撮像データセット(多次元順序付き系列データである)をまず複数のローカル領域へと分割することによって、本明細書に説明されるように圧縮され得る。この例では、ローカル領域は、部分領域であり得る(例えば、正方形または矩形部分領域であるが、任意の2次元形状が使用され得る)。これらの領域は、重複または非重複であり得る。各ローカル領域内の撮像(例えば、画素)データは、画像の所与のローカル領域内のインデックス(この場合、x、yインデックスなど、空間インデックス)が使用され得る)と、インデックス(画素強度、輝度、色など)によってインデックス化される1つまたは複数の変数とを含む少なくとも1つのインデックス付きデータセットを含む。
[0131]各ローカル領域は、データセットが処理される際に、現在のローカル領域を、一度に1つのローカル領域、処理するために順に(例えば、左から右、上から下などのラスタ順、または任意の他の一貫性のある順序)処理され得る。本明細書に説明されるように、ローカル領域ごとに、本方法/装置は、現在のローカル領域を識別し、次いで、この現在のローカル領域を識別し、以前の現在のローカル領域と比較し得る(最初の、または最初のいくつかの始めの現在のローカル領域は調節されないままであってもよい)。例えば、以前の現在のローカル領域は、左から右、上から下へ処理するとき、例えば、画像データセット内の現在のローカル領域の上および/または左の、すでに処理されたオフセット領域に対応する領域であり得る。異なる順序またはパターンで処理する場合、以前のローカル領域は、すでに処理された異なる部分から選択され得る。いくつかの変形において、2つ以上の以前のローカル領域は、比較され得るか、異なる順であり得る。例えば、いくつかの変形において、2つ以上の以前のローカル領域は、信号対ノイズ比を改善するために、組み合わされる(例えば、平均化される)などであり得る。現在のローカル領域は、(1つまたは複数の)以前のローカル領域(またはその組み合わせ)と比較され得、相関レベルが、この比較について決定(例えば、演算)され得る。例えば、異なる、および場合によっては部分的に重複する)領域間の対応するインデックス領域(例えば、x、y値)は比較され得、値(例えば、相関レベル)が決定され得る。相関レベルは、ローカル領域内の各対応する領域(例えば、x、y位置などのインデックス)の強度を比較することによって決定され得る。値が、1つまたは複数の変数において、インデックス値について高相関される場合、相関レベルは、設定量だけ増大され得る。
[0132]この演算された相関レベルは、次いで、現在のローカル領域のデータをさらに処理するために使用され得る。例えば、この比較/相関レベルまたは値が、予め設定され得るか調節可能であり得るしきい値を超える場合、予測因子が、識別され、現在のローカル領域を修正するために使用され得る。予測因子は、現在のローカル領域データおよび少なくとも1つの以前のローカル領域データの間で、インデックスの関数として1つまたは複数の変数の各々を計算し得る。例えば、予測因子は、以前のローカル領域内に十分に高いレベルの相関を有する現在のローカル領域のうちのスケーリングされたバージョンの領域(インデックス値)であり得る。各インデックスにおける値は、0(例えば、対応しない領域の場合)、または以前のローカル領域からの対応するインデックス付き値のいくらかスケーリングされた値であり得る。スケーリングされた値は、ローカル領域全体に基づいてスケーリングされ得、インデックス付きピーク(例えば、画像データセット内の、画素強度など)のうちの1つの最も近い予測値に対応する値へスケーリングされ得る。
[0133]現在のローカル領域は、このスケーリングされた予測因子を使用して調節され得る。例えば、現在のローカル領域は、相関のレベル(例えば、現在のローカル領域データと以前のローカル領域データとの)がしきい値を超えるとき、以前のローカル領域データに基づいて、スケーリングされた予測相関データを減算するために、現在のローカル領域データを調節することによって処理され得る。
[0134]修正された(例えば、調節された)現在のローカル領域は、次いで、PMIもしくはPCRエンコーダなど、エンコーダによって、または標準ZIPもしくは他の圧縮エンコーダを使用することによって、符号化され得る。現在のローカル領域データは、倍率および/または予測因子に関連した他のデータと一緒に、圧縮ストリーム内へ符号化され得る。
[0135]画像は、圧縮データを復号し、復元されるべきローカル領域を(処理/圧縮されたデータから)識別し、データセットの部分を修正するために使用される予測因子を(処理/圧縮されたデータから)識別し、スケーリングされた予測因子を復元されるべきローカル領域へと追加し直して復元されたローカル領域を形成することによって、(図8Bに示されるように)解凍および復元され得る。図9は、本明細書に説明されるような圧縮されるデータセットのすべてまたは一部分を復元するための方法(および装置)の一例を概略的に例証する。
[0136]図9において、圧縮データ905は、圧縮入力データ、ならびに予測因子データ(例えば、倍率975または予測因子倍率)から、圧縮データから、調節されたローカル領域情報910を復号することによって、解凍され得る。復元すべき調節されたローカル領域および予測因子データの両方が、データを符号化するために使用されるエンコードのタイプ(図1を参照)に対応するデコーダ907を使用して復号され得る。故に、デコーダは、復元されるべき復号された現在のローカル領域データ910、および復元されるべきこの標的ローカル領域に対応する復号された予測因子倍率975を提供し得る。図1において圧縮するための説明される手順を逆にすることによって、予測因子および復号されたローカル領域は、次いで、例えば、出力、表示、保存などされ得る復元された標的(「復元されたローカル」)領域データ990を提供するために一緒に追加され得る980。このプロセスは、ファイル全体を解凍および復元するために反復的に使用され得、ならびに/またはそれは、データセットの一部分を復元するためだけに使用され得る。
[0137]ローカル領域ごとに順に、圧縮データは、復号され、図5に示される調節されたローカル領域データを復元するために適用される。最適倍率975もまた、圧縮データから取得される。各ローカル領域は、データセットが処理される際に、現在のローカル領域を、一度に1つのローカル領域、処理するために順に(例えば、左から右、上から下などのラスタ順、または任意の他の一貫性のある順序)処理され得る。本明細書に説明されるように、ローカル領域ごとに、本方法/装置は、現在のローカル領域を識別し、次いで、この現在のローカル領域を識別し、以前の(すでに処理された)ローカル領域とおよび比較し得る。例えば、以前のローカル領域は、左から右、上から下へ処理するとき、例えば、画像データセット内の現在のローカル領域の上および/または左の、すでに処理されたオフセット領域に対応する領域であり得る。異なる順序またはパターンで処理する場合、以前のローカル領域は、すでに処理された異なる部分から選択され得る。いくつかの変形において、2つ以上の以前のローカル領域は、比較され得るか、または異なる順であり得る。例えば、いくつかの変形において、2つ以上の以前のローカル領域は、信号対ノイズ比を改善するために、組み合わされる(例えば、平均化される)などであり得る。
[0138]現在のローカル領域910は、本明細書に開示されるように調節されている場合のあるピークのサブセットを識別するために、(1つまたは複数の)以前のローカル領域920(または、その組み合わせ)と比較され得る。識別&予測モジュール960は、剰余ピークm/z位置(図5内のピーク405)に一致する以前の領域データ内の比較的高い強度候補ピークのシーケンス(図3内のピーク402)を求めて、ローカルおよび以前の領域データのコンテンツを検索する。識別は、質量分析機器の高いm/z精度、典型的には1ppm許容にまで及ぶ精度を活用することによって、高い信頼性を伴って行われ得る。識別されたピークは、剰余位置に一致しなければならず、後続のピーク間の均一な間隔は、以前のローカル領域データ内のピークの対応する電荷状態に一致しなければならない。加えて、以前のローカル領域内のピークの強度は、本明細書にすでに開示されるような予想されるavergine分布に一致しなければならない。
[0139]現在の調節された領域データ内のm/z剰余位置に一致する以前のローカル領域内の候補ピークシーケンスの識別がモジュール960によって行われると、同一の予測因子(符号化中に使用されるものと)が、以前のローカル領域データ内の識別されたピークに基づいてローカル領域ピークを予測するために適用される。以前のローカル領域内の識別されたピークの各々は、圧縮ストリームデータから抽出および復号される最適倍率によってスケーリングされる。スケーリングされたピーク965は、図9に示される。
[0140]ピーク965の予測したスケーリングされたシーケンスは、マルチプレクサ970および加算ノード980を通じて、調節されたローカル領域データ910に追加される。予測したスケーリングされたピーク(予測ローカル領域ピーク、図4内の402)を調節されたローカル剰余(調節されたローカル領域データ、図5内のピーク405)に追加することによって、元のローカルデータ(図2内のピーク404)は、元のローカル領域値へと効果的に復元される。復元されたローカル領域データは、これより加算ノード出力990において利用可能であり、復元されたローカル領域データが実際に正しくかつ正確であることを検証するために相関レベルモジュール930に提供される。
[0141]復元された現在のローカル領域データ990は、(1つまたは複数の)以前のローカル領域(またはその組み合わせ)と比較され得、相関レベルが、この比較について決定(例えば、演算)され得る。例えば、異なる、および場合によっては部分的に重複する)領域間の対応するインデックス領域(例えば、x、y値)が比較され得、値(例えば、相関レベル)が決定され得る。相関レベルは、ローカル領域内の各対応する領域(例えば、x、y位置などのインデックス)の強度を比較することによって決定され得る。値が、1つまたは複数の変数において、インデックス値について高相関される場合、相関レベルは、設定量だけ増大され得る。
[0142]演算された相関レベルは、次いで、現在のローカル領域のデータを検証するために使用され得る。例えば、この比較/相関レベルまたは値が、予め設定され得るか調節可能であり得るしきい値940を超える場合、マルチプレクサ970が、現在のローカル領域データを保持するためにオンにされ得る。しかしながら、現在のローカル領域データと以前のローカル領域データとの相関のレベルがしきい値940を下回る場合、マルチプレクサ970は、オフにされ、以て、スケーリングされたピーク補正が追加されることを無効にし、補正されていない調節されたローカル領域データ910を出力990に渡すだけである。故に、デコーダ出力990における復元されたローカル領域データは、エンコーダへの元の入力を正確に反映する(相関のレベルが設定されたしきい値を超えるとき、予測ピークピークに基づいて調節されたローカル領域データを使用するか、または相関のレベルがしきい値を下回るとき、未調節のローカルデータを使用することによって)。
[0143]ローカル領域データ990は、故に、高忠実度で復元され、閲覧または格納のため、または任意の後続の下流処理のために利用可能にされる。
[0144]例えば、図10は、どのようにして本明細書に説明される圧縮方法および装置が、圧縮データストリームからの直接(例えば、ランダム)アクセスを提供するために使用され得るかを例証する。例えば、図10において、大きいデータセット(例えば、示される大きい画像などの画像データ)は、圧縮され、データストリーム(圧縮されたビットストリーム)内へマッピングされ得る。この大きいデータセットのほんの一部分が分析または操作され得る。例えば、ある領域が、データセット全体を解凍する必要なしに抽出され得、特定の1つまたは複数の標的領域のみの処理を可能にする。これは、特定の領域へのアクセスを有するためにはデータセット全体(例えば、画像)を解凍する必要がある他の圧縮技術と対照的である。目的の画像の部分を含むローカル領域のみが復元される必要があり、画像の残りは解凍されない。
[0145]図11A~11Bは、本明細書に説明されるように圧縮され得るデータセットの別の例を例証する。この例では、データセットは、多重化蛍光データセットであり、(5つの異なるバイオマーカ染料の)5つの色移りを示す。疎の多次元順序付き系列データセット全体が、本明細書に説明されるように圧縮され得、領域は、15%~1600%のズームから、詳細の著しい損失なしに解凍領域を拡大することを含め、復号および調査され得る。例えば、図11Aにおいて、囲まれた領域Bは、解凍され、図11Bに示されるように拡大され得る。図11Bは、15%ズームの拡大を示す。図11B内の画像の元のファイルサイズは、321MBであり、本明細書に使用される方法が、少なくとも39:1の圧縮比でこのデータセットを圧縮するために使用され得、およそ8.2MBの圧縮ファイルサイズを提供する。処理および解凍された画像領域は、元の領域と区別不可能である。例えば、この例における画素あたりの平均2乗誤差(PMSE)は、4.24e-4であり、ピーク信号対ノイズ比(PSNR)は、およそ56.25dBである。これは、JPEG(Q=90で約45dBの典型的なPSNRを有する)などの他の一般的に使用される圧縮技術と比べて非常に有利である。平均して、他の画像タイプは、同等の品質で、類似のまたはより良好な圧縮比を有しており、例えば、サイズが1GBを超える画像のデータセットは、本明細書に説明される方法および装置を使用して、150:1超(例えば、1,628MB~14.4GB未満、約154:1の比を提供する)まで圧縮された。
[0146]図12Aは、本明細書に説明されるように有利に圧縮され得る大きい撮像データセットの別の例を例証する。図12Aに示される元の画像は、高圧縮で標準JPEG画像圧縮技術を使用して、および本明細書に説明される方法(PMI圧縮またはPCR圧縮と称される)を使用して圧縮された。拡大下で、本明細書に説明される方法は、JPEGを含む他の既知の圧縮技術よりも著しく少ないアーチファクトおよび損失をもたらした。例えば、図12Aの画像の小さい領域を、本明細書に説明される方法を使用した圧縮および復元の後に調査し(図12Bに示される)、図12Cに示されるJPEGを使用した圧縮および復元の後の同じ領域と比較した。この比較により分かるように、図12CのJPEG圧縮は、本明細書に説明される、および図12Bに示されるように処理されるときには存在しない著しいアーチファクトをもたらした。
[0147]特徴または要素が、別の特徴または要素の「上」にあると本明細書内で言及されるとき、それは、他の特徴もしくは要素の直接上にあり得るか、または介在する特徴および/もしくは要素も存在し得る。対照的に、特徴または要素が、別の特徴または要素の「直接上」にあると言及されるとき、介在する特徴または要素は存在しない。特徴または要素が、別の特徴または要素に「接続される」、「装着される」、または「結合される」と言及されるとき、それは、他の特徴もしくは要素に直接的に接続、装着、もしくは結合され得るか、または介在する特徴もしくは要素が存在し得るということも理解されたい。対照的に、特徴または要素が、別の特徴または要素に「直接的に接続される」、「直接的に装着される」、または「直接的に結合される」と言及されるとき、介在する特徴または要素は存在しない。1つの実施形態に関して説明される、または示されるが、そのように説明される、または示される特徴および要素は、他の実施形態にも適用することができる。別の特徴に「隣接して」配設される構造または特徴に対する言及は、隣接する特徴に重複するか、またはその下にある部分を有し得るということも当業者によって理解されるものとする。
[0148]本明細書で使用される用語は、特定の実施形態のみを説明するという目的のためであり、本発明の限定であることは意図されない。例えば、本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、複数形も同様に含むことが意図されるが、文脈が明白に別のことを示す場合はその限りではない。用語「備える(compreises)」および/または「備える(comprising)」は、本明細書において使用されるとき、述べられた特徴、ステップ、動作、要素、および/または構成要素の存在を特定するが、1つまたは複数の他の特徴、ステップ、動作、要素、構成要素、および/またはその群の存在または追加を除外しないということもさらに理解されたい。本明細書で使用される場合、用語「および/または」は、関連した列挙項目のうちの1つまたは複数の任意およびすべての組み合わせを含み、「/」と短縮され得る。
[0149]「下(under)」、「下方(below)」、「より低い(lower)」、「上(over)」、「上方(upper)」、および同様のものなど、空間関連の用語は、1つの要素または特徴の、図内に例証されるような別の要素および特徴に対する関係を説明するために、説明しやすくするために本明細書で使用され得る。空間関連の用語は、図に描写される配向に加えて、使用または動作中のデバイスの異なる配向を包含することが意図されることを理解されたい。例えば、図内のデバイスが反転される場合、他の要素または特徴の「下」または「真下」として説明される要素は、他の要素または特徴の「上」に配向される。故に、例示的な用語「下」は、上および下の配向の両方を包含し得る。デバイスは、(90度回転されて、または他の配向に)別途配向され得、本明細書で使用される空間関連の記述子は、それに応じて解釈される。同様に、用語「上方に」、「下方に」、「垂直」、「水平」、および同様のものは、別途具体的に示されない限り、説明の目的のためだけに本明細書で使用される。
[0150]用語「第1の」および「第2の」は、様々な特徴/要素(ステップを含む)を説明するために本明細書で使用され得るが、これらの特徴/要素は、文脈が別途示さない限り、これらの用語によって限定されるべきではない。これらの用語は、1つの特徴/要素を別の特徴/要素と区別するために使用され得る。故に、本明細書に説明される方法および装置の教示から逸脱することなく、以下で論じられる第1の特徴/要素は、第2の特徴/要素と呼ばれてもよく、同様に、以下で論じられる第2の特徴/要素は、第1の特徴/要素と呼ばれてもよい。
[0151]本明細書および以下に続く特許請求の範囲の全体を通して、文脈が別のことを要求しない限り、用語「備える(comprise)」、ならびに「備える(comprises)」および「備える(comprising)」などの変形は、様々な構成要素が、本方法および物品(例えば、組成物、およびデバイスを含む装置、および方法)において共に連帯して用いられ得ることを意味する。例えば、用語「備える」は、任意の述べられた要素またはステップの包含を示唆するが、任意の他の要素またはステップの除外は示唆しないものと理解される。
[0152]一般に、本明細書に説明される装置および方法のいずれかは、包括的であると理解されるべきであるが、構成要素および/またはステップのすべてまたはサブセットは、代替的に、排他的であり得、様々な構成要素、ステップ、副構成要素、またはサブステップから「なる」または代替的に「本質的になる」と表現され得る。
[0153]本明細書および特許請求の範囲において、ここで使用される場合、例で使用されるものを含め、また別途明示的に記載のない限り、すべての数字は、用語「約」または「およそ」があたかも前に置かれているかのように、たとえそれらの用語が明示的に登場しないとしても、読まれ得る。表現「約」または「およそ」は、説明される値および/または位置が値および/または位置の合理的な予想範囲以内であることを示すために、大きさおよび/または位置を説明するときに使用され得る。例えば、数値は、述べられた値(または値の範囲)の+/-0.1%、述べられた値(または値の範囲)の+/-1%、述べられた値(または値の範囲)の+/-2%、述べられた値(または値の範囲)の+/-5%、述べられた値(または値の範囲)の+/-10%などである値を有し得る。本明細書に提供される任意の数値は、文脈が別途示さない限り、約またはおよそのその値を含むということも理解されるべきである。例えば、値「10」が開示される場合、「約10」も開示される。本明細書に列挙される任意の数範囲は、本明細書に組み入れられるすべての部分範囲を含むことが意図される。ある値が開示されるとき、その値「よりも小さいか、またはこれに等しい」、「その値よりも大きいか、またはこれに等しい」、および値の間の可能な範囲もまた、当業者によって理解されるように、開示されるということを理解されたい。例えば、値「X」が開示される場合、「Xよりも小さいか、またはこれに等しい」ならびに「Xよりも大きいか、またはこれに等しい」も開示される(例えば、Xが数値である場合)。本出願全体を通して、データはいくつかの異なる形式で提供されること、また、このデータは、終点および開始点、ならびにデータ点の任意の組み合わせのための範囲を表すことを理解されたい。例えば、特定のデータ点「10」および特定のデータ点「15」が開示される場合、10および15より大きい、10および15以上、10および15未満、10および15以下、ならびに10および15に等しいが、10~15と同様に、開示されるとみなされるということを理解されたい。2つの特定の単数の間の各単数も開示されるということも理解されたい。例えば、10および15が開示される場合、11、12、13、および14も開示される。
[0154]様々な例証的な実施形態が上に説明されるが、いくつかの変更のうちのいずれかが、特許請求の範囲によって説明されるような本発明の範囲から逸脱することなく、様々な実施形態に対してなされ得る。例えば、様々な説明された方法ステップが実施される順序は、多くの場合、代替の実施形態においては変更され得、また他の代替の実施形態においては、1つまたは複数の方法ステップは、まとめてスキップされ得る。様々なデバイスおよびシステム実施形態の任意選択の特徴は、一部の実施形態においては含まれ得るが、他では含まれない。したがって、先述の説明は、主に例示の目的で提供され、特許請求の範囲に明記されるような本発明の範囲を制限すると解釈されるべきではない。
[0155]本明細書に含まれる例および例証は、主題が実践され得る特定の実施形態を、限定ではなく例証の目的で示す。述べられるように、他の実施形態が、構造的および論理的置換および変更が本開示の範囲から逸脱することなくなされ得るように、利用され、またそこから派生され得る。発明の主題のそのような実施形態は、単に簡便性のため、および本出願の範囲を、実際には2つ以上が開示される場合、任意の単一の発明または発明の概念に自発的に限定することを意図せずに、用語「発明」で、個々にまたはまとめて本明細書では言及される。故に、特定の実施形態が本明細書に例証および説明されているが、同じ目的を達成するために計算される任意の構成が、示される特定の実施形態の代わりとなり得る。本開示は、様々な実施形態の任意およびすべての適応または変形を網羅することが意図される。上の実施形態の組み合わせ、および本明細書に具体的に説明されない他の実施形態は、上の説明を読む際に当業者には明白であるものとする。

Claims (31)

  1. 疎の多次元順序付き系列データを圧縮するためのコンピュータ実装方法であって、
    多次元順序付き系列データを複数のローカル領域へと分割するステップであって、各ローカル領域内の前記データは、1つまたは複数のインデックス付きデータセットを含み、各インデックス付きデータセットは、前記疎の多次元順序付き系列データの所与のローカル領域内のインデックス(n)、および前記インデックス(n)によってインデックス化される1つまたは複数の変数を含む、ステップと、
    前記インデックス(n)、現在のローカル領域データ、および少なくとも1つの以前のローカル領域データの関数として、前記1つまたは複数の変数の各々を計算する予測因子を識別するステップと、
    しきい値を超える相関のレベルが前記現在のローカル領域データと前記以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、少なくとも1つの以前のローカル領域データに基づいて減算することにより、前記現在のローカル領域データを調節するステップと、
    最適倍率を含む、前記調節された現在のローカル領域データを、圧縮ストリーム内へ符号化するステップと、
    を含む、コンピュータ実装方法。
  2. 前記多次元順序付き系列データは、分光データである、請求項1に記載の方法。
  3. 分割するステップは、前記データを複数の重複ローカル領域へと分割することを含む、請求項1に記載の方法。
  4. 分割するステップは、前記データを複数の非重複ローカル領域へと分割することを含む、請求項1に記載の方法。
  5. 前記現在のローカル領域データと前記以前のローカル領域データとの相関レベルを演算することをさらに含む、請求項1に記載の方法。
  6. 前記相関レベルは、前記現在のローカル領域データと前記少なくとも1つの以前のローカル領域データとの間に存在する一連の類似ピークから演算される、請求項5に記載の方法。
  7. 前記一連の類似ピークは、前記一連の類似ピークからのピークの大半が、ほぼ同じ質量/電荷比、後続のピーク間の間隔から決定されるような、ほぼ同じ電荷状態、およびavergineモデルに一致する類似のピーク強度存在度分布のうちの1つまたは複数を有する場合に、類似とみなされる、請求項6に記載の方法。
  8. エンコーダが、前記少なくとも1つの以前のローカル領域データを識別する識別子を符号化する、請求項1に記載の方法。
  9. 前記複数のローカル領域を順番に処理するステップをさらに含み、前記予測因子を識別するステップ、前記現在のローカル領域データを調節するステップ、および前記調節された現在のローカル領域データを符号化するステップは、ローカル領域ごとに前記順番に繰り返される、請求項1に記載の方法。
  10. 前記順番は、スキャン順またはラスタースキャン順である、請求項9に記載の方法。
  11. 前記順番は、最も高い相関レベルを有する順番から選択される、請求項9に記載の方法。
  12. 疎の多次元順序付き系列データを圧縮するためのコンピュータ実装方法であって、
    病理組織撮像データを含む多次元順序付き系列データを複数のローカル領域へと分割するステップであって、各ローカル領域内の前記データは、1つまたは複数のインデックス付きデータセットを含み、各インデックス付きデータセットは、病理組織撮像データの所与のローカル領域内の空間インデックス(n)、および前記空間インデックス(n)によってインデックス化される1つまたは複数の変数を含む、ステップと、
    前記空間インデックス(n)、現在のローカル領域データ、および少なくとも1つの以前のローカル領域データの関数として、前記1つまたは複数の変数の各々を計算する予測因子を識別するステップ、
    しきい値を超える相関のレベルが前記現在のローカル領域データと前記以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、前記少なくとも1つの以前のローカル領域データに基づいて減算することによって、前記現在のローカル領域データを調節するステップ、ならびに
    最適倍率を含む前記調節された現在のローカル領域データを、圧縮ストリーム内へ符号化するステップ
    によって前記複数のローカル領域を順番に処理するステップと、
    を含む、コンピュータ実装方法。
  13. 疎の多次元順序付き系列データを圧縮するためのシステムであって、前記システムは、命令が格納された非一時的なコンピュータ可読媒体を備え、前記命令は、プロセッサによって実行されるとき、前記プロセッサに、
    多次元順序付き系列データを複数のローカル領域へと分割することであって、各ローカル領域内の前記データは、1つまたは複数のインデックス付きデータセットを含み、各インデックス付きデータセットは、前記疎の多次元順序付き系列データの所与のローカル領域内のインデックス(n)、および前記インデックス(n)によってインデックス化される1つまたは複数の変数を含む、分割することと、
    前記インデックス(n)、現在のローカル領域データ、および少なくとも1つの以前のローカル領域データの関数として、前記1つまたは複数の変数の各々を計算する予測因子を識別することと、
    しきい値を超える相関のレベルが前記現在のローカル領域データと前記以前のローカル領域データとの間に存在するとき、スケーリングされた予測相関データを、前記少なくとも1つの以前のローカル領域データに基づいて減算することによって、前記現在のローカル領域データを調節することと、
    最適倍率を含む前記調節された現在のローカル領域データを、圧縮ストリーム内へ符号化することと、
    を行わせるシステム。
  14. 前記多次元順序付き系列データは、分光データである、請求項13に記載のシステム。
  15. 前記プロセッサは、前記以前のローカル領域データのインジケータを前記圧縮ストリーム内へ符号化するように構成される、請求項13に記載のシステム。
  16. 分割することは、前記データを複数の重複ローカル領域へと分割することを含む、請求項13に記載のシステム。
  17. 分割することは、前記データを複数の非重複ローカル領域へと分割することを含む、請求項13に記載のシステム。
  18. 前記プロセッサは、前記現在のローカル領域データと前記以前のローカル領域データとの相関レベルを演算するようにさらに構成される、請求項13に記載のシステム。
  19. 前記相関レベルは、前記現在のローカル領域データと前記少なくとも1つの以前のローカル領域データとの間に存在する一連の類似ピークから演算される、請求項18に記載のシステム。
  20. 前記一連の類似ピークは、前記一連の類似ピークからのピークの大半が、ほぼ同じ質量/電荷比、後続のピーク間の間隔から決定されるような、ほぼ同じ電荷状態、およびavergineモデルに一致する類似のピーク強度存在度分布のうちの1つまたは複数を有する場合に、類似とみなされる、請求項19に記載のシステム。
  21. 圧縮データファイルまたはストリームから疎の多次元順序付き系列データを解凍するためのコンピュータ実装方法であって、
    前記圧縮データファイルまたはストリームを受信するステップと、
    前記圧縮データファイルまたはストリームから、調節されたローカル領域データを復号するステップであって、前記復号した調節されたローカル領域データは、復元されるべき標的ローカル領域に対応する、ステップと、
    最適倍率によってスケーリングされる予測ローカル領域ピークを生成するために、前記調節されたローカル領域データを1つまたは複数の以前のローカル領域と比較することによって、前記圧縮データファイルまたはストリームから予測因子倍率を復号するステップと、
    復元されたローカル領域データを提供するために、前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加するステップと、
    前記復元されたローカル領域データを出力するステップと、
    を含む、コンピュータ実装方法。
  22. 前記調節されたローカル領域データおよび前記予測因子倍率は、前記データを符号化するために使用されるエンコードを適用するデコーダを使用して復号される、請求項21に記載の方法。
  23. 前記予測因子倍率を復号するステップは、前記調節されたローカル領域データからのピークのサブセットを識別するために、前記調節されたローカル領域データを、前記調節されたローカル領域データからオフセットされる1つまたは複数の以前のローカル領域と比較すること、および前記予測ローカル領域ピークを生成するために、前記最適倍率によって前記ピークのサブセットをスケーリングすることを含む、請求項21に記載の方法。
  24. 前記復元されたローカル領域データを提供するために、前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加するステップは、前記調節されたローカル領域データと1つまたは複数の以前のローカル領域との相関がしきい値レベルを超えるとき、前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加し、そうでなければ、前記復元されたローカル領域データを前記復号した調節されたローカル領域データに設定することを含む、請求項21に記載の方法。
  25. 前記圧縮データファイルをその全体において復元するために前記復号、追加、および出力ステップを反復的に繰り返すステップをさらに含む、請求項21に記載の方法。
  26. 前記圧縮データファイルまたはストリームの一部分のみが復元される、請求項21に記載の方法。
  27. 前記圧縮データファイルまたはストリームから前記最適倍率を取得するステップをさらに含む、請求項21に記載の方法。
  28. 複数の現在のローカル領域を順次に処理するために、復号するステップおよび調節されたローカル領域データ、ならびに前記予測ローカル領域ピークおよび復号されたローカル領域データを追加するステップをさらに含む、請求項21に記載の方法。
  29. 前記圧縮データファイルまたはストリームを受信するステップは、圧縮データストリームを受信することを含む、請求項21に記載の方法。
  30. 圧縮データファイルまたはストリームから疎の多次元順序付き系列データを解凍するためのコンピュータ実装方法であって、
    前記圧縮データファイルまたはストリームを受信するステップと、
    前記圧縮データファイルまたはストリームから、調節されたローカル領域データを復号するステップであって、前記復号した調節されたローカル領域データは、復元されるべき標的ローカル領域に対応する、ステップと、
    前記調節されたローカル領域データからのピークのサブセットを識別するために、前記調節されたローカル領域データを、前記調節されたローカル領域データからオフセットされる1つまたは複数の以前のローカル領域データと比較すること、および予測ローカル領域ピークを生成するために、圧縮データファイルまたはストリームから抽出される最適倍率によって前記ピークのサブセットをスケーリングすることによって、前記圧縮データファイルまたはストリームから予測因子倍率を復号するステップと、
    復元されたローカル領域データを生成するために、前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加するステップと、
    前記復元されたローカル領域データを出力するステップと、
    を含む、コンピュータ実装方法。
  31. 前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加するステップは、前記調節されたローカル領域データと1つまたは複数の以前のローカル領域との相関レベルを演算し、前記相関レベルがしきい値を超えるときにのみ、前記予測ローカル領域ピークおよび前記復号した調節されたローカル領域データを一緒に追加し、そうでなければ、前記復元されたローカル領域データを前記復号した調節されたローカル領域データに設定することを含む、請求項30に記載の方法。
JP2023537885A 2020-08-31 2021-08-31 多次元時系列データのためのデータ圧縮 Pending JP2023544647A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063072890P 2020-08-31 2020-08-31
US63/072,890 2020-08-31
PCT/US2021/048402 WO2022047368A1 (en) 2020-08-31 2021-08-31 Data compression for multidimensional time series data

Publications (1)

Publication Number Publication Date
JP2023544647A true JP2023544647A (ja) 2023-10-24

Family

ID=80355787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023537885A Pending JP2023544647A (ja) 2020-08-31 2021-08-31 多次元時系列データのためのデータ圧縮

Country Status (4)

Country Link
US (3) US11276204B1 (ja)
EP (1) EP4204948A1 (ja)
JP (1) JP2023544647A (ja)
WO (1) WO2022047368A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022047368A1 (en) 2020-08-31 2022-03-03 Protein Metrics Inc. Data compression for multidimensional time series data
CN117176175B (zh) * 2023-11-01 2024-02-02 深圳对对科技有限公司 一种用于计算机的数据传输方法

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4464650A (en) 1981-08-10 1984-08-07 Sperry Corporation Apparatus and method for compressing data signals and restoring the compressed data signals
US4558302A (en) 1983-06-20 1985-12-10 Sperry Corporation High speed data compression and decompression apparatus and method
US4814764A (en) 1986-09-30 1989-03-21 The Boeing Company Apparatus and method for warning of a high yaw condition in an aircraft
US5343554A (en) 1988-05-20 1994-08-30 John R. Koza Non-linear genetic process for data encoding and for solving problems using automatically defined functions
GB2308917B (en) 1996-01-05 2000-04-12 Maxent Solutions Ltd Reducing interferences in elemental mass spectrometers
US6094627A (en) 1997-05-30 2000-07-25 Perkinelmer Instruments, Inc. High-performance digital signal averager
US5995989A (en) 1998-04-24 1999-11-30 Eg&G Instruments, Inc. Method and apparatus for compression and filtering of data associated with spectrometry
EP0966109B1 (en) 1998-06-15 2005-04-27 Matsushita Electric Industrial Co., Ltd. Audio coding method and audio coding apparatus
FR2792798B1 (fr) 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
JP2003532117A (ja) 2000-04-13 2003-10-28 サーモ フィニガン リミテッド ライアビリティ カンパニー 並列質量分析によるプロテオミクス解析
US7027655B2 (en) 2001-03-29 2006-04-11 Electronics For Imaging, Inc. Digital image compression with spatially varying quality levels determined by identifying areas of interest
US6836569B2 (en) 2001-04-13 2004-12-28 Erwan Le Pennec Method and apparatus for processing or compressing n-dimensional signals by foveal filtering along trajectories
US20030218634A1 (en) 2002-05-22 2003-11-27 Allan Kuchinsky System and methods for visualizing diverse biological relationships
US7483581B2 (en) 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US7006567B2 (en) 2001-11-30 2006-02-28 International Business Machines Corporation System and method for encoding three-dimensional signals using a matching pursuit algorithm
AU2003216495A1 (en) 2002-03-01 2003-09-16 Applera Corporation Determination of compatibility of a set of chemical modifications with an amino-acid chain
US7136010B2 (en) 2002-06-28 2006-11-14 Science Applications International Corporation Measurement and signature intelligence analysis and reduction technique
WO2004019003A2 (en) 2002-08-23 2004-03-04 Efeckta Technologies Corporation Image processing of mass spectrometry data for using at multiple resolutions
CA2521034A1 (en) 2003-04-02 2004-10-21 Merck & Co., Inc. Mass spectrometry data analysis techniques
US7400772B1 (en) 2003-05-20 2008-07-15 Sandia Corporation Spatial compression algorithm for the analysis of very large multivariate images
US7283684B1 (en) 2003-05-20 2007-10-16 Sandia Corporation Spectral compression algorithms for the analysis of very large multivariate images
US6798360B1 (en) 2003-06-27 2004-09-28 Canadian Space Agency Method and system for compressing a continuous data flow in real-time using recursive hierarchical self-organizing cluster vector quantization (HSOCVQ)
US7473892B2 (en) 2003-08-13 2009-01-06 Hitachi High-Technologies Corporation Mass spectrometer system
US7251376B2 (en) 2003-08-29 2007-07-31 Canadian Space Agency Data compression engines and real-time wideband compressor for multi-dimensional data
US7402438B2 (en) 2003-10-30 2008-07-22 Palo Alto Research Center Incorporated Automated identification of carbohydrates in mass spectra
CN1906855B (zh) 2004-01-30 2014-04-02 法国电信 空间矢量和可变分辨率量化
FR2867329A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de codage d'une sequence d'images par analyse temporelle hierarchique.
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
US7646924B2 (en) 2004-08-09 2010-01-12 David Leigh Donoho Method and apparatus for compressed sensing
US7979258B2 (en) 2004-12-20 2011-07-12 Palo Alto Research Center Incorporated Self-calibration of mass spectra using robust statistical methods
WO2006078141A1 (en) * 2005-01-21 2006-07-27 Lg Electronics Inc. Method and apparatus for encoding/decoding video signal using block prediction information
US7297940B2 (en) 2005-05-03 2007-11-20 Palo Alto Research Center Incorporated Method, apparatus, and program product for classifying ionized molecular fragments
US8511140B2 (en) 2005-10-25 2013-08-20 Waters Technologies Corporation Baseline modeling in chromatography
US20080260269A1 (en) 2005-11-22 2008-10-23 Matrixview Limited Repetition and Correlation Coding
US7429727B2 (en) 2005-12-13 2008-09-30 Palo Alto Research Center Incorporated Method, apparatus, and program product for quickly selecting complex molecules from a data base of molecules
US8108153B2 (en) 2005-12-13 2012-01-31 Palo Alto Research Center Incorporated Method, apparatus, and program product for creating an index into a database of complex molecules
US7283937B2 (en) 2005-12-21 2007-10-16 Palo Alto Research Center Incorporated Method, apparatus, and program product for distinguishing valid data from noise data in a data set
JP4689545B2 (ja) 2006-07-05 2011-05-25 富士フイルム株式会社 データ圧縮装置およびデータ圧縮プログラム
US7496453B2 (en) 2006-11-07 2009-02-24 The Hong Kong Polytechnic University Classification of herbal medicines using wavelet transform
WO2008149135A1 (en) 2007-06-04 2008-12-11 Bae Systems Plc Indexing and compression of results of computational fluid dynamics simulations
JP4930600B2 (ja) 2007-11-30 2012-05-16 株式会社島津製作所 飛行時間測定装置
US7884318B2 (en) 2008-01-16 2011-02-08 Metabolon, Inc. Systems, methods, and computer-readable medium for determining composition of chemical constituents in a complex mixture
US9671408B2 (en) 2008-11-18 2017-06-06 Protein Metrics Inc. Wild-card-modification search technique for peptide identification
US20100288917A1 (en) 2009-05-13 2010-11-18 Agilent Technologies, Inc. System and method for analyzing contents of sample based on quality of mass spectra
US8987662B2 (en) 2009-05-14 2015-03-24 Agilent Technologies, Inc. System and method for performing tandem mass spectrometry analysis
US20110093205A1 (en) 2009-10-19 2011-04-21 Palo Alto Research Center Incorporated Proteomics previewer
EP2524371B1 (en) 2010-01-12 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
US20110206118A1 (en) * 2010-02-19 2011-08-25 Lazar Bivolarsky Data Compression for Video
GB201005959D0 (en) 2010-04-12 2010-05-26 Univ Leuven Kath Spectroscopic analysis system
WO2011155984A1 (en) 2010-06-11 2011-12-15 Waters Technologies Corporation Techniques for mass spectrometry peak list computation using parallel processing
US9405884B2 (en) 2010-06-16 2016-08-02 Abbvie Inc. Methods and systems for the analysis of protein samples
JP2013532366A (ja) 2010-07-09 2013-08-15 アルダン アサノビッチ サパカリエフ 質量分析法及びそれらの装置
EP2596494B1 (en) 2010-07-20 2020-08-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Audio decoder, audio decoding method and computer program
CA2750093A1 (en) 2010-08-19 2012-02-19 Daniel Reem Method for computing and storing voronoi diagrams, and uses therefor
US8428889B2 (en) 2010-10-07 2013-04-23 Thermo Finnigan Llc Methods of automated spectral peak detection and quantification having learning mode
KR101712156B1 (ko) * 2010-12-06 2017-03-06 에스케이 텔레콤주식회사 임의의 형태의 블록을 이용한 인터예측에 의한 영상의 부호화/복호화 방법 및 장치
US20130144540A1 (en) 2011-12-06 2013-06-06 Palo Alto Research Center Incorporated Constrained de novo sequencing of peptides
US9158686B2 (en) 2012-03-30 2015-10-13 Altera Corporation Processing system and method including data compression API
US9141631B2 (en) 2012-04-16 2015-09-22 International Business Machines Corporation Table boundary detection in data blocks for compression
JP5972651B2 (ja) 2012-04-25 2016-08-17 日本電子株式会社 飛行時間型質量分析計
CN104813324B (zh) 2012-08-09 2017-09-05 珀金埃尔默健康科学公司 用于从质谱法输出识别聚合物物种的方法及设备
US10860526B2 (en) 2012-12-01 2020-12-08 The Regents Of The University Of California System and method of managing large data files
WO2015042704A1 (en) 2013-09-24 2015-04-02 University Of Guelph Biomarkers for mycobacterium avium paratuberculosis (map)
US9386126B2 (en) 2014-05-02 2016-07-05 Huawei Technologies Co., Ltd. System and method for hierarchical compression
US9640376B1 (en) 2014-06-16 2017-05-02 Protein Metrics Inc. Interactive analysis of mass spectrometry data
US9869662B2 (en) 2014-06-19 2018-01-16 Shimadzu Corporation Chromatograph/mass spectrometer data processing device
US10042710B2 (en) 2014-09-16 2018-08-07 Actifio, Inc. System and method for multi-hop data backup
US9385751B2 (en) 2014-10-07 2016-07-05 Protein Metrics Inc. Enhanced data compression for sparse multidimensional ordered series data
US9754394B2 (en) 2014-12-17 2017-09-05 Shimadzu Corporation Analytical data display processing device
US10354421B2 (en) 2015-03-10 2019-07-16 Protein Metrics Inc. Apparatuses and methods for annotated peptide mapping
WO2016145331A1 (en) 2015-03-12 2016-09-15 Thermo Finnigan Llc Methods for data-dependent mass spectrometry of mixed biomolecular analytes
US10319573B2 (en) 2017-01-26 2019-06-11 Protein Metrics Inc. Methods and apparatuses for determining the intact mass of large molecules from mass spectrographic data
US10546736B2 (en) 2017-08-01 2020-01-28 Protein Metrics Inc. Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US11626274B2 (en) 2017-08-01 2023-04-11 Protein Metrics, Llc Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US20220301840A1 (en) 2017-09-29 2022-09-22 Protein Metrics Inc. Interactive analysis of mass spectrometry data
US10510521B2 (en) 2017-09-29 2019-12-17 Protein Metrics Inc. Interactive analysis of mass spectrometry data
US11640901B2 (en) 2018-09-05 2023-05-02 Protein Metrics, Llc Methods and apparatuses for deconvolution of mass spectrometry data
US11346844B2 (en) 2019-04-26 2022-05-31 Protein Metrics Inc. Intact mass reconstruction from peptide level data and facilitated comparison with experimental intact observation
FR3098072B1 (fr) * 2019-06-26 2021-08-06 Ateme Procédé de traitement d’un ensemble d’images d’une séquence vidéo
WO2022047368A1 (en) 2020-08-31 2022-03-03 Protein Metrics Inc. Data compression for multidimensional time series data

Also Published As

Publication number Publication date
EP4204948A1 (en) 2023-07-05
US20220067980A1 (en) 2022-03-03
WO2022047368A1 (en) 2022-03-03
US11276204B1 (en) 2022-03-15
US11790559B2 (en) 2023-10-17
US20220207778A1 (en) 2022-06-30
US20240070923A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
US20240070923A1 (en) Data compression for multidimensional time series data
US9859917B2 (en) Enhanced data compression for sparse multidimensional ordered series data
US10903043B2 (en) Method, device and system for remote deep learning for microscopic image reconstruction and segmentation
JP5950034B2 (ja) イメージング質量分析データ処理方法及びイメージング質量分析装置
US10312067B2 (en) Imaging mass analysis data processing method and imaging mass spectrometer
JP5534909B2 (ja) 質量画像の形成方法
JP2020061374A (ja) 圧縮走査型電子顕微鏡システムおよび動作方法
WO2007084301A2 (en) Efficient bit-exact lossless image coding residual system
JP5725891B2 (ja) 質量信号のノイズ低減処理方法及び装置
CN112189136B (zh) 设备分析用数据处理方法以及装置
JP5454409B2 (ja) 質量分析装置
US20120092476A1 (en) Methods and apparatus to form a wavelet representation of a pathology slide having glass and tissue regions
Kölln et al. Label2label: training a neural network to selectively restore cellular structures in fluorescence microscopy
KR101967992B1 (ko) 디지털 병리 시스템의 영상 압축 방법
WO2017203679A1 (ja) 発光画像符号化装置、発光画像復号化装置、及び発光画像解析システム
Shao et al. Analysis‐preserving video microscopy compression via correlation and mathematical morphology
US20230344447A1 (en) Method for compression of time tagged data from time correlated single photon counting
EP3309744A1 (en) Image processing system and image processing method for processing image data of at least one image frame
He et al. Deep Learning for MS2 Feature Detection in Liquid Chromatography Mass Spectrometry
Karimi et al. Lossless compression of rnai fluorescence images using regional fluctuations of pixels
Shao et al. Analysis‐aware microscopy video compression
Karimi et al. Lossless compression of high-throughput RNAi images