JP2023511492A - Methods and kits for whole genome amplification and analysis of target molecules in biological samples - Google Patents

Methods and kits for whole genome amplification and analysis of target molecules in biological samples Download PDF

Info

Publication number
JP2023511492A
JP2023511492A JP2022536964A JP2022536964A JP2023511492A JP 2023511492 A JP2023511492 A JP 2023511492A JP 2022536964 A JP2022536964 A JP 2022536964A JP 2022536964 A JP2022536964 A JP 2022536964A JP 2023511492 A JP2023511492 A JP 2023511492A
Authority
JP
Japan
Prior art keywords
sequence
amplification
tagged
primer
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022536964A
Other languages
Japanese (ja)
Inventor
ニコロ・マナレージ
アンドレア・ラスパドーリ
アルベルト・フェラリーニ
Original Assignee
メナリーニ シリコン バイオシステムズ エッセ.ピー.アー.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メナリーニ シリコン バイオシステムズ エッセ.ピー.アー. filed Critical メナリーニ シリコン バイオシステムズ エッセ.ピー.アー.
Publication of JP2023511492A publication Critical patent/JP2023511492A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1075Isolating an individual clone by screening libraries by coupling phenotype to genotype, not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/131Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

ゲノムDNA及び標的分子を含む生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法であって、結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含むタグ付きオリゴヌクレオチドにコンジュゲート化された、標的分子のうちの少なくとも1種に対する少なくとも1種の結合剤と、生物学的試料を接触させる工程;未結合の結合剤を選択的に除去するための分離工程を行うことにより、標識された生物学的試料を取得する工程;標識された生物学的試料に対して、全ゲノム増幅及びタグ付きオリゴヌクレオチドの増幅を同時に行う工程;増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーを作製する工程;超並列シーケンシングライブラリーをシーケンシングする工程;各シーケンシングリードからBAB及びUMIの配列を検索する工程;各結合剤に対する異なるUMIの個数をカウントする工程を含む方法が開示される。A method for whole-genome amplification and analysis of multiple target molecules in a biological sample containing genomic DNA and target molecules, comprising tagged oligos comprising a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI) contacting the biological sample with at least one binding agent for at least one of the target molecules conjugated to the nucleotide; separating to selectively remove unbound binding agent. obtaining a labeled biological sample by performing; simultaneously performing whole genome amplification and tagged oligonucleotide amplification on the labeled biological sample; from the amplified tagged oligonucleotides generating a massively parallel sequencing library; sequencing the massively parallel sequencing library; retrieving sequences of BAB and UMI from each sequencing read; counting the number of different UMIs for each binding agent. A method is disclosed comprising:

Description

関連出願に対する相互参照
本特許出願は、2019年12月16日出願のイタリア特許出願第102019000024159号からの優先権を主張し、該出願の開示全体が、参照により本明細書中に組み入れられる。
CROSS-REFERENCE TO RELATED APPLICATIONS This patent application claims priority from Italian Patent Application No. 102019000024159, filed Dec. 16, 2019, the entire disclosure of which is incorporated herein by reference.

本発明は、生物学的試料における、特に単一細胞試料における、全ゲノム増幅及び標的分子の分析、特にタンパク質の定量化のための、方法及びキットに関する。 The present invention relates to methods and kits for whole genome amplification and analysis of target molecules, in particular protein quantification, in biological samples, especially in single cell samples.

単一細胞分析のための方法は、バルク試料の不均一性から生じる複雑性を伴わずに、細胞の状況に対する情報を取得することを可能にする。同じ単一細胞中のプロテオーム及びゲノムの分析は、細胞の表現型とその遺伝子型との間の相関を提供し、したがって、多様な生物学的及び病理学的プロセスに対する独自の洞察を可能にする。このことは、腫瘍に関して特に当てはまり、腫瘍では、体細胞により獲得された遺伝的不均一性並びに転写及びタンパク質翻訳に対するその影響が、癌の発生及び発達の重要な構成要素である。 Methods for single-cell analysis allow obtaining information on cellular context without the complications arising from bulk sample heterogeneity. Analysis of proteomes and genomes in the same single cell provides correlations between a cell's phenotype and its genotype, thus allowing unique insight into diverse biological and pathological processes. . This is particularly true with respect to tumors, where somatically acquired genetic heterogeneity and its effects on transcription and protein translation are important components of cancer initiation and development.

全ゲノム増幅(WGA)は、より多くのDNAを取得する目的で、且つ、シーケンシング、SNP検出等をはじめとする様々な種類の遺伝子解析を簡潔化及び/又は可能にする目的で、単一細胞由来のゲノムを分析するために有用である。確定的制限部位に基づくLM-PCRを用いるWGA(DRS-WGA)が、EP1109938から公知である。 Whole Genome Amplification (WGA) is used to obtain more DNA and to simplify and/or enable various types of genetic analysis, including sequencing, SNP detection, etc. Useful for analyzing cell-derived genomes. WGA using LM-PCR based on defined restriction sites (DRS-WGA) is known from EP1109938.

WO 2017/178655及びWO 2019/016401は、低パス全ゲノムシーケンシング及びコピー数プロファイリングのためのDRS-WGA(例えば、Ampli1(商標)WGA)又はMALBACから超並列シーケンシングライブラリーを作製するための簡略化された方法を教示する。 WO 2017/178655 and WO 2019/016401 for generating massively parallel sequencing libraries from DRS-WGA (e.g. Ampli1™ WGA) or MALBAC for low pass whole genome sequencing and copy number profiling. Teaches a simplified method.

近年、単一細胞におけるゲノム及びトランスクリプトームの同時分析のための方法が開発された。Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129による論文は、用手法により単離された単一細胞からのメッセンジャーRNAが、まず一本鎖cDNAへと転写され、続いて、準線形全ゲノム増幅を通して、ゲノムDNAと共に増幅される方法を教示する。続いて、一方はcDNA由来であり他方はゲノムDNA由来である2種類の異なるライブラリーが、作製及びシーケンシングされる。別のアプローチであるMacaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370では、完全に溶解された単一細胞からポリアデニル化mRNA分子を捕捉及び単離するために、オリゴ-dT-被覆ビーズを用いて、mRNAがgDNAから物理的に分離される。続いて、改変型Smart-seq2プロトコール(Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639)を用いてmRNAが増幅され、一方で、gDNAは利用可能な全ゲノム増幅方法を用いて増幅及びシーケンシングすることができる。これらの方法は、遺伝子型をメッセンジャー転写に関連付けるために有用であるが、その転写及びターンオーバー/分解が細胞中で活発に調節されるタンパク質の直接的検出を得ることを可能にしない。 Recently, methods have been developed for simultaneous genome and transcriptome analysis in single cells. Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. teaches how messenger RNA from a single cell isolated by is first transcribed into single-stranded cDNA and then amplified along with genomic DNA through quasi-linear whole-genome amplification. Subsequently, two different libraries, one from cDNA and the other from genomic DNA, are generated and sequenced. Alternative approach Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038 In /nmeth.3370, mRNA is physically separated from gDNA using oligo-dT-coated beads to capture and isolate polyadenylated mRNA molecules from fully lysed single cells. Subsequently, modified Smart-seq2 protocol (Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http:// doi.org/10.1038/nmeth.2639), while gDNA can be amplified and sequenced using available whole genome amplification methods. These methods are useful for relating genotype to messenger transcription, but do not allow obtaining direct detection of proteins whose transcription and turnover/degradation are actively regulated in cells.

現在、最も広く応用される単一細胞タンパク質検出アプローチは、タグ付き抗体を用いる特異的タンパク質の標的化に依存する。蛍光活性化細胞選別(FACS)又は蛍光顕微鏡観察によるタンパク質の蛍光ベースの検出及び定量化は、特異的細胞タンパク質を認識する蛍光標識抗体を用いて、低い多重化レベルを有する単一細胞におけるタンパク質検出を可能にする。しかしながら、フルオロフォアに基づく高度に多重化したアッセイが、複数色素の発光スペクトル間でのスペクトル重複によって困難であるので、このアプローチは、一般的に、10~15種類の同時測定に限定される。更に、重複スペクトルをデコンボリューションするために、複雑なアルゴリズムが必要である。 Currently, the most widely applied single-cell protein detection approaches rely on targeting specific proteins with tagged antibodies. Fluorescence-based detection and quantification of proteins by fluorescence-activated cell sorting (FACS) or fluorescence microscopy uses fluorescently-labeled antibodies that recognize specific cellular proteins to detect proteins in single cells with low multiplexing levels. enable However, this approach is generally limited to 10-15 simultaneous measurements, as highly multiplexed assays based on fluorophores are difficult due to spectral overlap between the emission spectra of multiple dyes. Furthermore, complex algorithms are required to deconvolve overlapping spectra.

フリューダイム(Fluidigm)マスサイトメーター(CyTOF(商標))は、タンパク質を検出するために金属含有ポリマータグ付き(MAXPAR(商標))抗体を利用する。機器は、非光学的な物理的検出原理及び標識の異なる化学的性質に基づく。蛍光標識が特別に設計された多重原子エレメントタグに置き換えられ、検出は、飛行時間型質量分析(TOF-MS)の高解像度、高感度、且つ高速の分析を活用する。多数の利用可能な安定的同位体をタグとして使用できるので、多数のタンパク質を個別の細胞において同時に検出できる可能性がある[Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]。Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742による研究は、RNAに対する近接ライゲーションアッセイ(Proximity Ligation Assay for RNA;PLAYR)に基づく、単一細胞でのRNA及びタンパク質の同時検出のための方法を教示する。PLAYRは、40種類超の異なるmRNA及びタンパク質の同時定量化を可能にするマスサイトメトリーにより、単一細胞での転写産物の高度に多重化した定量化を可能にする。最終的に、マスサイトメトリーは、タンパク質及びメッセンジャーRNA転写と共に、タンパク質リン酸化(Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704)及び細胞増殖(Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075)等の、複数の細胞内プロセス及び表現型特徴を調べることを可能にした。 The Fluidigm Mass Cytometer (CyTOF™) utilizes metal-containing polymer-tagged (MAXPAR™) antibodies to detect proteins. The instruments are based on non-optical physical detection principles and different chemistries of labels. Fluorescent labels are replaced by specially designed multi-atom element tags, and detection exploits the high resolution, sensitivity, and fast analysis of time-of-flight mass spectrometry (TOF-MS). Since the large number of available stable isotopes can be used as tags, many proteins may be detected simultaneously in individual cells [Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]. Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. A method for simultaneous detection of RNA and protein in a single cell based on the Proximity Ligation Assay for RNA (PLAYR) is taught. PLAYR enables highly multiplexed quantification of transcripts in a single cell with mass cytometry allowing simultaneous quantification of over 40 different mRNAs and proteins. Ultimately, mass cytometry has demonstrated protein phosphorylation (Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332), along with protein and messenger RNA transcription. (6030), 687-696. http://doi.org/10.1126/science.1198704) and cell proliferation (Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566.

これらのアプローチの限界は、以下の通りである:
- 質量分析計中でのイオン飛行の動態に起因して、マスサイトメトリーのスループットは、蛍光ベースの機器のものに後れをとる。加えて、マスレポーターの感度は、数個の比較的量子効率が高いフルオロフォア(フィコエリトリン等)にも達さず、これにより、マスサイトメトリーを用いて非常に低レベルで発現される分子特徴を測定することがより困難になる(Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019)。
- 重要なことに、細胞が噴霧化及びイオン化されるので、分析後に細胞を回収することができず、したがってゲノムDNAを分析することができない。
Limitations of these approaches are:
- Due to the dynamics of ion flight in mass spectrometers, the throughput of mass cytometry lags that of fluorescence-based instruments. In addition, the sensitivity of mass reporters falls short of even a few relatively high quantum efficiency fluorophores (such as phycoerythrin), which allows the detection of molecular features expressed at very low levels using mass cytometry. more difficult to measure (Spitzer, MH et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j. cell.2016.04.019).
- Importantly, since the cells are nebulized and ionized, they cannot be harvested after analysis and therefore the genomic DNA cannot be analyzed.

オリゴヌクレオチド標識抗体を通してタンパク質を検出するための方法が、Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473による論文において記載されており、この論文は、2つのDNAアプタマーによる標的タンパク質の協調的且つ近接した結合が、それぞれアプタマー親和性プローブに連結されたオリゴヌクレオチドのライゲーションを促進する技術(近接ライゲーションアッセイ;PLA)を教示する。2つのそのような近接プローブのライゲーションは、標的タンパク質の正体及び量を反映する増幅可能なDNA配列を生じる。3PLA法(Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974)は、3つの認識イベントを使用することにより近接ライゲーション法の感度及び特異度を拡張し、100個ほどの少ない標的分子を検出することを可能にする。3PLAでは、3つのオリゴヌクレオチド修飾型抗体試薬のセットが、個別の標的タンパク質に結合して、近接ライゲーションにより検出可能なシグナルを生じる。2つの近接プローブ上のオリゴヌクレオチドの3'末端及び5'末端は、第3の近接プローブ上に存在するオリゴヌクレオチドへとハイブリダイズすることが可能であり、それにより、3種類のプローブ及び標的タンパク質を含む複合体が形成される。これにより、2つのオリゴヌクレオチドが、2回のライゲーション反応により中間断片を介して連結され、第3の近接プローブにより鋳型化されて、qPCRにより検出することができる特異的な増幅可能DNA鎖を形成することが可能になる。近接伸長アッセイ(Proximity Extension Assay;PEA)はPLAの変法であり、PEAでは2つのオリゴヌクレオチド標識抗体が個別のタンパク質に結合し、オリゴヌクレオチドはその3'末端で部分的にアニーリングし、ポリメラーゼによる伸長によって、qPCRにより検出することができる増幅可能なDNA配列が生成される(Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424)。上記で開示された方法は単一細胞タンパク質検出に対して特異的に設計されていなかったが、フリューダイムC1(Fluidigm C1(商標))単一細胞自動調製システムが、PEAアッセイを用いて、1回の測定当たり最大96個の単一細胞での92種類のタンパク質のパネルの増幅可能な標的の調製を自動化するために利用された(Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5)。フリューダイムC1微小流体システムは、全エクソームシーケンシング及び標的化型DNAシーケンシングによるトランスクリプトーム又はゲノムDNA配列の分析のための一定範囲の単一細胞生物学法を支持するが、しかしながら、この方法は、同じ単一細胞から遺伝子型及び表現型に対する情報を取得するために容易に組み合わせることができない。 Methods for detecting proteins through oligonucleotide-labeled antibodies are described in Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org. /10.1038/nbt0502-473, in which the cooperative and close binding of target proteins by two DNA aptamers facilitates the ligation of oligonucleotides each linked to an aptamer affinity probe. A technique (proximity ligation assay; PLA) is taught. Ligation of two such proximity probes yields an amplifiable DNA sequence that reflects the identity and quantity of the target protein. The 3PLA method (Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974) The use of three recognition events extends the sensitivity and specificity of the proximity ligation method, allowing detection of as few as 100 target molecules. In 3PLA, a set of three oligonucleotide-modified antibody reagents bind to individual target proteins and generate detectable signals by proximity ligation. The 3' and 5' ends of oligonucleotides on two proximity probes are allowed to hybridize to oligonucleotides present on a third proximity probe, thereby forming three probes and a target protein. A complex containing is formed. Thereby, two oligonucleotides are joined via an intermediate fragment by two ligation reactions and templated by a third proximity probe to form a specific amplifiable DNA strand that can be detected by qPCR. it becomes possible to The Proximity Extension Assay (PEA) is a modification of PLA in which two oligonucleotide-labeled antibodies are bound to separate proteins, the oligonucleotides are partially annealed at their 3' ends, and are induced by a polymerase. Extension produces amplifiable DNA sequences that can be detected by qPCR (Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424). Although the methods disclosed above were not specifically designed for single-cell protein detection, the Fluidigm C1™ Single-Cell Automated Preparation System has demonstrated that using the PEA assay, 1 It was utilized to automate the preparation of amplifiable targets for a panel of 92 proteins in up to 96 single cells per assay (Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5). The Fluidigm C1 microfluidic system supports a range of single-cell biology methods for analysis of transcriptome or genomic DNA sequences by whole-exome sequencing and targeted DNA sequencing; Methods cannot be easily combined to obtain genotypic and phenotypic information from the same single cell.

したがって、検出がqPCRに基づくPLA及びPEAアッセイは、感度が高く非常に特異的であるが、それらのスループットが限定され、且つタンパク質のみしか検出できない。 Thus, while PLA and PEA assays based on qPCR for detection are sensitive and highly specific, they are limited in throughput and can only detect proteins.

NanoString Technologies社によるUS 9,714,937は、標的タンパク質の第1領域に対して特異的な部分(ビオチン等)にコンジュゲート化された捕捉抗体及び標的タンパク質の第2領域に対する検出抗体を、リンカーオリゴヌクレオチドへのハイブリダイゼーションを介して検出抗体に連結された複数の脱着可能な標識を含むナノレポーターと共に用いることによる、タンパク質の検出のための方法を教示する。2種類の抗体は、標的タンパク質と複合体を形成し、この複合体は、該部分に対して高親和性を有するマトリックス又はビーズと結合を形成することができる。標的は、ナノレポーター分子の個数をカウントすることにより検出及び定量化される。nCounter(登録商標)デジタル分子バーコード化技術に基づくNanostring社から市販されているアッセイは、特異的タンパク質エピトープを標的化する固有のオリゴヌクレオチド標識抗体を用いてタンパク質を検出する。固有の一本鎖DNAタグは、ビオチン化捕捉プローブと、一連の蛍光標識RNAセグメントにアニーリングした一本鎖DNA分子により作製されるレポータープローブとの組み合わせを用いて検出される。これらの標識の線形順序が、対象となる各標的に対する固有のバーコードを生成する。次に、複合体が、ビオチンと固相化されたストレプトアビジン分子との間の非共有結合を介してイメージング表面に固相化され、蛍光バーコードが撮像及びカウントされる。タンパク質特異的バーコード当たりのカウント数は、試料中に存在する分子数に直接関連するデジタルな測定値である。タンパク質検出は、特異的標的RNAに対して設計された捕捉プローブ-レポータープローブ対を用いて、メッセンジャーRNA検出と組み合わせることができる。約30種類のタンパク質標的及び770種類のmRNA標的を、1回の分析で分析することができる。 No. 9,714,937 by NanoString Technologies, Inc., attaches a capture antibody conjugated to a moiety (such as biotin) specific for the first region of the target protein and a detection antibody for the second region of the target protein to a linker oligonucleotide. A method is taught for the detection of proteins by use with a nanoreporter comprising multiple detachable labels linked via hybridization to a detection antibody. The two antibodies form a complex with the target protein and this complex can form a bond with a matrix or bead that has a high affinity for the moiety. Targets are detected and quantified by counting the number of nanoreporter molecules. A commercially available assay from Nanostring, Inc., based on nCounter® digital molecular barcoding technology, detects proteins using unique oligonucleotide-labeled antibodies that target specific protein epitopes. Unique single-stranded DNA tags are detected using a combination of biotinylated capture probes and reporter probes generated by single-stranded DNA molecules annealed to a series of fluorescently labeled RNA segments. A linear sequence of these labels produces a unique barcode for each target of interest. Complexes are then immobilized on an imaging surface via non-covalent bonding between biotin and immobilized streptavidin molecules, and fluorescent barcodes are imaged and counted. The number of counts per protein-specific barcode is a digital measurement directly related to the number of molecules present in the sample. Protein detection can be combined with messenger RNA detection using capture probe-reporter probe pairs designed against a specific target RNA. Approximately 30 protein targets and 770 mRNA targets can be analyzed in a single analysis.

この方法の欠点は、RNAをプロファイリングするため(2500個の細胞と同等)及び/又はタンパク質をプロファイリングするため(100000個の細胞と同等)に大量の細胞を必要とすること、及びそのままでは単一細胞をプロファイリングするために好適でないことである。この方法は、ゲノムDNA等の他のアナライトを検出するために用いることができる可能性があるが、しかしながら、ゲノム配列の直接的なリードアウトを提供できず、既知の配列の存在/非存在のシグナルのみを提供できる。ハイブリダイゼーションに基づくので、配列変異体に対して部分的に寛容でもあり、異なる配列変異体同士を区別できない可能性がある。 The drawback of this method is that it requires a large number of cells for profiling RNA (equivalent to 2500 cells) and/or for profiling proteins (equivalent to 100000 cells) and, as such, a single It is not suitable for profiling cells. This method could potentially be used to detect other analytes such as genomic DNA, however it fails to provide a direct readout of the genomic sequence and the presence/absence of known sequences. can only provide a signal of Because it is based on hybridization, it is also partially tolerant of sequence variants and may not be able to distinguish between different sequence variants.

シーケンシングによるトランスクリプトーム及びエピトープの細胞インデックス化(cellular indexing of transcriptomes and epitopes by sequencing;CITE-seq)と称される、単一細胞における複数タンパク質及びRNA転写産物の統合分析のためのNGSベースの方法が、Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868、及びUS 2018/0251825により最初に記載された。この方法は、メッセンジャーRNA上に存在するものと類似の抗体タグ上に存在する3'-ポリアデノシンテイルを通して、細胞タンパク質及びトランスクリプトーム測定を単一細胞リードアウトへと統合するために用いられる、オリゴヌクレオチド標識抗体に依存する。この方法は、10X Genomics社により提供されるもの等の、単一細胞における試料分割のための液滴ベースのアプローチ及び単一細胞ライブラリー作製と相性が良い。より詳細には、CITE-seq法では、細胞表面エピトープに対するオリゴヌクレオチド標識抗体を用いて染色された細胞が、微小流体法により、溶解性酵素及びバーコード化されたビーズを含有する油滴中に分割される。各単一細胞/液滴由来のバーコード化抗体及びmRNAは、固有の細胞バーコードを有するビーズにより捕捉される。続いて、mRNAがレトロ転写され、バーコード抗体由来のオリゴと共に増幅されて、直ちにシーケンシングできるNGSライブラリーを生じる。最終的に、バーコード抗体の定量化のために、配列カウントが用いられる。同様に、Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939は、DNA標識抗体及び液滴微小流体工学に基づくRNA発現及びタンパク質定量化アッセイ(REAP-seq)という方法を教示し、この方法によれば、82種類のバーコード化抗体を用いてタンパク質を定量化することができ、且つ20000種類超の転写を単一細胞においてプロファイリングすることができる。上記で言及された方法の両方が、ポリ(dT)細胞バーコードを用いてプライミングされたオリゴ標識抗体を伸長し、同時に、同じ反応中でmRNAから相補的DNAを合成する逆転写酵素のDNAポリメラーゼ活性を利用する。他方で、これもまた液滴アプローチに基づく他の方法が、ゲノム全体のコピー数プロファイルの分析のために、又は単一細胞におけるゲノム配列の分析のために利用可能である。例えば、10X Genomics社により市販されている溶液であるクロミウム単一細胞CNV溶液は、数百~数千の単一細胞のコピー数プロファイリングを可能にし、Mission Bio社のTapestri(登録商標)プラットフォームは、配列に関する単一細胞標的化DNAシーケンシング及び遺伝子のパネルのCNV分析を提供する。 An NGS-based approach for integrated analysis of multiple protein and RNA transcripts in single cells, termed cellular indexing of transcriptomes and epitopes by sequencing (CITE-seq). The method was originally described by Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868, and US 2018/0251825. This method is used to integrate cellular protein and transcriptome measurements into single-cell readouts through 3'-polyadenosine tails present on antibody tags similar to those present on messenger RNA. Depends on oligonucleotide labeled antibody. This method is compatible with droplet-based approaches for sample partitioning in single cells and single-cell library generation, such as those offered by 10X Genomics. More specifically, in the CITE-seq method, cells stained with oligonucleotide-labeled antibodies against cell surface epitopes are placed in oil droplets containing lytic enzymes and barcoded beads by a microfluidic method. split. Barcoded antibodies and mRNA from each single cell/droplet are captured by beads with unique cell barcodes. The mRNA is then retrotranscribed and amplified with barcode antibody-derived oligos to generate a sequence-ready NGS library. Finally, sequence counting is used for barcode antibody quantification. Similarly, Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939, describe RNA expression and protein quantification based on DNA labeled antibodies and droplet microfluidics. It teaches a method called quantification assay (REAP-seq), in which 82 barcoded antibodies can be used to quantify proteins and more than 20,000 transcripts can be profiled in a single cell. can do. Both of the methods mentioned above extend an oligo-labeled antibody primed with a poly(dT) cell barcode and, at the same time, reverse transcriptase DNA polymerase synthesizes complementary DNA from mRNA in the same reaction. Use activity. On the other hand, other methods, also based on the droplet approach, are available for analysis of genome-wide copy number profiles or for analysis of genomic sequences in single cells. For example, Chromium Single Cell CNV Solution, a solution marketed by 10X Genomics, allows copy number profiling of hundreds to thousands of single cells, and Mission Bio's Tapestri® platform, Single-cell targeted DNA sequencing for sequences and CNV analysis of a panel of genes are provided.

これらの方法の短所は、以下の通りである:
- ゲノムDNAはそれを増幅するために必要なポリアデノシンテイルを保有しないので、上記の同時トランスクリプトーム/プロテオームプロファイリングのための両方の方法が、タンパク質又は転写産物と一緒でのゲノム配列の同時分析を可能にしない。
- コピー数及び又は標的化シーケンシングのためのDropseqに基づく方法は、ゲノムDNAの分析に対してのみ好適であるが、単一細胞の表面マーカー若しくは他のタンパク質の転写プロファイル又は定量化等の表現型に関するいかなる情報も提供しない。
- 液滴ベースの単一細胞分割アプローチでは、単一細胞及びそれらの全ての情報含有物がこのプロセス中に原則として「破壊」され、手順が完了した後に、更なる分析を行うために単一細胞を回収することが可能でない。
Disadvantages of these methods are:
- Both methods for simultaneous transcriptome/proteome profiling described above require simultaneous analysis of genomic sequences together with proteins or transcripts, since genomic DNA does not possess the polyadenosine tails necessary to amplify it. does not allow
- Dropseq-based methods for copy number and/or targeted sequencing are suitable only for the analysis of genomic DNA, but not for expression of single cell surface markers or other protein transcriptional profiles or quantification, etc. It does not provide any information about the type.
- In the droplet-based single-cell splitting approach, single cells and all their information content are essentially 'destroyed' during this process, and after the procedure is completed, single cells are separated for further analysis. It is not possible to harvest the cells.

EP1109938EP1109938 WO 2017/178655WO 2017/178655 WO 2019/016401WO 2019/016401 US 9,714,937US 9,714,937 US 2018/0251825US 2018/0251825

Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129 Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370 Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639 Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002 Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742 Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science. 1198704 Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075 Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019 Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473 Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974 Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/ nar/gkr424 Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5 Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868 Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939

したがって、本発明の目的は、ゲノム全体のコピー数プロファイル/ゲノム配列の分析及び同じ単一細胞に対するタンパク質発現の分析を同時に可能にする、生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法を提供することであり、これにより、当技術分野の技術水準の以下の短所のうちの1つ又は複数が特に克服される:
- 単一細胞分解能まで下がって同じ試料中でタンパク質を検出及び定量化し、且つゲノムを分析することが不可能であること、
- 追加の標的化ゲノム情報に関して単一細胞を再分析することが不可能であること。
It is therefore an object of the present invention to develop whole-genome amplification and analysis of multiple target molecules in a biological sample that allows simultaneous analysis of genome-wide copy number profiles/genomic sequences and analysis of protein expression on the same single cell. The object is to provide a method for, which specifically overcomes one or more of the following disadvantages of the state of the art:
- the inability to detect and quantify proteins in the same sample and analyze the genome down to single-cell resolution;
- Inability to reanalyze single cells for additional targeted genomic information.

この目的は、請求項1に規定される方法により達成される。 This object is achieved by the method defined in claim 1.

本発明の更なる目的は、請求項17に規定されるキットを提供することである。 A further object of the invention is to provide a kit as defined in claim 17.

本発明に従う3'タグ付きオリゴ配列を用いないか(図1A)又は用いる(図1B)、タグ付きオリゴヌクレオチドの2種類の考えられる実施形態の全体構造を示す図である。PL=ペイロード配列;5-TOS=第1のタグ付きオリゴヌクレオチド増幅配列;3-TOS=第2のタグ付きオリゴヌクレオチド増幅配列;UMI=固有分子識別子配列;BAB=結合剤バーコード配列。Figure 1 shows the overall structure of two possible embodiments of tagged oligonucleotides, without (Fig. IA) or with (Fig. IB) 3' tagged oligo sequences according to the invention. PL = payload sequence; 5-TOS = first tagged oligonucleotide amplification sequence; 3-TOS = second tagged oligonucleotide amplification sequence; UMI = unique molecular identifier sequence; BAB = binding agent barcode sequence. 一方は異なる温度で5-TOS及び3-TOSの間での分子内ヘアピン形成を生じ易い、2種類の異なるタグ付きオリゴからのタグ付きオリゴヌクレオチドライブラリーを表すグラフを示す図である(「ヘアピンあり」:Tm=67℃;「ヘアピンなし」:Tm=45℃)。x軸上に予測されるUMIカウントを示し、y軸上にシーケンシング後にカウントされたUMIを示す。FIG. 10 shows a graph representing a tagged oligonucleotide library from two different tagged oligos, one prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (“Hairpins”). with": Tm=67°C; "without hairpin": Tm=45°C). Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis. 27回のPCRサイクルを用いる異なる量でのオリゴ混合物の増幅を表すグラフを示す図である。各希釈は、3回の独立した希釈複製から行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。FIG. 10 shows a graph representing amplification of oligo mixtures with different amounts using 27 PCR cycles. Each dilution was performed from 3 independent dilution replicates. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. 異なる量での異なるBABを用いた4種類のオリゴ混合物の増幅の3つのグラフを示す図である。各希釈は、それぞれ1つが各オリゴに対する、4つのデータ点を有する。図4A:23回のPCRサイクルを行った。図4B:27回のPCRサイクルを行った。図4C:35回のPCRサイクルを行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。FIG. 3 shows three graphs of amplification of four oligo mixtures with different BABs at different amounts. Each dilution has 4 data points, one for each oligo. Figure 4A: 23 PCR cycles were performed. Figure 4B: 27 PCR cycles were performed. Figure 4C: 35 PCR cycles were performed. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. 1回のプライマー増幅を伴うタグ付きオリゴの本発明に従う実施形態の構造を示す図である。追加の脚注:5-WGAH=5'WGAハンドル配列;3-WGAH=3'WGAハンドル配列;1AH=第1の増幅ハンドル配列;2AH=第2の増幅ハンドル配列。FIG. 3 shows the structure of an embodiment according to the invention of tagged oligos with one primer amplification. Additional footnotes: 5-WGAH=5'WGA handle sequence; 3-WGAH=3'WGA handle sequence; 1AH=first amplification handle sequence; 2AH=second amplification handle sequence. 少なくとも第2のプライマー増幅を伴うタグ付きオリゴの本発明に従う別の実施形態の構造を示す図である。図6A:タグ付きオリゴ及びBABに対応するアニーリング部位を有する相対的伸長オリゴヌクレオチドの構造。図6B:タグ付きオリゴ及びBABに対応しないアニーリング部位を有する相対的伸長オリゴヌクレオチドの構造。追加の脚注:E-p=5'伸長オリゴヌクレオチド配列;SS=スペーサー配列;AS=アニーリング配列;AS-RC=アニーリング配列逆相補体。Fig. 2 shows the structure of another embodiment according to the invention of tagged oligos with at least a second primer amplification; Figure 6A: Structures of tagged oligos and relatively extended oligonucleotides with annealing sites corresponding to BAB. Figure 6B: Structures of tagged oligos and relatively extended oligonucleotides with annealing sites that do not correspond to BAB. Additional footnotes: E-p = 5' extension oligonucleotide sequence; SS = spacer sequence; AS = annealing sequence; AS-RC = annealing sequence reverse complement. 分子長の関数としての、ssDNA分子の末端に位置する15nt長相補的配列により誘導されるヘアピンの融解温度([Na+]=150mM;[Mg++]=4mM)のin silico予測のグラフを示す図である。Graphs of the in silico prediction of the melting temperature of hairpins induced by 15 nt-long complementary sequences located at the ends of ssDNA molecules ([Na + ]=150 mM; [Mg ++ ]=4 mM) as a function of molecular length. FIG. 4 is a diagram showing; 少なくとも3回のプライマー増幅を伴うタグ付きオリゴの本発明に従う別の実施形態の構造を示す図である。FIG. 3 shows the structure of another embodiment according to the invention of tagged oligos with at least 3 rounds of primer amplification. ライブラリー作製のための一般的スキームを示す図である。図9A:図5の実施形態に従うタグ付きオリゴからのライブラリーの作製。図9B:図6Aの実施形態に従うタグ付きオリゴからのライブラリーの作製。図9C:図8の実施形態に従うタグ付きオリゴからのライブラリーの作製。追加の脚注:2AH-RC=第2の増幅ハンドル配列逆相補体。FIG. 1 shows a general scheme for library construction. FIG. 9A: Generation of libraries from tagged oligos according to the embodiment of FIG. Figure 9B: Generation of libraries from tagged oligos according to the embodiment of Figure 6A. FIG. 9C: Generation of libraries from tagged oligos according to the embodiment of FIG. Additional footnote: 2AH-RC = reverse complement of second amplification handle sequence. P5-Synthオリゴの設計及び実施例1に開示される対応するライブラリープライマーを示す図である。FIG. 1 shows the design of P5-Synth oligos and the corresponding library primers disclosed in Example 1. FIG. 実施例1に従うライブラリープライマーを用いるオリゴP5-SynthのNGSライブラリー作製のスキームを示す図である。1 shows a scheme for NGS library construction of oligo P5-Synth using library primers according to Example 1. FIG. Ab-オリゴ及び二次蛍光抗体を用いて染色されたPBMC細胞及びSK-BR-3細胞の散布図を示す図である。x軸上にAPCチャンネルでの蛍光レベルを示し、これはAb-オリゴtag1、tag2及びtag4の量に比例する。y軸上にPEチャンネルでの蛍光レベルを示し、これはAb-オリゴtag3の量に比例する。Scatter plots of PBMC cells and SK-BR-3 cells stained with Ab-oligos and secondary fluorescent antibodies. On the x-axis is shown the level of fluorescence in the APC channel, which is proportional to the amount of Ab-oligos tag1, tag2 and tag4. On the y-axis is shown the level of fluorescence in the PE channel, which is proportional to the amount of Ab-oligo tag3. 実施例1に従う単一細胞からのP5-synthタグ付きオリゴから作製されたライブラリー由来の電気泳動像を示す図である。FIG. 2 shows an electropherogram from a library made from P5-synth tagged oligos from a single cell according to Example 1. FIG. WGA後にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図14A)、Her2(図14B)、CD45(図14C)及びIgG1アイソタイプ対照(図14D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using WGA followed by tagged oligo amplification. UMI counts for cytokeratin (Figure 14A), Her2 (Figure 14B), CD45 (Figure 14C) and IgG1 isotype control (Figure 14D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA後にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図14A)、Her2(図14B)、CD45(図14C)及びIgG1アイソタイプ対照(図14D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using WGA followed by tagged oligo amplification. UMI counts for cytokeratin (Figure 14A), Her2 (Figure 14B), CD45 (Figure 14C) and IgG1 isotype control (Figure 14D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA中にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図15A)、Her2(図15B)、CD45(図15C)及びIgG1アイソタイプ対照(図15D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using tagged oligo amplification in WGA. UMI counts for cytokeratin (FIG. 15A), Her2 (FIG. 15B), CD45 (FIG. 15C) and IgG1 isotype control (FIG. 15D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA中にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図15A)、Her2(図15B)、CD45(図15C)及びIgG1アイソタイプ対照(図15D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using tagged oligo amplification in WGA. UMI counts for cytokeratin (FIG. 15A), Her2 (FIG. 15B), CD45 (FIG. 15C) and IgG1 isotype control (FIG. 15D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. P5-Lib1オリゴの設計及び実施例3に開示される対応するライブラリープライマーを示す図である。FIG. 2 shows the design of P5-Lib1 oligos and the corresponding library primers disclosed in Example 3. FIG. ライブラリープライマーを用いるP5-Lib1オリゴのNGSライブラリー作製のスキームを示す図である。FIG. 4 shows a scheme for NGS library construction of P5-Lib1 oligos using library primers. 単一細胞から取得されるCNA分析に対する低パスプロファイルの例を示す図である。図18A:P5-Lib1オリゴを用いてスパイク化され、且つ図5の実施形態に従って加工された単一細胞CNAプロファイル。図18B:P5-Synthオリゴを用いてスパイク化され、且つ図8の実施形態に従って加工された単一細胞CNAプロファイル。図18C:タグ付きオリゴスパイク化を伴わない単一細胞CNAプロファイル。全てのプロファイルは、典型的な損益を伴って、SK-BR-3細胞に対応する。小さな変動は、単一細胞ゲノム不均一性に起因する。FIG. 10 shows an example of a low pass profile for CNA analysis obtained from a single cell. FIG. 18A: Single-cell CNA profiles spiked with P5-Lib1 oligos and processed according to the embodiment of FIG. FIG. 18B: Single-cell CNA profiles spiked with P5-Synth oligos and processed according to the embodiment of FIG. Figure 18C: Single cell CNA profile without tagged oligo spiking. All profiles correspond to SK-BR-3 cells with typical gains and losses. Small variations are due to single-cell genomic heterogeneity. P5-Synth及びP5-Lib1を用いる単一細胞スパイク化から取得されたタグ付きオリゴライブラリーを表すグラフを示す図である。x軸上に予測されるUMIカウントを示し、y軸にはシーケンシング後にカウントされたUMIを示す。FIG. 10 shows a graph representing tagged oligo libraries obtained from single cell spiking with P5-Synth and P5-Lib1. Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis.

定義
別途定義されない限り、本明細書中で用いられる全ての技術用語及び科学用語は、本発明が属する技術分野の当業者により通常理解されるのと同じ意味を有する。本明細書中に記載されるものに類似するか又は等価である多数の方法及び材料を本発明の実施又は試行で用いることができるが、好ましい方法及び材料が以下に記載される。別途言及されない限り、本発明に伴う使用のために本明細書中に記載される技術は、当業者に周知の標準的方法論である。
DEFINITIONS Unless defined otherwise, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although numerous methods and materials similar or equivalent to those described herein can be used in the practice or trial of the present invention, preferred methods and materials are described below. Unless otherwise noted, the techniques described herein for use with the present invention are standard methodologies well known to those skilled in the art.

「ab-オリゴミックス」とは、細胞の内部(すなわち、「内部ab-オリゴミックス」)、及び/若しくは外部(すなわち、「外部ab-オリゴミックス」)エピトープ及び/又はアイソタイプ対照ab-オリゴを標的とする全てのab-オリゴを含有する溶液を意図する。 "ab-oligomix" targets epitopes and/or isotype control ab-oligos internal (i.e., "internal ab-oligomix") and/or external (i.e., "external ab-oligomix") of the cell A solution containing all ab-oligos with

「抗体-オリゴヌクレオチドコンジュゲート」又は「ab-オリゴコンジュゲート」又は「ab-オリゴ」とは、抗体分子とssDNAオリゴヌクレオチド分子との化学的コンジュゲート化により誘導される合成分子を意図する。化学的コンジュゲート化は、通常、共有的な2つの分子の連結を可能にする特異的化学反応を用いて行われる。抗体:オリゴヌクレオチド化学量論は、特定される比率を有するために制御することができる。WGA初期段階の間に、抗体部分は通常は消化されて、オリゴヌクレオチド部分のみが残る。簡略化のために、説明の中では、これらの分子はそれでもab-オリゴ分子又はab-オリゴアンプリコンと称されるであろう。 By "antibody-oligonucleotide conjugate" or "ab-oligoconjugate" or "ab-oligo" is intended a synthetic molecule derived from the chemical conjugation of an antibody molecule and an ssDNA oligonucleotide molecule. Chemical conjugation is usually performed using specific chemical reactions that allow the covalent linking of two molecules. Antibody:oligonucleotide stoichiometry can be controlled to have a specified ratio. During the early stages of WGA, the antibody portion is usually digested leaving only the oligonucleotide portion. For simplicity, in the description these molecules will still be referred to as ab-oligomolecules or ab-oligoamplicons.

頭字語「APC」とは、フルオロフォアであるアロフィコシアニンを意図する。 The acronym "APC" intends the fluorophore allophycocyanin.

「結合剤バーコード配列」(BAB)とは、結合剤を特定する固有のDNAオリゴヌクレオチド配列を意図する。 By "binding agent barcode sequence" (BAB) is intended a unique DNA oligonucleotide sequence that identifies a binding agent.

「平衡化PCR増幅」とは、それにより、各PCRサイクルにおいて、実質的に全ての標的分子が増幅される、複数標的の増幅を行うためのPCRの特徴を意図する。 By "balanced PCR amplification" is intended a feature of PCR for the amplification of multiple targets whereby substantially all target molecules are amplified in each PCR cycle.

「結合剤」とは、指定された標的分子(例えば、タンパク質又はグリコシル化タンパク質又はリン酸化タンパク質)に特異的に結合できる分子(非限定的な例として、抗体、アフィボディ、リガンド、アプタマー、合成結合性タンパク質、小分子等)を意図する。 A "binding agent" is a molecule (non-limiting examples include antibodies, affibodies, ligands, aptamers, synthetic binding proteins, small molecules, etc.).

「CITE-Seq」又は「シーケンシングによるトランスクリプトーム及びエピトープの細胞インデックス化」とは、単一細胞における同時でのタンパク質定量化及びmRNAシーケンシングのための、Stoeckius等により開発された方法を意図する。 By "CITE-Seq" or "Cellular Indexing of Transcriptomes and Epitopes by Sequencing" is intended the method developed by Stoeckius et al. for simultaneous protein quantification and mRNA sequencing in single cells. do.

「CyTOF」又は「飛行時間によるサイトメトリー」とは、サイトメトリーと組み合わせた質量分析を用いて単一細胞でのタンパク質の定量化を可能にする、マスサイトメトリー技術を行う装置を意図する。細胞は、重金属同位体とコンジュゲート化された結合剤を用いて染色される。 By "CyTOF" or "time-of-flight cytometry" is intended a device that performs mass cytometry techniques that allows quantification of proteins in single cells using mass spectrometry coupled with cytometry. Cells are stained with a binding agent conjugated to a heavy metal isotope.

用語「コンジュゲート」とは、結合剤とタグ付きオリゴヌクレオチドとの共有結合によるコンジュゲート化によって得られる分子を意図する。 The term "conjugate" intends a molecule obtained by covalent conjugation of a binding agent and a tagged oligonucleotide.

「コピー数変化」(CNA)とは、一般的に同じ個体ゲノムに関して規定される、ゲノム領域のコピー数の体細胞変化を意図する。 By "copy number alteration" (CNA) is intended a somatic alteration in the copy number of a genomic region, generally defined with respect to the same individual's genome.

「DNAライブラリー精製」とは、それによりDNAライブラリー材料が、酵素、dNTP、塩及び/又は所望のDNAライブラリーの一部分でない他の分子等の、望ましくない反応成分から分離されるプロセスを意図する。DNAライブラリー精製プロセスの例は、Agencourt AMPure、又はMerck Millipore Amiconスピンカラム又はBeckman Coulter社のもの等の固相可逆的固相化(SPRI)ビーズを用いる精製である。 By "DNA library purification" is intended the process by which DNA library material is separated from undesirable reaction components such as enzymes, dNTPs, salts and/or other molecules that are not part of the desired DNA library. do. An example of a DNA library purification process is purification using Agencourt AMPure, or solid phase reversible immobilization (SPRI) beads such as those from Merck Millipore Amicon spin columns or Beckman Coulter.

「DNAライブラリー定量化」とは、それによりDNAライブラリー材料が定量化されるプロセスを意図する。DNAライブラリー定量化プロセスの例は、QuBit技術、電気泳動アッセイ(Agilent Bioanalyzer 2100、Perkin Elmer LabChip technologies社)又はRT-PCR PicoGreenシステム(Kapa Biosystems社)を用いる定量化である。 By "DNA library quantification" is intended the process by which DNA library material is quantified. Examples of DNA library quantification processes are quantification using QuBit technology, electrophoresis assays (Agilent Bioanalyzer 2100, Perkin Elmer LabChip technologies) or RT-PCR PicoGreen system (Kapa Biosystems).

「ダイナミックレンジ」とは、ある量が想定できる最大値と最小値との比率を意図する。 By "dynamic range" is intended the ratio between the maximum and minimum values that a quantity can assume.

「ライブラリープライマー」とは、タグ付きオリゴヌクレオチドからの超並列シーケンシング可能なライブラリーを作製するために、プライマーとして機能するssDNA分子を意図する。 By "library primer" is intended an ssDNA molecule that serves as a primer to generate a massively parallel sequenceable library from tagged oligonucleotides.

「低パス全ゲノムシーケンシング」又は「低パスシーケンシング」とは、1未満の平均シーケンシング深度での全ゲノムシーケンシングを意図する。 By “low-pass whole-genome sequencing” or “low-pass sequencing” is intended whole-genome sequencing with an average sequencing depth of less than one.

「超並列シーケンシング」又は「次世代シーケンシング」(NGS)とは、クローン的にシーケンシングされる(事前のクローン増幅あり又はなしで)、空間的且つ/又は時間的に分離したDNA分子のライブラリーの作製を含む、DNAをシーケンシングする方法を意図する。例としては、Illuminaプラットフォーム(Illumina社)、IonTorrentプラットフォーム(ThermoFisher Scientific社)、Pacific Biosciencesプラットフォーム、MinIon(Oxford Nanopore Technologies社)が挙げられる。 "Massively Parallel Sequencing" or "Next Generation Sequencing" (NGS) refers to spatially and/or temporally separated DNA molecules that are clonally sequenced (with or without prior clonal amplification). Methods of sequencing DNA, including library generation, are contemplated. Examples include the Illumina platform (Illumina), IonTorrent platform (ThermoFisher Scientific), Pacific Biosciences platform, MinIon (Oxford Nanopore Technologies).

「多重アニーリング及びループピングベース増幅サイクル」(MALBAC)とは、準線形全ゲノム増幅法を意図する(Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.)。MALBACプライマーは、鋳型にハイブリダイズするための8ヌクレオチド3'ランダム配列、及び27ヌクレオチド5'共通配列(GTG AGT GAT GGT TGA GGT AGT GTG GAG)を有する。最初の伸長後、セミアンプリコンが別の伸長の鋳型として用いられて、相補的な5'末端及び3'末端を有する完全アンプリコンが生じる。数サイクルの準線形増幅に続いて、完全アンプリコンを、その後のPCRサイクルを用いて指数関数的に増幅することができる。 By "multiple annealing and looping-based amplification cycle" (MALBAC) is intended a quasi-linear whole genome amplification method (Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.). The MALBAC primer has an 8 nucleotide 3' random sequence to hybridize to the template and a 27 nucleotide 5' consensus sequence (GTG AGT GAT GGT TGA GGT AGT GTG GAG). After the first extension, the semi-amplicon is used as a template for another extension to generate a full amplicon with complementary 5' and 3' ends. Following several cycles of quasi-linear amplification, the full amplicon can be exponentially amplified using subsequent cycles of PCR.

用語「オリゴヌクレオチド」又は「オリゴ」とは、非限定的な例として、デオキシリボ核酸(DNA)、リボ核酸(RNA)、ロックド核酸(LNA)、ペプチド核酸(PNA)等のヌクレオチドの配列を含むオリゴマー分子を意図する。 The term "oligonucleotide" or "oligo" means an oligomer comprising a sequence of nucleotides such as deoxyribonucleic acid (DNA), ribonucleic acid (RNA), locked nucleic acid (LNA), peptide nucleic acid (PNA), etc., as non-limiting examples. Molecules are intended.

「タグ付きオリゴヌクレオチド」又は「タグ付きオリゴ」とは、結合剤(例えば、一次抗体)に直接的にコンジュゲート化されているオリゴヌクレオチド分子(例えば、ssDNA分子)を意図する。タグ付きオリゴは、結合剤に対するリガンドである標的分子(例えば、タンパク質)の間接的定量化のために用いられる。 By "tagged oligonucleotide" or "tagged oligo" is intended an oligonucleotide molecule (eg, ssDNA molecule) that is directly conjugated to a binding agent (eg, primary antibody). Tagged oligos are used for indirect quantification of target molecules (eg, proteins) that are ligands to binding agents.

頭字語「PE」とは、フルオロフォアであるフィコエリトリンを意図する。 The acronym "PE" intends the fluorophore phycoerythrin.

「PFA 2%」とは、リン酸緩衝生理食塩液中の2%w/vのパラホルムアルデヒドの溶液を意図する。 By "PFA 2%" is intended a solution of 2% w/v paraformaldehyde in phosphate buffered saline.

「一次WGA DNAライブラリー」(pWGAlib)とは、WGA反応から取得されるDNAライブラリーを意図する。 By "primary WGA DNA library" (pWGAlib) is intended a DNA library obtained from a WGA reaction.

用語「再増幅」又は「再amp」とは、一次WGA DNAライブラリーのうちの全部又は相当な部分が更に増幅されるPCR反応を意図する。 By the term "reamplification" or "reampl" is intended a PCR reaction in which all or a substantial portion of the primary WGA DNA library is further amplified.

「残基」とは、タンパク質においてポリペプチド鎖中に存在するアミノ酸残基を意図する。 By "residue" is intended an amino acid residue present in a polypeptide chain in a protein.

「シーケンシングバーコード」とは、1つのシーケンサーリード内でシーケンシングされる場合に、そのリードを、バーコードと関連付けられる特異的試料に対して割り当てることを可能にするポリヌクレオチド配列を意図する。 By "sequencing barcode" is intended a polynucleotide sequence that, when sequenced within one sequencer read, allows the assignment of that read to the specific sample associated with the barcode.

「UMI」又は「固有分子識別子配列」とは、各ssDNA又はdsDNA分子に対して実質的に固有である縮重又は部分縮重(すなわち、ランダム又は半ランダム)オリゴヌクレオチド配列を意図する。 By "UMI" or "Unique Molecular Identifier Sequence" is intended a degenerate or partially degenerate (ie, random or semi-random) oligonucleotide sequence that is substantially unique for each ssDNA or dsDNA molecule.

「普遍的WGAプライマー」又は「WGA PCRプライマー」とは、制限酵素の作用により作製される各断片に対してライゲーションした追加のオリゴヌクレオチドを意図する。普遍的WGAプライマーは、Ampli1(商標)WGA等のDRS-WGAにおいて用いられる。 By "universal WGA primer" or "WGA PCR primer" is intended an additional oligonucleotide ligated to each fragment generated by the action of a restriction enzyme. Universal WGA primers are used in DRS-WGA, such as Ampli1™ WGA.

発明の詳細な説明
本発明に従うゲノムDNA及び標的分子を含む生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法は、以下の工程を含む。
DETAILED DESCRIPTION OF THE INVENTION A method for whole genome amplification and analysis of multiple target molecules in a biological sample containing genomic DNA and target molecules according to the present invention comprises the following steps.

工程a)では、生物学的試料が用意される。生物学的試料は、好ましくは単一細胞であるが、数個の細胞を含む試料も用いることができる。 In step a) a biological sample is provided. The biological sample is preferably a single cell, but samples containing several cells can also be used.

工程b)では、タグ付きオリゴヌクレオチドとコンジュゲート化された、少なくとも1種の標的分子に対する1種の結合剤と、生物学的試料を接触させて、それにより、少なくとも1種の標的分子が生物学的試料中に存在する場合、該少なくとも1種の結合剤は、該少なくとも1種の標的分子に結合する。 In step b), the biological sample is contacted with one binding agent for at least one target molecule conjugated with the tagged oligonucleotide, whereby the at least one target molecule is When present in a biological sample, the at least one binding agent binds to the at least one target molecule.

結合剤は、好ましくは、抗体又はその断片、アプタマー、小分子、ペプチド、及びタンパク質からなる群から選択される。標的分子は、好ましくは、タンパク質、ペプチド、糖タンパク質、炭水化物、脂質、及びそれらの組み合わせからなる群から選択される。より好ましくは、結合剤は抗体である。結合剤は、モノクローナル抗体若しくは酵素基質等の特異的化学量論を有するか、又はポリクローナル抗体若しくは小分子等の特定されていない化学量論を有する標的分子に結合する。前者は、後者に対して標的の比較的良好な定量化を可能にする。結合剤は、共有結合相互作用又は非共有的相互作用を介して、タグ付きオリゴに化学的にコンジュゲート化される。前者の場合には、オリゴと結合剤の両方が、相互的な結合を可能にする反応性部分を保有する。結合剤:オリゴの化学量論は、コンジュゲート化手順の間に制御することができる。 Binding agents are preferably selected from the group consisting of antibodies or fragments thereof, aptamers, small molecules, peptides and proteins. Target molecules are preferably selected from the group consisting of proteins, peptides, glycoproteins, carbohydrates, lipids, and combinations thereof. More preferably the binding agent is an antibody. Binding agents bind target molecules with a specific stoichiometry, such as monoclonal antibodies or enzyme substrates, or with unspecified stoichiometry, such as polyclonal antibodies or small molecules. The former allows relatively better quantification of targets versus the latter. Binding agents are chemically conjugated to tagged oligos through covalent or non-covalent interactions. In the former case, both the oligo and the binding agent possess reactive moieties that allow mutual binding. Binder:oligo stoichiometry can be controlled during the conjugation procedure.

結合剤/標的分子の例の非限定的なリストは、以下の表1に報告される。 A non-limiting list of examples of binding agents/targeting molecules is reported in Table 1 below.

Figure 2023511492000002
Figure 2023511492000002

タグ付きオリゴヌクレオチドとして用いられるオリゴヌクレオチドは、好ましくは、5'末端又は3'末端に化学的修飾を有するssDNA又はdsDNA分子である。この修飾は、関連する結合剤との共有結合によるコンジュゲート化のために用いられる。 Oligonucleotides used as tagged oligonucleotides are preferably ssDNA or dsDNA molecules with chemical modifications at the 5' or 3' ends. This modification is used for covalent conjugation with relevant binding agents.

結合剤とコンジュゲート化されたタグ付きオリゴにより形成されるコンジュゲートは、細胞外エピトープと細胞内エピトープの両方を標的とする場合がある。「外部」及び「内部」コンジュゲートは、それらの最終染色濃度でコンジュゲートを含有する2種類の別個のミックスとして、生物学的試料に添加することができる。第1に、外部ミックスを、外部エピトープを標識するために添加する。第2に、界面活性剤又は同様の手段を用いて細胞を透過化し、内部ミックスを、内部エピトープを標識するために試料に添加する。或いは、外部及び内部コンジュゲートを、1ステップ染色を行うために、むしろ一緒に混合することができる。最終染色濃度は、各結合剤に対して異なり、且つ実験的に決定する必要がある。 Conjugates formed by tagged oligos conjugated to binding agents may target both extracellular and intracellular epitopes. The "external" and "internal" conjugates can be added to the biological sample as two separate mixes containing the conjugates at their final staining concentrations. First, an external mix is added to label the external epitope. Second, the cells are permeabilized using detergent or similar means and an internal mix is added to the sample to label internal epitopes. Alternatively, the external and internal conjugates can rather be mixed together to perform a one-step staining. The final staining concentration is different for each binding agent and has to be determined experimentally.

タグ付きオリゴ配列は、結合剤とのコンジュゲート化を容易にし、且つコストを低減するために、好ましくは300塩基よりも短く、より好ましくは120塩基よりも短い。好ましい実施形態では、タグ付きオリゴ配列は、60~80ヌクレオチドである。 Tagged oligo sequences are preferably shorter than 300 bases, more preferably shorter than 120 bases, to facilitate conjugation with binding agents and reduce costs. In preferred embodiments, the tagged oligo sequence is 60-80 nucleotides.

図1Aを参照すると、タグ付きオリゴヌクレオチドは、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、及び
ii)核酸の少なくとも1種の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含む。
Referring to FIG. 1A, tagged oligonucleotides are
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI), and
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS) of the nucleic acid
including.

ペイロード配列は、標的カウントのための必要な情報を含む。 The payload sequence contains the necessary information for target counting.

固有分子識別子配列(UMI)は、好ましくは、10~30ヌクレオチドの範囲の縮重又は半縮重配列である。好ましくは、UMIは、大部分の標的分子に対して十分な、理論上は4^10=1,048,576種類の異なる組み合わせに対応する、少なくとも10塩基の長さを有する。非常に豊富な標的分子に対して、12塩基等の、考えられる組み合わせを増加させるための、より長いUMIを用いることができる。半縮重塩基を用いると、考えられる組み合わせは減少し、UMI長は好ましくは増加して、例えば最大20又は30塩基となる。半縮重UMIは、配列を再アライメントして、存在する異なるUMIの過大評価を防ぐために、リードアウト中で用いることができる参照点を導入するために、有利に用いることができる。UMI配列は、BABの5'又は3'のいずれかに位置することができる。UMI配列は、優先的には、最初にシーケンシングされる塩基の複雑性を増大させるために、Read1シーケンシングプライマーアニーリング部位のすぐ後ろに位置する。初期シーケンシング工程がクラスター識別のための高い複雑性を必要とするので、これはIlluminaシーケンシングプラットフォームに関して有利である。BABは、各コンジュゲート分子に対して固定された配列である。BABは、一次PCR増幅及びシーケンシング工程を妨げ得る特徴(ホモ多量体、ヘアピン、及び/又はヘテロ二重鎖形成等)を回避するために設計され[Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362]、且つそれらの相対的ハミング距離を最大化して、それによりいずれかのPCR又はシーケンシングエラーがシーケンシングされたリードの誤った割り当てをもたらし得る可能性を最小限にするために、規定された長さの全ての考えられるBAB配列のプールから選択される。BAB長は、検出される標的分子の数に基づいて選択しなければならない。好ましくは、BABは、GC含量(例えば、[30%..70%])、ホモ多量体の非存在、ヘアピンの非存在及び最小ハミング距離(好ましくは3nt以上)に対するフィルターを適用した後に、約2000種類の考えられるBAB配列まで減少する、理論上は4^10=1,048,576種類の異なる組み合わせに対応する、少なくとも10ヌクレオチドの長さを有する。 A unique molecular identifier sequence (UMI) is preferably a degenerate or semi-degenerate sequence ranging from 10 to 30 nucleotides. Preferably, UMIs have a length of at least 10 bases, which is sufficient for most target molecules, corresponding theoretically to 4^10 = 1,048,576 different combinations. For highly abundant target molecules, longer UMIs can be used to increase the possible combinations, such as 12 bases. Using semi-degenerate bases reduces the number of possible combinations and preferably increases the UMI length, eg up to 20 or 30 bases. Semi-degenerate UMIs can be advantageously used to realign sequences to introduce reference points that can be used in readouts to prevent overestimation of different UMIs present. The UMI sequence can be located either 5' or 3' to the BAB. The UMI sequence is preferentially positioned immediately after the Read1 sequencing primer annealing site to increase the complexity of the first sequenced base. This is advantageous for Illumina sequencing platforms as the initial sequencing step requires high complexity for cluster identification. BAB is a fixed sequence for each conjugate molecule. BABs are designed to avoid features (such as homomultimers, hairpins, and/or heteroduplex formation) that can interfere with the primary PCR amplification and sequencing steps [Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362] and their relative Hamming distance pool of all possible BAB sequences of a defined length to minimize the possibility that any PCR or sequencing error could lead to misassignment of sequenced reads. is selected from The BAB length should be chosen based on the number of target molecules to be detected. Preferably, the BAB is about It has a length of at least 10 nucleotides, which theoretically corresponds to 4^10 = 1,048,576 different combinations, reduced to 2000 possible BAB sequences.

第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)は、タグ付きオリゴの5'に位置する。この配列は、タグ付きオリゴ増幅及びその後のライブラリー作製のために必要である。タグ付きオリゴ増幅は、適正なUMIカウントを妨げ得る、試料加工中の分子の喪失に起因するいかなるバイアスも回避するために必要である。 A first tagged oligonucleotide amplification sequence (5-TOS) is located 5' to the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library construction. Tagged oligo amplification is necessary to avoid any bias due to loss of molecules during sample processing that could interfere with proper UMI counting.

図1Bを参照すると、標的オリゴヌクレオチドは、好ましくは、少なくとも1種の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)を更に含む。この配列は、タグ付きオリゴの3'に位置する。この配列は、タグ付きオリゴ増幅及びその後のライブラリー作製のために必要である。タグ付きオリゴ増幅は、適正なUMIカウントを妨げ得る、試料加工中の分子の喪失に起因するいかなるバイアスも回避するために必要である。 Referring to Figure IB, the target oligonucleotide preferably further comprises at least one second tagged oligonucleotide amplification sequence (3-TOS). This sequence is located 3' of the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library construction. Tagged oligo amplification is necessary to avoid any bias due to loss of molecules during sample processing that could interfere with proper UMI counting.

好ましい実施形態では、5-TOS及び3-TOS配列は、ヘアピン及び増幅温度範囲内での他の分子内の安定的二次構造の形成を回避するために設計され、なぜなら、それらはタグ付きオリゴ増幅を妨げる可能性があるからである。図2は、一方は異なる温度で5-TOS及び3-TOSの間での分子内ヘアピン形成を生じ易い、2種類の異なるタグ付きオリゴからのタグ付きオリゴヌクレオチドライブラリーを表すグラフを示す(「ヘアピンあり」:Tm=67℃、配列番号50、ΔG=-11.15kcal/mol;「ヘアピンなし」:Tm=45℃、配列番号51、ΔG=-1.52kcal/mol)。x軸上に予測されるUMIカウントを示し、y軸上にシーケンシング後にカウントされたUMIを示す。 In a preferred embodiment, the 5-TOS and 3-TOS sequences are designed to avoid the formation of stable secondary structures in hairpins and other intramolecules within the amplification temperature range, since they are similar to tagged oligos. This is because it may interfere with amplification. Figure 2 shows a graph representing a tagged oligonucleotide library from two different tagged oligos, one of which is prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (" with hairpin": Tm=67°C, SEQ ID NO:50, ΔG=-11.15 kcal/mol; "without hairpin": Tm=45°C, SEQ ID NO:51, ΔG=-1.52 kcal/mol). Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis.

タグ付きオリゴ及びそれらの増幅プライマーは、最大感度、広いダイナミックレンジ、平衡化PCR増幅及び再現性を達成するために最適化される。 Tagged oligos and their amplification primers are optimized to achieve maximum sensitivity, wide dynamic range, balanced PCR amplification and reproducibility.

本発明の好ましい実施形態では、UMI配列長は、0~約106分子の範囲内で標的を定量化するために選択された(n=10)。 In a preferred embodiment of the invention, UMI sequence lengths were chosen to quantify targets within the range of 0 to about 10 6 molecules (n=10).

ダイナミックレンジは、4桁の大きさにわたる(102~106分子)濃度を有するタグ付きオリゴの増幅により特徴付けられた。図3は、27回のPCRサイクルを用いる異なる量でのオリゴ混合物の増幅を表すグラフを示す。各希釈は、3回の独立した希釈複製から行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。増幅前の観測されたUMIと予測されたUMIとの間の102~106個の分子の範囲での非常に線形な相関を観察することができる。 The dynamic range was characterized by amplification of tagged oligos with concentrations spanning four orders of magnitude (10 2 -10 6 molecules). Figure 3 shows a graph representing the amplification of oligo mixtures with different amounts using 27 PCR cycles. Each dilution was performed from 3 independent dilution replicates. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. A very linear correlation in the range of 10 2 to 10 6 molecules can be observed between the observed UMI before amplification and the predicted UMI.

平衡化PCR増幅は、同じ出発試料に対する異なるサイクルの増幅を行うことにより特徴付けられた。図4A及び図4Bに示される通り、異なる回数の合計PCRサイクル(それぞれ23及び27PCRサイクル)を用いるタグ付きオリゴの同じプールの増幅は、観測されたUMIでの差異を生じず、このことは、PCRサイクル数がUMIカウントに影響しないことを示した。 Balanced PCR amplification was characterized by performing different cycles of amplification on the same starting sample. As shown in Figures 4A and 4B, amplification of the same pool of tagged oligos using different numbers of total PCR cycles (23 and 27 PCR cycles, respectively) produced no difference in the observed UMI, which indicates that We showed that the number of PCR cycles did not affect UMI counts.

感度は、異なる量(40分子まで下げられた)でのタグ付きオリゴのプールの増幅により特徴付けられた。図4Cに示される通り、102個のタグ付きオリゴ分子まで下げて定量化することが可能である。連続希釈溶液実験は、体積内での分子の高度に不均一な分布に起因するサンプリングバイアスを生じ易く、このことは、非常に希釈された溶液に特に関連があることを注記すべきである。つまり、観測される定量化の限界は、アッセイの限界よりもむしろ、実験設定に関連する過小評価である可能性がある。 Sensitivity was characterized by amplification of pools of tagged oligos at different amounts (down to 40 molecules). As shown in Figure 4C, it is possible to quantify down to 102 tagged oligo molecules. It should be noted that serial dilute solution experiments are prone to sampling bias due to the highly non-uniform distribution of molecules within the volume, and this is especially relevant for highly dilute solutions. Thus, the observed limits of quantification may be underestimations related to experimental settings rather than assay limits.

本発明に従う方法の工程c)では、未結合の結合剤を選択的に除去するための分離工程が行われることにより、標識された生物学的試料が取得される。分離工程は、典型的には、好適な緩衝剤溶液中で洗浄すること、及び標識された生物学的試料を遠心分離により回収することにより行われる。 In step c) of the method according to the invention, a labeled biological sample is obtained by performing a separation step to selectively remove unbound binding agent. The separation step is typically performed by washing in a suitable buffer solution and recovering the labeled biological sample by centrifugation.

工程d)では、標識された生物学的試料に対して、前記ゲノムDNAの全ゲノム増幅及び少なくとも1種の結合剤とコンジュゲート化されたタグ付きオリゴヌクレオチドの増幅が同時に行われる。ゲノムDNAの全ゲノム増幅は、確定的制限部位全ゲノム増幅(DRS-WGA)によるか、又は多重アニーリング及びルーピングベース増幅サイクル全ゲノム増幅(MALBAC)によるかのいずれかで行われる。 In step d) the labeled biological sample undergoes simultaneous whole-genome amplification of said genomic DNA and amplification of tagged oligonucleotides conjugated with at least one binding agent. Whole genome amplification of genomic DNA is performed either by deterministic restriction site whole genome amplification (DRS-WGA) or by multiplex annealing and looping-based amplification cycle whole genome amplification (MALBAC).

工程e)では、増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーが作製される。 In step e), a massively parallel sequencing library is generated from the amplified tagged oligonucleotides.

工程f)では、超並列シーケンシングライブラリーがシーケンシングされる。 In step f) the massively parallel sequencing library is sequenced.

工程g)では、各シーケンシングリードから結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)の配列が検索される。 In step g), each sequencing read is retrieved for binding agent barcode sequence (BAB) and unique molecular identifier sequence (UMI) sequences.

工程h)では、各結合剤に対して、異なる固有分子識別子配列(UMI)の個数がカウントされる。 In step h), the number of different unique molecular identifier sequences (UMI) is counted for each binding agent.

工程e)、f)、g)及びh)は、説明において以下で具体的な実施形態を参照して更に詳細に開示されるであろう。 Steps e), f), g) and h) will be disclosed in more detail below in the description with reference to specific embodiments.

上記で開示された方法は、好ましくは、生物学的試料から単一細胞を単離する工程を更に含む。単離は、特に、例えば、DEPArray(登録商標)NxT(Menarini Silicon Biosystems社)等の細胞選別機を用いて、細胞を選別する工程、又は、代替として、液滴中へと細胞を分割する工程により、行うことができる。単離工程は、好ましくは、工程c)の後で、且つ工程d)の前に行われる。 The methods disclosed above preferably further comprise isolating single cells from the biological sample. Isolation is in particular the step of sorting the cells, e.g. can be done by The isolation step is preferably performed after step c) and before step d).

上記で開示された方法は、好ましくは、工程f)の前に超並列シーケンシングライブラリーを精製する工程を含む。 The method disclosed above preferably comprises a step of purifying the massively parallel sequencing library prior to step f).

より具体的であるが、本説明の範囲を限定する意図を有しない用語では、Ampli1タンパク質(A1-P)とも指定される上記で開示された方法は、単一細胞のタンパク質の定量化及び全ゲノム遺伝学的特性決定を可能にする。単一細胞での単一又は複数タンパク質定量化は、タグ付きオリゴヌクレオチドとコンジュゲート化された結合剤(特に、抗体(Ab))のパネルを用いて達成される。これらのオリゴヌクレオチドは、DNAバーコード配列を用いてコンジュゲート化された抗体を明確に特定するために、且つエピトープ定量化のために用いられるランダム又は部分的縮重配列(すなわち、固有分子識別子(UMI))を用いて対象となるエピトープの存在量を定量化するために、設計される。生物学的試料は、それぞれが固有のDNAバーコード配列を有する、1つ又は複数のAb-オリゴコンジュゲートを用いて標識される。続いて、単一細胞又は細胞のプールを、異なる手段(すなわち、DEPArray(商標)NxTシステム)により単離することができ、且つそれらのゲノム内容物を、全ゲノム増幅(すなわち、Ampli1(商標)全ゲノム増幅キット)により増幅することができる。後者の工程中又はそのすぐ後に、タグ付きオリゴヌクレオチドを、NGSライブラリー作製手順の間のいかなるダウンサンプリングも回避するために、予備増幅する。特異的プライマー、すなわち、「ライブラリープライマー」を、直ちにシーケンシングできるNGS(Illumina社)ライブラリーを作製するために用いる。タグ付きオリゴヌクレオチドは、Ampli1(商標)WGA(A1-WGA)ワークフローと適合性になるように設計され、これにより、A1-Pを用いるタンパク質定量化と並行して、単一細胞遺伝学分析(例えば、Ampli1(商標)LowPass)が可能になる。 In terms that are more specific, but not intended to limit the scope of this description, the methods disclosed above, also designated Ampli1 protein (A1-P), provide quantification and total Enables genome genetic characterization. Single or multiple protein quantification in a single cell is achieved using a panel of binding agents (especially antibodies (Abs)) conjugated to tagged oligonucleotides. These oligonucleotides contain random or partially degenerate sequences (i.e., unique molecular identifiers ( Designed to quantify the abundance of epitopes of interest using UMI)). A biological sample is labeled with one or more Ab-oligo conjugates, each with a unique DNA barcode sequence. Single cells or pools of cells can then be isolated by different means (i.e. DEPArray™ NxT system) and their genomic content analyzed by whole genome amplification (i.e. Ampli1™). whole genome amplification kit). During or shortly after the latter step, the tagged oligonucleotides are pre-amplified to avoid any downsampling during the NGS library preparation procedure. Specific primers, ie, "library primers", are used to generate sequence-ready NGS (Illumina) libraries. Tagged oligonucleotides were designed to be compatible with the Ampli1™ WGA (A1-WGA) workflow, allowing parallel protein quantification using A1-P for single-cell genetic analysis ( For example, Ampli1™ LowPass) is enabled.

以下では、本発明の3つの具体的実施形態が開示され、これらはそれぞれ、タグ付きオリゴ増幅及び全ゲノム増幅に対して異なる数のプライマーを利用する。 Three specific embodiments of the invention are disclosed below, each of which utilizes a different number of primers for tagged oligo amplification and whole genome amplification.

第1の好ましい実施形態では、図5を参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)さらに核酸の第2の増幅ハンドル配列(2AH)及び3'全ゲノム増幅ハンドル配列(3-WGAH)を含む、核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含む。
In a first preferred embodiment, referring to Figure 5, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) a nucleic acid second tagged oligonucleotide amplification sequence (3-TOS) further comprising a nucleic acid second amplification handle sequence (2AH) and a 3' whole genome amplification handle sequence (3-WGAH);
including.

3-WGAHは、全ゲノム増幅中にgDNA及びタグ付きオリゴヌクレオチドの同時増幅を可能にする、5-WGAHの逆相補的配列である。1AH及び2AHは、それぞれペイロード配列の5'末端及び3'末端に位置し、且つその後のライブラリー作製のために用いられる。1AH及び2AHは、好ましくは、タグ付きオリゴ増幅を阻害し得る、ヘアピン等の安定的な分子内二次構造を回避するために設計される。上述の各配列の間には、固定された配列が存在し得る。 3-WGAH is the reverse complementary sequence of 5-WGAH that allows simultaneous amplification of gDNA and tagged oligonucleotides during whole genome amplification. 1AH and 2AH are located at the 5' and 3' ends of the payload sequence, respectively, and are used for subsequent library construction. 1AH and 2AH are preferably designed to avoid stable intramolecular secondary structures such as hairpins that can inhibit tagged oligo amplification. Between each of the above sequences there may be fixed sequences.

全ゲノム増幅及びタグ付きオリゴの増幅は、好ましくは、単一プライマーを用いて行われる。 Whole genome amplification and tagged oligo amplification are preferably performed using a single primer.

第2の好ましい実施形態では、図6A及び図6Bを参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)任意選択で、アニーリング配列(AS)
を含む。
In a second preferred embodiment, referring to Figures 6A and 6B, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) optionally an annealing sequence (AS)
including.

全ゲノム増幅及びタグ付きオリゴヌクレオチドの増幅のために少なくとも1種のプライマーが用いられ、且つタグ付きオリゴヌクレオチドの伸長のために少なくとも1種のオリゴヌクレオチド(E-p)が用いられ、該少なくとも1種のオリゴヌクレオチド(E-p)は、5'から3'に向かって、少なくとも、
d)5'全ゲノム増幅ハンドル配列(5-WGAH);
e)スペーサー配列(SS);
f)第2の増幅ハンドル配列(2AH);及び
g)アニーリング配列に対して逆相補的な配列(AS-RC)又は結合剤バーコード配列に対して逆相補的な配列(BAB-RC)
を含む。
at least one primer is used for whole genome amplification and amplification of the tagged oligonucleotide, and at least one oligonucleotide (Ep) is used for extension of the tagged oligonucleotide; Oligonucleotides (Ep) are 5' to 3' at least
d) 5' Whole Genome Amplification Handle Sequence (5-WGAH);
e) a spacer sequence (SS);
f) a second amplification handle sequence (2AH); and
g) a sequence that is reverse complementary to the annealing sequence (AS-RC) or reverse complementary to the binder barcode sequence (BAB-RC)
including.

言い換えると、タグ付きオリゴの増幅は、E-pの3'末端に位置するアニーリング配列逆相補体(AS-RC)によって、タグ付きオリゴの3'に位置するASに対するE-pのアニーリング(図6A)により起こり、したがってタグ付きオリゴ及びE-pの両方の3'伸長が反応内で引き起こされ、これにより、次にWGAプライマー増幅可能分子が生じる。或いは、ASは、BAB配列と一致することができ、且つE-pは、図6Bに示される通りにBAB逆相補体配列(BAB-RC)を介してBAB配列にアニーリングする。第1の選択肢(ASに対するアニーリング)は、単一E-pをいずれのBABと共にでも用いることができるという利点を有し、したがって、製造コスト及びプロトコールの複雑性が低減される。第2の選択肢(BABに対するアニーリング)は、存在量に大きな差異を有する標的に由来するシグナルを標準化するために有利に用いることができる。これは、非限定的な例として、非常に豊富なタグ付きオリゴの増幅を減少させるために、非常に豊富な可能性がある標的に対するプライマーの制限的な量を用いることにより、又は異なるBABアニーリング温度を用いることにより、達成できる。アニーリング温度は、BAB長及び/又は組成により調節することができる。 In other words, amplification of the tagged oligo occurs through the annealing sequence reverse complement (AS-RC) located at the 3' end of the E-p by annealing of the E-p to the AS located 3' of the tagged oligo (Fig. 6A). , thus causing 3' extension of both the tagged oligo and the E-p within the reaction, which in turn yields a WGA primer amplifiable molecule. Alternatively, the AS can match the BAB sequence and the E-p anneal to the BAB sequence via the BAB reverse complement sequence (BAB-RC) as shown in Figure 6B. The first option (annealing to AS) has the advantage that a single E-p can be used with any BAB, thus reducing manufacturing costs and protocol complexity. The second option (annealing to BAB) can be used advantageously to normalize signals from targets with large differences in abundance. This can be done, as non-limiting examples, by using limiting amounts of primers against potentially highly abundant targets to reduce amplification of highly abundant tagged oligos, or by different BAB annealing It can be achieved by using temperature. Annealing temperature can be adjusted by BAB length and/or composition.

タグ付きオリゴ及びE-pの伸長後に、WGAプライマーが、生じる比較的大きな分子内で、タグ付きオリゴの増幅を行うであろう。スペーサー配列(SS)は、タグ付きオリゴにより生成されるアンプリコンの長さを増加させる。増加した断片長は、断片の相補的末端により誘導されるヘアピン等の分子内二次構造を不安定化させ、したがってそれらの融解温度を低下させ(図7)、これは他のWGA断片と一緒でのタグ付きオリゴ増幅に好都合である(M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003))。伸長オリゴヌクレオチド(E-p)配列長は、好ましくは、60~300塩基の範囲内である。より好ましくは、伸長オリゴヌクレオチド(E-p)配列長は、120~200塩基の範囲内である。 After extension of the tagged oligo and E-p, the WGA primer will amplify the tagged oligo within the resulting relatively large molecule. Spacer sequences (SS) increase the length of amplicons generated by tagged oligos. The increased fragment length destabilizes intramolecular secondary structures, such as hairpins, induced by the complementary ends of the fragments, thus lowering their melting temperature (Fig. 7), which is consistent with other WGA fragments. (M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003)). The extended oligonucleotide (E-p) sequence length is preferably in the range of 60-300 bases. More preferably, the extended oligonucleotide (E-p) sequence length is in the range of 120-200 bases.

第3の好ましい実施形態では、図8を参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)第1の増幅ハンドル配列(1AH)に対応する核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)第2の増幅ハンドル配列(2AH)に対応する核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含む。
In a third preferred embodiment, referring to Figure 8, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of nucleic acid corresponding to the first amplification handle sequence (1AH);
b) payload array (PL);
c) a second tagged oligonucleotide amplification sequence (3-TOS) of nucleic acid corresponding to a second amplification handle sequence (2AH)
including.

少なくとも1種の第1のプライマーが全ゲノム増幅のために用いられ、且つ少なくとも1種の第2のプライマー及び1種の第3のプライマーがタグ付きオリゴヌクレオチドの増幅のために用いられ、少なくとも1種の第2のプライマーは、第1の増幅ハンドル配列(1AH)に対して同一な配列を有し、且つ少なくとも1種の第3のプライマーは、第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)を有する。 at least one first primer is used for whole genome amplification, and at least one second primer and one third primer are used for amplification of tagged oligonucleotides, at least one The species second primer has sequence identical to the first amplification handle sequence (1AH) and the at least one species third primer is reverse complementary to the second amplification handle sequence sequence (2AH-RC).

タグ付きオリゴ増幅プライマーは、WGA PCR温度プロファイルの少なくとも最初の10~15サイクルに適合性である融解温度を有するように設計される。 Tagged oligo amplification primers are designed to have melting temperatures that are compatible with at least the first 10-15 cycles of the WGA PCR temperature profile.

好ましくは、少なくとも1種の第2のプライマー及び少なくとも第3のプライマーは、工程d)で添加される。 Preferably, at least one second primer and at least a third primer are added in step d).

増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーを作製する工程e)は、好ましくは、第1の増幅ハンドル配列(1AH)に対応する3'配列を含む少なくとも1種の第1のライブラリープライマー及び第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)に対応する3'配列を含む少なくとも1種の第2のライブラリープライマーを用いるPCR反応により行われる。 Step e) of generating a massively parallel sequencing library from the amplified tagged oligonucleotides preferably comprises at least one first library comprising a 3′ sequence corresponding to the first amplification handle sequence (1AH). A PCR reaction is performed using the rally primer and at least one second library primer containing a 3' sequence corresponding to a sequence (2AH-RC) that is reverse complementary to the second amplification handle sequence.

したがって、ライブラリープライマーは、単一PCR工程を用いる結合剤定量化分析のためのNGSライブラリーを作製するために、有利に用いられる。本説明で報告されるライブラリープライマーの具体例は、本発明の発明の範囲を限定することを意図せずに、Illuminaシーケンシングプラットフォームと適合性であるライブラリーを作製するために用いられる。 Library primers are therefore advantageously used to generate NGS libraries for binder quantification analysis using a single PCR step. Specific examples of library primers reported in this description are used to generate libraries compatible with Illumina sequencing platforms without intending to limit the scope of the present invention.

好ましい実施形態では、フォワードプライマー及びリバースプライマーは、Illuminaアダプター(Illumina社)に基づいて設計され、5'から3'に向かって、以下を含む:
1)Illuminaシーケンシングに必要とされるIlluminaアダプター配列(IA);
- インデックスシーケンシングプライマー/フローセル結合性配列(この領域は、フローセル結合のために必要とされる)並びにi5/i7インデックスシーケンシングプライマーに対するアニーリング配列;
- i5/i7インデックス:NGS多重化反応のために用いられるインデックス;
- Read1/read2シーケンシングプライマー:Illuminaシーケンシングプライマーに対するアニーリング配列、並びにタグ付きオリゴからのライブラリーの増幅のため。
2)第1の増幅ハンドル配列(1AH)又は第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC):これらの配列は、タグ付きオリゴ増幅後には二本鎖であるタグ付きオリゴ上で、第1の増幅ハンドル配列の逆相補体及び第2の増幅ハンドル配列にそれぞれアニーリングする。
In a preferred embodiment, the forward and reverse primers are designed based on Illumina adapters (Illumina) and, 5' to 3', contain:
1) Illumina adapter sequences (IA) required for Illumina sequencing;
- index sequencing primer/flow cell binding sequences (this region is required for flow cell binding) and annealing sequences for i5/i7 index sequencing primers;
- i5/i7 index: index used for NGS multiplexing reaction;
- Read1/read2 sequencing primers: annealing sequences to Illumina sequencing primers, as well as for amplification of libraries from tagged oligos.
2) the first amplification handle sequence (1AH) or the reverse complementary sequence to the second amplification handle sequence (2AH-RC): these sequences are double stranded after tagged oligo amplification tagged On the oligo, anneal to the reverse complement of the first amplification handle sequence and the second amplification handle sequence respectively.

図9は、それぞれ図5(図9A)、図6A(図9B)及び図8(図9C)に従う実施形態での、増幅されたタグ付きオリゴヌクレオチドからの超並列シーケンシングライブラリーの作製のために用いられるライブラリープライマーの構造を示す。 Figure 9 shows for the generation of massively parallel sequencing libraries from amplified tagged oligonucleotides in embodiments according to Figure 5 (Figure 9A), Figure 6A (Figure 9B) and Figure 8 (Figure 9C) respectively. The structures of the library primers used in .

ライブラリーの作製後、好ましくは少なくとも1回の精製工程が行われ、それにライブラリー定量化及びその後のシーケンシング手順のために必要なプール化が続く。シーケンシングは、優先的には、ペアードエンドシーケンシングとして行われ、それぞれがライブラリーDNA分子の鎖から誘導される2つのリードが生成される。 Generation of the library is preferably followed by at least one purification step, followed by the necessary pooling for library quantification and subsequent sequencing procedures. Sequencing is preferentially performed as paired-end sequencing to generate two reads, each derived from a strand of the library DNA molecule.

同じアプローチを、例えば、Ion Torrent社等の他のシーケンシングプラットフォームのためのNGSライブラリーを作製するために用いることができる。 The same approach can be used to generate NGS libraries for other sequencing platforms such as Ion Torrent.

NGSライブラリーから生成されるペアードエンドリード配列の分析は、以下の工程に従って分析する:
1.部分配列抽出。UMI、BAB及び増幅ハンドル配列(1AH及び/又は2AH)に対応する部分配列は、各タグ付きオリゴ分子に対する両方のシーケンシングリードから抽出される。
Analysis of paired-end read sequences generated from NGS libraries is analyzed according to the following steps:
1. Subsequence extraction. Subsequences corresponding to UMI, BAB and amplification handle sequences (1AH and/or 2AH) are extracted from both sequencing reads for each tagged oligo molecule.

2.リードの再アライメント。BAB及び/又は増幅ハンドル配列の部分配列が参照配列とマッチしない(5塩基毎に0.5~2個のミスマッチを許容して)場合、部分配列の位置が-nから+nの範囲の可変量だけオフセットされ、このときnは許容される最大オフセットであり(例えば、n=8)、部分配列が再抽出される。各反復に対して、参照配列からのハミング距離が算出され、最低距離に戻すオフセットが選択され、全ての部分配列(UMI、BAB、増幅ハンドル配列)が抽出される。 2. Read realignment. If a subsequence of the BAB and/or amplification handle sequence does not match the reference sequence (allowing 0.5-2 mismatches every 5 bases), the subsequence position is varied by a variable amount ranging from -n to +n. offset, where n is the maximum offset allowed (eg, n=8), and the subarray is re-extracted. For each repeat, the Hamming distance from the reference sequence is calculated, the offset that returns the lowest distance is chosen, and all subsequences (UMI, BAB, amplification handle sequences) are extracted.

3.リードフィルタリング。そのBAB及び/又はハンドル部分配列が参照配列と規定量の塩基を超えて異なるリードは、低品質リードとして廃棄される。 3. Lead filtering. Reads whose BAB and/or handle subsequences differ from the reference sequence by more than a defined amount of bases are discarded as low quality reads.

4.UMI決定。リードペアからのUMI配列は、シーケンシングエラーの非存在下で完璧に相補的になると予測される。第1鎖UMIと第2鎖相補的UMI配列との間のいずれかの差異の存在下では、
a.リードペアは低信頼度として廃棄される場合があるか、又は
b.2つの配列間のコンセンサスは、UMIの各位置に対して、シーケンサーのベースコーラーにより報告される最高ベースコーリングスコアを有する2つのシーケンシングリード由来の配列のうちから塩基を選択することにより、算出することができる。
4. UMI determination. UMI sequences from read pairs are predicted to be perfectly complementary in the absence of sequencing errors. In the presence of any difference between the first strand UMI and the second strand complementary UMI sequence,
a. Read pairs may be discarded as unreliable, or
b. Consensus between the two sequences is determined by selecting, for each position of the UMI, the base from among the sequences from the two sequencing reads with the highest base-calling score reported by the sequencer's base-caller. can be calculated.

第1の方法(a)は、シーケンシングバイアスに起因する標的分子の過大評価を引き起こしにくいが、第2の方法(b)を用いて代わりに回復される結合剤と標的分子との間の真の結合性イベントを失う場合があることを注記すべきである。 The first method (a) is less likely to cause overestimation of the target molecule due to sequencing bias, whereas the truth between the binding agent and the target molecule is instead recovered using the second method (b). It should be noted that it is possible to lose connectivity events for

5.標的分子定量化。標的分子のカウントが、分析された試料における特異的結合剤を表す各BAB配列に対する異なるUMI配列の個数を決定することにより行われる。 5. Target molecule quantification. Target molecule counting is performed by determining the number of different UMI sequences for each BAB sequence representing a specific binding agent in the analyzed sample.

本発明に従うキットは、
a)タグ付きオリゴヌクレオチドとコンジュゲート化された、生物学的試料中の少なくとも1種の標的分子に対する少なくとも1種の結合剤であって、タグ付きオリゴヌクレオチドは、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、
ii)少なくとも1種の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含む、結合剤;
b)全ゲノム増幅を行うための少なくとも1種のプライマー及びタグ付きオリゴヌクレオチドの増幅を行うための少なくとも1種のプライマーであって、同じ配列を有するか又は異なる配列を有するかのいずれかである、全ゲノム増幅を行うための少なくとも1つのプライマー及び該タグ付きオリゴヌクレオチドの増幅を行うための少なくとも1つのプライマー
を含む。
A kit according to the invention comprises
a) at least one binding agent for at least one target molecule in a biological sample, conjugated to a tagged oligonucleotide, the tagged oligonucleotide comprising:
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI);
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS)
a binding agent;
b) at least one primer for whole genome amplification and at least one primer for amplification of tagged oligonucleotides, either having the same sequence or having different sequences; , at least one primer for whole genome amplification and at least one primer for amplification of said tagged oligonucleotide.

好ましい実施形態では、キットは、タグ付きオリゴヌクレオチドを伸長するためのオリゴヌクレオチドを含む。 In preferred embodiments, the kit includes oligonucleotides for extending tagged oligonucleotides.

好ましい実施形態では、少なくとも1種のタグ付きオリゴヌクレオチドが配列番号1に対応する配列を有し、タグ付きオリゴヌクレオチドの増幅を行うためのプライマーは2種類であり、それぞれ配列番号2及び配列番号3の配列を有する。キットは、好ましくは、1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む。より好ましくは、該第1のライブラリープライマーは配列番号8~配列番号15からなる群から選択される配列を有し、該第2のライブラリープライマーは配列番号16~配列番号27からなる群から選択される配列を有する。 In a preferred embodiment, at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 1 and there are two primers for amplifying the tagged oligonucleotide, SEQ ID NO: 2 and SEQ ID NO: 3, respectively. has an array of The kit preferably further comprises one or more first library primers and one or more second library primers. More preferably, said first library primer has a sequence selected from the group consisting of SEQ ID NO: 8 to SEQ ID NO: 15, and said second library primer is from the group consisting of SEQ ID NO: 16 to SEQ ID NO: 27. It has a selected sequence.

別の好ましい実施形態では、少なくとも1種のタグ付きオリゴヌクレオチドが配列番号28に対応する配列を有し、タグ付きオリゴヌクレオチドの伸長を行うためのオリゴヌクレオチドは1種類であり、配列番号29に対応する配列を有する。キットは、好ましくは、1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む。より好ましくは、該第1のライブラリープライマーは配列番号30~配列番号37からなる群から選択される配列を有し、該第2のライブラリープライマーは配列番号38~配列番号49からなる群から選択される配列を有する。 In another preferred embodiment, at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO:28, and there is one oligonucleotide for extending the tagged oligonucleotide, corresponding to SEQ ID NO:29. has an array that The kit preferably further comprises one or more first library primers and one or more second library primers. More preferably, said first library primer has a sequence selected from the group consisting of SEQ ID NO:30 to SEQ ID NO:37, and said second library primer is from the group consisting of SEQ ID NO:38 to SEQ ID NO:49. It has a selected sequence.

(実施例1)
本実施例では、WGA後に図8に従う設定を用いる増幅を行うために、タグ付きオリゴを設計した。「P5-Synth」(配列番号1、図10、NNNNNNNNNN:UMI配列)と称されるタグ付きオリゴを、Ampli1(商標)WGAキット(Menarini Silicon Biosystems社)に適合するように設計した。第1の増幅ハンドル配列(1AH)は、Illumina TruSeq DNA and RNA CD IndexesからのIndex2(i5)アダプターの最後の19塩基と同一であった。第2の増幅ハンドル配列(2AH)を、いかなる分子内二次構造及びヒトゲノムに対する考えられるマッチも回避するように、in silicoで作製した。両方の増幅ハンドル配列の融解温度を、WGAプライマーのものと類似とするために設計した。タグ付きオリゴ増幅プライマー(配列番号2及び配列番号3)を、第1及び第2の増幅ハンドル配列に従って設計した。
(Example 1)
In this example, tagged oligos were designed for WGA followed by amplification using settings according to FIG. A tagged oligo called "P5-Synth" (SEQ ID NO: 1, Figure 10, NNNNNNNNNN:UMI sequence) was designed to be compatible with the Ampli1™ WGA kit (Menarini Silicon Biosystems). The first amplification handle sequence (1AH) was identical to the last 19 bases of the Index2(i5) adapter from the Illumina TruSeq DNA and RNA CD Indexes. A second amplification handle sequence (2AH) was generated in silico to avoid any intramolecular secondary structures and possible matches to the human genome. The melting temperatures of both amplification handle sequences were designed to be similar to those of the WGA primers. Tagged oligo amplification primers (SEQ ID NO:2 and SEQ ID NO:3) were designed according to the first and second amplification handle sequences.

図10に示される通り、フォワードライブラリープライマーがIndex2(i5)アダプター(Illumina社)と同一であった一方で、リバースライブラリープライマーは、第2の増幅ハンドル配列の逆相補的配列を付加したIndex1(i7)アダプターと同一であった。より詳細には、図10は、P5-Synthオリゴ及び対応するライブラリープライマーの設計を示す。 As shown in Figure 10, the forward library primer was identical to the Index2(i5) adapter (Illumina), while the reverse library primer was Index1 with the addition of the reverse complementary sequence of the second amplification handle sequence. (i7) Identical to the adapter. More specifically, Figure 10 shows the design of the P5-Synth oligos and corresponding library primers.

オリゴP5-Synth(配列番号1):白色ボックスは、UMI及び結合剤バーコードを含む内部ドメインを示す。黒色境界を有する灰色ボックスは、第1及び第2の増幅ハンドル配列を示す。 Oligo P5-Synth (SEQ ID NO: 1): White boxes indicate internal domains containing UMI and binder barcodes. Gray boxes with black borders indicate the first and second amplification handle sequences.

P5ライブラリープライマー(配列番号8):NGSライブラリー作製のために用いられるフォワードプライマー。灰色ボックス中にオリゴP5-Synthとのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 P5 library primer (SEQ ID NO: 8): forward primer used for NGS library construction. Annealing sites with oligo P5-Synth are indicated in gray boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

Synthライブラリープライマー(配列番号16):NGSライブラリー作製のために用いられるリバースプライマー。灰色ボックス中にオリゴP5-Synthとのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 Synth library primer (SEQ ID NO: 16): Reverse primer used for NGS library construction. Annealing sites with oligo P5-Synth are indicated in gray boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

図11に見て取れる通り、ライブラリー作製中に、Illumina Index1及び2アダプターが、それぞれタグ付きオリゴの5'及び3'に付加される。 As can be seen in Figure 11, Illumina Index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively, during library generation.

本実施例では、タグ付きオリゴを、5'アミノ修飾剤を介してコンジュゲート化した。その後のPCR反応に対するいかなる立体障害阻害作用も回避するために、C6又はC12スペーサーが、オリゴのアミン部分と5'との間に存在した。アミノ反応性試薬を介して、リジン、グルタミン、アルギニン及びアスパラギン残基由来の抗体中に通常存在するアミンを用いて、抗体をタグ付きオリゴに共有結合させた。4種類のAb-オリゴ(表2)を、タグ付きオリゴを用いて作製し、抗体オリゴコンジュゲート化は、抗体:タグ付きオリゴ化学量論を1:2として、Expedeon社(25 Norman Way、Over、Cambridge CB24 5QE、United Kingdom)により行った。エピトープ局在:細胞膜に対する位置を示す。 In this example, tagged oligos were conjugated via a 5' amino modifier. A C6 or C12 spacer was present between the amine portion of the oligo and 5' to avoid any steric hindrance to the subsequent PCR reaction. Antibodies were covalently attached to tagged oligos via amino-reactive reagents using amines normally present in antibodies derived from lysine, glutamine, arginine and asparagine residues. Four Ab-oligos (Table 2) were made with tagged oligos and antibody-oligo conjugation was performed at 1:2 antibody:tagged oligo stoichiometry by Expedeon (25 Norman Way, Over , Cambridge CB24 5QE, United Kingdom). Epitope localization: indicates the position relative to the cell membrane.

Figure 2023511492000003
Figure 2023511492000003

Ab-オリゴを、2種類の異なるタイプの細胞株を染色するために用いた。第1の細胞タイプは、サイトケラチン及びHer2タンパク質を過剰発現する乳癌由来細胞株であるSK-BR-3細胞であった。第2の細胞タイプは、CD45並びに無視できるレベルのサイトケラチン及びHer2を発現する、全血から抽出される白血球である末梢血単核細胞(PBMC)であった。 Ab-oligos were used to stain two different types of cell lines. The first cell type was SK-BR-3 cells, a breast cancer-derived cell line that overexpresses cytokeratin and Her2 proteins. The second cell type was peripheral blood mononuclear cells (PBMC), leukocytes extracted from whole blood that express CD45 and negligible levels of cytokeratin and Her2.

SK-BR-3細胞(ATCC(登録商標)HTB-30(商標)、ATCC)を、製造業者の手順に従って培養中で増殖させた。PBMCは、ヒト血液試料から抽出した。両方の細胞タイプを、カスタマイズされたプロトコールに従って、PFA 2%を用いて固定した。 SK-BR-3 cells (ATCC® HTB-30™, ATCC) were grown in culture according to the manufacturer's protocol. PBMC were extracted from human blood samples. Both cell types were fixed with PFA 2% according to customized protocols.

Ab-オリゴを用いる細胞染色は、100000~50000個の事前に固定及び透過化された細胞に対して行った。RT、1000×gで5分間の遠心分離により、細胞を回収した。少なくとも1mLのランニングバッファー(autoMACSランニングバッファー、ref. 130-091-221、Miltenyi Biotec社)を用いて細胞を洗浄し、遠心分離により回収した。この最後の工程を、2回繰り返した。外部Ab-オリゴ及びそれらのアイソタイプAb-オリゴ対照は、それらの作業濃度まで、100μLのランニングバッファー中に希釈する。外部Ab-オリゴミックス(Ab-オリゴtag3)を細胞に添加し、RTで15分間インキュベートした。続いて、1mLのランニングバッファーを用いて試料を2回洗浄し、遠心分離により回収した。500μLのランニングバッファー中のヤギ抗マウスIgG2a-PE抗体を添加し、+4℃で30分間インキュベートした。この工程は、PEでのPBMC細胞の染色を可能にした。ランニングバッファーを用いて試料を2回洗浄した。内部Ab-オリゴ及びそれらのアイソタイプAb-オリゴ対照は、それらの作業濃度まで、200μLのInside Permバッファー(Inside染色キット、Ref. 130-090-477、Miltenyi Biotec社)中に希釈する。内部Ab-オリゴミックス(Ab-オリゴtag1、2及び4)を細胞に添加し、RTで10分間インキュベートした。1mLのInside Permバッファーを用いて試料を2回洗浄し、遠心分離により回収した。Hoechst及びヤギ抗マウスIgG1-APC抗体の500μLのInside Permバッファー中のミックスを添加し、+4℃で30分間インキュベートした。この工程は、PEでのSK-BR-3細胞及び全ての細胞核の染色を可能にした。試料を、ランニングバッファーを用いて2回洗浄した。 Cell staining with Ab-oligos was performed on 100000-50000 pre-fixed and permeabilized cells. Cells were harvested by centrifugation at 1000 xg for 5 minutes at RT. Cells were washed with at least 1 mL of running buffer (autoMACS running buffer, ref. 130-091-221, Miltenyi Biotec) and harvested by centrifugation. This last step was repeated twice. External Ab-oligos and their isotype Ab-oligo controls are diluted in 100 μL of running buffer to their working concentrations. External Ab-oligomix (Ab-oligotag3) was added to the cells and incubated for 15 minutes at RT. Samples were then washed twice with 1 mL of running buffer and collected by centrifugation. Goat anti-mouse IgG2a-PE antibody in 500 μL of running buffer was added and incubated at +4° C. for 30 minutes. This step allowed staining of PBMC cells with PE. Samples were washed twice with running buffer. Internal Ab-oligos and their isotype Ab-oligo controls are diluted to their working concentrations in 200 μL Inside Perm buffer (Inside staining kit, Ref. 130-090-477, Miltenyi Biotec). Internal Ab-oligo mixes (Ab-oligo tag1, 2 and 4) were added to the cells and incubated for 10 minutes at RT. Samples were washed twice with 1 mL of Inside Perm buffer and collected by centrifugation. A mix of Hoechst and goat anti-mouse IgG1-APC antibodies in 500 μL of Inside Perm buffer was added and incubated at +4° C. for 30 minutes. This step allowed staining of SK-BR-3 cells and all cell nuclei with PE. Samples were washed twice with running buffer.

フルオロフォアにコンジュゲート化された二次抗体の添加は、蛍光によるSK-BR-3細胞(APCチャンネル)及びPBMC(PEチャンネル)の特定を可能にした。更に、蛍光レベルは、Ab-オリゴの相対的存在量を反映する。単一細胞を、それらの免疫蛍光標識に基づいて、DEPArray(商標)NxTシステム(Menarini Silicon Biosystems社)を用いて精製した(図12)。 Addition of a secondary antibody conjugated to a fluorophore allowed identification of SK-BR-3 cells (APC channel) and PBMCs (PE channel) by fluorescence. Furthermore, fluorescence levels reflect the relative abundance of Ab-oligos. Single cells were purified based on their immunofluorescence labeling using the DEPArray™ NxT system (Menarini Silicon Biosystems) (Figure 12).

具体的には、図12は、Ab-オリゴ及び二次蛍光抗体を用いて染色されたPBMC及びSK-BR-3細胞の散布図を示す。x軸上には、Ab-オリゴtag1、tag2及びtag4の量に比例する、APCチャンネルでの蛍光レベルを示す。y軸上には、Ab-オリゴtag3の量に比例する、PEチャンネルでの蛍光レベルを示す。散布図は、それらの免疫蛍光レベルに基づいて特異的細胞タイプをそれぞれ含む4つの象限に分割されている:1)PBMC(高レベルのCD45及び低レベルのCK、Her2);2)二重陽性細胞(高レベルのCD45、CK、Her2);3)二重陰性細胞(低レベルのCD45、CK、Her2);4)SK-BR-3細胞(低レベルのCD45及び高レベルのCK、Her2)。中空/中実四角/丸で強調される単一細胞が、ライブラリー作製のために単離及び使用された。 Specifically, Figure 12 shows scatter plots of PBMC and SK-BR-3 cells stained with Ab-oligos and secondary fluorescent antibodies. On the x-axis is shown the level of fluorescence in the APC channel proportional to the amount of Ab-oligos tag1, tag2 and tag4. On the y-axis is shown the level of fluorescence in the PE channel proportional to the amount of Ab-oligo tag3. Scatter plots are divided into four quadrants each containing a specific cell type based on their immunofluorescence levels: 1) PBMCs (high levels of CD45 and low levels of CK, Her2); 2) double positives. cells (high levels of CD45, CK, Her2); 3) double-negative cells (low levels of CD45, CK, Her2); 4) SK-BR-3 cells (low levels of CD45 and high levels of CK, Her2). . Single cells highlighted by open/filled squares/circles were isolated and used for library generation.

或いは、WGA後にタグ付きオリゴ増幅を行うために、フォワード/リバースプライマーのカスタマイズされた反応ミックス及びAmpli1(商標)PCRキット試薬を、表3の左側挿入部分に従って調製した、WGA産物が入った各チューブに、15μLの反応ミックスを添加した。各試料を、表3の右側挿入部分に示される温度プロファイルに従ってインキュベートした。 Alternatively, for tagged oligo amplification after WGA, a customized reaction mix of forward/reverse primers and Ampli1™ PCR kit reagents were prepared according to the left hand insert of Table 3 for each tube containing WGA product. To the was added 15 μL of reaction mix. Each sample was incubated according to the temperature profile shown in Table 3, right inset.

Figure 2023511492000004
Figure 2023511492000004

左側挿入部分:タグ付きオリゴ増幅反応の反応混合物組成。右側挿入部分:タグ付きオリゴ増幅のための熱サイクルプログラム。 Left insert: reaction mixture composition of tagged oligo amplification reaction. Right insert: thermocycling program for amplification of tagged oligos.

0.5μMの最終濃度でP5及びLib1ライブラリープライマーを用いて、Ampli1(商標)PCRキットを使用して増幅されたWGA含有Ab-オリゴアンプリコンの1μLのアリコートを取得することにより、ライブラリー作製を行った。PCR熱サイクルプロファイルは、表5に示される。各試料は、バイオインフォマティクス分析中にデータを逆多重化するために、二重インデックス化のためのNGSライブラリープライマーの異なる組み合わせを有した。用いたライブラリープライマーのリストを、表4に報告する。P5ライブラリープライマーは、タグ付きオリゴP5-Synthと共に用いることができるフォワードプライマーである。 Library preparation was performed by taking 1 μL aliquots of WGA-containing Ab-oligo amplicons amplified using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5 μM. gone. PCR thermocycling profiles are shown in Table 5. Each sample had a different combination of NGS library primers for double indexing to demultiplex the data during bioinformatic analysis. The list of library primers used is reported in Table 4. The P5 library primer is a forward primer that can be used with the tagged oligo P5-Synth.

Figure 2023511492000005
Figure 2023511492000005

Figure 2023511492000006
Figure 2023511492000006

Figure 2023511492000007
Figure 2023511492000007

NGSライブラリー作製のための熱サイクルプロファイル。ステップ3のサイクル数は、回収された細胞数及び細胞中の総Ab-オリゴの有効量に応じて変わる。通常、ステージ3での27回の増幅サイクルが、単一細胞からの十分なアンプリコン量を生じた。 Thermal cycling profile for NGS library preparation. The number of cycles in step 3 will vary depending on the number of cells harvested and the effective amount of total Ab-oligos in the cells. Twenty-seven amplification cycles at stage 3 usually yielded sufficient amplicon abundance from a single cell.

ライブラリー試料を、Agencourt AmPure XPビーズ(Beckman-Coulter社)を用いて精製した。NGS DNA定量化は、KAPA SYBR(登録商標)FAST qPCRキット(Kapa Biosystems社)を用いて行った。各NGSライブラリーを、Agilent Bioanalyzer 2100(Agilent社)を用いて検査し、これにより、典型的には185bpでの単一ピークから構成されたライブラリー電気泳動像が示された(図13)。 Library samples were purified using Agencourt AmPure XP beads (Beckman-Coulter). NGS DNA quantification was performed using the KAPA SYBR® FAST qPCR kit (Kapa Biosystems). Each NGS library was tested using an Agilent Bioanalyzer 2100 (Agilent), which showed a library electropherogram typically composed of a single peak at 185 bp (Figure 13).

試料を一緒にプールし、MiSeq試薬キットv3 150サイクル(Ref. MS-102-3001、Illumina社)を用いて、MiSeqシステム(Illumina社)上でシーケンシングを行った。データ解析は、Python社により開発されたカスタムソフトウェアを用いて行った。UMIカウントに従うタンパク質標的の定量化が、図14に報告される。予測される通り、SK-BR-3細胞は、サイトケラチン及びHer2の高発現並びに比較的低レベルのCD45を示したが、PBMCは逆の挙動を示した。タンパク質発現レベルは、二重陽性細胞において、特にアイソタイプ対照が高く、このことは、そのような細胞が非特異的染色を比較的受け易かったことを示す。逆に、二重陰性細胞は、全4種類の標的に関して比較的低いレベルを有した。 Samples were pooled together and sequenced on the MiSeq system (Illumina) using the MiSeq reagent kit v3 150 cycles (Ref. MS-102-3001, Illumina). Data analysis was performed using custom software developed by Python. Quantification of protein targets according to UMI counts is reported in FIG. As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and relatively low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were higher in double-positive cells, especially for isotype controls, indicating that such cells were relatively susceptible to non-specific staining. Conversely, double-negative cells had relatively low levels for all four targets.

(実施例2)
本実施例では、WGA中に、図8に従う設定を用いて増幅を行うために、タグ付きオリゴを設計した。実験手順は、以下を除いて実施例1と同一である。タグ付きオリゴ増幅プライマーを、0.02μMの最終濃度で、一次PCR反応ミックスに直接添加した。ライブラリー作製及びデータ解析は、実施例1に示される通りに行った。
(Example 2)
In this example, tagged oligos were designed for amplification using settings according to FIG. 8 during WGA. The experimental procedure is identical to Example 1 with the following exceptions. Tagged oligo amplification primers were added directly to the primary PCR reaction mix at a final concentration of 0.02 μM. Library construction and data analysis were performed as described in Example 1.

UMIカウントに従うタンパク質標的の定量化が、図15に報告される。予測される通り、SK-BR-3細胞は、サイトケラチン及びHer2の高発現並びに非常に低レベルのCD45を示したが、PBMCは逆の挙動を示した。タンパク質発現レベルは、二重陽性細胞において、特にアイソタイプ対照が高く、このことは、そのような細胞が非特異的染色を比較的受け易かったことを示す。逆に、二重陰性細胞は、全4種類の標的に関して比較的低いレベルを有した。実施例1からの結果に従って、タグ付きオリゴの増幅が、WGA中及びWGA後の両方で実行可能であることが推論できる。しかしながら、絶対的UMIカウントは、2種類の手順で顕著に異なることを注記すべきである。2種類の細胞タイプの差異は、WGA中にタグ付きオリゴ増幅が行われる場合に、CKと比較して低い発現を有するCD45標的に関して予測されるものにより良く一致する。 Quantification of protein targets according to UMI counts is reported in FIG. As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and very low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were higher in double-positive cells, especially for isotype controls, indicating that such cells were relatively susceptible to non-specific staining. Conversely, double-negative cells had relatively low levels for all four targets. According to the results from Example 1, it can be deduced that amplification of tagged oligos is feasible both during and after WGA. However, it should be noted that absolute UMI counts differ significantly between the two procedures. The differences between the two cell types are in better agreement with what would be expected for a CD45 target with lower expression compared to CK when tagged oligo amplification is performed during WGA.

(実施例3)
本実施例では、タグ付きオリゴを、単一細胞中に直接添加した。「P5-Lib1」(配列番号28)と称されるタグ付きオリゴを、Ampli1(商標)WGAキット(Menarini Silicon Biosystems社)により増幅可能であるように設計した。タグ付きオリゴ増幅プライマーは、配列番号29の配列を有する(フォワードプライマー及びリバースプライマーは同一であり、Ampli1 WGA Lib1プライマーの配列を共有する)。具体的には、5'-WGAハンドル配列はLib1 WGAプライマーと同一であった一方で、3'-WGAハンドル配列はLib1 WGAプライマーの逆相補体配列であった。第1の増幅ハンドル配列は、実施例1に記載されるものと同一である。第2の増幅ハンドル配列は、3'-WGAハンドル配列及びその5'末端での追加の5bp配列からなる(図16)。
(Example 3)
In this example, tagged oligos were added directly into single cells. A tagged oligo called "P5-Lib1" (SEQ ID NO:28) was designed to be amplifiable by the Ampli1™ WGA kit (Menarini Silicon Biosystems). The tagged oligo amplification primer has the sequence of SEQ ID NO: 29 (the forward and reverse primers are identical and share the sequence of the Ampli1 WGA Lib1 primer). Specifically, the 5'-WGA handle sequence was identical to the Lib1 WGA primer, while the 3'-WGA handle sequence was the reverse complement sequence of the Lib1 WGA primer. The first amplification handle sequence is identical to that described in Example 1. The second amplification handle sequence consists of the 3'-WGA handle sequence and an additional 5bp sequence at its 5' end (Figure 16).

より詳細には、図16は、P5-Synthオリゴ及び対応するライブラリープライマーの設計を示す。 More specifically, Figure 16 shows the design of the P5-Synth oligos and corresponding library primers.

オリゴP5-Lib1:太線境界を有する白色中実ボックスは、UMI及び結合剤バーコードを含む内部ドメインを示す。太線境界を有する灰色中実ボックスは、2つのライブラリープライマーに対するアニーリング部位を示す。細線境界を有する灰色ボックスは、WGAハンドル配列(Lib1)である。 Oligo P5-Lib1: White solid boxes with bold borders indicate internal domains containing UMI and binder barcodes. Gray solid boxes with bold borders indicate the annealing sites for the two library primers. The gray box with thin border is the WGA handle array (Lib1).

P5ライブラリープライマー:NGSライブラリー作製のために用いられるフォワードプライマー。灰色中実ボックス中にタグ付きオリゴP5-Lib1とのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 P5 library primer: forward primer used for NGS library generation. Annealing sites with tagged oligo P5-Lib1 are indicated in gray filled boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

Lib1ライブラリープライマー:NGSライブラリー作製のために用いられるリバースプライマー。灰色中実ボックス中にタグ付きオリゴP5-Lib1とのアニーリング部位が示され:この配列は、Lib1逆相補体配列の一部分及びオリゴP5-Lib1の3'末端にのみアニーリングすることを可能にする小さいテイル(ACCAC)から構成される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 Lib1 library primer: reverse primer used for NGS library generation. Annealing site with tagged oligo P5-Lib1 is indicated in gray solid box: this sequence is small allowing annealing only to a portion of the Lib1 reverse complement sequence and to the 3' end of oligo P5-Lib1. It consists of a tail (ACCAC). Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

フォワードライブラリープライマーがIndex2(i5)アダプター(Illumina社)と同一であった一方で、リバースライブラリープライマーは、第2の増幅ハンドル配列の逆相補的配列を付加したIndex1(i7)アダプターと同一であった(図16)。したがって、ライブラリー作製中に、Illumina Index1及び2アダプターが、それぞれタグ付きオリゴの5'及び3'に付加される(図17)。 The forward library primer was identical to the Index2(i5) adapter (Illumina), while the reverse library primer was identical to the Index1(i7) adapter appended with the reverse complementary sequence of the second amplification handle sequence. There was (Fig. 16). Therefore, during library construction, Illumina Index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively (Figure 17).

SK-BR-3細胞(ATCC(登録商標)HTB-30(商標)、ATCC)を、製造業者の手順に従って培養中で増殖させ、カスタマイズされたプロトコールに従って、PFA 2%を用いて固定した。単一細胞を、それらの形態学に基づいて、DEPArray(商標)NxTシステム(Menarini Silicon Biosystems社)を用いて精製した。P5-Lib1及びP5-Synthタグ付きオリゴを、単一細胞が入ったチューブの内部に直接添加した。異なる量の各オリゴを各単一細胞内に添加し、Ampli1(商標)WGAを行った。P5-Synthタグ付きオリゴを含有する試料を、実施例1の通りに増幅した。 SK-BR-3 cells (ATCC® HTB-30™, ATCC) were grown in culture according to the manufacturer's protocol and fixed with PFA 2% according to a customized protocol. Single cells were purified based on their morphology using the DEPArray™ NxT system (Menarini Silicon Biosystems). P5-Lib1 and P5-Synth tagged oligos were added directly to the inside of tubes containing single cells. Different amounts of each oligo were added into each single cell and Ampli1™ WGA was performed. Samples containing P5-Synth tagged oligos were amplified as in Example 1.

0.5μMの最終濃度でP5及びLib1ライブラリープライマーを用いて、Ampli1(商標)PCRキットを使用して増幅されたWGA含有Ab-オリゴアンプリコンの1μLのアリコートを取得することにより、タグ付きオリゴライブラリー作製を行った。PCR熱サイクルプロファイルは、表5に示される。各試料は、バイオインフォマティクス分析中にデータを逆多重化するために、二重インデックス化のためのNGSライブラリープライマーの異なる組み合わせを有した。用いたライブラリープライマーのリストを、表6に報告する。 Tagged oligos were generated by taking 1 μL aliquots of WGA-containing Ab-oligo amplicons amplified using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5 μM. I made a rally. PCR thermocycling profiles are shown in Table 5. Each sample had a different combination of NGS library primers for double indexing to demultiplex the data during bioinformatic analysis. The list of library primers used is reported in Table 6.

Figure 2023511492000008
Figure 2023511492000008

Figure 2023511492000009
Figure 2023511492000009

10μL WGA試料のアリコートを、SPRIビーズ(Beckmann Coulter社)を用いて精製し、続いて、Ampli1(商標)LowPassキットを用いて加工して、CNA分析のためのNGSライブラリーを作製した。WGA手順前の単一細胞におけるタグ付きオリゴのスパイク化は、下流の遺伝子解析に影響しなかった(図18)。図5及び図8に示されるワークフローに適合するように設計されたタグ付きオリゴは、WGA手順に影響又は干渉しなかった。更に、それでも、両方の条件でタグ付きオリゴヌクレオチドからNGSライブラリーを取得することが可能であった。両方のタグ付きオリゴヌクレオチドを正確に定量化することができ、このことは、両方の方法論、並びにタグ付きオリゴ設計の堅牢性を示した(図19)。 Aliquots of 10 μL WGA samples were purified using SPRI beads (Beckmann Coulter) and subsequently processed using the Ampli1™ LowPass kit to generate NGS libraries for CNA analysis. Spiking tagged oligos in single cells prior to the WGA procedure did not affect downstream genetic analysis (Figure 18). Tagged oligos designed to fit the workflows shown in Figures 5 and 8 did not affect or interfere with the WGA procedure. Furthermore, it was still possible to obtain NGS libraries from tagged oligonucleotides under both conditions. Both tagged oligonucleotides could be accurately quantified, demonstrating the robustness of both methodologies as well as the tagged oligo design (Figure 19).

利点
本発明に従う生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法は、ゲノム全体のコピー数プロファイル/ゲノム配列及び同じ単一細胞に対するタンパク質発現の分析を同時に得ることを可能にする。
Advantages The method for whole-genome amplification and analysis of multiple target molecules in a biological sample according to the present invention allows simultaneous acquisition of genome-wide copy number profiles/genomic sequences and analysis of protein expression for the same single cell. do.

本発明の方法は、低パスシーケンシング又は対象となる遺伝子のパネルの標的化シーケンシングによるゲノム全体のコピー数プロファイリング等の更なる分析を可能にし、且つ、わずかな(1個まで下がる)循環腫瘍細胞(CTC)が利用可能な場合であり得るので、非常にわずかな試料を用いて、単一細胞解像度まで下げた複数タンパク質のパネルのデジタル定量化を検出及び実行するために有用な、ゲノムDNAの全ゲノム増幅を行うことを可能にする。このことは、遺伝子型、表現型及び環境の差異が、遺伝子型(配列変化のコピー数)と表現型(タンパク質発現)との相関を混乱させ且つ完全に妨げ得る、遺伝的に不均一な試料中の異なる細胞での各分子タイプを測定することに関して、特に有利である。 The methods of the present invention allow for further analysis such as genome-wide copy number profiling by low-pass sequencing or targeted sequencing of panels of genes of interest, and a few (down to 1) circulating tumors. Genomic DNA useful for detecting and performing digital quantification of panels of multiple proteins down to single-cell resolution using very few samples, as may be the case when cells (CTCs) are available. whole genome amplification of This suggests that genetically heterogeneous samples where genotypic, phenotypic and environmental differences can confound and completely prevent the correlation between genotype (copy number of sequence variation) and phenotype (protein expression). It is particularly advantageous for measuring each molecule type in different cells in a cell.

本発明に従う方法は、驚くべきことに、非限定的な例として与えられる、以下の側面のうちの1つ又は複数で、当業者には達成できないと以前に考えられた実績を有して、当技術分野の技術水準を進歩させる:
・1個の細胞当たり数百コピーまで下がった単一細胞におけるタンパク質のデジタル定量化。
・プロセス中に内在するWGAの使用によって、該単一細胞の他の特徴の調査のための追加の遺伝的材料を取得できる更なる可能性、並びに10x Genomics社により提案されるもの等の液滴ベースのアプローチを用いて可能でない、確認のために単一細胞を確実に再分析できる可能性を伴って、上記の点が得られる。
The method according to the invention surprisingly has a track record previously considered unattainable by those skilled in the art in one or more of the following aspects, given as non-limiting examples: Advance the state of the art in the field:
• Digital quantification of proteins in single cells down to hundreds of copies per cell.
A further possibility of obtaining additional genetic material for investigation of other characteristics of the single cell by using WGA inherent in the process, as well as droplets such as those proposed by 10x Genomics. The above points are obtained with the possibility to reliably re-analyze single cells for confirmation, which is not possible using the base approach.

本方法の応用の主な分野は腫瘍学であるが、該方法は、皮膚科等のモザイク障害又は異常増殖表現型等の他の分野に応用することができる。 The main field of application of this method is oncology, but the method can be applied to other fields such as mosaic disorders or hyperproliferative phenotypes such as dermatology.

関連出願に対する相互参照
本特許出願は、2019年12月16日出願のイタリア特許出願第102019000024159号からの優先権を主張し、該出願の開示全体が、参照により本明細書中に組み入れられる。
CROSS-REFERENCE TO RELATED APPLICATIONS This patent application claims priority from Italian Patent Application No. 102019000024159, filed Dec. 16, 2019, the entire disclosure of which is incorporated herein by reference.

本発明は、生物学的試料における、特に単一細胞試料における、全ゲノム増幅及び標的分子の分析、特にタンパク質の定量化のための、方法及びキットに関する。 The present invention relates to methods and kits for whole genome amplification and analysis of target molecules, in particular protein quantification, in biological samples, especially in single cell samples.

単一細胞分析のための方法は、バルク試料の不均一性から生じる複雑性を伴わずに、細胞の状況に対する情報を取得することを可能にする。同じ単一細胞中のプロテオーム及びゲノムの分析は、細胞の表現型とその遺伝子型との間の相関を提供し、したがって、多様な生物学的及び病理学的プロセスに対する独自の洞察を可能にする。このことは、腫瘍に関して特に当てはまり、腫瘍では、体細胞により獲得された遺伝的不均一性並びに転写及びタンパク質翻訳に対するその影響が、癌の発生及び発達の重要な構成要素である。 Methods for single-cell analysis allow obtaining information on cellular context without the complications arising from bulk sample heterogeneity. Analysis of proteomes and genomes in the same single cell provides correlations between a cell's phenotype and its genotype, thus allowing unique insight into diverse biological and pathological processes. . This is particularly true with respect to tumors, where somatically acquired genetic heterogeneity and its effects on transcription and protein translation are important components of cancer initiation and development.

全ゲノム増幅(WGA)は、より多くのDNAを取得する目的で、且つ、シーケンシング、SNP検出等をはじめとする様々な種類の遺伝子解析を簡潔化及び/又は可能にする目的で、単一細胞由来のゲノムを分析するために有用である。確定的制限部位に基づくLM-PCRを用いるWGA(DRS-WGA)が、EP1109938から公知である。 Whole Genome Amplification (WGA) is used to obtain more DNA and to simplify and/or enable various types of genetic analysis, including sequencing, SNP detection, etc. Useful for analyzing cell-derived genomes. WGA using LM-PCR based on defined restriction sites (DRS-WGA) is known from EP1109938.

WO 2017/178655及びWO 2019/016401は、低パス全ゲノムシーケンシング及びコピー数プロファイリングのためのDRS-WGA(例えば、Ampli1(商標)WGA)又はMALBACから超並列シーケンシングライブラリーを作製するための簡略化された方法を教示する。 WO 2017/178655 and WO 2019/016401 for generating massively parallel sequencing libraries from DRS-WGA (e.g. Ampli1™ WGA) or MALBAC for low pass whole genome sequencing and copy number profiling. Teaches a simplified method.

近年、単一細胞におけるゲノム及びトランスクリプトームの同時分析のための方法が開発された。Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129による論文は、用手法により単離された単一細胞からのメッセンジャーRNAが、まず一本鎖cDNAへと転写され、続いて、準線形全ゲノム増幅を通して、ゲノムDNAと共に増幅される方法を教示する。続いて、一方はcDNA由来であり他方はゲノムDNA由来である2種類の異なるライブラリーが、作製及びシーケンシングされる。別のアプローチであるMacaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370では、完全に溶解された単一細胞からポリアデニル化mRNA分子を捕捉及び単離するために、オリゴ-dT-被覆ビーズを用いて、mRNAがgDNAから物理的に分離される。続いて、改変型Smart-seq2プロトコール(Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639)を用いてmRNAが増幅され、一方で、gDNAは利用可能な全ゲノム増幅方法を用いて増幅及びシーケンシングすることができる。これらの方法は、遺伝子型をメッセンジャー転写に関連付けるために有用であるが、その転写及びターンオーバー/分解が細胞中で活発に調節されるタンパク質の直接的検出を得ることを可能にしない。 Recently, methods have been developed for simultaneous genome and transcriptome analysis in single cells. Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. teaches how messenger RNA from a single cell isolated by is first transcribed into single-stranded cDNA and then amplified along with genomic DNA through quasi-linear whole-genome amplification. Subsequently, two different libraries, one from cDNA and the other from genomic DNA, are generated and sequenced. Alternative approach Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038 In /nmeth.3370, mRNA is physically separated from gDNA using oligo-dT-coated beads to capture and isolate polyadenylated mRNA molecules from fully lysed single cells. Subsequently, modified Smart-seq2 protocol (Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http:// doi.org/10.1038/nmeth.2639), while gDNA can be amplified and sequenced using available whole genome amplification methods. These methods are useful for relating genotype to messenger transcription, but do not allow obtaining direct detection of proteins whose transcription and turnover/degradation are actively regulated in cells.

現在、最も広く応用される単一細胞タンパク質検出アプローチは、タグ付き抗体を用いる特異的タンパク質の標的化に依存する。蛍光活性化細胞選別(FACS)又は蛍光顕微鏡観察によるタンパク質の蛍光ベースの検出及び定量化は、特異的細胞タンパク質を認識する蛍光標識抗体を用いて、低い多重化レベルを有する単一細胞におけるタンパク質検出を可能にする。しかしながら、フルオロフォアに基づく高度に多重化したアッセイが、複数色素の発光スペクトル間でのスペクトル重複によって困難であるので、このアプローチは、一般的に、10~15種類の同時測定に限定される。更に、重複スペクトルをデコンボリューションするために、複雑なアルゴリズムが必要である。 Currently, the most widely applied single-cell protein detection approaches rely on targeting specific proteins with tagged antibodies. Fluorescence-based detection and quantification of proteins by fluorescence-activated cell sorting (FACS) or fluorescence microscopy uses fluorescently-labeled antibodies that recognize specific cellular proteins to detect proteins in single cells with low multiplexing levels. enable However, this approach is generally limited to 10-15 simultaneous measurements, as highly multiplexed assays based on fluorophores are difficult due to spectral overlap between the emission spectra of multiple dyes. Furthermore, complex algorithms are required to deconvolve overlapping spectra.

フリューダイム(Fluidigm)マスサイトメーター(CyTOF(商標))は、タンパク質を検出するために金属含有ポリマータグ付き(MAXPAR(商標))抗体を利用する。機器は、非光学的な物理的検出原理及び標識の異なる化学的性質に基づく。蛍光標識が特別に設計された多重原子エレメントタグに置き換えられ、検出は、飛行時間型質量分析(TOF-MS)の高解像度、高感度、且つ高速の分析を活用する。多数の利用可能な安定的同位体をタグとして使用できるので、多数のタンパク質を個別の細胞において同時に検出できる可能性がある[Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]。Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742による研究は、RNAに対する近接ライゲーションアッセイ(Proximity Ligation Assay for RNA;PLAYR)に基づく、単一細胞でのRNA及びタンパク質の同時検出のための方法を教示する。PLAYRは、40種類超の異なるmRNA及びタンパク質の同時定量化を可能にするマスサイトメトリーにより、単一細胞での転写産物の高度に多重化した定量化を可能にする。最終的に、マスサイトメトリーは、タンパク質及びメッセンジャーRNA転写と共に、タンパク質リン酸化(Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704)及び細胞増殖(Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075)等の、複数の細胞内プロセス及び表現型特徴を調べることを可能にした。 The Fluidigm Mass Cytometer (CyTOF™) utilizes metal-containing polymer-tagged (MAXPAR™) antibodies to detect proteins. The instruments are based on non-optical physical detection principles and different chemistries of labels. Fluorescent labels are replaced by specially designed multi-atom element tags, and detection exploits the high resolution, sensitivity, and fast analysis of time-of-flight mass spectrometry (TOF-MS). Since the large number of available stable isotopes can be used as tags, many proteins may be detected simultaneously in individual cells [Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]. Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. A method for simultaneous detection of RNA and protein in a single cell based on the Proximity Ligation Assay for RNA (PLAYR) is taught. PLAYR enables highly multiplexed quantification of transcripts in a single cell with mass cytometry allowing simultaneous quantification of over 40 different mRNAs and proteins. Ultimately, mass cytometry has demonstrated protein phosphorylation (Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332), along with protein and messenger RNA transcription. (6030), 687-696. http://doi.org/10.1126/science.1198704) and cell proliferation (Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566.

これらのアプローチの限界は、以下の通りである:
- 質量分析計中でのイオン飛行の動態に起因して、マスサイトメトリーのスループットは、蛍光ベースの機器のものに後れをとる。加えて、マスレポーターの感度は、数個の比較的量子効率が高いフルオロフォア(フィコエリトリン等)にも達さず、これにより、マスサイトメトリーを用いて非常に低レベルで発現される分子特徴を測定することがより困難になる(Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019)。
- 重要なことに、細胞が噴霧化及びイオン化されるので、分析後に細胞を回収することができず、したがってゲノムDNAを分析することができない。
Limitations of these approaches are:
- Due to the dynamics of ion flight in mass spectrometers, the throughput of mass cytometry lags that of fluorescence-based instruments. In addition, the sensitivity of mass reporters falls short of even a few relatively high quantum efficiency fluorophores (such as phycoerythrin), which allows the detection of molecular features expressed at very low levels using mass cytometry. more difficult to measure (Spitzer, MH et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j. cell.2016.04.019).
- Importantly, since the cells are nebulized and ionized, they cannot be harvested after analysis and therefore the genomic DNA cannot be analyzed.

オリゴヌクレオチド標識抗体を通してタンパク質を検出するための方法が、Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473による論文において記載されており、この論文は、2つのDNAアプタマーによる標的タンパク質の協調的且つ近接した結合が、それぞれアプタマー親和性プローブに連結されたオリゴヌクレオチドのライゲーションを促進する技術(近接ライゲーションアッセイ;PLA)を教示する。2つのそのような近接プローブのライゲーションは、標的タンパク質の正体及び量を反映する増幅可能なDNA配列を生じる。3PLA法(Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974)は、3つの認識イベントを使用することにより近接ライゲーション法の感度及び特異度を拡張し、100個ほどの少ない標的分子を検出することを可能にする。3PLAでは、3つのオリゴヌクレオチド修飾型抗体試薬のセットが、個別の標的タンパク質に結合して、近接ライゲーションにより検出可能なシグナルを生じる。2つの近接プローブ上のオリゴヌクレオチドの3'末端及び5'末端は、第3の近接プローブ上に存在するオリゴヌクレオチドへとハイブリダイズすることが可能であり、それにより、3種類のプローブ及び標的タンパク質を含む複合体が形成される。これにより、2つのオリゴヌクレオチドが、2回のライゲーション反応により中間断片を介して連結され、第3の近接プローブにより鋳型化されて、qPCRにより検出することができる特異的な増幅可能DNA鎖を形成することが可能になる。近接伸長アッセイ(Proximity Extension Assay;PEA)はPLAの変法であり、PEAでは2つのオリゴヌクレオチド標識抗体が個別のタンパク質に結合し、オリゴヌクレオチドはその3'末端で部分的にアニーリングし、ポリメラーゼによる伸長によって、qPCRにより検出することができる増幅可能なDNA配列が生成される(Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424)。上記で開示された方法は単一細胞タンパク質検出に対して特異的に設計されていなかったが、フリューダイムC1(Fluidigm C1(商標))単一細胞自動調製システムが、PEAアッセイを用いて、1回の測定当たり最大96個の単一細胞での92種類のタンパク質のパネルの増幅可能な標的の調製を自動化するために利用された(Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5)。フリューダイムC1微小流体システムは、全エクソームシーケンシング及び標的化型DNAシーケンシングによるトランスクリプトーム又はゲノムDNA配列の分析のための一定範囲の単一細胞生物学法を支持するが、しかしながら、この方法は、同じ単一細胞から遺伝子型及び表現型に対する情報を取得するために容易に組み合わせることができない。 Methods for detecting proteins through oligonucleotide-labeled antibodies are described in Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org. /10.1038/nbt0502-473, in which the cooperative and close binding of target proteins by two DNA aptamers facilitates the ligation of oligonucleotides each linked to an aptamer affinity probe. A technique (proximity ligation assay; PLA) is taught. Ligation of two such proximity probes yields an amplifiable DNA sequence that reflects the identity and quantity of the target protein. The 3PLA method (Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974) The use of three recognition events extends the sensitivity and specificity of the proximity ligation method, allowing detection of as few as 100 target molecules. In 3PLA, a set of three oligonucleotide-modified antibody reagents bind to individual target proteins and generate detectable signals by proximity ligation. The 3' and 5' ends of oligonucleotides on two proximity probes are allowed to hybridize to oligonucleotides present on a third proximity probe, thereby forming three probes and a target protein. A complex containing is formed. Thereby, two oligonucleotides are joined via an intermediate fragment by two ligation reactions and templated by a third proximity probe to form a specific amplifiable DNA strand that can be detected by qPCR. it becomes possible to The Proximity Extension Assay (PEA) is a modification of PLA in which two oligonucleotide-labeled antibodies are bound to separate proteins, the oligonucleotides are partially annealed at their 3' ends, and are induced by a polymerase. Extension produces amplifiable DNA sequences that can be detected by qPCR (Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424). Although the methods disclosed above were not specifically designed for single-cell protein detection, the Fluidigm C1™ Single-Cell Automated Preparation System has demonstrated that using the PEA assay, 1 It was utilized to automate the preparation of amplifiable targets for a panel of 92 proteins in up to 96 single cells per assay (Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5). The Fluidigm C1 microfluidic system supports a range of single-cell biology methods for analysis of transcriptome or genomic DNA sequences by whole-exome sequencing and targeted DNA sequencing; Methods cannot be easily combined to obtain genotypic and phenotypic information from the same single cell.

したがって、検出がqPCRに基づくPLA及びPEAアッセイは、感度が高く非常に特異的であるが、それらのスループットが限定され、且つタンパク質のみしか検出できない。 Thus, while PLA and PEA assays based on qPCR for detection are sensitive and highly specific, they are limited in throughput and can only detect proteins.

NanoString Technologies社によるUS 9,714,937は、標的タンパク質の第1領域に対して特異的な部分(ビオチン等)にコンジュゲート化された捕捉抗体及び標的タンパク質の第2領域に対する検出抗体を、リンカーオリゴヌクレオチドへのハイブリダイゼーションを介して検出抗体に連結された複数の脱着可能な標識を含むナノレポーターと共に用いることによる、タンパク質の検出のための方法を教示する。2種類の抗体は、標的タンパク質と複合体を形成し、この複合体は、該部分に対して高親和性を有するマトリックス又はビーズと結合を形成することができる。標的は、ナノレポーター分子の個数をカウントすることにより検出及び定量化される。nCounter(登録商標)デジタル分子バーコード化技術に基づくNanostring社から市販されているアッセイは、特異的タンパク質エピトープを標的化する固有のオリゴヌクレオチド標識抗体を用いてタンパク質を検出する。固有の一本鎖DNAタグは、ビオチン化捕捉プローブと、一連の蛍光標識RNAセグメントにアニーリングした一本鎖DNA分子により作製されるレポータープローブとの組み合わせを用いて検出される。これらの標識の線形順序が、対象となる各標的に対する固有のバーコードを生成する。次に、複合体が、ビオチンと固相化されたストレプトアビジン分子との間の非共有結合を介してイメージング表面に固相化され、蛍光バーコードが撮像及びカウントされる。タンパク質特異的バーコード当たりのカウント数は、試料中に存在する分子数に直接関連するデジタルな測定値である。タンパク質検出は、特異的標的RNAに対して設計された捕捉プローブ-レポータープローブ対を用いて、メッセンジャーRNA検出と組み合わせることができる。約30種類のタンパク質標的及び770種類のmRNA標的を、1回の分析で分析することができる。 No. 9,714,937 by NanoString Technologies, Inc., attaches a capture antibody conjugated to a moiety (such as biotin) specific for the first region of the target protein and a detection antibody for the second region of the target protein to a linker oligonucleotide. A method is taught for the detection of proteins by use with a nanoreporter comprising multiple detachable labels linked via hybridization to a detection antibody. The two antibodies form a complex with the target protein and this complex can form a bond with a matrix or bead that has a high affinity for the moiety. Targets are detected and quantified by counting the number of nanoreporter molecules. A commercially available assay from Nanostring, Inc., based on nCounter® digital molecular barcoding technology, detects proteins using unique oligonucleotide-labeled antibodies that target specific protein epitopes. Unique single-stranded DNA tags are detected using a combination of biotinylated capture probes and reporter probes generated by single-stranded DNA molecules annealed to a series of fluorescently labeled RNA segments. A linear sequence of these labels produces a unique barcode for each target of interest. Complexes are then immobilized on an imaging surface via non-covalent bonding between biotin and immobilized streptavidin molecules, and fluorescent barcodes are imaged and counted. The number of counts per protein-specific barcode is a digital measurement directly related to the number of molecules present in the sample. Protein detection can be combined with messenger RNA detection using capture probe-reporter probe pairs designed against a specific target RNA. Approximately 30 protein targets and 770 mRNA targets can be analyzed in a single analysis.

この方法の欠点は、RNAをプロファイリングするため(2500個の細胞と同等)及び/又はタンパク質をプロファイリングするため(100000個の細胞と同等)に大量の細胞を必要とすること、及びそのままでは単一細胞をプロファイリングするために好適でないことである。この方法は、ゲノムDNA等の他のアナライトを検出するために用いることができる可能性があるが、しかしながら、ゲノム配列の直接的なリードアウトを提供できず、既知の配列の存在/非存在のシグナルのみを提供できる。ハイブリダイゼーションに基づくので、配列変異体に対して部分的に寛容でもあり、異なる配列変異体同士を区別できない可能性がある。 The drawback of this method is that it requires a large number of cells for profiling RNA (equivalent to 2500 cells) and/or for profiling proteins (equivalent to 100000 cells) and, as such, a single It is not suitable for profiling cells. This method could potentially be used to detect other analytes such as genomic DNA, however it fails to provide a direct readout of the genomic sequence and the presence/absence of known sequences. can only provide a signal of Because it is based on hybridization, it is also partially tolerant of sequence variants and may not be able to distinguish between different sequence variants.

シーケンシングによるトランスクリプトーム及びエピトープの細胞インデックス化(cellular indexing of transcriptomes and epitopes by sequencing;CITE-seq)と称される、単一細胞における複数タンパク質及びRNA転写産物の統合分析のためのNGSベースの方法が、Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868、及びUS 2018/0251825により最初に記載された。この方法は、メッセンジャーRNA上に存在するものと類似の抗体タグ上に存在する3'-ポリアデノシンテイルを通して、細胞タンパク質及びトランスクリプトーム測定を単一細胞リードアウトへと統合するために用いられる、オリゴヌクレオチド標識抗体に依存する。この方法は、10X Genomics社により提供されるもの等の、単一細胞における試料分割のための液滴ベースのアプローチ及び単一細胞ライブラリー作製と相性が良い。より詳細には、CITE-seq法では、細胞表面エピトープに対するオリゴヌクレオチド標識抗体を用いて染色された細胞が、微小流体法により、溶解性酵素及びバーコード化されたビーズを含有する油滴中に分割される。各単一細胞/液滴由来のバーコード化抗体及びmRNAは、固有の細胞バーコードを有するビーズにより捕捉される。続いて、mRNAがレトロ転写され、バーコード抗体由来のオリゴと共に増幅されて、直ちにシーケンシングできるNGSライブラリーを生じる。最終的に、バーコード抗体の定量化のために、配列カウントが用いられる。同様に、Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939は、DNA標識抗体及び液滴微小流体工学に基づくRNA発現及びタンパク質定量化アッセイ(REAP-seq)という方法を教示し、この方法によれば、82種類のバーコード化抗体を用いてタンパク質を定量化することができ、且つ20000種類超の転写を単一細胞においてプロファイリングすることができる。上記で言及された方法の両方が、ポリ(dT)細胞バーコードを用いてプライミングされたオリゴ標識抗体を伸長し、同時に、同じ反応中でmRNAから相補的DNAを合成する逆転写酵素のDNAポリメラーゼ活性を利用する。他方で、これもまた液滴アプローチに基づく他の方法が、ゲノム全体のコピー数プロファイルの分析のために、又は単一細胞におけるゲノム配列の分析のために利用可能である。例えば、10X Genomics社により市販されている溶液であるクロミウム単一細胞CNV溶液は、数百~数千の単一細胞のコピー数プロファイリングを可能にし、Mission Bio社のTapestri(登録商標)プラットフォームは、配列に関する単一細胞標的化DNAシーケンシング及び遺伝子のパネルのCNV分析を提供する。 An NGS-based approach for integrated analysis of multiple protein and RNA transcripts in single cells, termed cellular indexing of transcriptomes and epitopes by sequencing (CITE-seq). The method was originally described by Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868, and US 2018/0251825. This method is used to integrate cellular protein and transcriptome measurements into single-cell readouts through 3'-polyadenosine tails present on antibody tags similar to those present on messenger RNA. Depends on oligonucleotide labeled antibody. This method is compatible with droplet-based approaches for sample partitioning in single cells and single-cell library generation, such as those offered by 10X Genomics. More specifically, in the CITE-seq method, cells stained with oligonucleotide-labeled antibodies against cell surface epitopes are placed in oil droplets containing lytic enzymes and barcoded beads by a microfluidic method. split. Barcoded antibodies and mRNA from each single cell/droplet are captured by beads with unique cell barcodes. The mRNA is then retrotranscribed and amplified with barcode antibody-derived oligos to generate a sequence-ready NGS library. Finally, sequence counting is used for barcode antibody quantification. Similarly, Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939, describe RNA expression and protein quantification based on DNA labeled antibodies and droplet microfluidics. It teaches a method called quantification assay (REAP-seq), in which 82 barcoded antibodies can be used to quantify proteins and more than 20,000 transcripts can be profiled in a single cell. can do. Both of the methods mentioned above extend an oligo-labeled antibody primed with a poly(dT) cell barcode and, at the same time, reverse transcriptase DNA polymerase synthesizes complementary DNA from mRNA in the same reaction. Use activity. On the other hand, other methods, also based on the droplet approach, are available for analysis of genome-wide copy number profiles or for analysis of genomic sequences in single cells. For example, Chromium Single Cell CNV Solution, a solution marketed by 10X Genomics, allows copy number profiling of hundreds to thousands of single cells, and Mission Bio's Tapestri® platform, Single-cell targeted DNA sequencing for sequences and CNV analysis of a panel of genes are provided.

これらの方法の短所は、以下の通りである:
- ゲノムDNAはそれを増幅するために必要なポリアデノシンテイルを保有しないので、上記の同時トランスクリプトーム/プロテオームプロファイリングのための両方の方法が、タンパク質又は転写産物と一緒でのゲノム配列の同時分析を可能にしない。
- コピー数及び又は標的化シーケンシングのためのDropseqに基づく方法は、ゲノムDNAの分析に対してのみ好適であるが、単一細胞の表面マーカー若しくは他のタンパク質の転写プロファイル又は定量化等の表現型に関するいかなる情報も提供しない。
- 液滴ベースの単一細胞分割アプローチでは、単一細胞及びそれらの全ての情報含有物がこのプロセス中に原則として「破壊」され、手順が完了した後に、更なる分析を行うために単一細胞を回収することが可能でない。
Disadvantages of these methods are:
- Both methods for simultaneous transcriptome/proteome profiling described above require simultaneous analysis of genomic sequences together with proteins or transcripts, since genomic DNA does not possess the polyadenosine tails necessary to amplify it. does not allow
- Dropseq-based methods for copy number and/or targeted sequencing are suitable only for the analysis of genomic DNA, but not for expression of single cell surface markers or other protein transcriptional profiles or quantification, etc. It does not provide any information about the type.
- In the droplet-based single-cell splitting approach, single cells and all their information content are essentially 'destroyed' during this process, and after the procedure is completed, single cells are separated for further analysis. It is not possible to harvest the cells.

EP1109938EP1109938 WO 2017/178655WO 2017/178655 WO 2019/016401WO 2019/016401 US 9,714,937US 9,714,937 US 2018/0251825US 2018/0251825

Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129 Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370 Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639 Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002 Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742 Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science. 1198704 Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075 Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019 Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473 Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974 Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/ nar/gkr424 Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 TM Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5 Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868 Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939

したがって、本発明の目的は、ゲノム全体のコピー数プロファイル/ゲノム配列の分析及び同じ単一細胞に対するタンパク質発現の分析を同時に可能にする、生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法を提供することであり、これにより、当技術分野の技術水準の以下の短所のうちの1つ又は複数が特に克服される:
- 単一細胞分解能まで下がって同じ試料中でタンパク質を検出及び定量化し、且つゲノムを分析することが不可能であること、
- 追加の標的化ゲノム情報に関して単一細胞を再分析することが不可能であること。
It is therefore an object of the present invention to develop whole-genome amplification and analysis of multiple target molecules in a biological sample that allows simultaneous analysis of genome-wide copy number profiles/genomic sequences and analysis of protein expression on the same single cell. The object is to provide a method for, which specifically overcomes one or more of the following disadvantages of the state of the art:
- the inability to detect and quantify proteins in the same sample and analyze the genome down to single-cell resolution;
- Inability to reanalyze single cells for additional targeted genomic information.

この目的は、請求項1に規定される方法により達成される。 This object is achieved by the method defined in claim 1.

本発明の更なる目的は、請求項17に規定されるキットを提供することである。 A further object of the invention is to provide a kit as defined in claim 17.

本発明に従う3'タグ付きオリゴ配列を用いないか(図1A)又は用いる(図1B)、タグ付きオリゴヌクレオチドの2種類の考えられる実施形態の全体構造を示す図である。PL=ペイロード配列;5-TOS=第1のタグ付きオリゴヌクレオチド増幅配列;3-TOS=第2のタグ付きオリゴヌクレオチド増幅配列;UMI=固有分子識別子配列;BAB=結合剤バーコード配列。Figure 1 shows the overall structure of two possible embodiments of tagged oligonucleotides, without (Fig. IA) or with (Fig. IB) 3' tagged oligo sequences according to the invention. PL = payload sequence; 5-TOS = first tagged oligonucleotide amplification sequence; 3-TOS = second tagged oligonucleotide amplification sequence; UMI = unique molecular identifier sequence; BAB = binding agent barcode sequence. 一方は異なる温度で5-TOS及び3-TOSの間での分子内ヘアピン形成を生じ易い、2種類の異なるタグ付きオリゴからのタグ付きオリゴヌクレオチドライブラリーを表すグラフを示す図である(「ヘアピンあり」:Tm=67℃;「ヘアピンなし」:Tm=45℃)。x軸上に予測されるUMIカウントを示し、y軸上にシーケンシング後にカウントされたUMIを示す。FIG. 10 shows a graph representing a tagged oligonucleotide library from two different tagged oligos, one prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (“Hairpins”). with": Tm=67°C; "without hairpin": Tm=45°C). Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis. 27回のPCRサイクルを用いる異なる量でのオリゴ混合物の増幅を表すグラフを示す図である。各希釈は、3回の独立した希釈複製から行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。FIG. 10 shows a graph representing amplification of oligo mixtures with different amounts using 27 PCR cycles. Each dilution was performed from 3 independent dilution replicates. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. 異なる量での異なるBABを用いた4種類のオリゴ混合物の増幅の3つのグラフを示す図である。各希釈は、それぞれ1つが各オリゴに対する、4つのデータ点を有する。図4A:23回のPCRサイクルを行った。図4B:27回のPCRサイクルを行った。図4C:35回のPCRサイクルを行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。FIG. 3 shows three graphs of amplification of four oligo mixtures with different BABs at different amounts. Each dilution has 4 data points, one for each oligo. Figure 4A: 23 PCR cycles were performed. Figure 4B: 27 PCR cycles were performed. Figure 4C: 35 PCR cycles were performed. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. 1回のプライマー増幅を伴うタグ付きオリゴの本発明に従う実施形態の構造を示す図である。追加の脚注:5-WGAH=5'WGAハンドル配列;3-WGAH=3'WGAハンドル配列;1AH=第1の増幅ハンドル配列;2AH=第2の増幅ハンドル配列。FIG. 3 shows the structure of an embodiment according to the invention of tagged oligos with one primer amplification. Additional footnotes: 5-WGAH=5'WGA handle sequence; 3-WGAH=3'WGA handle sequence; 1AH=first amplification handle sequence; 2AH=second amplification handle sequence. 少なくとも第2のプライマー増幅を伴うタグ付きオリゴの本発明に従う別の実施形態の構造を示す図である。図6A:タグ付きオリゴ及びBABに対応するアニーリング部位を有する相対的伸長オリゴヌクレオチドの構造。図6B:タグ付きオリゴ及びBABに対応しないアニーリング部位を有する相対的伸長オリゴヌクレオチドの構造。追加の脚注:E-p=5'伸長オリゴヌクレオチド配列;SS=スペーサー配列;AS=アニーリング配列;AS-RC=アニーリング配列逆相補体。Fig. 2 shows the structure of another embodiment according to the invention of tagged oligos with at least a second primer amplification; Figure 6A: Structures of tagged oligos and relatively extended oligonucleotides with annealing sites corresponding to BAB. Figure 6B: Structures of tagged oligos and relatively extended oligonucleotides with annealing sites that do not correspond to BAB. Additional footnotes: E-p = 5' extension oligonucleotide sequence; SS = spacer sequence; AS = annealing sequence; AS-RC = annealing sequence reverse complement. 分子長の関数としての、ssDNA分子の末端に位置する15nt長相補的配列により誘導されるヘアピンの融解温度([Na+]=150mM;[Mg++]=4mM)のin silico予測のグラフを示す図である。Graphs of the in silico prediction of the melting temperature of hairpins induced by 15 nt-long complementary sequences located at the ends of ssDNA molecules ([Na + ]=150 mM; [Mg ++ ]=4 mM) as a function of molecular length. FIG. 4 is a diagram showing; 少なくとも3回のプライマー増幅を伴うタグ付きオリゴの本発明に従う別の実施形態の構造を示す図である。FIG. 3 shows the structure of another embodiment according to the invention of tagged oligos with at least 3 rounds of primer amplification. ライブラリー作製のための一般的スキームを示す図である。図9A:図5の実施形態に従うタグ付きオリゴからのライブラリーの作製。図9B:図6Aの実施形態に従うタグ付きオリゴからのライブラリーの作製。図9C:図8の実施形態に従うタグ付きオリゴからのライブラリーの作製。追加の脚注:2AH-RC=第2の増幅ハンドル配列逆相補体。FIG. 1 shows a general scheme for library construction. FIG. 9A: Generation of libraries from tagged oligos according to the embodiment of FIG. Figure 9B: Generation of libraries from tagged oligos according to the embodiment of Figure 6A. FIG. 9C: Generation of libraries from tagged oligos according to the embodiment of FIG. Additional footnote: 2AH-RC = reverse complement of second amplification handle sequence. P5-Synthオリゴの設計及び実施例1に開示される対応するライブラリープライマーを示す図である。FIG. 1 shows the design of P5-Synth oligos and the corresponding library primers disclosed in Example 1. FIG. 実施例1に従うライブラリープライマーを用いるオリゴP5-SynthのNGSライブラリー作製のスキームを示す図である。1 shows a scheme for NGS library construction of oligo P5-Synth using library primers according to Example 1. FIG. Ab-オリゴ及び二次蛍光抗体を用いて染色されたPBMC細胞及びSK-BR-3細胞の散布図を示す図である。x軸上にAPCチャンネルでの蛍光レベルを示し、これはAb-オリゴtag1、tag2及びtag4の量に比例する。y軸上にPEチャンネルでの蛍光レベルを示し、これはAb-オリゴtag3の量に比例する。Scatter plots of PBMC cells and SK-BR-3 cells stained with Ab-oligos and secondary fluorescent antibodies. On the x-axis is shown the level of fluorescence in the APC channel, which is proportional to the amount of Ab-oligos tag1, tag2 and tag4. On the y-axis is shown the level of fluorescence in the PE channel, which is proportional to the amount of Ab-oligo tag3. 実施例1に従う単一細胞からのP5-synthタグ付きオリゴから作製されたライブラリー由来の電気泳動像を示す図である。FIG. 2 shows an electropherogram from a library made from P5-synth tagged oligos from a single cell according to Example 1. FIG. WGA後にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図14A)、Her2(図14B)、CD45(図14C)及びIgG1アイソタイプ対照(図14D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using WGA followed by tagged oligo amplification. UMI counts for cytokeratin (Figure 14A), Her2 (Figure 14B), CD45 (Figure 14C) and IgG1 isotype control (Figure 14D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA後にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図14A)、Her2(図14B)、CD45(図14C)及びIgG1アイソタイプ対照(図14D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using WGA followed by tagged oligo amplification. UMI counts for cytokeratin (Figure 14A), Her2 (Figure 14B), CD45 (Figure 14C) and IgG1 isotype control (Figure 14D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA中にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図15A)、Her2(図15B)、CD45(図15C)及びIgG1アイソタイプ対照(図15D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using tagged oligo amplification in WGA. UMI counts for cytokeratin (FIG. 15A), Her2 (FIG. 15B), CD45 (FIG. 15C) and IgG1 isotype control (FIG. 15D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. WGA中にタグ付きオリゴ増幅を用いて図8の実施形態に従って加工された単一細胞からのタンパク質定量化結果を示す図である。それぞれ、サイトケラチン(図15A)、Her2(図15B)、CD45(図15C)及びIgG1アイソタイプ対照(図15D)定量化のUMIカウント。y軸上にUMIの個数を示し、x軸上に図9に従って単離された細胞タイプを示す。FIG. 9 shows protein quantification results from single cells processed according to the embodiment of FIG. 8 using tagged oligo amplification in WGA. UMI counts for cytokeratin (FIG. 15A), Her2 (FIG. 15B), CD45 (FIG. 15C) and IgG1 isotype control (FIG. 15D) quantification, respectively. The number of UMIs is indicated on the y-axis and the cell types isolated according to FIG. 9 on the x-axis. P5-Lib1オリゴの設計及び実施例3に開示される対応するライブラリープライマーを示す図である。FIG. 2 shows the design of P5-Lib1 oligos and the corresponding library primers disclosed in Example 3. FIG. ライブラリープライマーを用いるP5-Lib1オリゴのNGSライブラリー作製のスキームを示す図である。FIG. 4 shows a scheme for NGS library construction of P5-Lib1 oligos using library primers. 単一細胞から取得されるCNA分析に対する低パスプロファイルの例を示す図である。図18A:P5-Lib1オリゴを用いてスパイク化され、且つ図5の実施形態に従って加工された単一細胞CNAプロファイル。図18B:P5-Synthオリゴを用いてスパイク化され、且つ図8の実施形態に従って加工された単一細胞CNAプロファイル。図18C:タグ付きオリゴスパイク化を伴わない単一細胞CNAプロファイル。全てのプロファイルは、典型的な損益を伴って、SK-BR-3細胞に対応する。小さな変動は、単一細胞ゲノム不均一性に起因する。FIG. 10 shows an example of a low pass profile for CNA analysis obtained from a single cell. FIG. 18A: Single-cell CNA profiles spiked with P5-Lib1 oligos and processed according to the embodiment of FIG. FIG. 18B: Single-cell CNA profiles spiked with P5-Synth oligos and processed according to the embodiment of FIG. Figure 18C: Single cell CNA profile without tagged oligo spiking. All profiles correspond to SK-BR-3 cells with typical gains and losses. Small variations are due to single-cell genomic heterogeneity. P5-Synth及びP5-Lib1を用いる単一細胞スパイク化から取得されたタグ付きオリゴライブラリーを表すグラフを示す図である。x軸上に予測されるUMIカウントを示し、y軸にはシーケンシング後にカウントされたUMIを示す。FIG. 10 shows a graph representing tagged oligo libraries obtained from single cell spiking with P5-Synth and P5-Lib1. Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis.

定義
別途定義されない限り、本明細書中で用いられる全ての技術用語及び科学用語は、本発明が属する技術分野の当業者により通常理解されるのと同じ意味を有する。本明細書中に記載されるものに類似するか又は等価である多数の方法及び材料を本発明の実施又は試行で用いることができるが、好ましい方法及び材料が以下に記載される。別途言及されない限り、本発明に伴う使用のために本明細書中に記載される技術は、当業者に周知の標準的方法論である。
DEFINITIONS Unless defined otherwise, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although numerous methods and materials similar or equivalent to those described herein can be used in the practice or trial of the present invention, preferred methods and materials are described below. Unless otherwise noted, the techniques described herein for use with the present invention are standard methodologies well known to those skilled in the art.

「ab-オリゴミックス」とは、細胞の内部(すなわち、「内部ab-オリゴミックス」)、及び/若しくは外部(すなわち、「外部ab-オリゴミックス」)エピトープ及び/又はアイソタイプ対照ab-オリゴを標的とする全てのab-オリゴを含有する溶液を意図する。 "ab-oligomix" targets epitopes and/or isotype control ab-oligos internal (i.e., "internal ab-oligomix") and/or external (i.e., "external ab-oligomix") of the cell A solution containing all ab-oligos with

「抗体-オリゴヌクレオチドコンジュゲート」又は「ab-オリゴコンジュゲート」又は「ab-オリゴ」とは、抗体分子とssDNAオリゴヌクレオチド分子との化学的コンジュゲート化により誘導される合成分子を意図する。化学的コンジュゲート化は、通常、共有的な2つの分子の連結を可能にする特異的化学反応を用いて行われる。抗体:オリゴヌクレオチド化学量論は、特定される比率を有するために制御することができる。WGA初期段階の間に、抗体部分は通常は消化されて、オリゴヌクレオチド部分のみが残る。簡略化のために、説明の中では、これらの分子はそれでもab-オリゴ分子又はab-オリゴアンプリコンと称されるであろう。 By "antibody-oligonucleotide conjugate" or "ab-oligoconjugate" or "ab-oligo" is intended a synthetic molecule derived from the chemical conjugation of an antibody molecule and an ssDNA oligonucleotide molecule. Chemical conjugation is usually performed using specific chemical reactions that allow the covalent linking of two molecules. Antibody:oligonucleotide stoichiometry can be controlled to have a specified ratio. During the early stages of WGA, the antibody portion is usually digested leaving only the oligonucleotide portion. For simplicity, in the description these molecules will still be referred to as ab-oligomolecules or ab-oligoamplicons.

頭字語「APC」とは、フルオロフォアであるアロフィコシアニンを意図する。 The acronym "APC" intends the fluorophore allophycocyanin.

「結合剤バーコード配列」(BAB)とは、結合剤を特定する固有のDNAオリゴヌクレオチド配列を意図する。 By "binding agent barcode sequence" (BAB) is intended a unique DNA oligonucleotide sequence that identifies a binding agent.

「平衡化PCR増幅」とは、それにより、各PCRサイクルにおいて、実質的に全ての標的分子が増幅される、複数標的の増幅を行うためのPCRの特徴を意図する。 By "balanced PCR amplification" is intended a feature of PCR for the amplification of multiple targets whereby substantially all target molecules are amplified in each PCR cycle.

「結合剤」とは、指定された標的分子(例えば、タンパク質又はグリコシル化タンパク質又はリン酸化タンパク質)に特異的に結合できる分子(非限定的な例として、抗体、アフィボディ、リガンド、アプタマー、合成結合性タンパク質、小分子等)を意図する。 A "binding agent" is a molecule (non-limiting examples include antibodies, affibodies, ligands, aptamers, synthetic binding proteins, small molecules, etc.).

「CITE-Seq」又は「シーケンシングによるトランスクリプトーム及びエピトープの細胞インデックス化」とは、単一細胞における同時でのタンパク質定量化及びmRNAシーケンシングのための、Stoeckius等により開発された方法を意図する。 By "CITE-Seq" or "Cellular Indexing of Transcriptomes and Epitopes by Sequencing" is intended the method developed by Stoeckius et al. for simultaneous protein quantification and mRNA sequencing in single cells. do.

「CyTOF」又は「飛行時間によるサイトメトリー」とは、サイトメトリーと組み合わせた質量分析を用いて単一細胞でのタンパク質の定量化を可能にする、マスサイトメトリー技術を行う装置を意図する。細胞は、重金属同位体とコンジュゲート化された結合剤を用いて染色される。 By "CyTOF" or "time-of-flight cytometry" is intended a device that performs mass cytometry techniques that allows quantification of proteins in single cells using mass spectrometry coupled with cytometry. Cells are stained with a binding agent conjugated to a heavy metal isotope.

用語「コンジュゲート」とは、結合剤とタグ付きオリゴヌクレオチドとの共有結合によるコンジュゲート化によって得られる分子を意図する。 The term "conjugate" intends a molecule obtained by covalent conjugation of a binding agent and a tagged oligonucleotide.

「コピー数変化」(CNA)とは、一般的に同じ個体ゲノムに関して規定される、ゲノム領域のコピー数の体細胞変化を意図する。 By "copy number alteration" (CNA) is intended a somatic alteration in the copy number of a genomic region, generally defined with respect to the same individual's genome.

「DNAライブラリー精製」とは、それによりDNAライブラリー材料が、酵素、dNTP、塩及び/又は所望のDNAライブラリーの一部分でない他の分子等の、望ましくない反応成分から分離されるプロセスを意図する。DNAライブラリー精製プロセスの例は、Agencourt AMPure、又はMerck Millipore Amiconスピンカラム又はBeckman Coulter社のもの等の固相可逆的固相化(SPRI)ビーズを用いる精製である。 By "DNA library purification" is intended the process by which DNA library material is separated from undesirable reaction components such as enzymes, dNTPs, salts and/or other molecules that are not part of the desired DNA library. do. An example of a DNA library purification process is purification using Agencourt AMPure, or solid phase reversible immobilization (SPRI) beads such as those from Merck Millipore Amicon spin columns or Beckman Coulter.

「DNAライブラリー定量化」とは、それによりDNAライブラリー材料が定量化されるプロセスを意図する。DNAライブラリー定量化プロセスの例は、QuBit技術、電気泳動アッセイ(Agilent Bioanalyzer 2100、Perkin Elmer LabChip technologies社)又はRT-PCR PicoGreenシステム(Kapa Biosystems社)を用いる定量化である。 By "DNA library quantification" is intended the process by which DNA library material is quantified. Examples of DNA library quantification processes are quantification using QuBit technology, electrophoresis assays (Agilent Bioanalyzer 2100, Perkin Elmer LabChip technologies) or RT-PCR PicoGreen system (Kapa Biosystems).

「ダイナミックレンジ」とは、ある量が想定できる最大値と最小値との比率を意図する。 By "dynamic range" is intended the ratio between the maximum and minimum values that a quantity can assume.

「ライブラリープライマー」とは、タグ付きオリゴヌクレオチドからの超並列シーケンシング可能なライブラリーを作製するために、プライマーとして機能するssDNA分子を意図する。 By "library primer" is intended an ssDNA molecule that serves as a primer to generate a massively parallel sequenceable library from tagged oligonucleotides.

「低パス全ゲノムシーケンシング」又は「低パスシーケンシング」とは、1未満の平均シーケンシング深度での全ゲノムシーケンシングを意図する。 By “low-pass whole-genome sequencing” or “low-pass sequencing” is intended whole-genome sequencing with an average sequencing depth of less than one.

「超並列シーケンシング」又は「次世代シーケンシング」(NGS)とは、クローン的にシーケンシングされる(事前のクローン増幅あり又はなしで)、空間的且つ/又は時間的に分離したDNA分子のライブラリーの作製を含む、DNAをシーケンシングする方法を意図する。例としては、Illuminaプラットフォーム(Illumina社)、IonTorrentプラットフォーム(ThermoFisher Scientific社)、Pacific Biosciencesプラットフォーム、MinIon(Oxford Nanopore Technologies社)が挙げられる。 "Massively Parallel Sequencing" or "Next Generation Sequencing" (NGS) refers to spatially and/or temporally separated DNA molecules that are clonally sequenced (with or without prior clonal amplification). Methods of sequencing DNA, including library generation, are contemplated. Examples include the Illumina platform (Illumina), IonTorrent platform (ThermoFisher Scientific), Pacific Biosciences platform, MinIon (Oxford Nanopore Technologies).

「多重アニーリング及びループピングベース増幅サイクル」(MALBAC)とは、準線形全ゲノム増幅法を意図する(Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.)。MALBACプライマーは、鋳型にハイブリダイズするための8ヌクレオチド3'ランダム配列、及び27ヌクレオチド5'共通配列(GTG AGT GAT GGT TGA GGT AGT GTG GAG)を有する。最初の伸長後、セミアンプリコンが別の伸長の鋳型として用いられて、相補的な5'末端及び3'末端を有する完全アンプリコンが生じる。数サイクルの準線形増幅に続いて、完全アンプリコンを、その後のPCRサイクルを用いて指数関数的に増幅することができる。 By "multiple annealing and looping-based amplification cycle" (MALBAC) is intended a quasi-linear whole genome amplification method (Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.). The MALBAC primer has an 8 nucleotide 3' random sequence to hybridize to the template and a 27 nucleotide 5' consensus sequence (GTG AGT GAT GGT TGA GGT AGT GTG GAG). After the first extension, the semi-amplicon is used as a template for another extension to generate a full amplicon with complementary 5' and 3' ends. Following several cycles of quasi-linear amplification, the full amplicon can be exponentially amplified using subsequent cycles of PCR.

用語「オリゴヌクレオチド」又は「オリゴ」とは、非限定的な例として、デオキシリボ核酸(DNA)、リボ核酸(RNA)、ロックド核酸(LNA)、ペプチド核酸(PNA)等のヌクレオチドの配列を含むオリゴマー分子を意図する。 The term "oligonucleotide" or "oligo" means an oligomer comprising a sequence of nucleotides such as deoxyribonucleic acid (DNA), ribonucleic acid (RNA), locked nucleic acid (LNA), peptide nucleic acid (PNA), etc., as non-limiting examples. Molecules are intended.

「タグ付きオリゴヌクレオチド」又は「タグ付きオリゴ」とは、結合剤(例えば、一次抗体)に直接的にコンジュゲート化されているオリゴヌクレオチド分子(例えば、ssDNA分子)を意図する。タグ付きオリゴは、結合剤に対するリガンドである標的分子(例えば、タンパク質)の間接的定量化のために用いられる。 By "tagged oligonucleotide" or "tagged oligo" is intended an oligonucleotide molecule (eg, ssDNA molecule) that is directly conjugated to a binding agent (eg, primary antibody). Tagged oligos are used for indirect quantification of target molecules (eg, proteins) that are ligands to binding agents.

頭字語「PE」とは、フルオロフォアであるフィコエリトリンを意図する。 The acronym "PE" intends the fluorophore phycoerythrin.

「PFA 2%」とは、リン酸緩衝生理食塩液中の2%w/vのパラホルムアルデヒドの溶液を意図する。 By "PFA 2%" is intended a solution of 2% w/v paraformaldehyde in phosphate buffered saline.

「一次WGA DNAライブラリー」(pWGAlib)とは、WGA反応から取得されるDNAライブラリーを意図する。 By "primary WGA DNA library" (pWGAlib) is intended a DNA library obtained from a WGA reaction.

用語「再増幅」又は「再amp」とは、一次WGA DNAライブラリーのうちの全部又は相当な部分が更に増幅されるPCR反応を意図する。 By the term "reamplification" or "reampl" is intended a PCR reaction in which all or a substantial portion of the primary WGA DNA library is further amplified.

「残基」とは、タンパク質においてポリペプチド鎖中に存在するアミノ酸残基を意図する。 By "residue" is intended an amino acid residue present in a polypeptide chain in a protein.

「シーケンシングバーコード」とは、1つのシーケンサーリード内でシーケンシングされる場合に、そのリードを、バーコードと関連付けられる特異的試料に対して割り当てることを可能にするポリヌクレオチド配列を意図する。 By "sequencing barcode" is intended a polynucleotide sequence that, when sequenced within one sequencer read, allows the assignment of that read to the specific sample associated with the barcode.

「UMI」又は「固有分子識別子配列」とは、各ssDNA又はdsDNA分子に対して実質的に固有である縮重又は部分縮重(すなわち、ランダム又は半ランダム)オリゴヌクレオチド配列を意図する。 By "UMI" or "Unique Molecular Identifier Sequence" is intended a degenerate or partially degenerate (ie, random or semi-random) oligonucleotide sequence that is substantially unique for each ssDNA or dsDNA molecule.

「普遍的WGAプライマー」又は「WGA PCRプライマー」とは、制限酵素の作用により作製される各断片に対してライゲーションした追加のオリゴヌクレオチドを意図する。普遍的WGAプライマーは、Ampli1(商標)WGA等のDRS-WGAにおいて用いられる。 By "universal WGA primer" or "WGA PCR primer" is intended an additional oligonucleotide ligated to each fragment generated by the action of a restriction enzyme. Universal WGA primers are used in DRS-WGA, such as Ampli1™ WGA.

発明の詳細な説明
本発明に従うゲノムDNA及び標的分子を含む生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法は、以下の工程を含む。
DETAILED DESCRIPTION OF THE INVENTION A method for whole genome amplification and analysis of multiple target molecules in a biological sample containing genomic DNA and target molecules according to the present invention comprises the following steps.

工程a)では、生物学的試料が用意される。生物学的試料は、好ましくは単一細胞であるが、数個の細胞を含む試料も用いることができる。 In step a) a biological sample is provided. The biological sample is preferably a single cell, but samples containing several cells can also be used.

工程b)では、タグ付きオリゴヌクレオチドとコンジュゲート化された、少なくとも1種の標的分子に対する1種の結合剤と、生物学的試料を接触させて、それにより、少なくとも1種の標的分子が生物学的試料中に存在する場合、該少なくとも1種の結合剤は、該少なくとも1種の標的分子に結合する。 In step b), the biological sample is contacted with one binding agent for at least one target molecule conjugated with the tagged oligonucleotide, whereby the at least one target molecule is When present in a biological sample, the at least one binding agent binds to the at least one target molecule.

結合剤は、好ましくは、抗体又はその断片、アプタマー、小分子、ペプチド、及びタンパク質からなる群から選択される。標的分子は、好ましくは、タンパク質、ペプチド、糖タンパク質、炭水化物、脂質、及びそれらの組み合わせからなる群から選択される。より好ましくは、結合剤は抗体である。結合剤は、モノクローナル抗体若しくは酵素基質等の特異的化学量論を有するか、又はポリクローナル抗体若しくは小分子等の特定されていない化学量論を有する標的分子に結合する。前者は、後者に対して標的の比較的良好な定量化を可能にする。結合剤は、共有結合相互作用又は非共有的相互作用を介して、タグ付きオリゴに化学的にコンジュゲート化される。前者の場合には、オリゴと結合剤の両方が、相互的な結合を可能にする反応性部分を保有する。結合剤:オリゴの化学量論は、コンジュゲート化手順の間に制御することができる。 Binding agents are preferably selected from the group consisting of antibodies or fragments thereof, aptamers, small molecules, peptides and proteins. Target molecules are preferably selected from the group consisting of proteins, peptides, glycoproteins, carbohydrates, lipids, and combinations thereof. More preferably the binding agent is an antibody. Binding agents bind target molecules with a specific stoichiometry, such as monoclonal antibodies or enzyme substrates, or with unspecified stoichiometry, such as polyclonal antibodies or small molecules. The former allows relatively better quantification of targets versus the latter. Binding agents are chemically conjugated to tagged oligos through covalent or non-covalent interactions. In the former case, both the oligo and the binding agent possess reactive moieties that allow mutual binding. Binder:oligo stoichiometry can be controlled during the conjugation procedure.

結合剤/標的分子の例の非限定的なリストは、以下の表1に報告される。 A non-limiting list of examples of binding agents/targeting molecules is reported in Table 1 below.

Figure 2023511492000033
Figure 2023511492000033

タグ付きオリゴヌクレオチドとして用いられるオリゴヌクレオチドは、好ましくは、5'末端又は3'末端に化学的修飾を有するssDNA又はdsDNA分子である。この修飾は、関連する結合剤との共有結合によるコンジュゲート化のために用いられる。 Oligonucleotides used as tagged oligonucleotides are preferably ssDNA or dsDNA molecules with chemical modifications at the 5' or 3' ends. This modification is used for covalent conjugation with relevant binding agents.

結合剤とコンジュゲート化されたタグ付きオリゴにより形成されるコンジュゲートは、細胞外エピトープと細胞内エピトープの両方を標的とする場合がある。「外部」及び「内部」コンジュゲートは、それらの最終染色濃度でコンジュゲートを含有する2種類の別個のミックスとして、生物学的試料に添加することができる。第1に、外部ミックスを、外部エピトープを標識するために添加する。第2に、界面活性剤又は同様の手段を用いて細胞を透過化し、内部ミックスを、内部エピトープを標識するために試料に添加する。或いは、外部及び内部コンジュゲートを、1ステップ染色を行うために、むしろ一緒に混合することができる。最終染色濃度は、各結合剤に対して異なり、且つ実験的に決定する必要がある。 Conjugates formed by tagged oligos conjugated to binding agents may target both extracellular and intracellular epitopes. The "external" and "internal" conjugates can be added to the biological sample as two separate mixes containing the conjugates at their final staining concentrations. First, an external mix is added to label the external epitope. Second, the cells are permeabilized using detergent or similar means and an internal mix is added to the sample to label internal epitopes. Alternatively, the external and internal conjugates can rather be mixed together to perform a one-step staining. The final staining concentration is different for each binding agent and has to be determined experimentally.

タグ付きオリゴ配列は、結合剤とのコンジュゲート化を容易にし、且つコストを低減するために、好ましくは300塩基よりも短く、より好ましくは120塩基よりも短い。好ましい実施形態では、タグ付きオリゴ配列は、60~80ヌクレオチドである。 Tagged oligo sequences are preferably shorter than 300 bases, more preferably shorter than 120 bases, to facilitate conjugation with binding agents and reduce costs. In preferred embodiments, the tagged oligo sequence is 60-80 nucleotides.

図1Aを参照すると、タグ付きオリゴヌクレオチドは、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、及び
ii)核酸の少なくとも1種の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含む。
Referring to FIG. 1A, tagged oligonucleotides are
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI), and
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS) of the nucleic acid
including.

ペイロード配列は、標的カウントのための必要な情報を含む。 The payload sequence contains the necessary information for target counting.

固有分子識別子配列(UMI)は、好ましくは、10~30ヌクレオチドの範囲の縮重又は半縮重配列である。好ましくは、UMIは、大部分の標的分子に対して十分な、理論上は4^10=1,048,576種類の異なる組み合わせに対応する、少なくとも10塩基の長さを有する。非常に豊富な標的分子に対して、12塩基等の、考えられる組み合わせを増加させるための、より長いUMIを用いることができる。半縮重塩基を用いると、考えられる組み合わせは減少し、UMI長は好ましくは増加して、例えば最大20又は30塩基となる。半縮重UMIは、配列を再アライメントして、存在する異なるUMIの過大評価を防ぐために、リードアウト中で用いることができる参照点を導入するために、有利に用いることができる。UMI配列は、BABの5'又は3'のいずれかに位置することができる。UMI配列は、優先的には、最初にシーケンシングされる塩基の複雑性を増大させるために、Read1シーケンシングプライマーアニーリング部位のすぐ後ろに位置する。初期シーケンシング工程がクラスター識別のための高い複雑性を必要とするので、これはIlluminaシーケンシングプラットフォームに関して有利である。BABは、各コンジュゲート分子に対して固定された配列である。BABは、一次PCR増幅及びシーケンシング工程を妨げ得る特徴(ホモ多量体、ヘアピン、及び/又はヘテロ二重鎖形成等)を回避するために設計され[Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362]、且つそれらの相対的ハミング距離を最大化して、それによりいずれかのPCR又はシーケンシングエラーがシーケンシングされたリードの誤った割り当てをもたらし得る可能性を最小限にするために、規定された長さの全ての考えられるBAB配列のプールから選択される。BAB長は、検出される標的分子の数に基づいて選択しなければならない。好ましくは、BABは、GC含量(例えば、[30%..70%])、ホモ多量体の非存在、ヘアピンの非存在及び最小ハミング距離(好ましくは3nt以上)に対するフィルターを適用した後に、約2000種類の考えられるBAB配列まで減少する、理論上は4^10=1,048,576種類の異なる組み合わせに対応する、少なくとも10ヌクレオチドの長さを有する。 A unique molecular identifier sequence (UMI) is preferably a degenerate or semi-degenerate sequence ranging from 10 to 30 nucleotides. Preferably, UMIs have a length of at least 10 bases, which is sufficient for most target molecules, corresponding theoretically to 4^10 = 1,048,576 different combinations. For highly abundant target molecules, longer UMIs can be used to increase the possible combinations, such as 12 bases. Using semi-degenerate bases reduces the number of possible combinations and preferably increases the UMI length, eg up to 20 or 30 bases. Semi-degenerate UMIs can be advantageously used to realign sequences to introduce reference points that can be used in readouts to prevent overestimation of different UMIs present. The UMI sequence can be located either 5' or 3' to the BAB. The UMI sequence is preferentially positioned immediately after the Read1 sequencing primer annealing site to increase the complexity of the first sequenced base. This is advantageous for Illumina sequencing platforms as the initial sequencing step requires high complexity for cluster identification. BAB is a fixed sequence for each conjugate molecule. BABs are designed to avoid features (such as homomultimers, hairpins, and/or heteroduplex formation) that can interfere with the primary PCR amplification and sequencing steps [Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362] and their relative Hamming distance pool of all possible BAB sequences of a defined length to minimize the possibility that any PCR or sequencing error could lead to misassignment of sequenced reads. is selected from The BAB length should be chosen based on the number of target molecules to be detected. Preferably, the BAB is about It has a length of at least 10 nucleotides, which theoretically corresponds to 4^10 = 1,048,576 different combinations, reduced to 2000 possible BAB sequences.

第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)は、タグ付きオリゴの5'に位置する。この配列は、タグ付きオリゴ増幅及びその後のライブラリー作製のために必要である。タグ付きオリゴ増幅は、適正なUMIカウントを妨げ得る、試料加工中の分子の喪失に起因するいかなるバイアスも回避するために必要である。 A first tagged oligonucleotide amplification sequence (5-TOS) is located 5' to the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library construction. Tagged oligo amplification is necessary to avoid any bias due to loss of molecules during sample processing that could interfere with proper UMI counting.

図1Bを参照すると、標的オリゴヌクレオチドは、好ましくは、少なくとも1種の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)を更に含む。この配列は、タグ付きオリゴの3'に位置する。この配列は、タグ付きオリゴ増幅及びその後のライブラリー作製のために必要である。タグ付きオリゴ増幅は、適正なUMIカウントを妨げ得る、試料加工中の分子の喪失に起因するいかなるバイアスも回避するために必要である。 Referring to Figure IB, the target oligonucleotide preferably further comprises at least one second tagged oligonucleotide amplification sequence (3-TOS). This sequence is located 3' of the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library construction. Tagged oligo amplification is necessary to avoid any bias due to loss of molecules during sample processing that could interfere with proper UMI counting.

好ましい実施形態では、5-TOS及び3-TOS配列は、ヘアピン及び増幅温度範囲内での他の分子内の安定的二次構造の形成を回避するために設計され、なぜなら、それらはタグ付きオリゴ増幅を妨げる可能性があるからである。図2は、一方は異なる温度で5-TOS及び3-TOSの間での分子内ヘアピン形成を生じ易い、2種類の異なるタグ付きオリゴからのタグ付きオリゴヌクレオチドライブラリーを表すグラフを示す(「ヘアピンあり」:Tm=67℃、配列番号50、ΔG=-11.15kcal/mol;「ヘアピンなし」:Tm=45℃、配列番号51、ΔG=-1.52kcal/mol)。x軸上に予測されるUMIカウントを示し、y軸上にシーケンシング後にカウントされたUMIを示す。 In a preferred embodiment, the 5-TOS and 3-TOS sequences are designed to avoid the formation of stable secondary structures in hairpins and other intramolecules within the amplification temperature range, since they are similar to tagged oligos. This is because it may interfere with amplification. Figure 2 shows a graph representing a tagged oligonucleotide library from two different tagged oligos, one of which is prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (" with hairpin": Tm=67°C, SEQ ID NO:50, ΔG=-11.15 kcal/mol; "without hairpin": Tm=45°C, SEQ ID NO:51, ΔG=-1.52 kcal/mol). Predicted UMI counts are shown on the x-axis and UMI counted after sequencing are shown on the y-axis.

タグ付きオリゴ及びそれらの増幅プライマーは、最大感度、広いダイナミックレンジ、平衡化PCR増幅及び再現性を達成するために最適化される。 Tagged oligos and their amplification primers are optimized to achieve maximum sensitivity, wide dynamic range, balanced PCR amplification and reproducibility.

本発明の好ましい実施形態では、UMI配列長は、0~約106分子の範囲内で標的を定量化するために選択された(n=10)。 In a preferred embodiment of the invention, UMI sequence lengths were chosen to quantify targets within the range of 0 to about 10 6 molecules (n=10).

ダイナミックレンジは、4桁の大きさにわたる(102~106分子)濃度を有するタグ付きオリゴの増幅により特徴付けられた。図3は、27回のPCRサイクルを用いる異なる量でのオリゴ混合物の増幅を表すグラフを示す。各希釈は、3回の独立した希釈複製から行った。x軸上に観測が予測される異なるUMIの個数を示し、y軸上に実験的に観測されたUMIを示す。増幅前の観測されたUMIと予測されたUMIとの間の102~106個の分子の範囲での非常に線形な相関を観察することができる。 The dynamic range was characterized by amplification of tagged oligos with concentrations spanning four orders of magnitude (10 2 -10 6 molecules). Figure 3 shows a graph representing the amplification of oligo mixtures with different amounts using 27 PCR cycles. Each dilution was performed from 3 independent dilution replicates. The number of different UMIs expected to be observed is shown on the x-axis, and the experimentally observed UMIs are shown on the y-axis. A very linear correlation in the range of 10 2 to 10 6 molecules can be observed between the observed UMI before amplification and the predicted UMI.

平衡化PCR増幅は、同じ出発試料に対する異なるサイクルの増幅を行うことにより特徴付けられた。図4A及び図4Bに示される通り、異なる回数の合計PCRサイクル(それぞれ23及び27PCRサイクル)を用いるタグ付きオリゴの同じプールの増幅は、観測されたUMIでの差異を生じず、このことは、PCRサイクル数がUMIカウントに影響しないことを示した。 Balanced PCR amplification was characterized by performing different cycles of amplification on the same starting sample. As shown in Figures 4A and 4B, amplification of the same pool of tagged oligos using different numbers of total PCR cycles (23 and 27 PCR cycles, respectively) produced no difference in the observed UMI, which indicates that We showed that the number of PCR cycles did not affect UMI counts.

感度は、異なる量(40分子まで下げられた)でのタグ付きオリゴのプールの増幅により特徴付けられた。図4Cに示される通り、102個のタグ付きオリゴ分子まで下げて定量化することが可能である。連続希釈溶液実験は、体積内での分子の高度に不均一な分布に起因するサンプリングバイアスを生じ易く、このことは、非常に希釈された溶液に特に関連があることを注記すべきである。つまり、観測される定量化の限界は、アッセイの限界よりもむしろ、実験設定に関連する過小評価である可能性がある。 Sensitivity was characterized by amplification of pools of tagged oligos at different amounts (down to 40 molecules). As shown in Figure 4C, it is possible to quantify down to 102 tagged oligo molecules. It should be noted that serial dilute solution experiments are prone to sampling bias due to the highly non-uniform distribution of molecules within the volume, and this is especially relevant for highly dilute solutions. Thus, the observed limits of quantification may be underestimations related to experimental settings rather than assay limits.

本発明に従う方法の工程c)では、未結合の結合剤を選択的に除去するための分離工程が行われることにより、標識された生物学的試料が取得される。分離工程は、典型的には、好適な緩衝剤溶液中で洗浄すること、及び標識された生物学的試料を遠心分離により回収することにより行われる。 In step c) of the method according to the invention, a labeled biological sample is obtained by performing a separation step to selectively remove unbound binding agent. The separation step is typically performed by washing in a suitable buffer solution and recovering the labeled biological sample by centrifugation.

工程d)では、標識された生物学的試料に対して、前記ゲノムDNAの全ゲノム増幅及び少なくとも1種の結合剤とコンジュゲート化されたタグ付きオリゴヌクレオチドの増幅が同時に行われる。ゲノムDNAの全ゲノム増幅は、確定的制限部位全ゲノム増幅(DRS-WGA)によるか、又は多重アニーリング及びルーピングベース増幅サイクル全ゲノム増幅(MALBAC)によるかのいずれかで行われる。 In step d) the labeled biological sample undergoes simultaneous whole-genome amplification of said genomic DNA and amplification of tagged oligonucleotides conjugated with at least one binding agent. Whole genome amplification of genomic DNA is performed either by deterministic restriction site whole genome amplification (DRS-WGA) or by multiplex annealing and looping-based amplification cycle whole genome amplification (MALBAC).

工程e)では、増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーが作製される。 In step e), a massively parallel sequencing library is generated from the amplified tagged oligonucleotides.

工程f)では、超並列シーケンシングライブラリーがシーケンシングされる。 In step f) the massively parallel sequencing library is sequenced.

工程g)では、各シーケンシングリードから結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)の配列が検索される。 In step g), each sequencing read is retrieved for binding agent barcode sequence (BAB) and unique molecular identifier sequence (UMI) sequences.

工程h)では、各結合剤に対して、異なる固有分子識別子配列(UMI)の個数がカウントされる。 In step h), the number of different unique molecular identifier sequences (UMI) is counted for each binding agent.

工程e)、f)、g)及びh)は、説明において以下で具体的な実施形態を参照して更に詳細に開示されるであろう。 Steps e), f), g) and h) will be disclosed in more detail below in the description with reference to specific embodiments.

上記で開示された方法は、好ましくは、生物学的試料から単一細胞を単離する工程を更に含む。単離は、特に、例えば、DEPArray(登録商標)NxT(Menarini Silicon Biosystems社)等の細胞選別機を用いて、細胞を選別する工程、又は、代替として、液滴中へと細胞を分割する工程により、行うことができる。単離工程は、好ましくは、工程c)の後で、且つ工程d)の前に行われる。 The methods disclosed above preferably further comprise isolating single cells from the biological sample. Isolation is in particular the step of sorting the cells, e.g. can be done by The isolation step is preferably performed after step c) and before step d).

上記で開示された方法は、好ましくは、工程f)の前に超並列シーケンシングライブラリーを精製する工程を含む。 The method disclosed above preferably comprises a step of purifying the massively parallel sequencing library prior to step f).

より具体的であるが、本説明の範囲を限定する意図を有しない用語では、Ampli1タンパク質(A1-P)とも指定される上記で開示された方法は、単一細胞のタンパク質の定量化及び全ゲノム遺伝学的特性決定を可能にする。単一細胞での単一又は複数タンパク質定量化は、タグ付きオリゴヌクレオチドとコンジュゲート化された結合剤(特に、抗体(Ab))のパネルを用いて達成される。これらのオリゴヌクレオチドは、DNAバーコード配列を用いてコンジュゲート化された抗体を明確に特定するために、且つエピトープ定量化のために用いられるランダム又は部分的縮重配列(すなわち、固有分子識別子(UMI))を用いて対象となるエピトープの存在量を定量化するために、設計される。生物学的試料は、それぞれが固有のDNAバーコード配列を有する、1つ又は複数のAb-オリゴコンジュゲートを用いて標識される。続いて、単一細胞又は細胞のプールを、異なる手段(すなわち、DEPArray(商標)NxTシステム)により単離することができ、且つそれらのゲノム内容物を、全ゲノム増幅(すなわち、Ampli1(商標)全ゲノム増幅キット)により増幅することができる。後者の工程中又はそのすぐ後に、タグ付きオリゴヌクレオチドを、NGSライブラリー作製手順の間のいかなるダウンサンプリングも回避するために、予備増幅する。特異的プライマー、すなわち、「ライブラリープライマー」を、直ちにシーケンシングできるNGS(Illumina社)ライブラリーを作製するために用いる。タグ付きオリゴヌクレオチドは、Ampli1(商標)WGA(A1-WGA)ワークフローと適合性になるように設計され、これにより、A1-Pを用いるタンパク質定量化と並行して、単一細胞遺伝学分析(例えば、Ampli1(商標)LowPass)が可能になる。 In terms that are more specific, but not intended to limit the scope of this description, the methods disclosed above, also designated Ampli1 protein (A1-P), provide quantification and total Enables genome genetic characterization. Single or multiple protein quantification in a single cell is achieved using a panel of binding agents (especially antibodies (Abs)) conjugated to tagged oligonucleotides. These oligonucleotides contain random or partially degenerate sequences (i.e., unique molecular identifiers ( Designed to quantify the abundance of epitopes of interest using UMI)). A biological sample is labeled with one or more Ab-oligo conjugates, each with a unique DNA barcode sequence. Single cells or pools of cells can then be isolated by different means (i.e. DEPArray™ NxT system) and their genomic content analyzed by whole genome amplification (i.e. Ampli1™). whole genome amplification kit). During or shortly after the latter step, the tagged oligonucleotides are pre-amplified to avoid any downsampling during the NGS library preparation procedure. Specific primers, ie, "library primers", are used to generate sequence-ready NGS (Illumina) libraries. Tagged oligonucleotides were designed to be compatible with the Ampli1™ WGA (A1-WGA) workflow, allowing parallel protein quantification using A1-P for single-cell genetic analysis ( For example, Ampli1™ LowPass) is enabled.

以下では、本発明の3つの具体的実施形態が開示され、これらはそれぞれ、タグ付きオリゴ増幅及び全ゲノム増幅に対して異なる数のプライマーを利用する。 Three specific embodiments of the invention are disclosed below, each of which utilizes a different number of primers for tagged oligo amplification and whole genome amplification.

第1の好ましい実施形態では、図5を参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)さらに核酸の第2の増幅ハンドル配列(2AH)及び3'全ゲノム増幅ハンドル配列(3-WGAH)を含む、核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含む。
In a first preferred embodiment, referring to Figure 5, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) a nucleic acid second tagged oligonucleotide amplification sequence (3-TOS) further comprising a nucleic acid second amplification handle sequence (2AH) and a 3' whole genome amplification handle sequence (3-WGAH);
including.

3-WGAHは、全ゲノム増幅中にgDNA及びタグ付きオリゴヌクレオチドの同時増幅を可能にする、5-WGAHの逆相補的配列である。1AH及び2AHは、それぞれペイロード配列の5'末端及び3'末端に位置し、且つその後のライブラリー作製のために用いられる。1AH及び2AHは、好ましくは、タグ付きオリゴ増幅を阻害し得る、ヘアピン等の安定的な分子内二次構造を回避するために設計される。上述の各配列の間には、固定された配列が存在し得る。 3-WGAH is the reverse complementary sequence of 5-WGAH that allows simultaneous amplification of gDNA and tagged oligonucleotides during whole genome amplification. 1AH and 2AH are located at the 5' and 3' ends of the payload sequence, respectively, and are used for subsequent library generation. 1AH and 2AH are preferably designed to avoid stable intramolecular secondary structures such as hairpins that can inhibit tagged oligo amplification. Between each of the above sequences there may be fixed sequences.

全ゲノム増幅及びタグ付きオリゴの増幅は、好ましくは、単一プライマーを用いて行われる。 Whole genome amplification and tagged oligo amplification are preferably performed using a single primer.

第2の好ましい実施形態では、図6A及び図6Bを参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)任意選択で、アニーリング配列(AS)
を含む。
In a second preferred embodiment, referring to Figures 6A and 6B, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) optionally an annealing sequence (AS)
including.

全ゲノム増幅及びタグ付きオリゴヌクレオチドの増幅のために少なくとも1種のプライマーが用いられ、且つタグ付きオリゴヌクレオチドの伸長のために少なくとも1種のオリゴヌクレオチド(E-p)が用いられ、該少なくとも1種のオリゴヌクレオチド(E-p)は、5'から3'に向かって、少なくとも、
d)5'全ゲノム増幅ハンドル配列(5-WGAH);
e)スペーサー配列(SS);
f)第2の増幅ハンドル配列(2AH);及び
g)アニーリング配列に対して逆相補的な配列(AS-RC)又は結合剤バーコード配列に対して逆相補的な配列(BAB-RC)
を含む。
at least one primer is used for whole genome amplification and amplification of the tagged oligonucleotide, and at least one oligonucleotide (Ep) is used for extension of the tagged oligonucleotide; Oligonucleotides (Ep) are 5' to 3' at least
d) 5' Whole Genome Amplification Handle Sequence (5-WGAH);
e) a spacer sequence (SS);
f) a second amplification handle sequence (2AH); and
g) a sequence that is reverse complementary to the annealing sequence (AS-RC) or reverse complementary to the binder barcode sequence (BAB-RC)
including.

言い換えると、タグ付きオリゴの増幅は、E-pの3'末端に位置するアニーリング配列逆相補体(AS-RC)によって、タグ付きオリゴの3'に位置するASに対するE-pのアニーリング(図6A)により起こり、したがってタグ付きオリゴ及びE-pの両方の3'伸長が反応内で引き起こされ、これにより、次にWGAプライマー増幅可能分子が生じる。或いは、ASは、BAB配列と一致することができ、且つE-pは、図6Bに示される通りにBAB逆相補体配列(BAB-RC)を介してBAB配列にアニーリングする。第1の選択肢(ASに対するアニーリング)は、単一E-pをいずれのBABと共にでも用いることができるという利点を有し、したがって、製造コスト及びプロトコールの複雑性が低減される。第2の選択肢(BABに対するアニーリング)は、存在量に大きな差異を有する標的に由来するシグナルを標準化するために有利に用いることができる。これは、非限定的な例として、非常に豊富なタグ付きオリゴの増幅を減少させるために、非常に豊富な可能性がある標的に対するプライマーの制限的な量を用いることにより、又は異なるBABアニーリング温度を用いることにより、達成できる。アニーリング温度は、BAB長及び/又は組成により調節することができる。 In other words, amplification of the tagged oligo occurs through the annealing sequence reverse complement (AS-RC) located at the 3' end of the E-p by annealing of the E-p to the AS located 3' of the tagged oligo (Fig. 6A). , thus causing 3' extension of both the tagged oligo and the E-p within the reaction, which in turn yields a WGA primer amplifiable molecule. Alternatively, the AS can match the BAB sequence and the E-p anneal to the BAB sequence via the BAB reverse complement sequence (BAB-RC) as shown in Figure 6B. The first option (annealing to AS) has the advantage that a single E-p can be used with any BAB, thus reducing manufacturing costs and protocol complexity. The second option (annealing to BAB) can be used advantageously to normalize signals from targets with large differences in abundance. This can be done, as non-limiting examples, by using limiting amounts of primers against potentially highly abundant targets to reduce amplification of highly abundant tagged oligos, or by different BAB annealing It can be achieved by using temperature. Annealing temperature can be adjusted by BAB length and/or composition.

タグ付きオリゴ及びE-pの伸長後に、WGAプライマーが、生じる比較的大きな分子内で、タグ付きオリゴの増幅を行うであろう。スペーサー配列(SS)は、タグ付きオリゴにより生成されるアンプリコンの長さを増加させる。増加した断片長は、断片の相補的末端により誘導されるヘアピン等の分子内二次構造を不安定化させ、したがってそれらの融解温度を低下させ(図7)、これは他のWGA断片と一緒でのタグ付きオリゴ増幅に好都合である(M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003))。伸長オリゴヌクレオチド(E-p)配列長は、好ましくは、60~300塩基の範囲内である。より好ましくは、伸長オリゴヌクレオチド(E-p)配列長は、120~200塩基の範囲内である。 After extension of the tagged oligo and E-p, the WGA primer will amplify the tagged oligo within the resulting relatively large molecule. Spacer sequences (SS) increase the length of amplicons generated by tagged oligos. The increased fragment length destabilizes intramolecular secondary structures, such as hairpins, induced by the complementary ends of the fragments, thus lowering their melting temperature (Fig. 7), which is consistent with other WGA fragments. (M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003)). The extended oligonucleotide (E-p) sequence length is preferably in the range of 60-300 bases. More preferably, the extended oligonucleotide (E-p) sequence length is in the range of 120-200 bases.

第3の好ましい実施形態では、図8を参照すると、タグ付きオリゴヌクレオチドは、5'から3'に向かって、少なくとも、
a)第1の増幅ハンドル配列(1AH)に対応する核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)第2の増幅ハンドル配列(2AH)に対応する核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含む。
In a third preferred embodiment, referring to Figure 8, the tagged oligonucleotide, 5' to 3', has at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of nucleic acid corresponding to the first amplification handle sequence (1AH);
b) payload array (PL);
c) a second tagged oligonucleotide amplification sequence (3-TOS) of nucleic acid corresponding to a second amplification handle sequence (2AH)
including.

少なくとも1種の第1のプライマーが全ゲノム増幅のために用いられ、且つ少なくとも1種の第2のプライマー及び1種の第3のプライマーがタグ付きオリゴヌクレオチドの増幅のために用いられ、少なくとも1種の第2のプライマーは、第1の増幅ハンドル配列(1AH)に対して同一な配列を有し、且つ少なくとも1種の第3のプライマーは、第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)を有する。 at least one first primer is used for whole genome amplification, and at least one second primer and one third primer are used for amplification of tagged oligonucleotides, at least one The species second primer has sequence identical to the first amplification handle sequence (1AH) and the at least one species third primer is reverse complementary to the second amplification handle sequence sequence (2AH-RC).

タグ付きオリゴ増幅プライマーは、WGA PCR温度プロファイルの少なくとも最初の10~15サイクルに適合性である融解温度を有するように設計される。 Tagged oligo amplification primers are designed to have melting temperatures that are compatible with at least the first 10-15 cycles of the WGA PCR temperature profile.

好ましくは、少なくとも1種の第2のプライマー及び少なくとも第3のプライマーは、工程d)で添加される。 Preferably, at least one second primer and at least a third primer are added in step d).

増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーを作製する工程e)は、好ましくは、第1の増幅ハンドル配列(1AH)に対応する3'配列を含む少なくとも1種の第1のライブラリープライマー及び第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)に対応する3'配列を含む少なくとも1種の第2のライブラリープライマーを用いるPCR反応により行われる。 Step e) of generating a massively parallel sequencing library from the amplified tagged oligonucleotides preferably comprises at least one first library comprising a 3′ sequence corresponding to the first amplification handle sequence (1AH). A PCR reaction is performed using the rally primer and at least one second library primer containing a 3' sequence corresponding to a sequence (2AH-RC) that is reverse complementary to the second amplification handle sequence.

したがって、ライブラリープライマーは、単一PCR工程を用いる結合剤定量化分析のためのNGSライブラリーを作製するために、有利に用いられる。本説明で報告されるライブラリープライマーの具体例は、本発明の発明の範囲を限定することを意図せずに、Illuminaシーケンシングプラットフォームと適合性であるライブラリーを作製するために用いられる。 Library primers are therefore advantageously used to generate NGS libraries for binder quantification analysis using a single PCR step. Specific examples of library primers reported in this description are used to generate libraries compatible with Illumina sequencing platforms without intending to limit the scope of the present invention.

好ましい実施形態では、フォワードプライマー及びリバースプライマーは、Illuminaアダプター(Illumina社)に基づいて設計され、5'から3'に向かって、以下を含む:
1)Illuminaシーケンシングに必要とされるIlluminaアダプター配列(IA);
- インデックスシーケンシングプライマー/フローセル結合性配列(この領域は、フローセル結合のために必要とされる)並びにi5/i7インデックスシーケンシングプライマーに対するアニーリング配列;
- i5/i7インデックス:NGS多重化反応のために用いられるインデックス;
- Read1/read2シーケンシングプライマー:Illuminaシーケンシングプライマーに対するアニーリング配列、並びにタグ付きオリゴからのライブラリーの増幅のため。
2)第1の増幅ハンドル配列(1AH)又は第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC):これらの配列は、タグ付きオリゴ増幅後には二本鎖であるタグ付きオリゴ上で、第1の増幅ハンドル配列の逆相補体及び第2の増幅ハンドル配列にそれぞれアニーリングする。
In a preferred embodiment, the forward and reverse primers are designed based on Illumina adapters (Illumina) and, 5' to 3', contain:
1) Illumina adapter sequences (IA) required for Illumina sequencing;
- index sequencing primer/flow cell binding sequences (this region is required for flow cell binding) and annealing sequences for i5/i7 index sequencing primers;
- i5/i7 index: index used for NGS multiplexing reaction;
- Read1/read2 sequencing primers: annealing sequences to Illumina sequencing primers, as well as for amplification of libraries from tagged oligos.
2) the first amplification handle sequence (1AH) or the reverse complementary sequence to the second amplification handle sequence (2AH-RC): these sequences are double stranded after tagged oligo amplification tagged On the oligo, anneal to the reverse complement of the first amplification handle sequence and the second amplification handle sequence respectively.

図9は、それぞれ図5(図9A)、図6A(図9B)及び図8(図9C)に従う実施形態での、増幅されたタグ付きオリゴヌクレオチドからの超並列シーケンシングライブラリーの作製のために用いられるライブラリープライマーの構造を示す。 Figure 9 shows for the generation of massively parallel sequencing libraries from amplified tagged oligonucleotides in embodiments according to Figure 5 (Figure 9A), Figure 6A (Figure 9B) and Figure 8 (Figure 9C) respectively. The structures of the library primers used in .

ライブラリーの作製後、好ましくは少なくとも1回の精製工程が行われ、それにライブラリー定量化及びその後のシーケンシング手順のために必要なプール化が続く。シーケンシングは、優先的には、ペアードエンドシーケンシングとして行われ、それぞれがライブラリーDNA分子の鎖から誘導される2つのリードが生成される。 Generation of the library is preferably followed by at least one purification step, followed by the necessary pooling for library quantification and subsequent sequencing procedures. Sequencing is preferentially performed as paired-end sequencing to generate two reads, each derived from a strand of the library DNA molecule.

同じアプローチを、例えば、Ion Torrent社等の他のシーケンシングプラットフォームのためのNGSライブラリーを作製するために用いることができる。 The same approach can be used to generate NGS libraries for other sequencing platforms such as Ion Torrent.

NGSライブラリーから生成されるペアードエンドリード配列の分析は、以下の工程に従って分析する:
1.部分配列抽出。UMI、BAB及び増幅ハンドル配列(1AH及び/又は2AH)に対応する部分配列は、各タグ付きオリゴ分子に対する両方のシーケンシングリードから抽出される。
Analysis of paired-end read sequences generated from NGS libraries is analyzed according to the following steps:
1. Subsequence extraction. Subsequences corresponding to UMI, BAB and amplification handle sequences (1AH and/or 2AH) are extracted from both sequencing reads for each tagged oligo molecule.

2.リードの再アライメント。BAB及び/又は増幅ハンドル配列の部分配列が参照配列とマッチしない(5塩基毎に0.5~2個のミスマッチを許容して)場合、部分配列の位置が-nから+nの範囲の可変量だけオフセットされ、このときnは許容される最大オフセットであり(例えば、n=8)、部分配列が再抽出される。各反復に対して、参照配列からのハミング距離が算出され、最低距離に戻すオフセットが選択され、全ての部分配列(UMI、BAB、増幅ハンドル配列)が抽出される。 2. Read realignment. If a subsequence of the BAB and/or amplification handle sequence does not match the reference sequence (allowing 0.5-2 mismatches every 5 bases), the subsequence position is varied by a variable amount ranging from -n to +n. offset, where n is the maximum offset allowed (eg, n=8), and the subarray is re-extracted. For each repeat, the Hamming distance from the reference sequence is calculated, the offset that returns the lowest distance is chosen, and all subsequences (UMI, BAB, amplification handle sequences) are extracted.

3.リードフィルタリング。そのBAB及び/又はハンドル部分配列が参照配列と規定量の塩基を超えて異なるリードは、低品質リードとして廃棄される。 3. Lead filtering. Reads whose BAB and/or handle subsequences differ from the reference sequence by more than a defined amount of bases are discarded as low quality reads.

4.UMI決定。リードペアからのUMI配列は、シーケンシングエラーの非存在下で完璧に相補的になると予測される。第1鎖UMIと第2鎖相補的UMI配列との間のいずれかの差異の存在下では、
a.リードペアは低信頼度として廃棄される場合があるか、又は
b.2つの配列間のコンセンサスは、UMIの各位置に対して、シーケンサーのベースコーラーにより報告される最高ベースコーリングスコアを有する2つのシーケンシングリード由来の配列のうちから塩基を選択することにより、算出することができる。
4. UMI determination. UMI sequences from read pairs are predicted to be perfectly complementary in the absence of sequencing errors. In the presence of any difference between the first strand UMI and the second strand complementary UMI sequence,
a. Read pairs may be discarded as unreliable, or
b. Consensus between the two sequences is determined by selecting, for each position of the UMI, the base from among the sequences from the two sequencing reads with the highest base-calling score reported by the sequencer's base-caller. can be calculated.

第1の方法(a)は、シーケンシングバイアスに起因する標的分子の過大評価を引き起こしにくいが、第2の方法(b)を用いて代わりに回復される結合剤と標的分子との間の真の結合性イベントを失う場合があることを注記すべきである。 The first method (a) is less likely to cause overestimation of the target molecule due to sequencing bias, whereas the truth between the binding agent and the target molecule is instead recovered using the second method (b). It should be noted that it is possible to lose connectivity events for

5.標的分子定量化。標的分子のカウントが、分析された試料における特異的結合剤を表す各BAB配列に対する異なるUMI配列の個数を決定することにより行われる。 5. Target molecule quantification. Target molecule counting is performed by determining the number of different UMI sequences for each BAB sequence representing a specific binding agent in the analyzed sample.

本発明に従うキットは、
a)タグ付きオリゴヌクレオチドとコンジュゲート化された、生物学的試料中の少なくとも1種の標的分子に対する少なくとも1種の結合剤であって、タグ付きオリゴヌクレオチドは、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、
ii)少なくとも1種の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含む、結合剤;
b)全ゲノム増幅を行うための少なくとも1種のプライマー及びタグ付きオリゴヌクレオチドの増幅を行うための少なくとも1種のプライマーであって、同じ配列を有する全ゲノム増幅を行うための少なくとも1つのプライマー及び該タグ付きオリゴヌクレオチドの増幅を行うための少なくとも1つのプライマー
を含む。
A kit according to the invention comprises
a) at least one binding agent for at least one target molecule in a biological sample, conjugated to a tagged oligonucleotide, the tagged oligonucleotide comprising:
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI);
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS)
a binding agent;
b) at least one primer for whole genome amplification and at least one primer for amplification of tagged oligonucleotides, at least one primer for whole genome amplification having the same sequence; including primers and at least one primer for amplifying the tagged oligonucleotide.

好ましい実施形態では、キットは、タグ付きオリゴヌクレオチドを伸長するためのオリゴヌクレオチドを含む。 In preferred embodiments, the kit includes oligonucleotides for extending tagged oligonucleotides.

好ましい実施形態では、少なくとも1種のタグ付きオリゴヌクレオチドが配列番号1に対応する配列を有し、タグ付きオリゴヌクレオチドの増幅を行うためのプライマーは2種類であり、それぞれ配列番号2及び配列番号3の配列を有する。キットは、好ましくは、1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む。より好ましくは、該第1のライブラリープライマーは配列番号8~配列番号15からなる群から選択される配列を有し、該第2のライブラリープライマーは配列番号16~配列番号27からなる群から選択される配列を有する。 In a preferred embodiment, at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 1 and there are two primers for amplifying the tagged oligonucleotide, SEQ ID NO: 2 and SEQ ID NO: 3, respectively. has an array of The kit preferably further comprises one or more first library primers and one or more second library primers. More preferably, said first library primer has a sequence selected from the group consisting of SEQ ID NO: 8 to SEQ ID NO: 15, and said second library primer is from the group consisting of SEQ ID NO: 16 to SEQ ID NO: 27. It has a selected sequence.

別の好ましい実施形態では、少なくとも1種のタグ付きオリゴヌクレオチドが配列番号28に対応する配列を有し、タグ付きオリゴヌクレオチドの伸長を行うためのオリゴヌクレオチドは1種類であり、配列番号29に対応する配列を有する。キットは、好ましくは、1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む。より好ましくは、該第1のライブラリープライマーは配列番号30~配列番号37からなる群から選択される配列を有し、該第2のライブラリープライマーは配列番号38~配列番号49からなる群から選択される配列を有する。 In another preferred embodiment, at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO:28, and there is one oligonucleotide for extending the tagged oligonucleotide, corresponding to SEQ ID NO:29. has an array that The kit preferably further comprises one or more first library primers and one or more second library primers. More preferably, said first library primer has a sequence selected from the group consisting of SEQ ID NO:30 to SEQ ID NO:37, and said second library primer is from the group consisting of SEQ ID NO:38 to SEQ ID NO:49. It has a selected sequence.

(実施例1)
本実施例では、WGA後に図8に従う設定を用いる増幅を行うために、タグ付きオリゴを設計した。「P5-Synth」(配列番号1、図10、NNNNNNNNNN:UMI配列)と称されるタグ付きオリゴを、Ampli1(商標)WGAキット(Menarini Silicon Biosystems社)に適合するように設計した。第1の増幅ハンドル配列(1AH)は、Illumina TruSeq DNA and RNA CD IndexesからのIndex2(i5)アダプターの最後の19塩基と同一であった。第2の増幅ハンドル配列(2AH)を、いかなる分子内二次構造及びヒトゲノムに対する考えられるマッチも回避するように、in silicoで作製した。両方の増幅ハンドル配列の融解温度を、WGAプライマーのものと類似とするために設計した。タグ付きオリゴ増幅プライマー(配列番号2及び配列番号3)を、第1及び第2の増幅ハンドル配列に従って設計した。
(Example 1)
In this example, tagged oligos were designed for WGA followed by amplification using settings according to FIG. A tagged oligo called "P5-Synth" (SEQ ID NO: 1, Figure 10, NNNNNNNNNN:UMI sequence) was designed to be compatible with the Ampli1™ WGA kit (Menarini Silicon Biosystems). The first amplification handle sequence (1AH) was identical to the last 19 bases of the Index2(i5) adapter from the Illumina TruSeq DNA and RNA CD Indexes. A second amplification handle sequence (2AH) was generated in silico to avoid any intramolecular secondary structures and possible matches to the human genome. The melting temperatures of both amplification handle sequences were designed to be similar to those of the WGA primers. Tagged oligo amplification primers (SEQ ID NO:2 and SEQ ID NO:3) were designed according to the first and second amplification handle sequences.

図10に示される通り、フォワードライブラリープライマーがIndex2(i5)アダプター(Illumina社)と同一であった一方で、リバースライブラリープライマーは、第2の増幅ハンドル配列の逆相補的配列を付加したIndex1(i7)アダプターと同一であった。より詳細には、図10は、P5-Synthオリゴ及び対応するライブラリープライマーの設計を示す。 As shown in Figure 10, the forward library primer was identical to the Index2(i5) adapter (Illumina), while the reverse library primer was Index1 with the addition of the reverse complementary sequence of the second amplification handle sequence. (i7) Identical to the adapter. More specifically, Figure 10 shows the design of the P5-Synth oligos and corresponding library primers.

オリゴP5-Synth(配列番号1):白色ボックスは、UMI及び結合剤バーコードを含む内部ドメインを示す。黒色境界を有する灰色ボックスは、第1及び第2の増幅ハンドル配列を示す。 Oligo P5-Synth (SEQ ID NO: 1): White boxes indicate internal domains containing UMI and binder barcodes. Gray boxes with black borders indicate the first and second amplification handle sequences.

P5ライブラリープライマー(配列番号8):NGSライブラリー作製のために用いられるフォワードプライマー。灰色ボックス中にオリゴP5-Synthとのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 P5 library primer (SEQ ID NO: 8): forward primer used for NGS library construction. Annealing sites with oligo P5-Synth are indicated in gray boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

Synthライブラリープライマー(配列番号16):NGSライブラリー作製のために用いられるリバースプライマー。灰色ボックス中にオリゴP5-Synthとのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 Synth library primer (SEQ ID NO: 16): Reverse primer used for NGS library construction. Annealing sites with oligo P5-Synth are indicated in gray boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

図11に見て取れる通り、ライブラリー作製中に、Illumina Index1及び2アダプターが、それぞれタグ付きオリゴの5'及び3'に付加される。 As can be seen in Figure 11, Illumina Index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively, during library generation.

本実施例では、タグ付きオリゴを、5'アミノ修飾剤を介してコンジュゲート化した。その後のPCR反応に対するいかなる立体障害阻害作用も回避するために、C6又はC12スペーサーが、オリゴのアミン部分と5'との間に存在した。アミノ反応性試薬を介して、リジン、グルタミン、アルギニン及びアスパラギン残基由来の抗体中に通常存在するアミンを用いて、抗体をタグ付きオリゴに共有結合させた。4種類のAb-オリゴ(表2)を、タグ付きオリゴを用いて作製し、抗体オリゴコンジュゲート化は、抗体:タグ付きオリゴ化学量論を1:2として、Expedeon社(25 Norman Way、Over、Cambridge CB24 5QE、United Kingdom)により行った。エピトープ局在:細胞膜に対する位置を示す。 In this example, tagged oligos were conjugated via a 5' amino modifier. A C6 or C12 spacer was present between the amine portion of the oligo and 5' to avoid any steric hindrance to the subsequent PCR reaction. Antibodies were covalently attached to tagged oligos via amino-reactive reagents using amines normally present in antibodies derived from lysine, glutamine, arginine and asparagine residues. Four Ab-oligos (Table 2) were made with tagged oligos and antibody-oligo conjugation was performed at 1:2 antibody:tagged oligo stoichiometry by Expedeon (25 Norman Way, Over , Cambridge CB24 5QE, United Kingdom). Epitope localization: indicates the position relative to the cell membrane.

Figure 2023511492000034
Figure 2023511492000034

Ab-オリゴを、2種類の異なるタイプの細胞株を染色するために用いた。第1の細胞タイプは、サイトケラチン及びHer2タンパク質を過剰発現する乳癌由来細胞株であるSK-BR-3細胞であった。第2の細胞タイプは、CD45並びに無視できるレベルのサイトケラチン及びHer2を発現する、全血から抽出される白血球である末梢血単核細胞(PBMC)であった。 Ab-oligos were used to stain two different types of cell lines. The first cell type was SK-BR-3 cells, a breast cancer-derived cell line that overexpresses cytokeratin and Her2 proteins. The second cell type was peripheral blood mononuclear cells (PBMC), leukocytes extracted from whole blood that express CD45 and negligible levels of cytokeratin and Her2.

SK-BR-3細胞(ATCC(登録商標)HTB-30(商標)、ATCC)を、製造業者の手順に従って培養中で増殖させた。PBMCは、ヒト血液試料から抽出した。両方の細胞タイプを、カスタマイズされたプロトコールに従って、PFA 2%を用いて固定した。 SK-BR-3 cells (ATCC® HTB-30™, ATCC) were grown in culture according to the manufacturer's protocol. PBMC were extracted from human blood samples. Both cell types were fixed with PFA 2% according to customized protocols.

Ab-オリゴを用いる細胞染色は、100000~50000個の事前に固定及び透過化された細胞に対して行った。RT、1000×gで5分間の遠心分離により、細胞を回収した。少なくとも1mLのランニングバッファー(autoMACSランニングバッファー、ref. 130-091-221、Miltenyi Biotec社)を用いて細胞を洗浄し、遠心分離により回収した。この最後の工程を、2回繰り返した。外部Ab-オリゴ及びそれらのアイソタイプAb-オリゴ対照は、それらの作業濃度まで、100μLのランニングバッファー中に希釈する。外部Ab-オリゴミックス(Ab-オリゴtag3)を細胞に添加し、RTで15分間インキュベートした。続いて、1mLのランニングバッファーを用いて試料を2回洗浄し、遠心分離により回収した。500μLのランニングバッファー中のヤギ抗マウスIgG2a-PE抗体を添加し、+4℃で30分間インキュベートした。この工程は、PEでのPBMC細胞の染色を可能にした。ランニングバッファーを用いて試料を2回洗浄した。内部Ab-オリゴ及びそれらのアイソタイプAb-オリゴ対照は、それらの作業濃度まで、200μLのInside Permバッファー(Inside染色キット、Ref. 130-090-477、Miltenyi Biotec社)中に希釈する。内部Ab-オリゴミックス(Ab-オリゴtag1、2及び4)を細胞に添加し、RTで10分間インキュベートした。1mLのInside Permバッファーを用いて試料を2回洗浄し、遠心分離により回収した。Hoechst及びヤギ抗マウスIgG1-APC抗体の500μLのInside Permバッファー中のミックスを添加し、+4℃で30分間インキュベートした。この工程は、PEでのSK-BR-3細胞及び全ての細胞核の染色を可能にした。試料を、ランニングバッファーを用いて2回洗浄した。 Cell staining with Ab-oligos was performed on 100000-50000 pre-fixed and permeabilized cells. Cells were harvested by centrifugation at 1000 xg for 5 minutes at RT. Cells were washed with at least 1 mL of running buffer (autoMACS running buffer, ref. 130-091-221, Miltenyi Biotec) and harvested by centrifugation. This last step was repeated twice. External Ab-oligos and their isotype Ab-oligo controls are diluted in 100 μL running buffer to their working concentrations. External Ab-oligomix (Ab-oligotag3) was added to the cells and incubated for 15 minutes at RT. Samples were then washed twice with 1 mL of running buffer and collected by centrifugation. Goat anti-mouse IgG2a-PE antibody in 500 μL of running buffer was added and incubated at +4° C. for 30 minutes. This step allowed staining of PBMC cells with PE. Samples were washed twice with running buffer. Internal Ab-oligos and their isotype Ab-oligo controls are diluted to their working concentrations in 200 μL Inside Perm buffer (Inside staining kit, Ref. 130-090-477, Miltenyi Biotec). Internal Ab-oligo mixes (Ab-oligo tag1, 2 and 4) were added to the cells and incubated for 10 minutes at RT. Samples were washed twice with 1 mL of Inside Perm buffer and collected by centrifugation. A mix of Hoechst and goat anti-mouse IgG1-APC antibodies in 500 μL of Inside Perm buffer was added and incubated at +4° C. for 30 minutes. This step allowed staining of SK-BR-3 cells and all cell nuclei with PE. Samples were washed twice with running buffer.

フルオロフォアにコンジュゲート化された二次抗体の添加は、蛍光によるSK-BR-3細胞(APCチャンネル)及びPBMC(PEチャンネル)の特定を可能にした。更に、蛍光レベルは、Ab-オリゴの相対的存在量を反映する。単一細胞を、それらの免疫蛍光標識に基づいて、DEPArray(商標)NxTシステム(Menarini Silicon Biosystems社)を用いて精製した(図12)。 Addition of a secondary antibody conjugated to a fluorophore allowed identification of SK-BR-3 cells (APC channel) and PBMCs (PE channel) by fluorescence. Furthermore, fluorescence levels reflect the relative abundance of Ab-oligos. Single cells were purified based on their immunofluorescence labeling using the DEPArray™ NxT system (Menarini Silicon Biosystems) (Figure 12).

具体的には、図12は、Ab-オリゴ及び二次蛍光抗体を用いて染色されたPBMC及びSK-BR-3細胞の散布図を示す。x軸上には、Ab-オリゴtag1、tag2及びtag4の量に比例する、APCチャンネルでの蛍光レベルを示す。y軸上には、Ab-オリゴtag3の量に比例する、PEチャンネルでの蛍光レベルを示す。散布図は、それらの免疫蛍光レベルに基づいて特異的細胞タイプをそれぞれ含む4つの象限に分割されている:1)PBMC(高レベルのCD45及び低レベルのCK、Her2);2)二重陽性細胞(高レベルのCD45、CK、Her2);3)二重陰性細胞(低レベルのCD45、CK、Her2);4)SK-BR-3細胞(低レベルのCD45及び高レベルのCK、Her2)。中空/中実四角/丸で強調される単一細胞が、ライブラリー作製のために単離及び使用された。 Specifically, Figure 12 shows scatter plots of PBMC and SK-BR-3 cells stained with Ab-oligos and secondary fluorescent antibodies. On the x-axis is shown the level of fluorescence in the APC channel proportional to the amount of Ab-oligos tag1, tag2 and tag4. On the y-axis is shown the level of fluorescence in the PE channel proportional to the amount of Ab-oligo tag3. Scatter plots are divided into four quadrants each containing a specific cell type based on their immunofluorescence levels: 1) PBMCs (high levels of CD45 and low levels of CK, Her2); 2) double positives. cells (high levels of CD45, CK, Her2); 3) double-negative cells (low levels of CD45, CK, Her2); 4) SK-BR-3 cells (low levels of CD45 and high levels of CK, Her2). . Single cells highlighted by open/filled squares/circles were isolated and used for library generation.

或いは、WGA後にタグ付きオリゴ増幅を行うために、フォワード/リバースプライマーのカスタマイズされた反応ミックス及びAmpli1(商標)PCRキット試薬を、表3の左側挿入部分に従って調製した、WGA産物が入った各チューブに、15μLの反応ミックスを添加した。各試料を、表3の右側挿入部分に示される温度プロファイルに従ってインキュベートした。 Alternatively, for tagged oligo amplification after WGA, a customized reaction mix of forward/reverse primers and Ampli1™ PCR kit reagents were prepared according to the left hand insert of Table 3 for each tube containing WGA product. To the was added 15 μL of reaction mix. Each sample was incubated according to the temperature profile shown in Table 3, right inset.

Figure 2023511492000035
Figure 2023511492000035

左側挿入部分:タグ付きオリゴ増幅反応の反応混合物組成。右側挿入部分:タグ付きオリゴ増幅のための熱サイクルプログラム。 Left insert: reaction mixture composition of tagged oligo amplification reaction. Right insert: thermocycling program for amplification of tagged oligos.

0.5μMの最終濃度でP5及びLib1ライブラリープライマーを用いて、Ampli1(商標)PCRキットを使用して増幅されたWGA含有Ab-オリゴアンプリコンの1μLのアリコートを取得することにより、ライブラリー作製を行った。PCR熱サイクルプロファイルは、表5に示される。各試料は、バイオインフォマティクス分析中にデータを逆多重化するために、二重インデックス化のためのNGSライブラリープライマーの異なる組み合わせを有した。用いたライブラリープライマーのリストを、表4に報告する。P5ライブラリープライマーは、タグ付きオリゴP5-Synthと共に用いることができるフォワードプライマーである。 Library preparation was performed by taking 1 μL aliquots of WGA-containing Ab-oligo amplicons amplified using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5 μM. gone. PCR thermocycling profiles are shown in Table 5. Each sample had a different combination of NGS library primers for double indexing to demultiplex the data during bioinformatic analysis. The list of library primers used is reported in Table 4. The P5 library primer is a forward primer that can be used with the tagged oligo P5-Synth.

Figure 2023511492000036
Figure 2023511492000036

Figure 2023511492000037
Figure 2023511492000037

Figure 2023511492000038
Figure 2023511492000038

NGSライブラリー作製のための熱サイクルプロファイル。ステップ3のサイクル数は、回収された細胞数及び細胞中の総Ab-オリゴの有効量に応じて変わる。通常、ステージ3での27回の増幅サイクルが、単一細胞からの十分なアンプリコン量を生じた。 Thermal cycling profile for NGS library preparation. The number of cycles in step 3 will vary depending on the number of cells harvested and the effective amount of total Ab-oligos in the cells. Twenty-seven amplification cycles at stage 3 usually yielded sufficient amplicon abundance from a single cell.

ライブラリー試料を、Agencourt AmPure XPビーズ(Beckman-Coulter社)を用いて精製した。NGS DNA定量化は、KAPA SYBR(登録商標)FAST qPCRキット(Kapa Biosystems社)を用いて行った。各NGSライブラリーを、Agilent Bioanalyzer 2100(Agilent社)を用いて検査し、これにより、典型的には185bpでの単一ピークから構成されたライブラリー電気泳動像が示された(図13)。 Library samples were purified using Agencourt AmPure XP beads (Beckman-Coulter). NGS DNA quantification was performed using the KAPA SYBR® FAST qPCR kit (Kapa Biosystems). Each NGS library was tested using an Agilent Bioanalyzer 2100 (Agilent), which showed a library electropherogram typically composed of a single peak at 185 bp (Figure 13).

試料を一緒にプールし、MiSeq試薬キットv3 150サイクル(Ref. MS-102-3001、Illumina社)を用いて、MiSeqシステム(Illumina社)上でシーケンシングを行った。データ解析は、Python社により開発されたカスタムソフトウェアを用いて行った。UMIカウントに従うタンパク質標的の定量化が、図14に報告される。予測される通り、SK-BR-3細胞は、サイトケラチン及びHer2の高発現並びに比較的低レベルのCD45を示したが、PBMCは逆の挙動を示した。タンパク質発現レベルは、二重陽性細胞において、特にアイソタイプ対照が高く、このことは、そのような細胞が非特異的染色を比較的受け易かったことを示す。逆に、二重陰性細胞は、全4種類の標的に関して比較的低いレベルを有した。 Samples were pooled together and sequenced on the MiSeq system (Illumina) using the MiSeq reagent kit v3 150 cycles (Ref. MS-102-3001, Illumina). Data analysis was performed using custom software developed by Python. Quantification of protein targets according to UMI counts is reported in FIG. As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and relatively low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were higher in double-positive cells, especially for isotype controls, indicating that such cells were relatively susceptible to non-specific staining. Conversely, double-negative cells had relatively low levels for all four targets.

(実施例2)
本実施例では、WGA中に、図8に従う設定を用いて増幅を行うために、タグ付きオリゴを設計した。実験手順は、以下を除いて実施例1と同一である。タグ付きオリゴ増幅プライマーを、0.02μMの最終濃度で、一次PCR反応ミックスに直接添加した。ライブラリー作製及びデータ解析は、実施例1に示される通りに行った。
(Example 2)
In this example, tagged oligos were designed for amplification using settings according to FIG. 8 during WGA. The experimental procedure is identical to Example 1 with the following exceptions. Tagged oligo amplification primers were added directly to the primary PCR reaction mix at a final concentration of 0.02 μM. Library construction and data analysis were performed as described in Example 1.

UMIカウントに従うタンパク質標的の定量化が、図15に報告される。予測される通り、SK-BR-3細胞は、サイトケラチン及びHer2の高発現並びに非常に低レベルのCD45を示したが、PBMCは逆の挙動を示した。タンパク質発現レベルは、二重陽性細胞において、特にアイソタイプ対照が高く、このことは、そのような細胞が非特異的染色を比較的受け易かったことを示す。逆に、二重陰性細胞は、全4種類の標的に関して比較的低いレベルを有した。実施例1からの結果に従って、タグ付きオリゴの増幅が、WGA中及びWGA後の両方で実行可能であることが推論できる。しかしながら、絶対的UMIカウントは、2種類の手順で顕著に異なることを注記すべきである。2種類の細胞タイプの差異は、WGA中にタグ付きオリゴ増幅が行われる場合に、CKと比較して低い発現を有するCD45標的に関して予測されるものにより良く一致する。 Quantification of protein targets according to UMI counts is reported in FIG. As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and very low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were higher in double-positive cells, especially for isotype controls, indicating that such cells were relatively susceptible to non-specific staining. Conversely, double-negative cells had relatively low levels for all four targets. According to the results from Example 1, it can be deduced that amplification of tagged oligos is feasible both during and after WGA. However, it should be noted that absolute UMI counts differ significantly between the two procedures. The differences between the two cell types are in better agreement with what would be expected for a CD45 target with lower expression compared to CK when tagged oligo amplification is performed during WGA.

(実施例3)
本実施例では、タグ付きオリゴを、単一細胞中に直接添加した。「P5-Lib1」(配列番号28)と称されるタグ付きオリゴを、Ampli1(商標)WGAキット(Menarini Silicon Biosystems社)により増幅可能であるように設計した。タグ付きオリゴ増幅プライマーは、配列番号29の配列を有する(フォワードプライマー及びリバースプライマーは同一であり、Ampli1 WGA Lib1プライマーの配列を共有する)。具体的には、5'-WGAハンドル配列はLib1 WGAプライマーと同一であった一方で、3'-WGAハンドル配列はLib1 WGAプライマーの逆相補体配列であった。第1の増幅ハンドル配列は、実施例1に記載されるものと同一である。第2の増幅ハンドル配列は、3'-WGAハンドル配列及びその5'末端での追加の5bp配列からなる(図16)。
(Example 3)
In this example, tagged oligos were added directly into single cells. A tagged oligo called "P5-Lib1" (SEQ ID NO:28) was designed to be amplifiable by the Ampli1™ WGA kit (Menarini Silicon Biosystems). The tagged oligo amplification primer has the sequence of SEQ ID NO: 29 (the forward and reverse primers are identical and share the sequence of the Ampli1 WGA Lib1 primer). Specifically, the 5'-WGA handle sequence was identical to the Lib1 WGA primer, while the 3'-WGA handle sequence was the reverse complement sequence of the Lib1 WGA primer. The first amplification handle sequence is identical to that described in Example 1. The second amplification handle sequence consists of the 3'-WGA handle sequence and an additional 5bp sequence at its 5' end (Figure 16).

より詳細には、図16は、P5-Synthオリゴ及び対応するライブラリープライマーの設計を示す。 More specifically, Figure 16 shows the design of the P5-Synth oligos and corresponding library primers.

オリゴP5-Lib1:太線境界を有する白色中実ボックスは、UMI及び結合剤バーコードを含む内部ドメインを示す。太線境界を有する灰色中実ボックスは、2つのライブラリープライマーに対するアニーリング部位を示す。細線境界を有する灰色ボックスは、WGAハンドル配列(Lib1)である。 Oligo P5-Lib1: White solid boxes with bold borders indicate internal domains containing UMI and binder barcodes. Gray solid boxes with bold borders indicate the annealing sites for the two library primers. The gray box with thin border is the WGA handle array (Lib1).

P5ライブラリープライマー:NGSライブラリー作製のために用いられるフォワードプライマー。灰色中実ボックス中にタグ付きオリゴP5-Lib1とのアニーリング部位が示される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 P5 library primer: forward primer used for NGS library generation. Annealing sites with tagged oligo P5-Lib1 are indicated in gray filled boxes. Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

Lib1ライブラリープライマー:NGSライブラリー作製のために用いられるリバースプライマー。灰色中実ボックス中にタグ付きオリゴP5-Lib1とのアニーリング部位が示され:この配列は、Lib1逆相補体配列の一部分及びオリゴP5-Lib1の3'末端にのみアニーリングすることを可能にする小さいテイル(ACCAC)から構成される。短破線ボックス中にシーケンシングプライマー部位が示され;一点鎖線ボックス中にシーケンシング反応を多重化するために用いられるi5インデックスが示され;長破線ボックス中にインデックスシーケンシングプライマー/フローセルアダプター配列が示される。 Lib1 library primer: reverse primer used for NGS library generation. Annealing site with tagged oligo P5-Lib1 is indicated in gray solid box: this sequence is small allowing annealing only to a portion of the Lib1 reverse complement sequence and to the 3' end of oligo P5-Lib1. It consists of a tail (ACCAC). Sequencing primer sites are indicated in short-dashed boxes; i5 indexes used to multiplex sequencing reactions are indicated in dashed-dotted boxes; Index sequencing primer/flow cell adapter sequences are indicated in long-dashed boxes. be

フォワードライブラリープライマーがIndex2(i5)アダプター(Illumina社)と同一であった一方で、リバースライブラリープライマーは、第2の増幅ハンドル配列の逆相補的配列を付加したIndex1(i7)アダプターと同一であった(図16)。したがって、ライブラリー作製中に、Illumina Index1及び2アダプターが、それぞれタグ付きオリゴの5'及び3'に付加される(図17)。 The forward library primer was identical to the Index2(i5) adapter (Illumina), while the reverse library primer was identical to the Index1(i7) adapter appended with the reverse complementary sequence of the second amplification handle sequence. There was (Fig. 16). Therefore, during library construction, Illumina Index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively (Figure 17).

SK-BR-3細胞(ATCC(登録商標)HTB-30(商標)、ATCC)を、製造業者の手順に従って培養中で増殖させ、カスタマイズされたプロトコールに従って、PFA 2%を用いて固定した。単一細胞を、それらの形態学に基づいて、DEPArray(商標)NxTシステム(Menarini Silicon Biosystems社)を用いて精製した。P5-Lib1及びP5-Synthタグ付きオリゴを、単一細胞が入ったチューブの内部に直接添加した。異なる量の各オリゴを各単一細胞内に添加し、Ampli1(商標)WGAを行った。P5-Synthタグ付きオリゴを含有する試料を、実施例1の通りに増幅した。 SK-BR-3 cells (ATCC® HTB-30™, ATCC) were grown in culture according to the manufacturer's protocol and fixed with PFA 2% according to a customized protocol. Single cells were purified based on their morphology using the DEPArray™ NxT system (Menarini Silicon Biosystems). P5-Lib1 and P5-Synth tagged oligos were added directly to the inside of tubes containing single cells. Different amounts of each oligo were added into each single cell and Ampli1™ WGA was performed. Samples containing P5-Synth tagged oligos were amplified as in Example 1.

0.5μMの最終濃度でP5及びLib1ライブラリープライマーを用いて、Ampli1(商標)PCRキットを使用して増幅されたWGA含有Ab-オリゴアンプリコンの1μLのアリコートを取得することにより、タグ付きオリゴライブラリー作製を行った。PCR熱サイクルプロファイルは、表5に示される。各試料は、バイオインフォマティクス分析中にデータを逆多重化するために、二重インデックス化のためのNGSライブラリープライマーの異なる組み合わせを有した。用いたライブラリープライマーのリストを、表6に報告する。 Tagged oligos were generated by taking 1 μL aliquots of WGA-containing Ab-oligo amplicons amplified using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5 μM. I made a rally. PCR thermocycling profiles are shown in Table 5. Each sample had a different combination of NGS library primers for double indexing to demultiplex the data during bioinformatic analysis. The list of library primers used is reported in Table 6.

Figure 2023511492000039
Figure 2023511492000039

Figure 2023511492000040
Figure 2023511492000040

10μL WGA試料のアリコートを、SPRIビーズ(Beckmann Coulter社)を用いて精製し、続いて、Ampli1(商標)LowPassキットを用いて加工して、CNA分析のためのNGSライブラリーを作製した。WGA手順前の単一細胞におけるタグ付きオリゴのスパイク化は、下流の遺伝子解析に影響しなかった(図18)。図5及び図8に示されるワークフローに適合するように設計されたタグ付きオリゴは、WGA手順に影響又は干渉しなかった。更に、それでも、両方の条件でタグ付きオリゴヌクレオチドからNGSライブラリーを取得することが可能であった。両方のタグ付きオリゴヌクレオチドを正確に定量化することができ、このことは、両方の方法論、並びにタグ付きオリゴ設計の堅牢性を示した(図19)。 Aliquots of 10 μL WGA samples were purified using SPRI beads (Beckmann Coulter) and subsequently processed using the Ampli1™ LowPass kit to generate NGS libraries for CNA analysis. Spiking tagged oligos in single cells prior to the WGA procedure did not affect downstream genetic analysis (Figure 18). Tagged oligos designed to fit the workflows shown in Figures 5 and 8 did not affect or interfere with the WGA procedure. Furthermore, it was still possible to obtain NGS libraries from tagged oligonucleotides under both conditions. Both tagged oligonucleotides could be accurately quantified, demonstrating the robustness of both methodologies as well as the tagged oligo design (Figure 19).

利点
本発明に従う生物学的試料における全ゲノム増幅及び複数標的分子の分析のための方法は、ゲノム全体のコピー数プロファイル/ゲノム配列及び同じ単一細胞に対するタンパク質発現の分析を同時に得ることを可能にする。
Advantages The method for whole-genome amplification and analysis of multiple target molecules in a biological sample according to the present invention allows simultaneous acquisition of genome-wide copy number profiles/genomic sequences and analysis of protein expression for the same single cell. do.

本発明の方法は、低パスシーケンシング又は対象となる遺伝子のパネルの標的化シーケンシングによるゲノム全体のコピー数プロファイリング等の更なる分析を可能にし、且つ、わずかな(1個まで下がる)循環腫瘍細胞(CTC)が利用可能な場合であり得るので、非常にわずかな試料を用いて、単一細胞解像度まで下げた複数タンパク質のパネルのデジタル定量化を検出及び実行するために有用な、ゲノムDNAの全ゲノム増幅を行うことを可能にする。このことは、遺伝子型、表現型及び環境の差異が、遺伝子型(配列変化のコピー数)と表現型(タンパク質発現)との相関を混乱させ且つ完全に妨げ得る、遺伝的に不均一な試料中の異なる細胞での各分子タイプを測定することに関して、特に有利である。 The methods of the present invention allow for further analysis such as genome-wide copy number profiling by low-pass sequencing or targeted sequencing of panels of genes of interest, and a few (down to 1) circulating tumors. Genomic DNA useful for detecting and performing digital quantification of panels of multiple proteins down to single-cell resolution using very few samples, as may be the case when cells (CTCs) are available. whole genome amplification of This suggests that genetically heterogeneous samples where genotypic, phenotypic and environmental differences can confound and completely prevent the correlation between genotype (copy number of sequence variation) and phenotype (protein expression). It is particularly advantageous for measuring each molecule type in different cells in a cell.

本発明に従う方法は、驚くべきことに、非限定的な例として与えられる、以下の側面のうちの1つ又は複数で、当業者には達成できないと以前に考えられた実績を有して、当技術分野の技術水準を進歩させる:
・1個の細胞当たり数百コピーまで下がった単一細胞におけるタンパク質のデジタル定量化。
・プロセス中に内在するWGAの使用によって、該単一細胞の他の特徴の調査のための追加の遺伝的材料を取得できる更なる可能性、並びに10x Genomics社により提案されるもの等の液滴ベースのアプローチを用いて可能でない、確認のために単一細胞を確実に再分析できる可能性を伴って、上記の点が得られる。
The method according to the invention surprisingly has a track record previously considered unattainable by those skilled in the art in one or more of the following aspects, given as non-limiting examples: Advance the state of the art in the field:
• Digital quantification of proteins in single cells down to hundreds of copies per cell.
A further possibility of obtaining additional genetic material for investigation of other characteristics of the single cell by using WGA inherent in the process, as well as droplets such as those proposed by 10x Genomics. The above points are obtained with the possibility to reliably re-analyze single cells for confirmation, which is not possible using the base approach.

本方法の応用の主な分野は腫瘍学であるが、該方法は、皮膚科等のモザイク障害又は異常増殖表現型等の他の分野に応用することができる。 The main field of application of this method is oncology, but the method can be applied to other fields such as mosaic disorders or hyperproliferative phenotypes such as dermatology.

Claims (24)

ゲノムDNA及び標的分子を含む生物学的試料における、全ゲノム増幅及び複数標的分子の分析のための方法であって、
a)生物学的試料を用意する工程;
b)タグ付きオリゴヌクレオチドにコンジュゲート化された、標的分子のうちの少なくとも1つに対する少なくとも1つの結合剤と、該生物学的試料を接触させる工程であって、該タグ付きオリゴヌクレオチドが、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、及び
ii)核酸の少なくとも1つの第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含み、それにより、少なくとも1つの標的分子が該生物学的試料中に存在する場合、該少なくとも1つの結合剤が、該少なくとも1つの標的分子に結合する、工程;
c)未結合の結合剤を選択的に除去するための分離工程を行うことにより、標識された生物学的試料を取得する工程;
d)該標識された生物学的試料に対して、
- i)確定的制限部位全ゲノム増幅(DRS-WGA)、又は
ii)多重アニーリング及びルーピングベース増幅サイクル全ゲノム増幅(MALBAC)
による該ゲノムDNAの全ゲノム増幅、及び
- 該少なくとも1つの結合剤とコンジュゲート化されたタグ付きオリゴヌクレオチドの増幅
を行う工程であって、全ゲノム増幅及び該タグ付きオリゴヌクレオチドの増幅が同時に行われる工程;
e)増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーを作製する工程;
f)該超並列シーケンシングライブラリーをシーケンシングする工程;
g)各シーケンシングリードから、該結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)の配列を検索する工程;
h)各結合剤に対して、異なる固有分子識別子配列(UMI)の個数をカウントする工程
を含む方法。
1. A method for whole genome amplification and analysis of multiple target molecules in a biological sample comprising genomic DNA and target molecules, comprising:
a) providing a biological sample;
b) contacting the biological sample with at least one binding agent for at least one of the target molecules conjugated to a tagged oligonucleotide, wherein the tagged oligonucleotide is
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI), and
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS) of the nucleic acid
whereby said at least one binding agent binds to said at least one target molecule when said at least one target molecule is present in said biological sample;
c) obtaining a labeled biological sample by performing a separation step to selectively remove unbound binding agent;
d) for said labeled biological sample,
- i) deterministic restriction site whole genome amplification (DRS-WGA), or
ii) Multiple Annealing and Looping-Based Amplification Cycle Whole Genome Amplification (MALBAC)
whole genome amplification of said genomic DNA by
- performing amplification of tagged oligonucleotides conjugated with said at least one binding agent, wherein whole genome amplification and amplification of said tagged oligonucleotides are performed simultaneously;
e) generating a massively parallel sequencing library from the amplified tagged oligonucleotides;
f) sequencing said massively parallel sequencing library;
g) retrieving the sequence of the binding agent barcode sequence (BAB) and unique molecular identifier sequence (UMI) from each sequencing read;
h) a method comprising counting the number of different unique molecular identifier sequences (UMI) for each binding agent.
前記タグ付きオリゴヌクレオチドが、少なくとも1つの第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)を更に含む、請求項1に記載の方法。 2. The method of claim 1, wherein said tagged oligonucleotide further comprises at least one second tagged oligonucleotide amplification sequence (3-TOS). 前記固有分子識別子配列(UMI)が、10~30ヌクレオチドの範囲の縮重又は半縮重配列である、請求項1又は2に記載の方法。 3. The method of claim 1 or 2, wherein the unique molecular identifier sequence (UMI) is a degenerate or semi-degenerate sequence ranging from 10-30 nucleotides. 前記生物学的試料から単一細胞を単離する工程を更に含む、請求項1から3のいずれか一項に記載の方法。 4. The method of any one of claims 1-3, further comprising isolating single cells from said biological sample. 前記単離工程が、細胞を選別することにより行われる、請求項4に記載の方法。 5. The method of claim 4, wherein said isolating step is performed by sorting cells. 前記単離工程が、液滴中へと細胞を分割することにより行われる、請求項4に記載の方法。 5. The method of claim 4, wherein said isolating step is performed by dividing cells into droplets. 前記単離工程が、工程c)の後で、且つ工程d)の前に行われる、請求項4から6のいずれか一項に記載の方法。 7. A method according to any one of claims 4 to 6, wherein said isolation step is performed after step c) and before step d). 工程f)の前に前記超並列シーケンシングライブラリーを精製する工程を更に含む、請求項1から7のいずれか一項に記載の方法。 8. The method of any one of claims 1-7, further comprising the step of purifying said massively parallel sequencing library prior to step f). 前記少なくとも1つの結合剤が、
a)抗体又はその断片、
b)アプタマー、
c)小分子、
d)ペプチド、及び
e)タンパク質
からなる群から選択される、請求項1から8のいずれか一項に記載の方法。
The at least one binding agent is
a) antibodies or fragments thereof,
b) aptamers,
c) small molecules,
d) peptides, and
9. The method of any one of claims 1 to 8, wherein e) is selected from the group consisting of proteins.
前記標的分子が、
a)タンパク質、
b)ペプチド、
c)糖タンパク質、
d)炭水化物、
e)脂質、及び
f)それらの組み合わせ
からなる群から選択される、請求項1から9のいずれか一項に記載の方法。
the target molecule is
a) proteins,
b) peptides,
c) glycoproteins,
d) carbohydrates,
e) lipids, and
10. A method according to any one of claims 1 to 9, wherein f) is selected from the group consisting of combinations thereof.
前記タグ付きオリゴヌクレオチドが、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)さらに核酸の第2の増幅ハンドル配列(2AH)及び3'全ゲノム増幅ハンドル配列(3-WGAH)を含む、核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含む、請求項2から10のいずれか一項に記載の方法。
From 5′ to 3′, the tagged oligonucleotide comprises at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) a nucleic acid second tagged oligonucleotide amplification sequence (3-TOS) further comprising a nucleic acid second amplification handle sequence (2AH) and a 3' whole genome amplification handle sequence (3-WGAH);
11. A method according to any one of claims 2 to 10, comprising
前記全ゲノム増幅及び前記タグ付きオリゴの増幅が、単一プライマーを用いて行われる、請求項1から11のいずれか一項に記載の方法。 12. The method of any one of claims 1-11, wherein the whole genome amplification and the amplification of the tagged oligos are performed using a single primer. 前記タグ付きオリゴヌクレオチドが、5'から3'に向かって、少なくとも、
a)さらに5'全ゲノム増幅ハンドル配列(5-WGAH)及び第1の増幅ハンドル配列(1AH)を含む、核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)任意選択で、アニーリング配列(AS)
を含み、少なくとも1つのプライマーが、全ゲノム増幅及び該タグ付きオリゴヌクレオチドの増幅のために用いられ、且つ少なくとも1つのオリゴヌクレオチド(E-p)が、タグ付きオリゴヌクレオチドの伸長のために用いられ、該少なくとも1つのオリゴヌクレオチド(E-p)は、5'から3'に向かって、少なくとも、
d)5'全ゲノム増幅ハンドル配列(5-WGAH);
e)スペーサー配列(SS);
f)第2の増幅ハンドル配列(2AH);及び
g)該アニーリング配列に対して逆相補的な配列(AS-RC)又は前記結合剤バーコード配列に対して逆相補的な配列(BAB-RC)
を含む、請求項1から10のいずれか一項に記載の方法。
From 5′ to 3′, the tagged oligonucleotide comprises at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid further comprising a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) payload array (PL);
c) optionally an annealing sequence (AS)
wherein at least one primer is used for whole genome amplification and amplification of the tagged oligonucleotide, and at least one oligonucleotide (Ep) is used for extension of the tagged oligonucleotide, the At least one oligonucleotide (Ep), 5′ to 3′, is at least
d) 5' Whole Genome Amplification Handle Sequence (5-WGAH);
e) a spacer sequence (SS);
f) a second amplification handle sequence (2AH); and
g) a sequence that is reverse complementary to said annealing sequence (AS-RC) or a sequence that is reverse complementary to said binder barcode sequence (BAB-RC)
11. A method according to any one of claims 1 to 10, comprising
前記タグ付きオリゴヌクレオチドが、5'から3'に向かって、少なくとも、
a)第1の増幅ハンドル配列(1AH)に対応する核酸の第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS);
b)ペイロード配列(PL);
c)第2の増幅ハンドル配列(2AH)に対応する核酸の第2のタグ付きオリゴヌクレオチド増幅配列(3-TOS)
を含み、少なくとも1つの第1のプライマーが全ゲノム増幅のために用いられ、少なくとも1つの第2のプライマー及び1つの第3のプライマーが該タグ付きオリゴヌクレオチドの増幅のために用いられ;
該少なくとも1つの第2のプライマーは、第1の増幅ハンドル配列(1AH)に対して同一な配列を有し、該少なくとも1つの第3のプライマーは、第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)を有する、請求項1から10のいずれか一項に記載の方法。
From 5′ to 3′, the tagged oligonucleotide comprises at least
a) a first tagged oligonucleotide amplification sequence (5-TOS) of nucleic acid corresponding to the first amplification handle sequence (1AH);
b) payload array (PL);
c) a second tagged oligonucleotide amplification sequence (3-TOS) of nucleic acid corresponding to a second amplification handle sequence (2AH)
wherein at least one first primer is used for whole genome amplification and at least one second primer and one third primer are used for amplification of said tagged oligonucleotide;
The at least one second primer has a sequence identical to the first amplification handle sequence (1AH) and the at least one third primer is reverse complementary to the second amplification handle sequence 11. The method according to any one of claims 1 to 10, having a unique sequence (2AH-RC).
前記少なくとも1つの第2のプライマー及び少なくとも1つの第3のプライマーが、工程d)で添加される、請求項14に記載の方法。 15. The method of claim 14, wherein said at least one second primer and at least one third primer are added in step d). 前記増幅されたタグ付きオリゴヌクレオチドから超並列シーケンシングライブラリーを作製する前記工程e)が、第1の増幅ハンドル配列(1AH)に対応する3'配列を含む少なくとも1つの第1のライブラリープライマー、及び第2の増幅ハンドル配列に対して逆相補的な配列(2AH-RC)に対応する3'配列を含む少なくとも1つの第2のライブラリープライマーを用いるPCR反応により行われる、請求項11から15のいずれか一項に記載の方法。 Said step e) of generating a massively parallel sequencing library from said amplified tagged oligonucleotides comprises at least one first library primer comprising a 3′ sequence corresponding to a first amplification handle sequence (1AH). , and at least one second library primer comprising a 3′ sequence corresponding to a sequence (2AH-RC) that is reverse complementary to the second amplification handle sequence. 16. The method of any one of 15. a)タグ付きオリゴヌクレオチドとコンジュゲート化された、生物学的試料中の少なくとも1つの標的分子に対する少なくとも1つの結合剤であって、該タグ付きオリゴヌクレオチドが、
i)結合剤バーコード配列(BAB)及び固有分子識別子配列(UMI)を含む核酸のペイロード配列(PL)、
ii)少なくとも1つの第1のタグ付きオリゴヌクレオチド増幅配列(5-TOS)
を含む、結合剤;
b)全ゲノム増幅を行うための少なくとも1つのプライマー及び該タグ付きオリゴヌクレオチドの増幅を行うための少なくとも1つのプライマーであって、同じ配列を有するか、又は異なる配列を有するかのいずれかである、全ゲノム増幅を行うための少なくとも1つのプライマー及び該タグ付きオリゴヌクレオチドの増幅を行うための少なくとも1つのプライマー
を含む、請求項1から16のいずれか一項に記載の方法を行うためのキット。
a) at least one binding agent for at least one target molecule in a biological sample, conjugated to a tagged oligonucleotide, the tagged oligonucleotide comprising:
i) a nucleic acid payload sequence (PL) comprising a binding agent barcode sequence (BAB) and a unique molecular identifier sequence (UMI);
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS)
a binding agent;
b) at least one primer for whole genome amplification and at least one primer for amplification of said tagged oligonucleotide, either having the same sequence or having different sequences; , at least one primer for carrying out whole genome amplification and at least one primer for carrying out amplification of said tagged oligonucleotides. .
タグ付きオリゴヌクレオチドを伸長するためのオリゴヌクレオチドを更に含む、請求項20に記載のキット。 21. The kit of Claim 20, further comprising an oligonucleotide for extending the tagged oligonucleotide. 前記少なくとも1つのタグ付きオリゴヌクレオチドが配列番号1に対応する配列を有し、前記タグ付きオリゴヌクレオチドの増幅を行うためのプライマーが2種類であり、それぞれ配列番号2及び配列番号3の配列を有する、請求項17又は18に記載のキット。 The at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 1, and two types of primers for amplifying the tagged oligonucleotide have sequences of SEQ ID NO: 2 and SEQ ID NO: 3, respectively. , a kit according to claim 17 or 18. 1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む、請求項17から19のいずれか一項に記載のキット。 20. The kit of any one of claims 17-19, further comprising one or more first library primers and one or more second library primers. 前記第1のライブラリープライマーが配列番号8から配列番号15からなる群から選択される配列を有し、前記第2のライブラリープライマーが配列番号16から配列番号27からなる群から選択される配列を有する、請求項20に記載のキット。 The first library primer has a sequence selected from the group consisting of SEQ ID NO: 8 to SEQ ID NO: 15, and the second library primer has a sequence selected from the group consisting of SEQ ID NO: 16 to SEQ ID NO: 27 21. The kit of claim 20, comprising: 前記少なくとも1つのタグ付きオリゴヌクレオチドが配列番号28に対応する配列を有し、前記タグ付きオリゴヌクレオチドの増幅を行うためのプライマーが1種類であり、配列番号29に対応する配列を有する、請求項17又は18に記載のキット。 28. The at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO:28, there is one type of primer for amplifying the tagged oligonucleotide, and has a sequence corresponding to SEQ ID NO:29. 19. The kit according to 17 or 18. 1つ又は複数の第1のライブラリープライマー及び1つ又は複数の第2のライブラリープライマーを更に含む、請求項22に記載のキット。 23. The kit of claim 22, further comprising one or more first library primers and one or more second library primers. 前記第1のライブラリープライマーが配列番号30から配列番号37からなる群から選択される配列を有し、前記第2のライブラリープライマーが配列番号38から配列番号49からなる群から選択される配列を有する、請求項23に記載のキット。 The first library primer has a sequence selected from the group consisting of SEQ ID NO:30 to SEQ ID NO:37, and the second library primer has a sequence selected from the group consisting of SEQ ID NO:38 to SEQ ID NO:49 24. The kit of claim 23, comprising:
JP2022536964A 2019-12-16 2020-12-16 Methods and kits for whole genome amplification and analysis of target molecules in biological samples Pending JP2023511492A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT102019000024159A IT201900024159A1 (en) 2019-12-16 2019-12-16 METHOD AND KIT FOR TOTAL AMPLIFICATION OF THE GENOME AND ANALYSIS OF TARGET MOLECULES IN A BIOLOGICAL SAMPLE
IT102019000024159 2019-12-16
PCT/IB2020/062053 WO2021124166A1 (en) 2019-12-16 2020-12-16 Method and kit for whole genome amplification and analysis of target molecules in a biological sample

Publications (1)

Publication Number Publication Date
JP2023511492A true JP2023511492A (en) 2023-03-20

Family

ID=69904109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022536964A Pending JP2023511492A (en) 2019-12-16 2020-12-16 Methods and kits for whole genome amplification and analysis of target molecules in biological samples

Country Status (15)

Country Link
US (1) US20230053146A1 (en)
EP (1) EP4077713B1 (en)
JP (1) JP2023511492A (en)
KR (1) KR20220139859A (en)
CN (1) CN114867867A (en)
AU (1) AU2020408301A1 (en)
CA (1) CA3161615A1 (en)
DK (1) DK4077713T5 (en)
ES (1) ES2959838T3 (en)
FI (1) FI4077713T3 (en)
IL (1) IL293720B2 (en)
IT (1) IT201900024159A1 (en)
PL (1) PL4077713T3 (en)
PT (1) PT4077713T (en)
WO (1) WO2021124166A1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1109938T3 (en) 1998-09-18 2002-05-27 Micromet Ag DNA amplification of a single cell
EP3236264A3 (en) 2009-10-13 2017-11-08 Nanostring Technologies, Inc Protein detection via nanoreporters
ITUA20162640A1 (en) 2016-04-15 2017-10-15 Menarini Silicon Biosystems Spa METHOD AND KIT FOR THE GENERATION OF DNA LIBRARIES FOR PARALLEL MAXIMUM SEQUENCING
EP3583214B1 (en) 2017-02-02 2023-11-22 New York Genome Center, Inc. Methods and compositions for identifying or quantifying targets in a biological sample
EP3431611A1 (en) 2017-07-21 2019-01-23 Menarini Silicon Biosystems S.p.A. Improved method and kit for the generation of dna libraries for massively parallel sequencing
US11414701B2 (en) * 2018-05-24 2022-08-16 The Broad Institute, Inc. Multimodal readouts for quantifying and sequencing nucleic acids in single cells

Also Published As

Publication number Publication date
CA3161615A1 (en) 2021-06-24
IL293720B1 (en) 2023-10-01
EP4077713B1 (en) 2023-07-26
PL4077713T3 (en) 2024-01-03
US20230053146A1 (en) 2023-02-16
PT4077713T (en) 2023-08-18
DK4077713T5 (en) 2024-07-22
IL293720B2 (en) 2024-02-01
KR20220139859A (en) 2022-10-17
EP4077713A1 (en) 2022-10-26
CN114867867A (en) 2022-08-05
DK4077713T3 (en) 2023-08-28
WO2021124166A1 (en) 2021-06-24
ES2959838T3 (en) 2024-02-28
AU2020408301A1 (en) 2022-06-30
FI4077713T3 (en) 2023-09-27
IT201900024159A1 (en) 2021-06-16
IL293720A (en) 2022-08-01

Similar Documents

Publication Publication Date Title
US11434538B2 (en) Method of nucleic acid sequence detection
US20210371914A1 (en) Methods and compositions for identifying or quantifying targets in a biological sample
EP3891300B1 (en) Methods for spatial analysis using rna-templated ligation
US20230279477A1 (en) Methods for spatial analysis using targeted rna capture
US20110045462A1 (en) Digital analysis of gene expression
EP3129505B1 (en) Methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications
CN112154216A (en) Biomolecule probes and methods for detecting gene and protein expression
KR20130113447A (en) Direct capture, amplification and sequencing of target dna using immobilized primers
KR102512168B1 (en) Method for Quantitatively Analyzing Protein Population Using Next Generation Sequencing and Use Thereof
US20140336058A1 (en) Method and kit for characterizing rna in a composition
KR20240069835A (en) Improved method and kit for the generation of dna libraries for massively parallel sequencing
KR20180041331A (en) The method and kit of the selection of Molecule-Binding Nucleic Acids and the identification of the targets, and their use
CN115109846A (en) Method for accurate parallel quantification of nucleic acids in diluted or unpurified samples
EP4077713B1 (en) Method and kit for whole genome amplification and analysis of target molecules in a biological sample
CA3168563A1 (en) Parallelized sample processing and library prep
Ang et al. Highly Efficient and Reliable DNA Aptamer Selection Using the Partitioning Capabilities of Ddpcr: The Hi-Fi Selex Method

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220728

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231102