CN107805278A - 产生内源标记的蛋白的方法 - Google Patents

产生内源标记的蛋白的方法 Download PDF

Info

Publication number
CN107805278A
CN107805278A CN201711044283.XA CN201711044283A CN107805278A CN 107805278 A CN107805278 A CN 107805278A CN 201711044283 A CN201711044283 A CN 201711044283A CN 107805278 A CN107805278 A CN 107805278A
Authority
CN
China
Prior art keywords
sequence
cell
gfp
zfn
albumen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711044283.XA
Other languages
English (en)
Inventor
D.马尔科夫
N.津泽
D.瓦萨
张帆
张红艺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sigma Aldrich Co LLC
Original Assignee
Sigma Aldrich Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sigma Aldrich Co LLC filed Critical Sigma Aldrich Co LLC
Publication of CN107805278A publication Critical patent/CN107805278A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5035Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on sub-cellular localization
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5041Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects involving analysis of members of signalling pathways
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/72Fusion polypeptide containing domain for protein-protein interaction containing SH2 domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/027Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from a retrovirus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Toxicology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本公开内容提供了内源标记细胞中的内源蛋白的方法以及包含内源标记蛋白的细胞。本公开内容还描述了利用此类方法产生的细胞和包含具有标记的内源蛋白的细胞的试剂盒。

Description

产生内源标记的蛋白的方法
本案是分案申请,其母案的中国申请号是201180029160.3,国际申请号是PCT/US2011/032218,申请日是2011年4月13日。
相关申请的交叉引用
本申请要求于2010年4月13日提交的美国临时申请第61/323,702号、于2010年4月13日提交的美国临时申请第61/323,719号、于2010年4月13日提交的美国临时申请第61/323,698号、于2010年7月23日提交的美国临时申请第61/367,017号、于2010年10月7日提交的美国临时申请第61/390,668号、于2010年11月1日提交的美国临时申请第61/408,856号以及于2011年1月12日提交的美国临时申请第61/431,957号的优先权,其各自通过引用以其整体结合于本文。
发明领域
本公开内容涉及标记内源蛋白的方法。
发明背景
蛋白标记广泛用于对细胞中的目标蛋白提供目视读出。在其它用途中,标记蛋白用于研究蛋白丰度和定位、转录调控和翻译调控、翻译后修饰、蛋白-蛋白相互作用、可变剪接、通过RNAi对RNA和蛋白的敲减以及转录因子结合位点。然而,在细胞中表达标记蛋白的目前方法导致失真的表达,其并不反映内源蛋白的表达模式。这是由于标记蛋白的表达往往依赖异源启动子用于表达。此外,一些标记蛋白异位表达自外遗传载体或随机整合至细胞基因组的载体,并因此不受内源调节途径控制。因此,对于可直接特异地整合至细胞的染色体中以产生通过内源调节途径控制的标记蛋白的方法存在强烈的需要。
发明简述
在一个方面,本公开内容提供标记至少一种内源蛋白的方法,所述方法包括:a)将以下物质引入细胞中:(i)至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸,所述靶向内切核酸酶结合靶位点并能切割编码所述内源蛋白的染色体序列中的切割位点;和(ii)至少一种包含标签序列的供体多核苷酸,所述标签序列被上游序列和下游序列侧接,所述上游序列和所述下游序列与所述染色体序列中切割位点的任一侧享有基本的序列同一性;和(b)将所述细胞保持在这样的条件下,所述条件使得通过所述靶向内切核酸酶在切割位点引入的双链断裂通过同源性定向的过程修复,使得所述供体多核苷酸中的标签序列被符合读框地整合至所述编码所述内源蛋白的染色体序列中,其中产生标记的内源蛋白。
在另一个方面,本公开内容提供一种细胞,所述细胞包含至少一个被符合读框地整合至编码内源蛋白的染色体序列中的标签序列,使得所述细胞表达至少一种标记的内源蛋白。
而在另一个方面,本公开内容提供监测内源蛋白的定位的试剂盒。所述试剂盒包含一种细胞,所述细胞具有至少一个被符合读框地整合至编码内源蛋白的染色体序列中的标签序列,使得所述细胞表达至少一种标记的内源蛋白。
以下更详细地描述本公开内容的其它方面和重复内容。
彩图的引用
本申请文件包含至少一张以彩色完成的图片。含彩图的本专利申请出版物的拷贝将在请求并支付必要费用时由专利局提供。
附图简述
图1描述了TUBA1B基因座上标签序列整合的设计。(A)为显示了用于标签序列整合的靶区的染色体序列(SEQ ID NO:29)、染色体靶区上的ZFN结合位点(带边框的核苷酸)、ZFN切割位点(黄色箭头)和标签序列整合位点(绿色箭头)的示意图。(B)为描述TUBA1B基因组靶区的示意图,其显示了编码区(红色)、非翻译区(蓝色)和ZFN切割位点(黄色箭头)。(C)为整合前TUBA1B基因组区域的DNA片段的示意图。(D)为含符合读框地与TUBA1B编码序列整合的GFP序列的TUBA1B基因组区域的DNA片段的示意图。(E)为所述标签序列成功整合后产生的在N端与GFP标签融合的内源α-微管蛋白的示意图。
图2描述了包含被基因组微管蛋白序列侧接的GFP标签的供体质粒的图谱。
图3描述了U2OS细胞中TUBA1B基因组区域的DNA序列(SEQ ID NO:4),其证明了GFP2编码序列被整合至微管蛋白编码区。带下划线的文字表示经测序的区域,加粗文字表示GFP2的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的Met密码子。
图4描述了U2OS细胞中TUBA1B基因组区域的DNA序列(SEQ ID NO:5),其证明了RFP编码序列被整合至微管蛋白编码区。带下划线的文字表示经测序的区域,加粗文字表示RFP的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的Met密码子。
图5出示了使用对TUBA1B基因座内GFP的靶定整合特异的引物对14个细胞克隆的接头PCR (junction PCR)的琼脂糖凝胶电泳分析。
图6显示了表达标记有GFP的内源α-微管蛋白同种型1B蛋白的单独分离的细胞克隆的微分干涉相差(DIC)显微术图像和荧光显微术图像的多个实例。(A) U2OS细胞中GFP标记的α-微管蛋白同种型1B蛋白,(B) U2OS细胞中GFP标记的α-微管蛋白同种型1B蛋白,(C)U2OS细胞中GFP标记的α-微管蛋白同种型1B蛋白,(D) A549细胞中GFP标记的α-微管蛋白同种型1B蛋白,(E) A549细胞中GFP标记的α-微管蛋白同种型1B蛋白,(F) K562细胞中GFP标记的α-微管蛋白同种型1B蛋白,(G) HEK293细胞中GFP标记的α-微管蛋白同种型1B蛋白和(H) HEK293T细胞中GFP标记的α-微管蛋白同种型1B蛋白。
图7描述了包含被基因组微管蛋白序列侧接的RFP标签的供体质粒的图谱。
图8显示了MCF10a细胞系中RFP整合至TUBA1B区的验证。该整合利用微管蛋白引物通过基因组PCR和接头PCR来验证。(A)显示存在1945 bp RFP/微管蛋白融合物带的DNA印迹和(B)显示在几个克隆中RFP标签序列阳性整合至TUBA1B的基因组PCR (T.I.=靶定整合)。Wt MCF10a细胞和含RFP整合的U2SO细胞系用作对照。
图9描述了MCF10a细胞中TUBA1B区的确证序列,其证明了RFP序列的整合(SEQ IDNO:8)。带下划线的文字表示经测序的区域,加粗文字表示GFP2的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的Met密码子。
图10描述了RFP整合至MCF10a细胞的TUBA1B基因座以及RFP和GFP整合至U2OS细胞的相同基因座的PCR验证。野生型条带为452 bp而靶定整合(T.I.)条带为1190 bp。
图11显示出在MCF10a克隆5中RFP的***位点处的接头(junction)具有预期大小。左边接头的预期大小为453 bp而右边接头的预期大小为4089 bp。
图12描述蛋白印迹,其检测含RFP标记的微管蛋白的MCF10a克隆5中RFP和微管蛋白的表达。
图13证明了大于99%的野生型MCF10a细胞缺少红色荧光,而大于99%包含RFP标记的微管蛋白的MCF10a克隆5细胞有红色荧光。
图14描述了包含RFP标记的微管蛋白的转染的MCF10a细胞的表型稳定性。(A)在P2的表达和(B)在P18的表达。DIC图像在左边而荧光图像在右边。
图15描述了包含被基因组STAT3序列侧接的GFP标签的供体序列的图谱。
图16描述的示意图显示了用于标签序列整合的STAT3区的染色体序列(SEQ IDNO:27)、染色体靶区上的ZFN结合位点(黄色序列)、ZFN切割位点(黄色箭头)和标签序列整合位点(绿色箭头)。“M”象征氨基酸起始密码子甲硫氨酸。
图17描述的Cel-1测定确证了ZFN在预期位点切割STAT3染色体序列中的效力(第三泳道)。还显示了仅供体多核苷酸对照和含供体多核苷酸对照的ZFN的Cel-1结果。
图18出示了编码对STAT3基因座特异的ZFN的合成RNA的琼脂糖凝胶电泳分析。
图19描述了转染了用于将GFP整合至STAT3基因座的ZFN和供体多核苷酸的细胞的细胞分选仪数据(A)。还显示了阴性对照细胞的细胞分选仪数据(B)。
图20描述了基因组中2个不同的靶区的接头PCR的琼脂糖凝胶电泳分析:编码β-肌动蛋白的ACTB区用编码GFP或RFP的标签序列靶定,而STAT3用编码GFP的标签序列靶定。STAT3用2种不同的接头引物组(“引物1”和“引物2”)来分析。PCR确认了在肌动蛋白基因座内整合,而非在STAT3基因座内整合。还显示了分子大小标记和GFP对照。
图21描述了包含侧接GFP标签序列的基因组MAPRE3序列的供体序列的图谱。
图22描述的Cel-1测定显示了多个ZFN对在N端整合位点切割MAPRE3染色体序列中的效力。泳道1为DNA大小标记,泳道2和11为GFP对照,而泳道3-10描述了利用上述各泳道所示的不同ZFN对的Cel-1测定。
图23描述显示多个ZFN对在C端整合位点切割MAPRE3靶定染色体序列中的有效性的Cel-1测定(泳道4-7)和ZFN对在切割LMNB1靶定染色体序列中的Cel-1测定结果(泳道10-13)。泳道1和2为DNA大小标记,泳道3和8为GFP-MAPRE3对照,而泳道9和14为GFP-核纤层蛋白对照。
图24出示了MAPRE3靶位点的接头PCR的琼脂糖凝胶电泳分析。圆圈突出了标签序列的可能整合。
图25描述转染了用于将GFP标签序列整合至MAPRE3基因座的ZFN和供体多核苷酸的细胞的细胞分选仪分析。(A)仅转染供体多核苷酸的对照细胞,和(B)转染了ZFN+供体多核苷酸的细胞。
图26描述了在ACTB基因座的标签序列整合的设计。(A)为显示用于标签序列整合的靶区的染色体序列(SEQ ID NO:24)、染色体靶区上的ZFN结合位点(黄色序列)、ZFN切割位点(黄色箭头)和标签序列整合位点(绿色箭头,以及绿色和黄色箭头)的示意图。(B)为描述了ACTB基因组靶区的示意图,其显示了编码区(红色)、非翻译区(蓝色)和ZFN切割位点(黄色箭头)。(C)为含符合读框地与ACTB编码序列整合的GFP序列的ACTB基因组区域的示意图。(D)为标签序列成功整合后产生的在N端与GFP标签融合的内源β-微管蛋白的示意图。
图27显示在K562细胞中针对靶向ACTB基因座的ZFN的Cel-1测定筛选。泳道1为标记,并且泳道上的数字是指ZFN对。
图28描述了包含被基因组ACTB序列侧接的GFP标签的供体质粒的图谱,其整合位点在图26A中表示为“v.2”。
图29显示了表达用GFP标记的内源β-肌动蛋白的单独分离的细胞克隆的荧光显微术图像。孔的位置标记在各图像上方。
图30描述了U2OS细胞中ACTB1基因组区域的DNA序列(SEQ ID NO:16),其证明了GFP2编码序列被整合至肌动蛋白编码区。带下划线的文字表示经测序的区域,加粗文字表示GFP2的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的Met密码子。
图31描述了U2OS细胞中ACTB1基因组区域的DNA序列(SEQ ID NO:17),其证明了RFP编码序列被整合至肌动蛋白编码区。带下划线的文字表示经测序的区域,加粗文字表示RFP的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的Met密码子。
图32描述了用于整合GFP标签序列并用编码备选密码子使用的核酸序列交换编码β-肌动蛋白的前15个氨基酸的基因组序列的供体质粒图谱,其整合位点在图26A中表示为“v.1”。
图33为供体多核苷酸中ACTB基因组区域的图32中所示的DNA片段的示意图,所述供体多核苷酸用于用编码备选密码子使用的核酸序列替代编码β-肌动蛋白的前15个氨基酸的基因组序列。
图34描述了在LMNB1基因座的标签序列整合的设计。(A)为显示用于标签序列整合的靶区的染色体序列(SEQ ID NO:20)、染色体靶区上的ZFN结合位点(黄色序列)、ZFN切割位点(黄色箭头)和标签序列整合位点(绿色箭头)的示意图。(B)为描述LMNB1基因组靶区的示意图,其显示了编码区(红色)、非翻译区(蓝色)和ZFN切割位点(黄色箭头)。(C)为LMNB1基因组区域中整合的靶定位点的示意图。(D)为其中GFP序列整合至LMNB1编码序列中的LMNB1基因组区域的示意图。(E)为标签序列成功整合后产生的在N端与GFP标签融合的内源核纤层蛋白B1蛋白的示意图。
图35显示了表达用GFP标记的内源核纤层蛋白B1蛋白的细胞的微分干涉相差(DIC)显微术图像和荧光显微术图像。
图36描述了U2OS细胞中LAMNB1基因组区域的DNA序列,其证明了RFP编码序列被整合至核纤层蛋白编码区(SEQ ID NO:21)。带下划线的文字表示经测序的区域,加粗文字表示GFP2的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的起始密码子。
图37显示了包含RFP标记的核纤层蛋白的iPS细胞的图像。(A)细胞视野的DIC图像。(B)显示用RFP标记的核纤层蛋白的表达的红色荧光图像。(C)用DAPI染的细胞的核。
图38描述了在ERBB2基因座的标签序列(SEQ ID:15)整合的设计。该示意图显示了在用于标签序列整合的靶区的染色体序列、染色体靶区上的ZFN结合位点、ZFN切割位点和标签序列整合位点。
图39描述了用于整合GFP标签序列的供体质粒的图谱。GFP编码序列被ERBB2基因组序列侧接。
图40描述了左边接头的接头PCR以确认在SKOV3细胞中GFP2整合至ERBB2基因座。
图41显示了SKOV3细胞中GFP标记的HER2的表达情况。上图:DIC;下图:荧光显微术。
图42描述了在HMGA基因座的标签序列整合的设计。该示意图显示了用于标签序列整合的靶区的染色体序列(SEQ ID NO:3)、染色体靶区上的ZFN结合位点、ZFN切割位点和标签序列整合位点以及HMGA基因座中编码区、非翻译区和GFP***位点的相关位置。
图43描述了用于整合GFP标签序列的供体质粒的图谱。GFP编码序列被HMG1染色体序列侧接。
图44描述了在选定克隆中GFP标签整合至HMGA1基因座的(A)基因组PCR验证和(B)DNA印迹(用GFP探针进行)验证。
图45 描述了U2OS细胞中HMGA1基因组区域的DNA序列,其证明了GFP2编码序列被整合至HMGA编码区(SEQ ID NO:17)。带下划线的文字表示经测序的区域,加粗文字表示GFP2的编码序列,斜体文字表示限制位点或接头,加粗并大写的文字表示剪接点的起始密码子。
图46显示了表达GFP标记的HMGA1蛋白的U2OS细胞的图像。左:DIC图像;右:荧光图像。
发明详述
本公开内容包含标记细胞中的内源蛋白的方法。所述方法包括将细胞与靶向内切核酸酶和包含标签序列的供体多核苷酸接触。所述靶向内切核酸酶在编码内源蛋白的染色体序列中的特定位点引入双链断裂。所述双链断裂诱导细胞DNA修复过程,其导致同源重组并利用供体多核苷酸作为模板修复双链断裂。因此,所述供体多核苷酸中的标签序列被符合读框地整合至编码内源蛋白的染色体序列中。由于所述标签序列与内源编码序列符合读框地整合,当产生所述内源蛋白时其包含标签蛋白。
有利地,如实施例中所阐述地,可运用所述方法在内源调节途径控制下表达标记蛋白,反映内源蛋白的表达模式。
本公开内容还提供细胞,所述细胞包含至少一个被符合读框地整合至编码内源蛋白的染色体序列的标签序列,使得所述细胞表达至少一种标记的内源蛋白。本文还提供用于监测至少一种内源蛋白的定位的试剂盒,其中所述试剂盒包含具有至少一个被符合读框地整合至编码内源蛋白的染色体序列的标签序列的细胞。
I. 包含标记内源蛋白的细胞
本公开内容的一个方面包含一种细胞,所述细胞包含至少一个被符合读框地整合至编码内源蛋白的染色体序列的标签序列,使得所述细胞表达至少一种标记的内源蛋白。在以下详述合适的内源蛋白的实例,合适标签的实例亦是如此。
(a) 内源蛋白
本文术语“内源蛋白”是指由细胞的遗传物质编码的蛋白。一般而言,任何目标内源蛋白可用多个标签序列标记。
在一个实施方案中,所述内源蛋白可为微管蛋白。在各个实施方案中,所述微管蛋白可为人微管蛋白,例如由TUBA1A、TUBA1B、TUBA1C、TUBA3C、TUBA3D、TUBA3E、TUBA4A和TUBA8基因编码的α-微管蛋白;由TUBB、TUBB1、TUBB2A、TUBB2B、TUBB2C、TUBB3、TUBB4、TUBB4Q和TUBB6基因编码的β-微管蛋白;由TUBG1、TUBG2、TUBGCP2、TUBGCP3、TUBGCP4、TUBGCP5和TUBGCP6基因编码的γ-微管蛋白;由TUBD1基因编码的δ-微管蛋白或由TUBE1基因编码的ε-微管蛋白。在示例性实施方案中,所述内源微管蛋白可为由人12号染色体上的TUBA1B基因(登录号NM_006082)编码的人α-微管蛋白同种型1B蛋白。
在另一个实施方案中,内源蛋白可为肌动蛋白。在一些实施方案中,所述肌动蛋白可为人肌动蛋白例如由ACTA1基因编码的α-肌动蛋白、由ACTB基因编码的β-肌动蛋白或由ACTG1基因编码的γ-肌动蛋白。在示例性实施方案中,所述内源蛋白可为由人7号染色体上的ACTB基因(登录号NM_001101)编码的人β-肌动蛋白。
而在另一个实施方案中,内源蛋白可为核纤层蛋白。在某些实施方案中,所述核纤层蛋白可为人核纤层蛋白例如由LMNB1和LMNB2基因表达的B1核纤层蛋白和B2核纤层蛋白,或核纤层蛋白A和C,LMNA基因的剪接变体。在示例性实施方案中,所述内源蛋白可为由人5号染色体上的LMNB1基因(登录号NM_005573)编码的人核纤层蛋白B1蛋白。
而在另一个实施方案中,所述内源蛋白可为由ERBB2基因编码的人表皮生长因子受体2 (HER2蛋白)。HER2为细胞膜表面结合的受体酪氨酸激酶并参与导致细胞生长和分化的信号转导途径。 ERBB2基因的扩增或其蛋白产物的过表达与乳腺癌、卵巢癌和胃癌相关。内源HER2蛋白可为人HER2蛋白(UniProtKB/ Swiss-Prot登录号:P04626)。
在备选实施方案中,所述内源蛋白可为HMGA。HMGA是指高泳动族染色体蛋白,其通过经由结合富含AT区改变DNA构象而调节基因表达。它们属于最大且最佳表征的非组蛋白核蛋白族。HMGA1基因调节多种正常的生物学过程,包括细胞生长、增殖、分化和死亡。针对该基因已发现编码两种不同同种型的至少7种转录变体。在一些实施方案中,所述内源蛋白可为人HMGA蛋白。可用于本发明的人HMGA蛋白的非限制性实例包括HMGA同种型a和HMGA同种型b,其由HMGA1基因(登录号NM_145899)表达。
在另外的实施方案中,所述内源蛋白可为表A中所列的蛋白:
(b)标签序列
本文中标签是指与内源蛋白融合以得到标记的内源蛋白的蛋白。所述标签序列被符合读框地与内源蛋白编码序列融合,使得产生融合蛋白。符合读框意指在***所述标签序列后保持编码蛋白的染色体序列的开放阅读框(ORF)。当被***的核苷酸数目可被三整除时发生符合读框的***,若适用的话其可通过将具有许多核苷酸的接头添加至所述标签蛋白编码序列中来实现。所述内源蛋白可在蛋白多肽序列内的任何地方标记,只要所述内源蛋白的功能不受影响。一般而言标记在蛋白的N-端或C-端。所述内源蛋白可在例如蛋白的N-端标记。或者,所述内源蛋白可在蛋白的C-端标记。
标签序列可为由核酸序列编码的任何肽序列。标签序列可编码多种标签,包括但不限于表位标签、亲和标签、报道分子或其组合。
所述标签可为例如表位标签。所述表位标签可包含随机的氨基酸序列或已知的氨基酸序列。已知的氨基酸序列可具有例如针对其产生的抗体,或可能没有已知的针对所述序列产生的抗体。所述表位标签可为可获得针对其的商业抗体的抗体表位标签。合适的抗体表位标签的非限制性实例为:myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、麦芽糖结合蛋白、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、BCCP和钙调蛋白。
示例性标签可为报道分子。合适的报道分子为本领域已知。报道分子的非限制性实例包括亲和标签、目视报道分子或选择性标记报道分子。亲和标签的非限制性实例包括:几丁质结合蛋白(CBP)、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签和谷胱甘肽-S-转移酶(GST)。目视报道分子典型地导致目视信号,例如细胞中的颜色变化,或细胞的荧光或发光。例如,报道分子LacZ (其编码β-半乳糖苷酶),在存在合适的底物(如X-gal)的情况下将使细胞变成蓝色。目视报道分子的其它非限制性实例包括荧光蛋白、萤光素酶、碱性磷酸酶、β-半乳糖苷酶、β-内酰胺酶、辣根过氧化物酶及其变体。此外,可使用萤光素酶。选择性标记报道分子典型地赋予细胞的可选择性状,例如药物抗性(例如抗生素抗性)。
示例性标签是荧光蛋白目视报道分子。荧光蛋白目视报道分子的非限制性实例包括绿色荧光蛋白(例如GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如YFP、EYFP、Citrine、Venus、Ypet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、青色荧光蛋白(例如ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cya)、红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed- Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)和橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)或任何其他合适的荧光蛋白。示例性标签为绿色荧光蛋白或红色荧光蛋白。
非限制性实例还包括环状排列的绿色荧光蛋白,其中氨基和羧基部分被互换并与连接原来末端的短间隔物再结合,同时仍然有荧光。荧光蛋白的这些环状排列具有改变的pKa值和发色团的取向。此外,一些荧光蛋白内的某些位置耐受整个蛋白的***,并且***物的构象变化可对荧光具有重大影响,例如增强或改变颜色。例如,代替GFP的黄色突变体(EYFP,增强型黄色荧光蛋白)的Tyr-145的钙调蛋白或锌指结构域***导致产生指示蛋白,所述指示蛋白的荧光可在金属结合时提高数倍。向增强型黄色荧光蛋白中的钙调蛋白移植可监测单个哺乳动物细胞中的胞质Ca2+
例如,所述内源蛋白可通过肽接头与所述标签融合。基于肽区段的已知结构作用和构象作用来选择所述接头肽的序列,以允许适当的折叠并防止待标记蛋白和标签多肽可能的空间位阻。接头肽为本领域常用且已知的,并且长度可在约3-约40个氨基酸。
所述内源蛋白还可用多于一种标签标记。例如,内源蛋白可用至少一种、二种、三种、四种、五种、六种、七种、八种或九种标签标记。多于一种的标签可表达为与目标内源蛋白融合的单一多肽。与内源蛋白融合的多于一种标签可表达为单一多肽,所述单一多肽在翻译后被切割为单独的标签多肽。作为非限制性实例,标签多肽之间或标签多肽和内源蛋白之间***的小RNA病毒的2A肽可导致标签的共翻译“切割”并导致以等摩尔的水平表达多个蛋白。
在一个示例性实施方案中,所述细胞表达一种内源蛋白,其用荧光蛋白标记。在另一个示例性实施方案中,所述细胞表达两种荧光标记的内源蛋白。在又一个示例性实施方案中,所述细胞表达三种荧光标记的内源蛋白。在另外的实施方案中,所述细胞表达四种或更多种标记的内源蛋白。
(c)细胞类型
一般而言,所述细胞可为真核细胞。合适的细胞包括真菌或酵母(例如巴斯德毕赤酵母(Pichia pastoris)或酿酒酵母(Saccharomyces cerevisiae));昆虫细胞(例如来自草地贪夜蛾(Spodoptera frugiperda)的SF9细胞或来自黑腹果蝇(Drosophila melanogaster)的S2细胞),植物细胞和动物细胞(例如小鼠、大鼠、仓鼠、非人灵长类或人的细胞)。示例性细胞为哺乳动物。所述哺乳动物细胞可为原代细胞。一般而言,可使用对双链断裂敏感的任何原代细胞。所述细胞可为多种细胞类型,例如成纤维细胞、肌原细胞、T细胞或B细胞、巨噬细胞、上皮细胞等。
所述哺乳动物细胞可为哺乳动物细胞系细胞。所述细胞系可为任何已建立的细胞系或原代细胞系。所述细胞系可为贴壁或非贴壁的,或者所述细胞系可利用本领域的技术人员已知的标准技术在一定条件下生长,所述条件促进贴壁、非贴壁或器官型生长。合适的哺乳动物细胞系的非限制性实例包括:中国仓鼠卵巢(CHO)细胞、SV40转化的猴肾CVI系(COS7);人胚肾系293;幼仓鼠肾细胞(BHK);小鼠支持细胞(TM4);猴肾细胞(CVI-76);非洲绿猴肾细胞(VERO-76);人***细胞(HELA);犬肾细胞(MDCK);布法罗大鼠肝细胞(BRL3A);人肺细胞(W138);人肝细胞(Hep G2);小鼠乳腺肿瘤细胞(MMT);大鼠肝癌细胞(HTC);HIH/3T3细胞、人U2-OS骨肉瘤细胞系、人A549细胞系、人K562细胞系、人HEK293细胞系、人HEK293T细胞系和TRI细胞。对于哺乳动物细胞系的广泛列表,本领域的普通技术人员可参考美国典型培养物保藏中心目录(ATCC®,Mamassas,VA)。一般而言,所述细胞可为多种细胞类型,例如成纤维细胞、肌原细胞、T细胞或B细胞、巨噬细胞、上皮细胞等。本公开内容的示例性细胞系为人U2OS骨肉瘤细胞系。备选的示例性人细胞系为A549细胞系、K562细胞系、HEK293细胞系和HEK293T细胞系。另一种示例性人细胞系为MCF10a,即乳腺上皮癌细胞系。又一种示例性人细胞系为SKOV3,其为上皮细胞系。备选的示例性细胞系包括iPS细胞,其是从成纤维细胞或其它细胞类型产生的诱导多能干细胞。
而在其它的实施方案中,所述细胞可为干细胞。合适的干细胞包括但不限于:胚胎干细胞、ES样干细胞、胎儿干细胞、成体干细胞、多潜能干细胞、诱导多能干细胞、多能干细胞、寡能干细胞和单能干细胞。
在另外的实施方案中,所述细胞可为单细胞胚胎。所述胚胎可为脊椎动物或无脊椎动物。合适的脊椎动物包括哺乳动物、鸟、爬行动物、两栖动物和鱼。合适的哺乳动物的实例包括但不限于啮齿动物、伴侣动物、家畜和非灵长类。啮齿类动物的非限制性实例包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。合适的伴侣动物包括但不限于猫、狗、兔、刺猬和雪貂。家畜的非限制性实例包括马、山羊、绵羊、猪、牛、驼马和羊驼。合适的非灵长类包括但不限于卷尾猴、黑猩猩、狐猴、猕猴、狨猴、绢毛猴、蜘蛛猴、松鼠猴和黑长尾猴。鸟的非限制性实例包括鸡、火鸡、鸭和鹅。或者,所述动物可为无脊椎动物(例如昆虫、线虫等)。昆虫的非限制性实例包括果蝇属(Drosophila)和蚊子。
II. 标记内源蛋白的方法
本公开内容的另一个方面包括一种方法,所述方法用于标记细胞中的至少一种内源蛋白。所述方法包括使用靶向内切核酸酶以介导标签序列符合读框地与内源编码序列的整合。更特别地,所述方法包括向细胞内引入至少一种锌指核酸酶或编码锌指核酸酶的核酸和至少一种供体多核苷酸。所述供体多核苷酸包含待符合读框地整合至内源染色体序列的标签序列、侧接所述标签序列的上游序列和下游序列,其中所述上游序列和下游序列与编码所述蛋白的内源染色体序列中切割位点的任一侧享有基本的序列同一性。接着将所述细胞保持在一定条件下,所述条件使得通过同源性定向的过程修复通过锌指核酸酶在切割位点引入的双链断裂,使得所述供体多核苷酸中的标签序列被符合读框地整合至编码内源蛋白的染色体序列中。表达至少一种标记的内源蛋白的通过所述方法产生的细胞在以上章节(I)中详细描述。在以下更详尽地描述所述方法的组成。
(a)靶向内切核酸酶
所述方法部分包括向细胞内引入至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸。所述靶向内切核酸酶可为天然存在的蛋白或改造的蛋白。在一些实施方案中,所述靶向内切核酸酶可为大范围核酸酶或寻靶内切核酸酶。在其它的实施方案中,所述靶向内切核酸酶可为转录激活因子样效应子(TALE)-核酸酶。在优选的实施方案中,所述靶向内切核酸酶可为锌指核酸酶。典型地,锌指核酸酶包含DNA结合结构域(即,锌指)和切割结构域(即,核酸酶),其在以下描述。
(i)锌指结合结构域
锌指结合结构域可被改造以识别并结合任何选定的核酸序列。参见,例如,Beerli等(2002) Nat. Biotechnol. 20:135-141;Pabo等(2001) Ann. Rev. Biochem. 70:313-340;Isalan等(2001) Nat. Biotechnol. 19:656-660;Segal等(2001) Curr. Opin.Biotechnol. 12:632-637;Choo等(2000) Curr. Opin. Struct. Biol. 10:411-416;Zhang等(2000) J. Biol. Chem. 275(43):33850-33860;Doyon等(2008) Nat.Biotechnol. 26:702-708和Santiago等(2008) Proc. Natl. Acad. Sci. USA 105:5809-5814。改造的锌指结合结构域相对于天然存在的锌指蛋白可具有新的结合特异性。改造方法包括但不限于合理设计和多种类型的选择。合理设计包括,例如,利用包含双联体、三联体和/或四联体核苷酸序列和单独的锌指氨基酸序列的数据库,其中各个双联体、三联体或四联体核苷酸序列与结合特定的三联体或四联体序列的锌指的一条或多条氨基酸序列相关。参见例如,美国专利第6,453,242号和第6,534,261号,其公开内容通过引用以其整体结合于本文中。作为实例,美国专利6,453,242中所述的算法可用于设计锌指结合结构域以靶向预选定的序列。备选方法,例如使用非简并性识别密码表的合理设计也可用于设计锌指结合结构域以靶向特定序列(Sera等(2002) Biochemistry 41:7074-7081)。用于鉴定DNA序列中的潜在靶位点和设计锌指结合结构域的公众可用的基于网络的工具可分别参见http://www.zincfingertools.org和http://bindr.gdcb.iastate.edu/ZiFiT/ (Mandell等(2006) Nuc. Acid Res. 34:W516-W523;Sander等(2007) Nuc. Acid Res. 35:W599-W605)。
锌指结合结构域可被设计以识别并结合长度在约3个核苷酸-约21个核苷酸的DNA序列,或长度在约8个核苷酸-约19个核苷酸的DNA序列。一般而言,本文公开的锌指核酸酶的锌指结合结构域包含至少三个锌指识别区(即,锌指)。在一个实施方案中,所述锌指结合结构域可包含四个锌指识别区。在另一个实施方案中,所述锌指结合结构域可包含五个锌指识别区。而在另一个实施方案中,所述锌指结合结构域可包含六个锌指识别区。锌指结合结构域可被设计以结合任何合适的靶DNA序列。参见,例如,美国专利第6,607,882号;第6,534,261号和第6,453,242号,其公开内容通过引用以其整体结合于本文中。
选择锌指识别区的示例性方法可包括噬菌体展示和双杂交***,并公开于美国专利第5,789,538号;第5,925,523号;第6,007,988号;第6,013,453号;第6,410,248号;第6,140,466号;第6,200,759号和6,242,568号;以及WO98/37186;WO98/53057;WO00/27878;WO01/88197和GB2,338,237,其各自通过引用以其整体结合于本文中。此外,针对锌指结合结构域的结合特异性的增强已在例如WO02/077227中描述。
锌指结合结构域和用于设计和构建融合蛋白(以及编码所述融合蛋白的多核苷酸)的方法为本领域的技术人员已知并且详述于美国专利申请公布号20050064474和20060188987,其各自通过引用以其整体结合于本文中。锌指识别区和/或多指锌指蛋白可利用合适的接头序列连接在一起,所述接头序列包括例如长度在5个或更多个氨基酸的接头。关于长度在六个或更多个氨基酸的接头序列的非限制性实例,参见美国专利第6,479,626号;第6,903,185号和第7,153,949号,其公开内容通过引用以其整体结合于本文中。本文所述的锌指结合结构域可包含蛋白的单独锌指之间的合适接头的组合。
在一些实施方案中,所述锌指核酸酶还可包含核定位信号或核定位序列(NLS)。NLS为促进锌指核酸酶蛋白靶向至核中以在染色体的靶序列上引入双链断裂的氨基酸序列。核定位信号为本领域已知。参见,例如Makkerh等(1996) Current Biology 6:1025-1027。
示例性锌指DNA结合结构域识别并结合与选自SEQ ID NO: 1、2、13、14、18、19、22、23、25和26的序列有至少约80%序列同一性的序列。在其它的实施方案中,所述序列同一性可为约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
(ii)切割结构域
锌指核酸酶还包含切割结构域。本文所公开的锌指核酸酶的切割结构域部分可获自任何内切核酸酶或外切核酸酶。可自其获得切割结构域的内切核酸酶的非限制性实例包括但不限于限制性内切核酸酶和寻靶内切核酸酶。参见,例如,2002-2003目录, New EnglandBiolabs, Beverly, Mass.和Belfort等(1997) Nucleic Acids Res. 25:3379-3388或www.neb.com。切割DNA的其它酶为已知的(例如,S1核酸酶;绿豆核酸酶;胰DNA酶I;微球菌核酸酶;酵母HO内切核酸酶)。还参见Linn等(编辑) Nucleases, Cold Spring HarborLaboratory Press, 1993。这些酶中的一种或多种(或其有功能的片段)可用作切割结构域的来源。
切割结构域还可来源于如上所述的酶或其部分,其需要二聚化用于切割活性。切割可能需要两个锌指核酸酶,因为各个核酸酶包含有活性的酶二聚体的单体。或者,单个锌指核酸酶可包含两个单体以产生有活性的酶二聚体。本文所用“有活性的酶二聚体”为能切割核酸分子的酶二聚体。所述两个切割单体可来源于相同的内切核酸酶(或其有功能的片段),或者各单体可来源于不同的内切核酸酶(或其有功能的片段)。
当两个切割单体用于形成有活性的酶二聚体时,优选布置两个锌指核酸酶的识别位点,使得两个锌指核酸酶与其各自的识别位点的结合使切割单体彼此以允许所述切割单体例如通过二聚化形成有活性的酶二聚体的空间定向放置。因此,识别位点的近边可被约5个-约18个核苷酸分离。例如,所述近边可被约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个或18个核苷酸分离。然而应理解的是,任何整数的核苷酸或核苷酸对可***两个识别位点之间(例如约2个-约50个核苷酸对或更多对)。锌指核酸酶的识别位点的近边,例如本文详细描述的那些,可被6个核苷酸分离。一般而言,切割位点位于识别位点之间。
限制性内切核酸酶(限制性酶)存在于许多物种中并能序列特异性结合DNA(在识别位点上),并且在结合位点上或附近切割DNA。某些限制性酶(例如,IIS型)在远离识别位点的位点上切割DNA并且具有可分离的结合结构域和切割结构域。例如,IIS型酶FokI在一条链上距其识别位点9个核苷酸处和在另一条链上距其识别位点13个核苷酸处催化DNA的双链切割。参见,例如,美国专利第5,356,802号;第5,436,150号和第5,487,994号;以及Li等(1992) Proc. Natl. Acad. Sci. USA 89:4275-4279;Li等 (1993) Proc. Natl.Acad. Sci. USA 90:2764-2768;Kim 等 (1994a) Proc. Natl. Acad. Sci. USA 91:883-887;Kim 等 (1994b) J. Biol. Chem. 269:31, 978-31, 982。因此,锌指核酸酶可包含来自至少一种IIS型限制性酶的切割结构域和一种或多种锌指结合结构域,其可被改造或可不被改造。示例性IIS型限制性酶描述于例如国际公布WO07/014,275中,其公开内容通过引用以其整体结合于本文中。另外的限制性酶还包含可分离的结合结构域和切割结构域,并且其也包含于本公开内容中。参见,例如,Roberts等(2003) Nucleic Acids Res. 31:418-420。
其切割结构域可从结合结构域中分离出来的示例性IIS型限制性酶为FokI。该特定酶作为二聚体是有活性的(Bitinaite等(1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10, 575)。因此,对于本公开内容的目的,用于锌指核酸酶中的FokI酶的部分被认为是切割单体。因此,对于使用FokI切割结构域的靶定双链切割,各自包含FokI切割单体的两个锌指核酸酶,可用于重构有活性的酶二聚体。或者,也可使用包含锌指结合结构域和两个FokI切割单体的单个多肽分子。
在某些实施方案中,切割结构域可包含一个或多个改造的切割单体,其使均二聚化最小化或阻止均二聚化,如描述于例如美国专利公布第20050064474号、第20060188987号和第20080131962号中,其各自通过引用以其整体结合于本文中。作为非限制实例,在FokI的446位、447位、479位、483位、484位、486位、487位、490位、491位、496位、498位、499位、500位、531位、534位、537位和538位的氨基酸残基为影响FokI切割半结构域的二聚化的全部靶标。形成强制性异二聚体的FokI的示例性的改造切割单体包含一对单体,其中第一切割单体在FokI的氨基酸残基位置490和538处包含突变并且第二切割单体在氨基酸残基位置486和499处包含突变。
因此,在一个实施方案中,氨基酸位置490的突变用Lys(K)代替Glu(E);氨基酸残基538的突变用Lys(K)代替Iso(I);氨基酸残基486的突变用Glu(E)代替Gln(Q);并且499位的突变用Lys(K)代替Iso(I)。具体地,改造的切割单体可通过以下制备:将一个切割单体中的490位从E突变成K并将538位从I突变成K以产生命名为"E490K:I538K"的改造切割单体,以及将另一个切割单体中的486位从Q突变成E并将499位从I突变成L以产生命名为"Q486E:I499L"的改造切割单体。上述改造的切割单体为必要的异二聚体突变体,其中异常的切割被最小化或被消除。改造的切割单体可利用合适的方法(例如,通过如美国专利公布第20050064474号中所述的野生型切割单体(FokI)的定向诱变(参见实施例5))来制备。
上述的锌指核酸酶可被改造以在整合的靶定位点引入双链断裂。所述双链断裂可在整合的靶定位点,或者其可距整合位点多至1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个或1000个核苷酸。在一些实施方案中,所述双链断裂可在距整合位点多至1个、2个、3个、4个、5个、10个、15个或20个核苷酸处。在其它的实施方案中,所述双链断裂可在距整合位点多至10个、15个、20个、25个、30个、35个、40个、45个或50个核苷酸处。而在其它实施方案中,所述双链断裂可在距整合位点多至50个、100个或1000个核苷酸处。
(iv)靶定切割的另外方法
染色体序列中具有靶位点的任何核酸酶可用于本文所公开的方法。例如寻靶内切核酸酶和大范围核酸酶具有非常长的识别序列,其中的一些基于统计学可能在人大小的基因组中出现一次。在细胞基因组中具有独特靶位点的任何此类核酸酶可代替锌指核酸酶或加上锌指核酸酶用于细胞染色体的靶定切割。
寻靶内切核酸酶的非限制性实例包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-Scell、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。这些酶的识别序列为本领域已知。还参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997) Nucleic Acids Res. 25:3379-3388;Dujon 等 (1989) Gene 82:115-118;Perler等 (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) TrendsGenet. 12:224-228;Gimble 等 (1996) J. Mol. Biol. 263:163-180;Argast等 (1998)J. Mol. Biol. 280:345-353和the New England Biolabs目录。
尽管大多数寻靶内切核酸酶的切割特异性并不绝对针对其识别位点,但所述位点具有足够长度以致单个切割事件/哺乳动物大小的基因组可通过在包含其识别位点的单拷贝的细胞中表达寻靶内切核酸酶来获得。还已报道寻靶内切核酸酶和大范围核酸酶的特异性可被改造以结合非天然的靶位点。参见,例如,Chevalier等 (2002) Molec. Cell 10:895-905;Epinat等 (2003) Nucleic Acids Res. 31:2952-2962;Ashworth等 (2006)Nature 441:656-659;Paque等(2007) Current Gene Therapy 7:49-66。
(v)编码锌指核酸酶的核酸
锌指核酸酶可以编码锌指核酸酶的核酸引入细胞中。所述编码锌指核酸酶的核酸可为DNA或RNA。在一个实施方案中,所述编码锌指核酸酶的核酸可为DNA。例如,包含锌指核酸酶编码序列的质粒DNA可引入细胞中。在另一个实施方案中,所述编码锌指核酸酶的核酸可为RNA或mRNA。当所述编码锌指核酸酶的核酸为mRNA时,所述mRNA分子可为5’加帽的。相似地,当编码锌指核酸酶的核酸为mRNA时,所述mRNA分子可被聚腺苷酸化。因此,本方法的核酸可为编码锌指核酸酶的加帽和聚腺苷酸化的mRNA分子。用于加帽和聚腺苷酸化mRNA的方法为本领域已知。
(b)供体多核苷酸
用于将所述标签序列符合读框地整合至靶定染色体序列的方法还包括向细胞中引入至少一种包含所述标签序列的供体多核苷酸。供体多核苷酸不仅包含如以上章节(I)(b)中详述的标签序列,而且还包含上游序列和下游序列。所述上游序列和下游序列侧接供体多核苷酸中的标签序列。此外,所述上游序列和下游序列与内源染色体序列中整合位点的任一侧享有基本的序列同一性。
选择供体多核苷酸中的上游序列和下游序列以促进靶定染色体序列和供体多核苷酸之间的重组。本文所用的上游序列是指与整合的靶定位点上游的染色体序列享有序列相似性的核酸序列。相似地,所述下游序列是指与整合的靶定位点下游的染色体序列享有序列相似性的核酸序列。所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可具有约75%、80%、85%、90%、95%或100%的序列同一性。在其它的实施方案中,所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可具有约95%、96%、97%、98%、99%或100%的序列同一性。在示例性实施方案中,所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可有约99%或100%的序列同一性。
上游序列或下游序列可包含约20bp-约2500bp。在一个实施方案中,上游序列或下游序列可包含约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。示例性的上游序列或下游序列可包含约200bp-约2000bp、约600bp-约1000bp或更具体地约700bp-约1000bp。
典型地,所述供体多核苷酸可为DNA。所述供体多核苷酸可为DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、DNA的线性碎片、PCR片段、裸核酸或与递送载体(例如脂质体或泊洛沙姆)复合的核酸。在一个实施方案中,包含标签序列的供体多核苷酸可为DNA质粒。在另一个实施方案中,包含标签序列的供体多核苷酸可为BAC。
本领域的技术人员能使用熟知的标准重组技术(参见,例如,Sambrook等, 2001和Ausubel等, 1996)构建如本文所述的供体多核苷酸。
(c)递送至细胞
所述方法包括将所述靶向内切核酸酶或编码所述靶向内切核酸酶的核酸以及所述供体多核苷酸引入细胞中。合适的细胞在以上章节(I)(c)中详述。
合适的递送方法包括:显微注射、电穿孔、声致穿孔(sonoporation)、生物弹射、磷酸钙介导的转染、阳离子转染、脂质体转染、树形高分子转染、热休克转染、核转染、磁转染、脂转染、基因交付(impalefection)、光转染、核酸的专有试剂增强摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工毒粒的递送。在一个实施方案中,所述分子可通过核转染引入细胞中。在另一个实施方案中,所述分子可通过显微注射引入。所述分子可显微注射进细胞的核或胞质中。
包含所述标签序列的供体多核苷酸与靶向内切核酸酶或编码所述靶向内切核酸酶的核酸的比例可改变并会改变。在优选的实施方案中,所述靶向内切核酸酶可为锌指核酸酶。一般而言,所述供体多核苷酸与所述锌指核酸酶分子的比例可为约1:10-约10:1。在各个实施方案中,供体多核苷酸与锌指核酸酶分子的比例可为约1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。在一个实施方案中,所述比例可为约1:1。
在其中将多于一种靶向内切核酸酶分子和多于一种供体多核苷酸引入细胞中的实施方案中,所述分子可同时或序贯地引入。例如,各自对不同的识别序列特异的靶向内切核酸酶分子以及相应的供体多核苷酸可同时引入。或者,各靶向内切核酸酶分子以及相应的供体多核苷酸可序贯引入。
(d)培养细胞
所述方法还包括将细胞保持在合适的条件下,使得所述靶向内切核酸酶介导的整合可发生。若必要时所述细胞可使用标准程序培养以允许靶向内切核酸酶的表达。标准细胞培养技术描述于例如Santiago 等(2008) PNAS 105:5809-5814;Moehle等(2007) PNAS 104:3055-3060;Urnov等(2005) Nature 435:646-651和Lombardo等(2007) Nat.Biotechnology 25:1298-1306。本领域的技术人员理解的是用于培养细胞的方法为本领域已知并且可以且会视细胞类型而变化。在所有情况下可使用常规优化,以确定用于特定细胞类型的最佳技术。
在其中细胞为单细胞胚胎的实施方案中,所述胚胎可在体外(例如,在细胞培养物中)培养。典型地,所述胚胎在合适的温度下和含有必需的O2/CO2比例的合适培养基中培养以允许锌指核酸酶的表达。培养基的合适的非限制性实例包括M2、M16、KSOM、BMOC和HTF培养基。技术人员应理解的是培养条件可以并且会视胚胎的种类而变化。在所有情况下可使用常规优化,以确定用于胚胎的特定种类的最佳培养条件。在一些实例中,所述胚胎还可通过将胚胎转移至雌性宿主的子宫中在体内培养。一般而言,所述雌性宿主来自与所述胚胎相同或相似的物种。优选地,所述雌性宿主为假孕的。制备假孕雌性宿主的方法为本领域已知。此外,将胚胎转移至雌性宿主的方法是已知的。体内培养胚胎允许胚胎发育并且可导致来源于胚胎的动物的活产。
在所述方法的该步骤中,所述靶向内切核酸酶(其在一些情况下表达自被引入的核酸)识别、结合并切割染色体中的靶序列。通过所述靶向内切核酸酶引入的双链断裂经由与供体多核苷酸的同源重组而得以修复,使得所述供体多核苷酸的标签序列被符合读框地整合至染色***置。所述供体多核苷酸可被物理地整合,或者所述供体多核苷酸可用作用于修复断裂的模板,引起所述标签序列以及所述供体多核苷酸的上游序列和下游序列的全部或部分整合至染色体。技术人员应理解的是,培养细胞的方法为本领域已知的并且可以且会视细胞类型而变化。在所有情况下可使用常规优化以确定用于特定细胞类型的最佳技术。
(e)多重整合
上述发明的另外的实施方案包含连续地进行本发明的方法,使得形成带有多于一个靶定整合的细胞,使得标记多于一种内源蛋白。例如,具有第一靶定整合的细胞可接着用于本发明的方法中以产生第二靶定整合。可重复同一过程以产生具有三个、四个、五个、六个、七个、八个、九个、十个或多于十个靶定整合的细胞。
或者,具有多重整合的细胞可通过引入多于一种靶向内切核酸酶并引入相应数目的供体多核苷酸来形成,各种靶向内切核酸酶对整合的独特位点特异。各个供体多核苷酸可包含待整合的核酸序列和与如以上所详述的整合的染色***点同源的上游序列和下游序列。注射进细胞的靶向内切核酸酶和相应供体多核苷酸的数目可为两种、三种、四种、五种或多于五种。
III.标记内源蛋白的试剂盒
本公开内容还包括用于监测细胞中至少一种内源蛋白的定位的试剂盒,所述试剂盒包含具有至少一个标签序列的细胞,所述至少一个标签序列被符合读框地整合至编码内源蛋白的染色体序列中,使得所述细胞表达至少一种被标记的内源蛋白。所述细胞可为哺乳动物细胞。优选地,所述细胞为人细胞。所述人细胞可为选自以下的细胞系细胞:人U2OS细胞、人MCF10A、人SKOV3或人iPS。所述被标记的内源蛋白可选自微管蛋白、肌动蛋白、核纤层蛋白、HER2和HMGA。或者,所述试剂盒可表达至少一种标记的选自表A所列的那些的内源蛋白。在优选的实施方案中,所述内源蛋白的标签可为选自以下的荧光蛋白:绿色荧光蛋白、蓝色荧光蛋白、青色荧光蛋白、黄色荧光蛋白、橙色荧光蛋白和红色荧光蛋白。示例性标签为绿色荧光蛋白和红色荧光蛋白。
定义
除非另外定义,否则本文所用的所有技术术语和科学术语具有本发明所属领域的技术人员通常理解的含义。以下引用提供技术人员本发明所用的许多术语的普遍定义:Singleton等, Dictionary of Microbiology and Molecular Biology (第二版 1994);The Cambridge Dictionary of Science and Technology (Walker编辑, 1988);TheGlossary of Genetics, 第五版, R. Rieger等(编辑), Springer Verlag (1991)以及Hale和Marham, The Harper Collins Dictionary of Biology (1991)。除非另有规定,否则本文所用的以下术语具有赋予其的含义。
当介绍本公开内容或其优选实施方案的要素时,冠词“一种”、“一个”、“所述”和“该”意指存在一个或多个要素。术语“包括”、“包含”和“具有”意味着包括性的并且意指可存在除列出要素之外的其它要素。
本文所用“基因”是指编码基因产物的DNA区(包含外显子和内含子),以及调节所述基因产物产生的所有DNA区,无论此类调节序列是否与编码序列和/或转录序列邻接。因此,基因包括但并不一定限于启动子序列、终止子、翻译调节序列(例如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。
“异源蛋白”是对于目标细胞或有机体并非天然的(即,外来的)蛋白。
术语“核酸”和“多核苷酸”是指呈线性或环状构象和呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。对于本公开内容的目的,就聚合物的长度而言这些术语并不应理解为限制。所述术语可包含天然核苷酸的已知类似物以及在碱基、糖和/或磷酸酯部分(或例如硫代磷酸酯骨架)被修饰的核苷酸。一般而言,特定核苷酸的类似物具有相同的碱基配对特异性,即,A的类似物可与T碱基配对。
术语“多肽”和“蛋白”可互换用于指代氨基酸残基的聚合物。
术语“重组”是指遗传信息在两个多核苷酸之间的交换过程。对于本公开内容的目的,“同源重组”是指例如在细胞的双链断裂的修复期间发生的此类交换的专化形式。该过程需要两个多核苷酸之间的序列相似性,将“供体”或“交换”分子用于“靶”分子(即经历双链断裂的那个分子)的模板修复,以及不同地被称作“非交换型基因转换”或“短道基因转换”,因为其导致遗传信息从供体向靶的转移。在不被任何特定理论限制的情况下,此类转移可涉及异源双链DNA的错配校正(所述异源双链DNA在断裂的靶和供体之间形成),和/或“合成依赖性链退火”(其中所述供体用于重新合成将成为靶的一部分的遗传信息),和/或相关过程。此类专化同源重组往往导致靶分子中序列的改变,使得所述供体多核苷酸中序列的部分或全部掺入靶多核苷酸中。
术语“序列同一性”是指其中两个核苷酸序列不变(即两个序列在相同位置具有相同的核苷酸)的程度。序列同一性通常表示为百分比。在序列和长度方面相同的两个核苷酸序列具有100%的序列同一性。
本文所用术语“靶位点”或“靶序列”是指这样的核酸序列,其限定待编辑的染色体序列的一部分,并且锌指核酸酶经改造以识别并结合该核酸序列,条件是存在用于结合的充足条件。
用于确定核酸和氨基酸的序列同一性的技术为本领域已知。典型地,此类技术包括确定基因的mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并将这些序列与第二核苷酸或氨基酸序列比较。还可以该方式确定并比较基因组序列。一般而言,同一性是指两个多核苷酸或多肽序列分别的精确的核苷酸与核苷酸对应性或氨基酸与氨基酸对应性。两个或更多个序列(多核苷酸或氨基酸)可通过确定其同一性百分比来比较。两个序列(无论核酸或氨基酸的序列)的同一性百分比,为两个比对序列之间的精确匹配的数目除以较短序列的长度,并乘以100。核酸序列的近似比对由Smith和Waterman, Advances in AppliedMathematics 2:482-489 (1981)的局部同源性算法提供。该算法可通过使用由Dayhoff,Atlas of Protein Sequences and Structure, M. O. Dayhoff编, 5增刊 3:353-358,National Biomedical Research Foundation, Washington, D.C., USA开发并由Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)归一化的打分矩阵而应用于氨基酸序列。确定序列同一性百分比的该算法的示例性工具由Genetics Computer Group(Madison, Wis.)提供于“BestFit”实用应用中。计算序列之间的同一性百分比或相似性的其它合适的程序一般在本领域中为已知的,例如,另一个比对程序是BLAST,其使用默认参数。例如,BLASTN和BLASTP可通过使用下面的默认参数来使用:遗传密码=标准;过滤器=无;链=两者;截止=60;期望=10;矩阵=BLOSUM62;描述=50个序列;排序=高分;数据库=非冗余的,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+Swiss蛋白+Spupdate+PIR。这些程序的细节可见于GenBank网站。关于本文所述的序列,序列同一性的所需程度的范围为约80%至100%以及其之间的任何整数值。通常,序列之间的同一性百分比为至少70-75%、优选80-82%、更优选85-90%、甚至更优选92%、仍更优选95%和最优选98%序列同一性。。
或者,多核苷酸之间的序列相似性的程度可通过如下确定:在允许享有一定程度序列同一性的区之间形成稳定双链体的条件下杂交多核苷酸,随后用单链特异性的核酸酶消化,并确定消化片段的大小。当如使用以上方法所确定的,在分子的限定长度内序列表现出至少约70%-75%,优选80%-82%,更优选85%-90%,甚至更优选92%,还更优选95%并且最优选98%序列同一性时,两个核酸或两个多肽序列为彼此基本相似的。本文所用的基本相似还指对特定的DNA或多肽序列显示出完全同一性的序列。基本相似的DNA序列可在例如如对该特定***限定的严格条件下的Southern杂交实验中鉴定。限定合适的杂交条件在本领域的技术之内。参见,例如,Sambrook等,见上文;Nucleic Acid Hybridization: A PracticalApproach, 编者B. D. Hames和S. J. Higgins, (1985) Oxford; Washington, D.C.;IRL Press)。
两个核酸片段的选择性杂交可如下确定。两个核酸分子之间的序列同一性的程度影响此类分子之间杂交事件的效率和强度。部分相同的核酸序列可至少部分抑制完全相同序列与靶分子的杂交。完全相同序列的杂交的抑制可使用本领域熟知的杂交测定来评价(例如,Southern (DNA)印迹、Northern (RNA)印迹、溶液杂交等,参见Sambrook等,Molecular Cloning: A Laboratory Manual, 第二版, (1989) Cold Spring Harbor,N.Y.)。这类测定可用不同程度的选择性来进行,例如使用从低严格性到高严格性变化的条件。若应用低严格性的条件,则非特异性结合的缺乏可利用第二探针来评价,所述第二探针甚至缺少部分程度的序列同一性(例如,与靶分子有少于约30%序列同一性的探针),使得在不存在非特异性结合事件的情况下,所述第二探针不会与靶标杂交。
当运用基于杂交的检测***时,选择与参考核酸序列互补的核酸探针,并接着通过选择合适条件,使探针与参考序列彼此选择性地杂交或结合以形成双链体分子。在中度严格性的杂交条件下能选择性地与参考序列杂交的核酸分子典型地在一定条件下杂交,所述条件允许检测与选定核酸探针的序列有至少约70%序列同一性的、长度为至少约10-14个核苷酸的靶核酸序列。严格的杂交条件典型地允许检测与选定核酸探针的序列有大于约90-95%的序列同一性的、长度为至少约10-14个核苷酸的靶核酸序列。当探针和参考序列有特定程度的序列同一性时,可如本领域已知地来确定可用于探针/参考序列杂交的杂交条件(参见,例如Nucleic Acid Hybridization: A Practical Approach, 编者B. D. Hames和S. J. Higgins, (1985) Oxford; Washington, D.C.; IRL Press))。杂交的条件为本领域的技术人员所熟知。
杂交严格性是指杂交条件不利于包含错配核苷酸的杂合体的形成的程度,更高的严格性与不匹配杂合体的较低容许限度相关。影响杂交严格性的因素为本领域的技术人员熟知并且包括但不限于:温度、pH、离子强度和有机溶剂(例如甲酰胺和二甲基亚砜)的浓度。如本领域的技术人员已知,杂交严格性通过较高的温度、较低的离子强度和较低的溶剂浓度来增加。关于杂交的严格性条件,本领域熟知的是,可应用许多同等条件以通过改变例如以下因素来建立特定的严格性:序列的长度和性质、不同序列的碱基组成、盐和其它杂交溶液组分的浓度、杂交溶液中存在或不存在阻断剂(例如,葡聚糖硫酸酯和聚乙二醇)、杂交反应温度和时间参数以及不同的洗涤条件。杂交条件的具体组合可依据本领域中的标准方法来选择(参见,例如,Sambrook等, Molecular Cloning: A Laboratory Manual,第二版,(1989) Cold Spring Harbor, N.Y.)。
实施例
包含以下实施例以表明本发明的优选实施方案。
实施例1:标记内源α-微管蛋白同种型1B蛋白
将内源α-微管蛋白同种型1B蛋白利用ZFN诱导的同源重组用GFP进行标记。简而言之,ZFN用于将双链断裂引入编码α-微管蛋白同种型1B的染色体区中,所述α-微管蛋白同种型1B由TUBA1B基因座编码。双链断裂诱导与供体多核苷酸的同源重组并导致GFP编码区整合至TUBA1B基因座染色体内,所述供体多核苷酸包含被与TUBA1B基因座染色体区同源的核酸序列侧接的GFP编码序列。构建供体多核苷酸以将GFP标签与α-微管蛋白同种型1B编码序列符合读框地融合,从而产生在N端用GFP标记的蛋白。GFP标记的α-微管蛋白同种型1B蛋白在内源微管蛋白启动子的控制下表达。
针对标签向TUBA1B靶位点中的靶定整合设计一对ZFN。关于更多信息参见Science(2009)325:433,通过引用以其整体结合于本文中。ZFN处理的细胞池中靶定ZFN对双链断裂产生的频率通过利用Cel-1核酸酶测定来确定。该测定检测靶基因座的等位基因,其因ZFN诱导的DNA双链断裂的非同源末端连接(NHEJ)介导的不完全修复所致而偏离野生型。来自ZFN-处理的细胞池的靶定区域的PCR扩增产生野生型扩增子和突变型扩增子的混合物。该混合物的解链和再退火引起野生型等位基因和突变型等位基因的异源双链体之间形成错配。错配位点处形成的DNA“气泡”被检验者(surveyor)核酸酶Cel-1切割,并且切割产物可通过凝胶电泳解析。切割产物相对于亲本条带的相对强度是异源双链体的Cel-1切割水平的衡量。其转而反映了内源靶基因座的ZFN介导的切割频率,该内源靶基因座随后通过NHEJ经历不完全修复。对于用于标记α-微管蛋白同种型1B蛋白的ZFN对,设计了一种结合5’CTTCGCCTCCTAATC 3’(SEQ ID NO:1)序列的ZFN,设计了另一种结合5’ CACTATGGTGAGTAA3’(SEQ ID NO:2)序列的ZFN (图1A)。接着利用已知的分子生物学技术产生编码ZFN对的加帽的聚腺苷腺化mRNA。在结合时,ZFN对在识别位点之间的CCTAGC染色体序列中引入双链断裂(图1A和图1B)以诱导同源重组。
构建质粒(图2)作为用于将GFP标签靶定整合至U2OS人细胞系的TUBA1B基因座内的多核苷酸供体。该质粒包含GFP编码序列,所述GFP编码序列被通过ZFN对引入的切割位点上游和下游的1Kb和700 碱基对的TUBA1B基因座序列侧接(图1C和图1D)。以这样的方式将质粒中的标签序列与TUBA1B基因座的上游和下游融合,所述方式使得当表达TUBA1B基因座时,产生如图1E中所详述的在N端与GFP标签融合的α-微管蛋白同种型1B蛋白。还设计了GFP-微管蛋白融合体使得引入GFP编码序列时,TUBA1B基因座的第一个外显子的剪接信号被保持完整。
U2OS细胞中微管蛋白的标记
将供体质粒和编码ZFN的RNA对转染至U2OS、A549、K562、HEK293、MCF10a或HEK293T细胞中。核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。在37℃和30℃下进行的接头PCR用于确认供体DNA整合至微管蛋白TUBA1B基因座中。序列分析确认了GFP2序列被整合至U2OS细胞中的TUBA1B基因座中,如图3 (SEQ ID NO:4)所示。U2OS细胞的TUBA1B区中RFP序列的确认整合在图4 (SEQ ID NO: 5)中示出。
利用侧接右边接头的引物的PCR分析确认整合。为此,将100 ng模板DNA在25 μl反应混合物中扩增(26个循环的95℃,5分钟;95℃,30秒;51℃,30秒;70℃,1.1分钟;70℃,7分钟;4℃,保持)。图5显示了包含在大小上指示GFP整合的PCR片段的十四个细胞克隆。接着用荧光显微术显现GFP标记的α-微管蛋白同种型1B蛋白的U2OS细胞(图6A-图6C)、A549细胞(图6D-图6E)、K562细胞(图6F)和HEK293细胞(图6G-图6H)。
标记MCF10a细胞系中的微管蛋白
构建质粒(图7)作为用于RFP标签靶定整合至MCF10a人细胞系的TUBA1B基因座内的多核苷酸供体。MCF10a细胞的TUBA1B基因座内RFP标签的整合通过利用以下微管蛋白引物的基因组PCR和接头PCR来验证:5’ CCCCTCCGCAGCCGCTACT 3’ (SEQ ID NO:6; tub80U)和5’GGACCGCACCCAGGACACAGT 3’ (SEQ ID NO:7; tub511L)。基因组PCR和DNA印迹表明在数个克隆中RFP标签整合至TUBA1B内(图8)。确认标签序列整合至MCF10a 细胞系的TUBA1B基因座中的序列分析在图9 (SEQ ID NO: 8)中示出。选择转染的MCF10a的克隆5用于进一步的验证(图10)。在RFP整合的Jumpstart PCR验证中:扩增95 ng的基因组DNA (MCF10a细胞的野生型和克隆5,以及U2OS细胞的野生型和克隆9,5) (35X, 在69℃退火并在72℃延伸,利用tub80U引物和tub522L引物)。转染的MCF10a克隆5经确认具有整合序列(参见图10)。MCF10a克隆5的左边接头和右边接头的大小用RFP-特异性引物和微管蛋白-特异性引物确认,并发现分别为452个碱基对和408个碱基对的预期大小(图11)。RFP-微管蛋白的表达通过蛋白印迹确认(图12)。印迹用抗RFP抗体或抗微管蛋白抗体探测。还用荧光显微术观察RFP的表达并且观察到其与内源TUBA1B表达共定位(图13)。将转染的MCF10a细胞的生长特征与亲本细胞系对比。转染的MCF10a细胞的倍增时间是亲本细胞系倍增时间的+/-20%。评价了转染的MCF10a细胞的表型稳定性。观察到在8周和16次***后,99%的细胞保留了RFP信号(表1)。荧光显微术确认了MCF10a克隆5细胞中RFP-标记的微管蛋白的表达(图14)。
实施例2:尝试标记由STAT3编码的信号转导及转录激活蛋白3
产生GFP或RFP标记的由STAT3编码的信号转导及转录激活蛋白3的尝试并不成功。产生了包含上游和下游STAT3基因座序列的供体质粒,所述上游和下游STAT3基因座序列侧接编码与信号转导蛋白N端融合的GFP或RFP的多核苷酸(图15)。如以上实施例中所述设计ZFN。设计了一种结合5’ AGCTACAGCAGCTTG 3’ (SEQ ID NO:9)序列的ZFN,设计了另一种结合构成STAT3基因座的5’ CGGTACCTGGAGCAG 3’ (SEQ ID NO:10)序列的ZFN (图16)。上述的Cel-1测定用于确认ZFN对在合适的位点有效切割STAT3基因座(图17)。
将供体质粒和编码ZFN的RNA对(图18)转染到细胞中。荧光激活细胞分选(FACS)分析显示没有检测到荧光信号,因此靶定整合并不成功(图19)。通过接头PCR分析确认了这些结果,该分析没有检测到STAT3基因座内GFP的任何靶定整合,但检测到编码β-肌动蛋白的ACTB基因座处编码GFP和RFP的标签序列的靶定整合(图20)。
因此,尽管设计的ZFN对能将双链断裂引入正确的染色***置内,但未实现GFP标签的整合。
实施例3:尝试标记由MAPRE3编码的微管相关蛋白RP/EB家族成员3
产生GFP标记的由MAPRE3编码的微管相关蛋白RP/EB家族成员3的尝试并不成功。
首先,尝试在N端标记微管相关蛋白。如上文实施例1中所述设计多个ZFN以在微管相关蛋白的N端整合标签序列。发现了在MAPRE3 N端附近成功切割染色体DNA的ZFN (对6/8和16/17;图22和表2)。但是,这些ZFN对无一在适合产生所需标记的融合蛋白的位置上切割染色体。
由于在N端标记微管相关蛋白并不成功,接着尝试在C端标记该蛋白。设计了多个ZFN对以在微管相关蛋白的C端整合标签序列。作为对照,还设计了ZFN对以在核纤层蛋白的N端整合标签序列(图23和表4)。发现了一种在MAPRE3 C端或其附近成功切割染色体DNA的ZFN对(对31/32;图23和表3)。在该对ZFN中,设计了一种结合5’ TTCCTCTCTCTCCCAC 3’(SEQ ID NO:11)序列的ZFN,并设计了另一种结合构成MAPRE3基因座的5’AGGAAGGATTCGCAC 3’ (SEQ ID NO:12)序列的ZNF。
产生包含侧接编码GFP的多核苷酸的上游和下游MAPRE3基因座序列的供体质粒(图21)。将供体质粒和编码ZFN的RNA 的31/32对转染到细胞中,接头PCR显示GFP标签可能***至MAPRE3基因座中(图24)。但是,FACS分析显示没有检测到荧光信号,因此靶定整合并不成功(图25)。
实施例4:标记内源β-肌动蛋白
将内源β-肌动蛋白利用ZFN诱导的同源重组用GFP进行标记。简而言之,ZFN用于将双链断裂引入编码由ACTB基因座编码的β-肌动蛋白的染色体区中。双链断裂诱导与供体多核苷酸的同源重组并导致GFP编码区整合至ACTB基因座染色体内,所述供体多核苷酸包含被与ACTB基因座染色体区同源的核酸序列侧接的GFP编码序列。构建供体多核苷酸(图28)以将GFP标签与β-肌动蛋白编码序列符合读框地整合(图26,“v.2”),从而产生在N端用GFP标记的蛋白(图26D)。GFP标记的β-肌动蛋白在内源肌动蛋白启动子的控制下表达。
如上详述地,针对ACTB靶位点内标签的靶定整合设计ZFN对。对于用于标记β-肌动蛋白的ZFN对,设计了一种结合5’ GTCGTCGACAACGGCTCC 3’ (SEQ ID NO:13)序列的ZFN,并设计了另一种结合5’ TGCAAGGCCGGCTTCGCGG 3’ (SEQ ID NO:14)序列的ZFN (图26A)。在结合时,ZFN对将双链断裂引入识别位点之间的GGCATG染色体序列中(图26A和图26B)以诱导同源重组。接着利用已知的分子生物学技术产生编码ZFN对的加帽的聚腺苷腺化mRNA。
ZFN处理的细胞池中靶定ZFN对双链断裂产生的频率通过利用Cel-1核酸酶测定来确定(图27)。该测定检测靶基因座的等位基因,其因ZFN诱导的DNA双链断裂的非同源末端连接(NHEJ)介导的不完全修复所致而偏离野生型。来自ZFN-处理的细胞池的靶定区域的PCR扩增产生野生型扩增子和突变型扩增子的混合物。该混合物的解链和再退火引起野生型等位基因和突变型等位基因的异源双链体之间形成错配。错配位点处形成的DNA“气泡”被检验者核酸酶Cel-1切割,并且切割产物可通过凝胶电泳解析。切割产物相对于亲本条带的相对强度是异源双链体的Cel-1切割水平的衡量。其转而反映了内源靶基因座的ZFN介导的切割频率,该内源靶基因座随后通过NHEJ经历不完全修复。
构建质粒(图28)作为用于将GFP标签靶定整合至人细胞系的ACTB基因座中的多核苷酸供体。该质粒包含GFP编码序列,所述GFP编码序列被通过ZFN对引入的切割位点上游和下游的861个核苷酸和593个核苷酸的ACTB基因座序列侧接(图26C)。以这样的方式将质粒中的标签序列与ACTB基因座的上游序列和下游序列融合,所述方式使得当表达ACTB基因座时,产生如图26D中详述的在N端与GFP标签融合的β-肌动蛋白。还设计了GFP-肌动蛋白融合体使得引入GFP编码序列时,ACTB基因座的第一个外显子的剪接信号被保持完整。
将供体质粒和编码ZFN的RNA对转染至细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。利用荧光显微术显现GFP标记的β-肌动蛋白(图29)。U2OS细胞中整合了GFP2的ACTB基因座的确认序列在图30 (SEQID NO:16)中示出。U2OS细胞中整合了RFP的ACTB基因座的确认序列在图31 (SEQ ID NO:17)中示出。
实施例5:利用2A肽的GFP标记的β-肌动蛋白
还将β-肌动蛋白在N端用GFP标记,但同时用具有备选密码子使用的核酸序列代替编码β-肌动蛋白的前15个氨基酸的核酸序列。
为了在ZFN切割位点附近整合标签序列(图26, “v.1”)(这会产生与GFP翻译性融合的全长β-肌动蛋白),得到了一种新的供体质粒,其中β-肌动蛋白的前15个氨基酸被改变(图32)。供体质粒包含侧接编码与GFP融合的2a肽的多核苷酸的上游和下游ACTB基因座序列,该GFP转而通过3个丙氨酸氨基酸残基接头融合至由备选密码子编码的β-肌动蛋白的前15个氨基酸(图33)。2a肽的共翻译切割去除了由新密码子编码的β-肌动蛋白的前15个氨基酸,产生在N端用GFP标记的β-肌动蛋白(图26D)。
ZFN如实施例4中所述。将供体质粒和编码ZFN的RNA对转染至细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。荧光显微术用于确认GFP标记的β-肌动蛋白的表达(图29)。
实施例6:标记内源核纤层蛋白B1蛋白
内源核纤层蛋白B1蛋白利用ZFN诱导的同源重组用GFP进行标记。简而言之,ZFN用于将双链断裂引入编码由LMNB1基因座编码的核纤层蛋白B1的染色体区中。双链断裂诱导与供体多核苷酸的同源重组并导致GFP编码区整合至染色体内,所述供体多核苷酸包含被与LMNB1基因座染色体区同源的核酸序列侧接的GFP编码序列。构建供体多核苷酸以将GFP标签与核纤层蛋白B1编码序列符合读框地融合,从而产生在N端标记了GFP的蛋白。GFP标记的核纤层蛋白B1蛋白在内源核纤层蛋白启动子的控制下表达。
如上所述设计ZFN对。ZFN处理的细胞池中靶定ZFN对双链断裂产生的频率通过利用Cel-1核酸酶测定来确定。对于用于标记核纤层蛋白B1蛋白的ZFN对,设计了一种结合5’CCTCGCCGCCCCGCT 3’ (SEQ ID NO:18)序列的ZFN,并设计了另一种结合5’GCCGCCCGCCATGGCG 3’ (SEQ ID NO:19)序列的ZFN (图34A)。在结合时,ZFN对将双链断裂引入识别位点之间的GTCTCC染色体序列中(图34A和图34B)以诱导同源重组。接着利用已知的分子生物学技术产生编码ZFN对的加帽的聚腺苷腺化mRNA。
构建质粒作为用于将GFP标签靶定整合至U2OS人细胞系的LMNB1基因座中的多核苷酸供体。该质粒包含GFP编码序列,所述GFP编码序列被通过ZFN对引入的切割位点上游和下游的633Kb和629个碱基对的LMNB1基因座序列侧接(图34C和图34D)。以这样的方式将质粒中的标签序列与LMNB1基因座的上游和下游融合,所述方式使得当表达LMNB1基因座时,产生如图34E中详述的在N端融合GFP标签的核纤层蛋白B1蛋白。
将供体质粒和编码ZFN的RNA对转染至细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。在37℃和30℃下进行的接头PCR用于确认供体DNA整合至核纤层蛋白LMNB1基因座中。接着用荧光显微术显现GFP标记的核纤层蛋白B1蛋白(图35)。U2OS细胞的核纤层蛋白编码区中GFP2的整合位点的确认序列在图36 (SEQ ID NO:21)中示出。
还将包含RFP编码序列和侧接核纤层蛋白序列的供体质粒以及编码ZFN的RNA对转染至iPS细胞中,iPS细胞为自成纤维细胞或其它细胞类型产生的诱导性多能干细胞。包含RFP-标记的核纤层蛋白的iPS细胞的图像在图37中示出。
实施例7:标记内源HER2蛋白
内源HER2蛋白利用ZFN诱导的同源重组用GFP进行标记。简而言之,ZFN用于将双链断裂引入编码由ERBB2基因基因座编码的HER2的染色体区中。双链断裂诱导与供体多核苷酸的同源重组并导致GFP编码区整合至染色体内,所述供体多核苷酸包含被与ERBB2基因座染色体区同源的核酸序列侧接的GFP编码序列。构建供体多核苷酸以将GFP标签与HER2编码序列符合读框地融合,从而产生N端标记了GFP的蛋白。GFP标记的HER2蛋白在内源ERBB2启动子的控制下表达。
如上所述设计ZFN对。通过使用Cel-1核酸酶测定来确定ZFN处理的细胞池中靶定ZFN对双链断裂产生的频率。对于用于标记HER2蛋白的ZFN对,设计了一种结合5’TACCTGGGTCTGGAC 3’ (SEQ ID NO:22)序列的ZFN,并设计了另一种结合5’AGTGTGAACCAGAAGGCC 3’ (SEQ ID NO:23)序列的ZFN。在结合时,ZFN对将双链断裂引入识别位点之间的GTGCC染色体序列中(图38)以诱导同源重组。接着利用已知的分子生物学技术产生编码ZFN对的加帽的聚腺苷腺化mRNA。
构建质粒作为用于将GFP标签靶定整合至ERBB2基因座内的多核苷酸供体(图39)。以这样的方式将质粒中的标签序列与ERBB2基因座的上游和下游融合,所述方式使得当表达ERBB2基因座时,产生N端融合了GFP标签的HER2蛋白。
将供体质粒和编码ZFN的RNA对转染至SKOV3细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。在37℃和30℃下进行的接头PCR用于确认供体DNA被整合至转染的SKOV3细胞中的ERBB2基因座中(图40)。接着用荧光显微术显现GFP标记的HER2蛋白(图41)。
实施例8:标记内源HMGA蛋白
HMGA蛋白利用ZFN诱导的同源重组用GFP进行标记。简而言之,ZFN用于将双链断裂引入编码由HMGA1基因座编码的HMGA的染色体区中。双链断裂诱导与供体多核苷酸的同源重组并导致GFP编码区整合至染色体中,所述供体多核苷酸包含被与HMGA1基因座染色体区同源的核酸序列侧接的GFP编码序列。构建供体多核苷酸以将GFP标签与HMGA1编码序列符合读框地融合,从而产生N端标记了GFP的蛋白。GFP标记的HMGA1蛋白在内源HMGA1启动子的控制下表达。
如上所述设计ZFN对以标记内源HMG1蛋白。设计了一种结合5’CACACCAACAACTGCCCA 3’ (SEQ ID NO:25)序列的ZFN,并设计了另一种结合5’GGAGAAGGAGGAAGA 3’ (SEQ ID NO:26)序列的ZFN (图42)。在结合时,ZFN对将双链断裂引入识别位点之间的CCTCACA染色体序列中(图44)以诱导同源重组。接着利用已知的分子生物学技术产生编码ZFN对的加帽的聚腺苷腺化mRNA。
构建质粒作为用于将GFP标签靶定整合至HMGA1基因座内的多核苷酸供体(图43)。该质粒包含GFP编码序列,所述GFP编码序列被通过ZFN对引入的切割位点上游和下游的806个碱基对和747个碱基对的HMGA1基因座序列侧接(图43)。以这样的方式将质粒中的标签序列与HMGA1基因座的上游和下游融合,所述方式使得当表达HMGA1基因座时,产生N端融合了GFP标签的HMGA蛋白。
将供体质粒和编码ZFN的RNA对转染至U2OS细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞培养并分析单独的细胞克隆。基因组PCR和DNA印迹表明选定克隆中标签序列整合在HMGA1基因座内(图44A和图44B)。序列分析确认了在靶定染色体区内的整合(图45) (SEQ ID NO: 28)。接着用荧光显微术显现GFP标记的HMGA1蛋白(图46)。
序 列 表
<110> 西格马-奥尔德里奇有限责任公司
MALKOV, Dmitry
ZENSER, Nathan
VASSAR, Deborah L
ZHANG, Fan
ZHANG, Hongyi
<120> 产生内源标记的蛋白的方法
<130> 047497-424729
<150> US 61/323,702
<151> 2010-04-13
<150> US 61/323,719
<151> 2010-04-13
<150> US 61/323,698
<151> 2010-04-13
<150> US 61/367,017
<151> 2010-07-23
<150> US 61/390,668
<151> 2010-10-07
<150> US 61/408,856
<151> 2010-11-01
<150> US 61/431,957
<151> 2011-01-12
<160> 29
<170> PatentIn版本3.5
<210> 1
<211> 15
<212> DNA
<213> 人类(Homo sapiens)
<400> 1
cttcgcctcc taatc 15
<210> 2
<211> 15
<212> DNA
<213> 人类
<400> 2
cactatggtg agtaa 15
<210> 3
<211> 80
<212> DNA
<213> 人类
<400> 3
cacaccaaca actgcccacc tcacaggaga aggaggaaga ggagggcatc tcgcaggagt 60
cctcggagga ggagcagtga 80
<210> 4
<211> 1197
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
ccgcccctcc gcagccgcta cttaagaggc tccagcgccg gccccgccct agtgcgttac 60
ttacctcgac tcttagcttg tcggggacgg taaccgggac ccggtgtctg ctcctgtcgc 120
cttcgcctcc taatccctag ccactatggg taccgcaagc gggggcgagg agctgttcgc 180
cggcatcgtg cccgtgctga tcgagctgga cggcgacgtg cacggccaca agttcagcgt 240
gcgcggcgag ggcgagggcg acgccgacta cggcaagctg gagatcaagt tcatctgcac 300
caccggcaag ctgcccgtgc cctggcccac cctggtgacc accctctgct acggcatcca 360
gtgcttcgcc cgctaccccg agcacatgaa gatgaacgac ttcttcaaga gcgccatgcc 420
cgagggctac atccaggagc gcaccatcca gttccaggac gacggcaagt acaagacccg 480
cggcgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcaagga 540
cttcaaggag gacggcaaca tcctgggcca caagctggag tacagcttca acagccacaa 600
cgtgtacatc cgccccgaca aggccaacaa cggcctggag gctaacttca agacccgcca 660
caacatcgag ggcggcggcg tgcagctggc cgaccactac cagaccaacg tgcccctggg 720
cgacggcccc gtgctgatcc ccatcaacca ctacctgagc actcagacca agatcagcaa 780
ggaccgcaac gaggcccgcg accacatggt gctcctggag tccttcagcg cctgctgcca 840
cacccacggc atggacgagc tgtacagggc cgctggggat cccactatgg tgagtaagcc 900
gtgcggctcc cggctgcttt cagggaagca gggaaaagcg agccggcggg gcgctggggc 960
cctgtataca gccgggaagg gctggcctca gagccgtccg tttggagggc ggaaaacgag 1020
gcgagaggcc agggcgggag tggtgagacc tcggtgtgtg taaatagcgg gggcccggaa 1080
aggtcgaggg gcgccaggat ttcttctcgg actctggaag ggatgggggg ctcgggctgc 1140
cctccgccgt atccggagct ctcttttgtc gcgtaactgt gtcctgggtg cggtccc 1197
<210> 5
<211> 1198
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
gcccctccgc agccgctact taagaggctc cagcgccggc cccgccctag tgcgttactt 60
acctcgactc ttagcttgtc ggggacggta accgggaccc ggtgtctgct cctgtcgcct 120
tcgcctccta atccctagcc actatgggta ccgcagtgtc taagggcgaa gagctgatta 180
aggagaacat gcacatgaag ctgtacatgg agggcaccgt gaacaaccac cacttcaagt 240
gcacatccga gggcgaaggc aagccctacg agggcaccca gaccatgaga atcaaggtgg 300
tcgagggcgg ccctctcccc ttcgccttcg acatcctggc taccagcttc atgtacggca 360
gcagaacctt catcaaccac acccagggca tccccgactt ctttaagcag tccttccctg 420
agggcttcac atgggagaga gtcaccacat acgaagacgg gggcgtgctg accgctaccc 480
aggacaccag cctccaggac ggctgcctca tctacaacgt caagatcaga ggggtgaact 540
tcccatccaa cggccctgtg atgcagaaga aaacactcgg ctgggaggcc aacaccgaga 600
tgctgtaccc cgctgacggc ggcctggaag gcagaagcga catggccctg aagctcgtgg 660
gcgggggcca cctgatctgc aacttcaaga ccacatacag atccaagaaa cccgctaaga 720
acctcaagat gcccggcgtc tactatgtgg accacagact ggaaagaatc aaggaggccg 780
acaaagagac ctacgtcgag cagcacgagg tggctgtggc cagatactgc gacctcccta 840
gcaaactggg gcacaaactt aatgccgctg gggatcccac tatggtgagt aagccgtgcg 900
gctcccggct gctttcaggg aagcagggaa aagcgagccg gcggggcgct ggggccctgt 960
atacagccgg gaagggctgg cctcagagcc gtccgtttgg agggcggaaa acgaggcgag 1020
aggccagggc gggagtggtg agacctcggt gtgtgtaaat agcgggggcc cggaaaggtc 1080
gaggggcgcc aggatttctt ctcggactct ggaagggatg gggggctcgg gctgccctcc 1140
gccgtatccg gagctctctt ttgtcgcgta actgtgtcct gggtgcggtc cctcgagt 1198
<210> 6
<211> 19
<212> DNA
<213> 人类
<400> 6
cccctccgca gccgctact 19
<210> 7
<211> 19
<212> DNA
<213> 人类
<400> 7
cccctccgca gccgctact 19
<210> 8
<211> 1198
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
gcccctccgc agccgctact taagaggctc cagcgccggc cccgccctag tgcgttactt 60
acctcgactc ttagcttgtc ggggacggta accgggaccc ggtgtctgct cctgtcgcct 120
tcgcctccta atccctagcc actatgggta ccgcagtgtc taagggcgaa gagctgatta 180
aggagaacat gcacatgaag ctgtacatgg agggcaccgt gaacaaccac cacttcaagt 240
gcacatccga gggcgaaggc aagccctacg agggcaccca gaccatgaga atcaaggtgg 300
tcgagggcgg ccctctcccc ttcgccttcg acatcctggc taccagcttc atgtacggca 360
gcagaacctt catcaaccac acccagggca tccccgactt ctttaagcag tccttccctg 420
agggcttcac atgggagaga gtcaccacat acgaagacgg gggcgtgctg accgctaccc 480
aggacaccag cctccaggac ggctgcctca tctacaacgt caagatcaga ggggtgaact 540
tcccatccaa cggccctgtg atgcagaaga aaacactcgg ctgggaggcc aacaccgaga 600
tgctgtaccc cgctgacggc ggcctggaag gcagaagcga catggccctg aagctcgtgg 660
gcgggggcca cctgatctgc aacttcaaga ccacatacag atccaagaaa cccgctaaga 720
acctcaagat gcccggcgtc tactatgtgg accacagact ggaaagaatc aaggaggccg 780
acaaagagac ctacgtcgag cagcacgagg tggctgtggc cagatactgc gacctcccta 840
gcaaactggg gcacaaactt aatgccgctg gggatcccac tatggtgagt aagccgtgcg 900
gctcccggct gctttcaggg aagcagggaa aagcgagccg gcggggcgct ggggccctgt 960
atacagccgg gaagggctgg cctcagagcc gtccgtttgg agggcggaaa acgaggcgag 1020
aggccagggc gggagtggtg agacctcggt gtgtgtaaat agcgggggcc cggaaaggtc 1080
gaggggcgcc aggatttctt ctcggactct ggaagggatg gggggctcgg gctgccctcc 1140
gccgtatccg gagctctctt ttgtcgcgta actgtgtcct gggtgcggtc cctcgagt 1198
<210> 9
<211> 15
<212> DNA
<213> 人类
<400> 9
agctacagca gcttg 15
<210> 10
<211> 15
<212> DNA
<213> 人类
<400> 10
cggtacctgg agcag 15
<210> 11
<211> 16
<212> DNA
<213> 人类
<400> 11
ttcctctctc tcccac 16
<210> 12
<211> 15
<212> DNA
<213> 人类
<400> 12
aggaaggatt cgcac 15
<210> 13
<211> 18
<212> DNA
<213> 人类
<400> 13
gtcgtcgaca acggctcc 18
<210> 14
<211> 19
<212> DNA
<213> 人类
<400> 14
tgcaaggccg gcttcgcgg 19
<210> 15
<211> 47
<212> DNA
<213> 人类
<400> 15
ccagagtacc tgggtctgga cgtgccagtg tgaaccagaa ggccaag 47
<210> 16
<211> 1191
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
ggacgcctcc gaccagtgtt tgccttttat ggtaataacg cggccggccc ggcttccttt 60
gtccccaatc tgggcgcgcg ccggcgcccc ctggcggcct aaggactcgg cgcgccggaa 120
gtggccaggg cgggggcgac ctcggctcac agcgcgcccg gctattctcg cagctcacca 180
tgggatccgg gggcgaggag ctgttcgccg gcatcgtgcc cgtgctgatc gagctggacg 240
gcgacgtgca cggccacaag ttcagcgtgc gcggcgaggg cgagggcgac gccgactacg 300
gcaagctgga gatcaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc 360
tggtgaccac cctctgctac ggcatccagt gcttcgcccg ctaccccgag cacatgaaga 420
tgaacgactt cttcaagagc gccatgcccg agggctacat ccaggagcgc accatccagt 480
tccaggacga cggcaagtac aagacccgcg gcgaggtgaa gttcgagggc gacaccctgg 540
tgaaccgcat cgagctgaag ggcaaggact tcaaggagga cggcaacatc ctgggccaca 600
agctggagta cagcttcaac agccacaacg tgtacatccg ccccgacaag gccaacaacg 660
gcctggaggc taacttcaag acccgccaca acatcgaggg cggcggcgtg cagctggccg 720
accactacca gaccaacgtg cccctgggcg acggccccgt gctgatcccc atcaaccact 780
acctgagcac tcagaccaag atcagcaagg accgcaacga ggcccgcgac cacatggtgc 840
tcctggagtc cttcagcgcc tgctgccaca cccacggcat ggacgagctg tacagggccg 900
gctccggtac cgatgatgat atcgccgcgc tcgtcgtcga caacggcagc ggcatgtgca 960
aggccggctt cgcgggcgac gatgcccccc gggccgtctt cccctccatc gtggggcgcc 1020
ccaggcacca ggtaggggag ctggctgggt ggggcagccc cgggagcggg cgggaggcaa 1080
gggcgctttc tctgcacagg agcctcccgg tttccggggt gggggctgcg cccgtgctca 1140
gggcttcttg tcctttcctt cccagggcgt gatggtgggc atgggtcaga a 1191
<210> 17
<211> 1192
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
ggacgcctcc gaccagtgtt tgccttttat ggtaataacg cggccggccc ggcttccttt 60
gtccccaatc tgggcgcgcg ccggcgcccc ctggcggcct aaggactcgg cgcgccggaa 120
gtggccaggg cgggggcgac ctcggctcac agcgcgcccg gctattctcg cagctcacca 180
tgggatccgt gtctaagggc gaagagctga ttaaggagaa catgcacatg aagctgtaca 240
tggagggcac cgtgaacaac caccacttca agtgcacatc cgagggcgaa ggcaagccct 300
acgagggcac ccagaccatg agaatcaagg tggtcgaggg cggccctctc cccttcgcct 360
tcgacatcct ggctaccagc ttcatgtacg gcagcagaac cttcatcaac cacacccagg 420
gcatccccga cttctttaag cagtccttcc ctgagggctt cacatgggag agagtcacca 480
catacgaaga cgggggcgtg ctgaccgcta cccaggacac cagcctccag gacggctgcc 540
tcatctacaa cgtcaagatc agaggggtga acttcccatc caacggccct gtgatgcaga 600
agaaaacact cggctgggag gccaacaccg agatgctgta ccccgctgac ggcggcctgg 660
aaggcagaag cgacatggcc ctgaagctcg tgggcggggg ccacctgatc tgcaacttca 720
agaccacata cagatccaag aaacccgcta agaacctcaa gatgcccggc gtctactatg 780
tggaccacag actggaaaga atcaaggagg ccgacaaaga gacctacgtc gagcagcacg 840
aggtggctgt ggccagatac tgcgacctcc ctagcaaact ggggcacaaa cttaatgccg 900
gctccggtac cgatgatgat atcgccgcgc tcgtcgtcga caacggcagc ggcatgtgca 960
aggccggctt cgcgggcgac gatgcccccc gggccgtctt cccctccatc gtggggcgcc 1020
ccaggcacca ggtaggggag ctggctgggt ggggcagccc cgggagcggg cgggaggcaa 1080
gggcgctttc tctgcacagg agcctcccgg tttccggggt gggggctgcg cccgtgctca 1140
gggcttcttg tcctttcctt cccagggcgt gatggtgggc atgggtcaga ag 1192
<210> 18
<211> 15
<212> DNA
<213> 人类
<400> 18
cctcgccgcc ccgct 15
<210> 19
<211> 16
<212> DNA
<213> 人类
<400> 19
gccgcccgcc atggcg 16
<210> 20
<211> 37
<212> DNA
<213> 人类
<400> 20
cctcgccgcc ccgctgtctc cgccgcccgc catggcg 37
<210> 21
<211> 1996
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
ccctgagcct ggtccgggaa ccgcccagcc gggagggccg agctgacggt tgcccaaggg 60
ccagatttta aatttacagg cccggccccc gaaccgccga agcgcgctgc ctgctcccca 120
ttggcccatg gtagtcacgt ggaggcgccg gggcgtgccg gccatgttgg ggagtgcggc 180
gccgcggccc gcgccacctc cgccccccgc ggcttgcctc cagcccgccc ctcccggccc 240
tcctcccccc gcccgccgct ccgtgcagcc tgagaggaaa caaagtgctg cgagcaggag 300
acggcggcgg cgcgaaccct gctgggcctc cagtcaccct cgtcttgcat tttcccgcgt 360
gcgtgtgtga gtgggtgtgt gtgttttctt acaaagggta tttcgcgatc gatcgattga 420
ttcgtagttc ccccccgcgc gcctttgccc tttgtgctgt aatcgagctc ccgccatccc 480
aggtgcttct ccgttcctct aaacgccagc gtctggacgt gagcgcaggt cgccggtttg 540
tgccttcggt ccccgcttcg ccccctgccg tcccctcctt atcacggtcc cgctcgcggc 600
ctcgccgccc cgctgtctcc gccgcccgcc atgggatccg ggggcgagga gctgttcgcc 660
ggcatcgtgc ccgtgctgat cgagctggac ggcgacgtgc acggccacaa gttcagcgtg 720
cgcggcgagg gcgagggcga cgccgactac ggcaagctgg agatcaagtt catctgcacc 780
accggcaagc tgcccgtgcc ctggcccacc ctggtgacca ccctctgcta cggcatccag 840
tgcttcgccc gctaccccga gcacatgaag atgaacgact tcttcaagag cgccatgccc 900
gagggctaca tccaggagcg caccatccag ttccaggacg acggcaagta caagacccgc 960
ggcgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcaaggac 1020
ttcaaggagg acggcaacat cctgggccac aagctggagt acagcttcaa cagccacaac 1080
gtgtacatcc gccccgacaa ggccaacaac ggcctggagg ctaacttcaa gacccgccac 1140
aacatcgagg gcggcggcgt gcagctggcc gaccactacc agaccaacgt gcccctgggc 1200
gacggccccg tgctgatccc catcaaccac tacctgagca ctcagaccaa gatcagcaag 1260
gaccgcaacg aggcccgcga ccacatggtg ctcctggagt ccttcagcgc ctgctgccac 1320
acccacggca tggacgagct gtacagggga tctggatcag gtaccgcgac tgcgaccccc 1380
gtgccgccgc ggatgggcag ccgcgctggc ggccccacca cgccgctgag ccccacgcgc 1440
ctgtcgcggc tccaggagaa ggaggagctg cgcgagctca atgaccggct ggcggtgtac 1500
atcgacaagg tgcgcagcct ggagacggag aacagcgcgc tgcagctgca ggtgacggag 1560
cgcgaggagg tgcgcggccg tgagctcacc ggcctcaagg cgctctacga gaccgagctg 1620
gccgacgcgc gacgcgcgct cgacgacacg gcccgcgagc gcgccaagct gcagatcgag 1680
ctgggcaagt gcaaggcgga acacgaccag ctgctcctca agtgagtgct agctggcggc 1740
cgcgttagcg ccaaggaggg gcgggggcgc aaccgcggcg accagctcac cgggttctgc 1800
cgtggggagg gagcagaggc caggatgcac gcgtccttct gaaggaacag ggtctcggtc 1860
tccggaaagg agaaagaatc tagagttcat agcggagcag gggtcgcgga gggggctcga 1920
gctgtagcgc tggggggccg tgatgcccat ttctagattt tggatacccg ctgggacgtg 1980
gtaagtgcgc gcctgg 1996
<210> 22
<211> 15
<212> DNA
<213> 人类
<400> 22
tacctgggtc tggac 15
<210> 23
<211> 18
<212> DNA
<213> 人类
<400> 23
agtgtgaacc agaaggcc 18
<210> 24
<211> 69
<212> DNA
<213> 人类
<400> 24
atggatgatg atatcgccgc gctcgtcgtc gacaacggct ccggcatgtg caaggccggc 60
ttcgcgggc 69
<210> 25
<211> 18
<212> DNA
<213> 人类
<400> 25
cacaccaaca actgccca 18
<210> 26
<211> 15
<212> DNA
<213> 人类
<400> 26
ggagaaggag gaaga 15
<210> 27
<211> 51
<212> DNA
<213> 人类
<400> 27
atggcccaat ggaatcagct acagcagctt gacacacggt acctggagca g 51
<210> 28
<211> 3343
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
ggtctgcccc ccatcactat tgggcatcgg gtgagcactg atgagcattt tggacttagg 60
agatattttc tctaaccctc tagaaaacca ccacaactcc aggaaggaaa ccaaggggca 120
gacccaaaaa actggtaggt gaagaagcag actgctgctt gcctcctggg ctcttttgag 180
ttgagggtgt tgagtacaca gtacctgatg ctatgcaccc cctatggaaa ggctctcctt 240
gacctgctgg gacatcagat tttacagaag tccagagagg ggaaggtacc tggcctgggc 300
tgtgcccatg agaagtgagg ggtcccaggt ataaatcaga ccacatcccc ctgccctgcc 360
ctgccctagt tgtgtgtggg ggtccctccc tctcctgctc ctagaatact cagaacttct 420
aggggagatc ttggaagtca tctagcctgt gtccccctca attagagatg aggaaaggaa 480
gccatagggg gaaggtttgt ccttcctatg agcctctgca gaagagaaac agcgaaggag 540
ctgggccctg ggaggggtcg gtgctggagt tctgatgtga cccaccacac tgcactggag 600
ggcaccatcc aattctgggt ccccaaacag ctggtggaaa ggctcggtgg gctgagtcaa 660
gaagctgcct ctagggggcc actgcagtta gggtcacccc agccttccag ctcctggccc 720
tctcctaccc ccagcctgcc ccctcaaatc cctgaagctg tcattccttg agctgagcca 780
ctgctggggt gggggggtta gggggtgctg ctggccaggc cccaagagtg agtaacagga 840
aacaagttgt tttggagttt gtgcctggca cgggggctgt agccccgtgt ggtgtcccga 900
cattcccgcc cagtgagtga gccccggcgg cacacacttc cccttcctcc ccaccccggc 960
ctagggtcag ccctcggcca ccccggaggg ccagggcacc acagcacagc atctgcccct 1020
gtgggccaag gacctggttc ccctgcaccc accagcgggc tcttgcacct tccagccacc 1080
ccttcccatt tcctccccca gccacctctt cccccacctc ctcttctccc ctagggagtc 1140
agtcacatcc tgaagctcat tgctgccctg agctctgccc tcctgccctc cctgggcctg 1200
ggggccaagg gggcttggct cctggctctg ggtgagagca gcatgtgtgt ggggtttttt 1260
cctcctttta aattcttttt atgaatgaag ccgggccgtg gaggttgctg agtcacccac 1320
acactcagcc ctgactcatc cctcttcagg agagccaggg agtgcaggga gcgggtgggg 1380
ccagcctctg ggggtggaag agggggaccg ggccagagct cacaccaaca actgcccacc 1440
tcacaggaga aggaggaaga ggagggcatc tcgcaggagt cctcggagga ggagcaggga 1500
tctggatcag gtgctagcgg gggcgaggag ctgttcgccg gcatcgtgcc cgtgctgatc 1560
gagctggacg gcgacgtgca cggccacaag ttcagcgtgc gcggcgaggg cgagggcgac 1620
gccgactacg gcaagctgga gatcaagttc atctgcacca ccggcaagct gcccgtgccc 1680
tggcccaccc tggtgaccac cctctgctac ggcatccagt gcttcgcccg ctaccccgag 1740
cacatgaaga tgaacgactt cttcaagagc gccatgcccg agggctacat ccaggagcgc 1800
accatccagt tccaggacga cggcaagtac aagacccgcg gcgaggtgaa gttcgagggc 1860
gacaccctgg tgaaccgcat cgagctgaag ggcaaggact tcaaggagga cggcaacatc 1920
ctgggccaca agctggagta cagcttcaac agccacaacg tgtacatccg ccccgacaag 1980
gccaacaacg gcctggaggc taacttcaag acccgccaca acatcgaggg cggcggcgtg 2040
cagctggccg accactacca gaccaacgtg cccctgggcg acggccccgt gctgatcccc 2100
atcaaccact acctgagcac tcagaccaag atcagcaagg accgcaacga ggcccgcgac 2160
cacatggtgc tcctggagtc cttcagcgcc tgctgccaca cccacggcat ggacgagctg 2220
tacaggtaag gtacctgacc catgcgtgcc gcctgctcct cactggagga gcagcttcct 2280
tctgggactg gacagctttg ctccgctccc accgccccca ccccttcccc aggcccacca 2340
tcaccaccgc ctctggccgc cacccccatc ttccacctgt gccctcacca ccacactaca 2400
cagcacacca gccgctgcag ggctcccatg ggctgagtgg ggagcagttt tcccctggcc 2460
tcagttccca gctccccccg cccacccacg catacacaca tgccctcctg gacaaggcta 2520
acatcccact tagccgcacc ctgcacctgc tgcgtcccca ctcccttggt ggtggggaca 2580
ttgctctctg ggcttttggt ttgggggcgc cctctctgct ccttcactgt tccctctggc 2640
ttcccatagt ggggcctggg agggttcccc tggccttaaa aggggcccaa gccccatctc 2700
atcctggcac gccctactcc actgccctgg cagcagcagg tgtggccaat ggaggggggt 2760
gctggccccc aggattcccc cagccaaact gtctttgtca ccacgtgggg ctcacttttc 2820
atccttcccc aacttcccta gtccccgtac taggttggac agcccccttc ggttacagga 2880
aggcaggagg ggtgagtccc ctactccctc ttcactgtgg ccacagcccc cttgccctcc 2940
gcctgggatc tgagtacata ttgtggtgat ggagatgcag tcacttattg tccaggtgag 3000
gcccaagagc cctgtggccg ccacctgagg tgggctgggg ctgctcccct aaccctactt 3060
tgcttccgcc actcagccat ttccccctcc tcagatgggg caccaataac aaggagctca 3120
ccctgcccgc tcccaacccc cctcctgctc ctccctgccc cccaaggttc tggttccatt 3180
tttcctctgt tcacaaacta cctctggaca gttgtgttgt tttttgttca atgttccatt 3240
cttcgacatc cgtcattgct gctgctacca gcgccaaatg ttcatcctca ttgcctcctg 3300
ttctgcccac gatcccctcc cccaagatac tctttgtggg gaa 3343
<210> 29
<211> 42
<212> DNA
<213> 人类
<400> 29
tgtcgccttc gcctcctaat ccctagccac tatggtgagt aa 42

Claims (13)

1.一种标记至少一种内源蛋白的方法,所述方法包括:
a)将以下物质引入哺乳动物细胞中:(i)至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸,所述靶向内切核酸酶结合靶位点并能切割编码所述内源蛋白的染色体序列中的切割位点;和(ii)至少一种包含标签序列的供体多核苷酸,所述标签序列被上游序列和下游序列侧接,所述上游序列和所述下游序列与所述染色体序列中切割位点的任一侧享有基本的序列同一性;和
(b)将所述细胞保持在这样的条件下,所述条件使得通过所述靶向内切核酸酶在所述切割位点引入的双链断裂通过同源性定向的过程修复,使得所述供体多核苷酸中的标签序列被符合读框地整合至所述编码所述内源蛋白的染色体序列中,使得产生标记的内源蛋白,其中所述内源蛋白选自肌动蛋白、微管蛋白、核纤层蛋白、人表皮生长因子受体2(HER2)和高泳动族A蛋白(HMGA)。
2.权利要求1的方法,其中所述靶向内切核酸酶为锌指核酸酶。
3.权利要求1的方法,其中所述细胞为人U2OS细胞、人MCF10A细胞、人SKOV3细胞或人iPS细胞。
4.权利要求1的方法,其中所述内源蛋白在C端或N端标记。
5.权利要求2的方法,其中所述锌指核酸酶结合与选自SEQ ID NO:13、14、1、2、18、19、22、23、25和26的序列有至少约80%序列同一性的序列。
6.一种哺乳动物细胞,所述细胞包含至少一个被符合读框地整合至编码内源蛋白的染色体序列中的标签序列,使得所述细胞表达至少一种标记的内源蛋白,其中所述内源蛋白选自肌动蛋白、微管蛋白、核纤层蛋白、人表皮生长因子受体2(HER2)和高泳动族A蛋白(HMGA)。
7.权利要求6的细胞,其中所述细胞为人U2OS细胞、人MCF10A细胞、人SKOV3细胞或人iPS细胞。
8.权利要求6的细胞,其中所述内源蛋白在C端或N端标记。
9.权利要求6的细胞,其中所述细胞表达一种或多种荧光标记的内源蛋白。
10.权利要求6的细胞,其中所述细胞通过以下步骤产生:
a)将以下物质引入亲本细胞中:(i)至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸,所述靶向内切核酸酶结合靶位点并能切割编码所述内源蛋白的染色体序列中的切割位点;和(ii)至少一种包含标签序列的供体多核苷酸,所述标签序列被上游序列和下游序列侧接,所述上游序列和下游序列与所述染色体序列中切割位点的任一侧享有基本的序列同一性;和
(b)将所述细胞保持在这样的条件下,所述条件使得通过靶向内切核酸酶在切割位点引入的双链断裂通过同源性定向的过程修复,使得所述供体多核苷酸中的标签序列被符合读框地整合至编码所述内源蛋白的染色体序列中。
11.权利要求10的细胞,其中所述靶向内切核酸酶为锌指核酸酶。
12.权利要求11的细胞,其中所述锌指核酸酶结合与选自SEQ ID NO:13、14、1、2、18、19、22、23、25和26的序列有至少约80%序列同一性的序列。
13.权利要求5的方法或12的细胞,所述序列同一性为约85%、90%、95%、99%或100%。
CN201711044283.XA 2010-04-13 2011-04-13 产生内源标记的蛋白的方法 Pending CN107805278A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US32370210P 2010-04-13 2010-04-13
US32371910P 2010-04-13 2010-04-13
US32369810P 2010-04-13 2010-04-13
US61/323719 2010-04-13
US61/323702 2010-04-13
US61/323698 2010-04-13
US36701710P 2010-07-23 2010-07-23
US61/367017 2010-07-23
US39066810P 2010-10-07 2010-10-07
US61/390668 2010-10-07
US40885610P 2010-11-01 2010-11-01
US61/408856 2010-11-01
US201161431957P 2011-01-12 2011-01-12
US61/431957 2011-01-12
CN2011800291603A CN102971421A (zh) 2010-04-13 2011-04-13 产生内源标记的蛋白的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2011800291603A Division CN102971421A (zh) 2010-04-13 2011-04-13 产生内源标记的蛋白的方法

Publications (1)

Publication Number Publication Date
CN107805278A true CN107805278A (zh) 2018-03-16

Family

ID=44799004

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201711044283.XA Pending CN107805278A (zh) 2010-04-13 2011-04-13 产生内源标记的蛋白的方法
CN201180029129.XA Active CN102959078B (zh) 2010-04-13 2011-04-13 内源启动子在表达异源蛋白中的用途
CN2011800291603A Pending CN102971421A (zh) 2010-04-13 2011-04-13 产生内源标记的蛋白的方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201180029129.XA Active CN102959078B (zh) 2010-04-13 2011-04-13 内源启动子在表达异源蛋白中的用途
CN2011800291603A Pending CN102971421A (zh) 2010-04-13 2011-04-13 产生内源标记的蛋白的方法

Country Status (10)

Country Link
US (5) US20130059388A1 (zh)
EP (2) EP2558574B1 (zh)
JP (2) JP5841996B2 (zh)
KR (2) KR20130054955A (zh)
CN (3) CN107805278A (zh)
BR (1) BR112012026379A2 (zh)
CA (2) CA2795643C (zh)
DK (1) DK2558575T3 (zh)
ES (1) ES2565216T3 (zh)
WO (3) WO2011130345A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114703174A (zh) * 2022-04-12 2022-07-05 中国科学院海洋研究所 快速获得基因型和表型突变的CRISPR/Cas9基因敲除方法及应用

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG187075A1 (en) 2010-07-23 2013-03-28 Sigma Aldrich Co Llc Genome editing using targeting endonucleases and single-stranded nucleic acids
US9012617B2 (en) * 2011-04-11 2015-04-21 The Trustees Of The University Of Pennsylvania Detection reagents for tyrosine kinase activity and methods of use thereof
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
CN105026422B (zh) 2012-03-27 2019-09-27 西安大略大学 Sh2结构域变体
DK2839013T3 (da) * 2012-04-18 2020-09-14 Univ Leland Stanford Junior Ikke-disruptiv-gen-targetering
EP3372679A1 (en) * 2012-10-23 2018-09-12 Toolgen Incorporated Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof
JP2016519652A (ja) 2013-03-14 2016-07-07 カリブー・バイオサイエンシーズ・インコーポレイテッド 核酸ターゲティング核酸の組成物および方法
KR20160135729A (ko) 2014-03-21 2016-11-28 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 뉴클레아제 없는 게놈 편집
CN113150109A (zh) * 2014-04-01 2021-07-23 拜恩科技细胞&基因治疗有限公司 密封蛋白-6特异性免疫受体和t细胞表位
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
EP3268394B1 (en) * 2015-03-13 2020-05-27 University of Maryland, Baltimore Universal antibody-mediated biosensor
CA2999500A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
PT3371314T (pt) * 2015-11-04 2023-08-31 Fate Therapeutics Inc Modificação genómica de células pluripotentes
CN108495928A (zh) * 2015-12-23 2018-09-04 芬兰国家技术研究中心股份公司 用于从细胞获得指示剂信号的方法
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
CN106800602B (zh) * 2017-01-22 2020-05-01 中国科学院生物物理研究所 一种可视化标记基因组位点的方法
WO2018148603A1 (en) * 2017-02-09 2018-08-16 Allen Institute Genetically-tagged stem cell lines and methods of use
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US11932858B2 (en) 2017-12-14 2024-03-19 Donald Danforth Plant Science Center Homologous recombination via transcriptional activation
CA3099385A1 (en) * 2018-05-04 2019-11-07 Sigma-Aldrich Co. Llc Producing recombinant proteins with reduced levels of host cell proteins
JP7233545B2 (ja) * 2018-12-30 2023-03-06 エフ. ホフマン-ラ ロシュ アーゲー 標的タンパク質への検出可能なタグのCRISPR/Cas制御組み込みに基づく細胞の選択方法
WO2021055372A1 (en) * 2019-09-16 2021-03-25 Fred Hutchinson Cancer Research Center Chimeric receptor proteins and uses thereof
CN113684228B (zh) * 2021-10-26 2022-03-11 天九再生医学(天津)科技有限公司 利用内参快速准确表征蛋白质相对丰度的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047805A1 (en) * 2008-08-22 2010-02-25 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7192772B1 (en) * 1988-08-31 2007-03-20 The University Of Florida Research Foundations, Inc. Recombinant cells that highly express chromosomally-integrated heterologous gene
US7090976B2 (en) * 1999-11-10 2006-08-15 Rigel Pharmaceuticals, Inc. Methods and compositions comprising Renilla GFP
US6495664B1 (en) * 1998-07-24 2002-12-17 Aurora Biosciences Corporation Fluorescent protein sensors of post-translational modifications
US6534261B1 (en) * 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6710170B2 (en) * 1999-09-10 2004-03-23 Corixa Corporation Compositions and methods for the therapy and diagnosis of ovarian cancer
US7125660B2 (en) * 2000-09-13 2006-10-24 Archemix Corp. Nucleic acid sensor molecules and methods of using same
AU2002327730A1 (en) * 2001-09-26 2003-04-07 University Of North Carolina At Chapel Hill Variants of alpha-fetoprotein coding and expression sequences
EP2927318B1 (en) * 2003-08-08 2020-05-20 Sangamo Therapeutics, Inc. Methods and compositions for targeted cleavage and recombination
US7402436B2 (en) * 2004-05-03 2008-07-22 City Of Hope Lentiviral vectors for site-specific gene insertion
WO2006017751A2 (en) * 2004-08-02 2006-02-16 Cellumen, Inc. Methods for the detection of molecular interactions within cells
CA2579677A1 (en) * 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
US20060171929A1 (en) * 2005-01-31 2006-08-03 The University Of Washington Regulation of dendritic cell functions by the DCAL-2 receptor
US20060199226A1 (en) * 2005-03-02 2006-09-07 Schiffer Hans H Functional bioluminescence energy resonance transfer (BRET) assay to screen, identify and characterize receptor tyrosine kinase ligands
WO2006094116A2 (en) * 2005-03-02 2006-09-08 The Albert Einstein College Of Medicine Of Yeshiva University Enzyme sensors including environmentally sensitive or fluorescent labels and uses thereof
US8114964B2 (en) * 2005-05-19 2012-02-14 Centocor, Inc. Anti-MCP-1 antibodies, compositions, methods and uses
US20070155014A1 (en) * 2005-07-20 2007-07-05 Invitrogen Corporation Methods for increasing efficiency of homologous recombination
US20080305519A1 (en) * 2006-02-23 2008-12-11 Qing Lin Biochemical method for specific protein labeling
EP2032983A2 (en) * 2006-05-24 2009-03-11 Cellumen, Inc. Method for modeling a disease
US8936936B2 (en) * 2007-10-25 2015-01-20 Sangamo Biosciences, Inc. Methods and compositions for targeted integration
JP2011518555A (ja) * 2008-04-14 2011-06-30 サンガモ バイオサイエンシーズ, インコーポレイテッド 標的組込みのための線形ドナーコンストラクト

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047805A1 (en) * 2008-08-22 2010-02-25 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FYODOR D URNOV等: "Highly efficient endogenous human gene correction using designed zinc-finger nucleases", 《NATURE》 *
JEFFREY C MILLER等: "An improved zinc-finger nuclease architecture for highly specific genome editing", 《NATURE BIOTECHNOLOGY》 *
MATTHEW H PORTEUS等: "Gene targeting using zinc finger nucleases", 《NATURE BIOTECHNOLOGY》 *
李其翔等 主编: "《新药药物靶标开发技术》", 31 July 2006 *
胡维新主编: "《医学分子生物学》", 31 October 2001 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114703174A (zh) * 2022-04-12 2022-07-05 中国科学院海洋研究所 快速获得基因型和表型突变的CRISPR/Cas9基因敲除方法及应用
CN114703174B (zh) * 2022-04-12 2023-10-24 中国科学院海洋研究所 快速获得基因型和表型突变的CRISPR/Cas9基因敲除方法及应用

Also Published As

Publication number Publication date
EP2558575A1 (en) 2013-02-20
CN102971421A (zh) 2013-03-13
EP2558574A1 (en) 2013-02-20
WO2011130346A1 (en) 2011-10-20
DK2558575T3 (en) 2016-03-21
ES2565216T3 (es) 2016-04-01
JP5841997B2 (ja) 2016-01-13
WO2011130343A1 (en) 2011-10-20
WO2011130345A1 (en) 2011-10-20
US20130059388A1 (en) 2013-03-07
KR20130055588A (ko) 2013-05-28
JP2013523180A (ja) 2013-06-17
CA2795636A1 (en) 2011-10-20
US20130065310A1 (en) 2013-03-14
EP2558574B1 (en) 2015-03-18
CN102959078B (zh) 2016-01-20
JP5841996B2 (ja) 2016-01-13
KR20130054955A (ko) 2013-05-27
EP2558574A4 (en) 2013-10-30
EP2558575A4 (en) 2013-10-30
US20130059362A1 (en) 2013-03-07
CN102959078A (zh) 2013-03-06
CA2795643A1 (en) 2011-10-20
US20180105564A1 (en) 2018-04-19
CA2795636C (en) 2018-07-31
CA2795643C (en) 2018-07-17
BR112012026379A2 (pt) 2015-09-22
EP2558575B1 (en) 2015-12-16
JP2013523181A (ja) 2013-06-17
US20180134759A1 (en) 2018-05-17

Similar Documents

Publication Publication Date Title
CN107805278A (zh) 产生内源标记的蛋白的方法
CN102625655B (zh) 使用锌指核酸酶在大鼠中进行基因组编辑
Trichas et al. Use of the viral 2A peptide for bicistronic expression in transgenic mice
CN102939377B (zh) 使用锌指核酸酶对Rosa位点进行基因组编辑
US20160145645A1 (en) Targeted integration
CN103168101A (zh) 使用靶向核酸内切酶和单链核酸的基因组编辑
US8975042B2 (en) Fluorescent and colored proteins and methods for using them
US9771402B2 (en) Fluorescent and colored proteins and methods for using them
US9102750B2 (en) Branchiostoma derived fluorescent proteins
EP3845651A1 (en) Novel nuclease domain and uses thereof
CA2707732A1 (en) Method of generating .rho.0 cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180316