CN116096900A - 用于治疗gjb2相关听力损失的组合物和方法 - Google Patents

用于治疗gjb2相关听力损失的组合物和方法 Download PDF

Info

Publication number
CN116096900A
CN116096900A CN202180049197.6A CN202180049197A CN116096900A CN 116096900 A CN116096900 A CN 116096900A CN 202180049197 A CN202180049197 A CN 202180049197A CN 116096900 A CN116096900 A CN 116096900A
Authority
CN
China
Prior art keywords
cells
promoter
construct
seq
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180049197.6A
Other languages
English (en)
Inventor
E.J.西蒙斯
R.恩格
D.R.伦兹
H.蒋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Akus Co ltd
Original Assignee
Akus Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Akus Co ltd filed Critical Akus Co ltd
Publication of CN116096900A publication Critical patent/CN116096900A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/02Inorganic compounds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/08Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
    • A61K47/10Alcohols; Phenols; Salts thereof, e.g. glycerol; Polyethylene glycols [PEG]; Poloxamers; PEG/POE alkyl ethers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0046Ear
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M25/00Catheters; Hollow probes
    • A61M25/0021Catheters; Hollow probes characterised by the form of the tubing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M25/00Catheters; Hollow probes
    • A61M25/0067Catheters; Hollow probes characterised by the distal end, e.g. tips
    • A61M25/0082Catheter tip comprising a tool
    • A61M25/0084Catheter tip comprising a tool being one or more injection needles
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/16Otologicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/20Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing sulfur, e.g. dimethyl sulfoxide [DMSO], docusate, sodium lauryl sulfate or aminosulfonic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M25/00Catheters; Hollow probes
    • A61M25/0021Catheters; Hollow probes characterised by the form of the tubing
    • A61M2025/0042Microcatheters, cannula or the like having outside diameters around 1 mm or less
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M25/00Catheters; Hollow probes
    • A61M25/0067Catheters; Hollow probes characterised by the distal end, e.g. tips
    • A61M25/0082Catheter tip comprising a tool
    • A61M25/0084Catheter tip comprising a tool being one or more injection needles
    • A61M2025/0093Catheter tip comprising a tool being one or more injection needles wherein at least one needle is a microneedle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Pulmonology (AREA)
  • Anesthesiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Hematology (AREA)
  • Dispersion Chemistry (AREA)
  • Inorganic Chemistry (AREA)

Abstract

本公开提供了构建体,其包含与启动子可操作地连接的编码序列,其中该编码序列编码connexin 26蛋白。示例性构建体包括AAV构建体。还提供了使用所公开的构建体来治疗听力损失和/或耳聋的方法。

Description

用于治疗GJB2相关听力损失的组合物和方法
对相关申请的交叉引用
本申请要求2020年5月13日提交的美国临时申请号63,024/468和2021年2月23日提交的美国临时申请号63/152,835的权益,这些申请通过引用其整体并入本文。
对电子提交的序列表的引用
与本申请一起提交的电子提交的序列表的内容为ASCII文本文件(名称:4833_006PC02_Seqlisting_ST25.txt;大小:227,027字节;和创建日期:2021年5月13日),通过引用其整体并入本文。
背景技术
听力损失可能是传导性的(起因于耳道或中耳)、感觉神经性的(起因于内耳或听觉神经),或混合性的。大多数形式的非综合征性耳聋与内耳结构损伤引起的永久性听力损失(感觉神经性耳聋)相关联,尽管一些形式可能涉及中耳的变化(传导性听力损失)。绝大多数人感觉神经性听力损失是由耳蜗中Corti器官的毛细胞异常引起的(毛细胞功能较差)。毛细胞可能在出生时异常,或在个体的一生中受损(例如,由于噪音创伤或感染)。
发明内容
本公开提供了与听力损失相关联的疾病或病况可以经由例如替换或添加某些基因产物来治疗的认识。本公开进一步提供,参与内耳细胞发育、功能和/或维护的基因产物可以用于治疗与毛细胞和/或支持细胞损失相关联的疾病或病况。因此,本发明提供了导致参与内耳细胞(包括支持细胞和毛细胞)发育、功能和/或维持的基因产物表达的组合物的施用,和/或此类组合物在治疗听力损失或与听力损失相关联的疾病或病况中的用途。在一些实施方案中,基因产物可以由间隙连接β-2(GJB2)基因(GJB2基因编码connexin 26蛋白)或其特征部分编码。在一些实施方案中,基因产物可以是connexin 26蛋白(由GJB2基因编码)或其特征部分。
本公开进一步提供,AAV颗粒可以用于施用导致参与内耳细胞发育、功能和/或维持的基因产物表达的组合物,和/或治疗听力损失,或与听力损失相关的疾病或病况。如本文所述,AAV颗粒包含(i)AAV多核苷酸构建体(例如,重组AAV(rAAV)多核苷酸构建体),和(ii)包含衣壳蛋白的衣壳。在一些实施方案中,AAV多核苷酸构建体包含GJB2基因或其特征部分。
本公开进一步提供了包含多核苷酸构建体的组合物,该多核苷酸构建体包含GJB2基因或其特征部分。在一些实施方案中,构建体可以进一步包括可操作地附接到编码序列的调控元件。在某些实施方案中,所包括的调控元件促进在生理上合适的水平上的组织特异性表达。
本文还提供了施用本文所述构建体和组合物的方法。在某些实施方案中,施用涉及手术干预和包含治疗性构建体的rAAV颗粒的递送。在某些实施方案中,AAV颗粒可以通过手术引入,通过圆窗膜被递送到有此需要的受试者的内耳。在一些实施方案中,通过既定的测试来确定干预的功效,并将测量值与已知的对照测量值进行比较。
序列表
<110> 阿库斯股份有限公司
SIMONS, EMMANUEL JOHN
NG, ROBERT
LENZ, DANIELLE R.
CHIANG, HAO
<120> 用于治疗GJB2相关听力损失的组合物和方法
<130> 4833.006PC02
<150> US 63/024,468
<151> 2020-05-13
<150> US 63/152,835
<151> 2021-02-23
<160> 112
<170> PatentIn version 3.5
<210> 1
<211> 678
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GJB2 cDNA编码序列
<400> 1
atggattggg gcacgctgca gacgatcctg gggggtgtga acaaacactc caccagcatt 60
ggaaagatct ggctcaccgt cctcttcatt tttcgcatta tgatcctcgt tgtggctgca 120
aaggaggtgt ggggagatga gcaggccgac tttgtctgca acaccctgca gccaggctgc 180
aagaacgtgt gctacgatca ctacttcccc atctcccaca tccggctatg ggccctgcag 240
ctgatcttcg tgtccacgcc agcgctccta gtggccatgc acgtggccta ccggagacat 300
gagaagaaga ggaagttcat caagggggag ataaagagtg aatttaagga catcgaggag 360
atcaaaaccc agaaggtccg catcgaaggc tccctgtggt ggacctacac aagcagcatc 420
ttcttccggg tcatcttcga agccgccttc atgtacgtct tctatgtcat gtacgacggc 480
ttctccatgc agcggctggt gaagtgcaac gcctggcctt gtcccaacac tgtggactgc 540
tttgtgtccc ggcccacgga gaagactgtc ttcacagtgt tcatgattgc agtgtctgga 600
atttgcatcc tgctgaatgt cactgaattg tgttatttgc taattagata ttgttctggg 660
aagtcaaaaa agccagtt 678
<210> 2
<211> 681
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GJB2 cDNA编码序列
<400> 2
atggattggg gcacgctgca gacgatcctg gggggtgtga acaaacactc caccagcatt 60
ggaaagatct ggctcaccgt cctcttcatt tttcgcatta tgatcctcgt tgtggctgca 120
aaggaggtgt ggggagatga gcaggccgac tttgtctgca acaccctgca gccaggctgc 180
aagaacgtgt gctacgatca ctacttcccc atctcccaca tccggctatg ggccctgcag 240
ctgatcttcg tgtccacgcc agcgctccta gtggccatgc acgtggccta ccggagacat 300
gagaagaaga ggaagttcat caagggggag ataaagagtg aatttaagga catcgaggag 360
atcaaaaccc agaaggtccg catcgaaggc tccctgtggt ggacctacac aagcagcatc 420
ttcttccggg tcatcttcga agccgccttc atgtacgtct tctatgtcat gtacgacggc 480
ttctccatgc agcggctggt gaagtgcaac gcctggcctt gtcccaacac tgtggactgc 540
tttgtgtccc ggcccacgga gaagactgtc ttcacagtgt tcatgattgc agtgtctgga 600
atttgcatcc tgctgaatgt cactgaattg tgttatttgc taattagata ttgttctggg 660
aagtcaaaaa agccagttta a 681
<210> 3
<211> 2290
<212> DNA
<213> 人工序列
<220>
<223> 示例性剪接人GJB2异构体1 cDNA,包括非翻译区序列
<400> 3
gttgcggccc cgcagcgccc gcgcgctcct ctccccgact cggagcccct cggcggcgcc 60
cggcccagga cccgcctagg agcgcaggag ccccagcgca gagaccccaa cgccgagacc 120
cccgccccgg ccccgccgcg cttcctcccg acgcagagca aaccgcccag agtagaagat 180
ggattggggc acgctgcaga cgatcctggg gggtgtgaac aaacactcca ccagcattgg 240
aaagatctgg ctcaccgtcc tcttcatttt tcgcattatg atcctcgttg tggctgcaaa 300
ggaggtgtgg ggagatgagc aggccgactt tgtctgcaac accctgcagc caggctgcaa 360
gaacgtgtgc tacgatcact acttccccat ctcccacatc cggctatggg ccctgcagct 420
gatcttcgtg tccacgccag cgctcctagt ggccatgcac gtggcctacc ggagacatga 480
gaagaagagg aagttcatca agggggagat aaagagtgaa tttaaggaca tcgaggagat 540
caaaacccag aaggtccgca tcgaaggctc cctgtggtgg acctacacaa gcagcatctt 600
cttccgggtc atcttcgaag ccgccttcat gtacgtcttc tatgtcatgt acgacggctt 660
ctccatgcag cggctggtga agtgcaacgc ctggccttgt cccaacactg tggactgctt 720
tgtgtcccgg cccacggaga agactgtctt cacagtgttc atgattgcag tgtctggaat 780
ttgcatcctg ctgaatgtca ctgaattgtg ttatttgcta attagatatt gttctgggaa 840
gtcaaaaaag ccagtttaac gcattgccca gttgttagat taagaaatag acagcatgag 900
agggatgagg caacccgtgc tcagctgtca aggctcagtc gctagcattt cccaacacaa 960
agattctgac cttaaatgca accatttgaa acccctgtag gcctcaggtg aaactccaga 1020
tgccacaatg gagctctgct cccctaaagc ctcaaaacaa aggcctaatt ctatgcctgt 1080
cttaattttc tttcacttaa gttagttcca ctgagacccc aggctgttag gggttattgg 1140
tgtaaggtac tttcatattt taaacagagg atatcggcat ttgtttcttt ctctgaggac 1200
aagagaaaaa agccaggttc cacagaggac acagagaagg tttgggtgtc ctcctggggt 1260
tctttttgcc aactttcccc acgttaaagg tgaacattgg ttctttcatt tgctttggaa 1320
gttttaatct ctaacagtgg acaaagttac cagtgcctta aactctgtta cactttttgg 1380
aagtgaaaac tttgtagtat gataggttat tttgatgtaa agatgttctg gataccatta 1440
tatgttcccc ctgtttcaga ggctcagatt gtaatatgta aatggtatgt cattcgctac 1500
tatgatttaa tttgaaatat ggtcttttgg ttatgaatac tttgcagcac agctgagagg 1560
ctgtctgttg tattcattgt ggtcatagca cctaacaaca ttgtagcctc aatcgagtga 1620
gacagactag aagttcctag tgatggctta tgatagcaaa tggcctcatg tcaaatattt 1680
agatgtaatt ttgtgtaaga aatacagact ggatgtacca ccaactacta cctgtaatga 1740
caggcctgtc caacacatct cccttttcca tgactgtggt agccagcatc ggaaagaacg 1800
ctgatttaaa gaggtcgctt gggaatttta ttgacacagt accatttaat ggggaggaca 1860
aaatggggca ggggagggag aagtttctgt cgttaaaaac agatttggaa agactggact 1920
ctaaagtctg ttgattaaag atgagctttg tctacttcaa aagtttgttt gcttacccct 1980
tcagcctcca attttttaag tgaaaatata gctaataaca tgtgaaaaga atagaagcta 2040
aggtttagat aaatattgag cagatctata ggaagattga acctgaatat tgccattatg 2100
cttgacatgg tttccaaaaa atggtactcc acatatttca gtgagggtaa gtattttcct 2160
gttgtcaaga atagcattgt aaaagcattt tgtaataata aagaatagct ttaatgatat 2220
gcttgtaact aaaataattt tgtaatgtat caaatacatt taaaacatta aaatataatc 2280
tctataataa 2290
<210> 4
<211> 2318
<212> DNA
<213> 人工序列
<220>
<223> 示例性剪接人GJB2异构体X1 cDNA,包括非翻译区序列
<400> 4
tttaggaccc ttgttcgcga agaggtggtg tgcggctgag acccgcgtcc tcaggacggt 60
tccatcagtg cctcgatcct gccccactgg aggaggaagg cagcccgaac agcgctcacc 120
taactaacag ctgctgagag ctgggttccg tggccatgca cctgggactg ccttgagaag 180
cgtgagcaaa ccgcccagag tagaagatgg attggggcac gctgcagacg atcctggggg 240
gtgtgaacaa acactccacc agcattggaa agatctggct caccgtcctc ttcatttttc 300
gcattatgat cctcgttgtg gctgcaaagg aggtgtgggg agatgagcag gccgactttg 360
tctgcaacac cctgcagcca ggctgcaaga acgtgtgcta cgatcactac ttccccatct 420
cccacatccg gctatgggcc ctgcagctga tcttcgtgtc cacgccagcg ctcctagtgg 480
ccatgcacgt ggcctaccgg agacatgaga agaagaggaa gttcatcaag ggggagataa 540
agagtgaatt taaggacatc gaggagatca aaacccagaa ggtccgcatc gaaggctccc 600
tgtggtggac ctacacaagc agcatcttct tccgggtcat cttcgaagcc gccttcatgt 660
acgtcttcta tgtcatgtac gacggcttct ccatgcagcg gctggtgaag tgcaacgcct 720
ggccttgtcc caacactgtg gactgctttg tgtcccggcc cacggagaag actgtcttca 780
cagtgttcat gattgcagtg tctggaattt gcatcctgct gaatgtcact gaattgtgtt 840
atttgctaat tagatattgt tctgggaagt caaaaaagcc agtttaacgc attgcccagt 900
tgttagatta agaaatagac agcatgagag ggatgaggca acccgtgctc agctgtcaag 960
gctcagtcgc tagcatttcc caacacaaag attctgacct taaatgcaac catttgaaac 1020
ccctgtaggc ctcaggtgaa actccagatg ccacaatgga gctctgctcc cctaaagcct 1080
caaaacaaag gcctaattct atgcctgtct taattttctt tcacttaagt tagttccact 1140
gagaccccag gctgttaggg gttattggtg taaggtactt tcatatttta aacagaggat 1200
atcggcattt gtttctttct ctgaggacaa gagaaaaaag ccaggttcca cagaggacac 1260
agagaaggtt tgggtgtcct cctggggttc tttttgccaa ctttccccac gttaaaggtg 1320
aacattggtt ctttcatttg ctttggaagt tttaatctct aacagtggac aaagttacca 1380
gtgccttaaa ctctgttaca ctttttggaa gtgaaaactt tgtagtatga taggttattt 1440
tgatgtaaag atgttctgga taccattata tgttccccct gtttcagagg ctcagattgt 1500
aatatgtaaa tggtatgtca ttcgctacta tgatttaatt tgaaatatgg tcttttggtt 1560
atgaatactt tgcagcacag ctgagaggct gtctgttgta ttcattgtgg tcatagcacc 1620
taacaacatt gtagcctcaa tcgagtgaga cagactagaa gttcctagtg atggcttatg 1680
atagcaaatg gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa tacagactgg 1740
atgtaccacc aactactacc tgtaatgaca ggcctgtcca acacatctcc cttttccatg 1800
actgtggtag ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg gaattttatt 1860
gacacagtac catttaatgg ggaggacaaa atggggcagg ggagggagaa gtttctgtcg 1920
ttaaaaacag atttggaaag actggactct aaagtctgtt gattaaagat gagctttgtc 1980
tacttcaaaa gtttgtttgc ttaccccttc agcctccaat tttttaagtg aaaatatagc 2040
taataacatg tgaaaagaat agaagctaag gtttagataa atattgagca gatctatagg 2100
aagattgaac ctgaatattg ccattatgct tgacatggtt tccaaaaaat ggtactccac 2160
atatttcagt gagggtaagt attttcctgt tgtcaagaat agcattgtaa aagcattttg 2220
taataataaa gaatagcttt aatgatatgc ttgtaactaa aataattttg taatgtatca 2280
aatacattta aaacattaaa atataatctc tataataa 2318
<210> 5
<211> 5469
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GJB2基因组DNA序列
<400> 5
gttgcggccc cgcagcgccc gcgcgctcct ctccccgact cggagcccct cggcggcgcc 60
cggcccagga cccgcctagg agcgcaggag ccccagcgca gagaccccaa cgccgagacc 120
cccgccccgg ccccgccgcg cttcctcccg acgcaggtga gcccgccggc cccggactgc 180
ccggccagga acctggcgcg gggagggacc gcgagaccca gagcggttgc ccggccgcgt 240
gggtctcggg gaaccggggg gctggaccaa cacacgtcct tgggccgggg ggcgggggcc 300
gccttctgga gcgggcgttt ctgcggccga gctccggagc tggaatgggg cggccgggga 360
agtggacgcg atggcaccgc ccggggtgcg agtggggccg ggcgcgcgcg ggaggggaaa 420
aaggcgcggg cgagccgcca gcgcgaggtt tgtggtgtcg ccgatgtccc ttcggggtac 480
tctagcgcag ccgcctggct acttgaccca ctgccaccaa acgttttaaa ttcaccgaaa 540
gcttagcttc gaagcaaagc tccgtttcgc cggtgaagca ggaagccttc gctgcaggaa 600
ctgaccttta cctcttggag cggcttctgc agaaaaatcc ccgggcagag atttgggcgg 660
agtttgccta gaactaacgc ggagccagcc gatcccggcc taccccgggg ccaagatttc 720
agtggcttcc ctttttccta aacacttcac gagggtctgt ttccgggctg tgctccccgc 780
ctagaaggaa aatttttagg acccttgttc gcgaagaggt ggtgtgcggc tgagacccgc 840
gtcctcagga cggttccatc agtgcctcga tcctgcccca ctggaggagg aaggcagccc 900
gaacagcgct cacctaacta acagctgctg agagctgggt tccgtggcca tgcacctggg 960
actgccttga gaagcgtggt acggccgtgt ccccatgtga ccttagagtc cctttcgaaa 1020
ctgctgtgca cagtcggtca caatttcaga cactggtgag aagggtggag gaaccctctg 1080
gggacagcca ggcaaggtcg accacccatc acctaagggt ggagaaattt aaggggtgaa 1140
gagtcccttt tgccttttct ggatcctggt gattcaccta gtgtcttccc taaggaactg 1200
aaccaactcc tccgctggcc tctggcagcc ctccaggcgg tgcaggatgg cgtgggcccg 1260
gtaggaagct gcatgtaacc gcccagggtc gggaggccag gagggcagct cctcctctga 1320
cttgaatatt gaaaacaact tcgtcctgct tctgagcccc tcttaaccca tgacccccta 1380
gcccattggg gagtaaatct taatttactc ctcttcctga aaaaggatct ttaaaacagg 1440
tagcttcaac tcaagcttta taaaataaca atatagggtt tctcggaact gtatttttct 1500
cagctgatgg taactggaca ggtctgtaga agggtgtatg acctgggttt ggcaggtgga 1560
agagggcaaa ggataaaccc ctcctcctgc agccccatat tcttggccag gtgtattgtt 1620
gtaaaccagg agagagttta cttcggggag tatcctgttt tccactcagt gagggccaat 1680
gaagaatgtc taattccata agatgctttt gttaaaatcg gaatgttgct gtcctcggtg 1740
gttctgctgt tgggacggga ctggcctgag ctgtgggtgc tgtagcagga caaccagctc 1800
acctaagggc ctcccagtct ggattatcaa tgggtcagtg ctgaacctgg gctaaaatat 1860
tgttttttcc aatgatgttg tctttcccaa gctcagtgaa gctaaatgtt tcacaggcct 1920
atgtcaatct gatgtaactt tcgtggccac ctctctcctg ttagcctctg accaaggtgg 1980
cactggatgg tttctgcctg accttggtgc cccgtggcag cgactgtggg tcatgaaaga 2040
cattcactac gagcctgctt ctggagtcca tcagaaaacg ggatgcaact tgcctaaaat 2100
gaggagagga ggatgctttt aagaaaaaga agaaggagga ttcactacca gctctgaagg 2160
gtggaaaaga gatgattcat ccggattgtg gagagggtgg aatcttgttt aggagagcgt 2220
tggttgtggc aggcagggtg taactatgaa tcagtgaaga caattcacat cctgggatga 2280
aaagaaggcc atgggctcac aggagattat ccactggcct ctccacatcc gcttgcagta 2340
aggagtgtgg gactctccca agcttcagcg ctgaactgca atgcagtgac gtcgcttagc 2400
tgggccagta accgagggag ttgaattttc tgtcatttta aaataatgtg tcttttaaga 2460
aacactttga aattaaaacc acagcccaca attataatgc actgttgcag cacttatcaa 2520
aacagatatg ctaactgagc catcagtgcc agcctgacag tgaggccacc aagccatcca 2580
caaagcctac acgaaagtct gtgctcacag tggcttttct ccatgaagag ggcattccta 2640
acctcttcct ttcacgtagg aggaagcaag gtcctttgta aaattttaac tcggggtgcc 2700
tcaaatgtaa acttaaccac tggtaacaac agtttcactg ctacatgcca cgtctgtgaa 2760
aattcattca agacattaag gaaagtggct cagcagagag actagacatc ttatcctcac 2820
ggttctcctg tacttggcct ctcagccttt gagcaaggtt ggcccaagct agtatcggcc 2880
ccagtggtac agccaaaact tgagactgca aatggatgca gctgttgaac gctgagtaac 2940
ttctgcagag tcaggaagac ccaaggaagc tctgcagagg atgcaggggt acggtcagaa 3000
cccctgagtg cctttcagct aacgaggact ttatgacact ccccagcaca gcaaattttt 3060
atgatgtgtt taaagattgg gtgaattact caggtgaaca agctactttt tatcagagaa 3120
cacctaaaaa cacgttcaag agggtttggg aactatacat ttaatcctat gacaaactaa 3180
gttggttctg tcttcacctg ttttggtgag gttgtgtaag agttggtgtt tgctcaggaa 3240
gagatttaag catgcttgct tacccagact cagagaagtc tccctgttct gtcctagcta 3300
gtgattcctg tgttgtgtgc attcgtcttt tccagagcaa accgcccaga gtagaagatg 3360
gattggggca cgctgcagac gatcctgggg ggtgtgaaca aacactccac cagcattgga 3420
aagatctggc tcaccgtcct cttcattttt cgcattatga tcctcgttgt ggctgcaaag 3480
gaggtgtggg gagatgagca ggccgacttt gtctgcaaca ccctgcagcc aggctgcaag 3540
aacgtgtgct acgatcacta cttccccatc tcccacatcc ggctatgggc cctgcagctg 3600
atcttcgtgt ccacgccagc gctcctagtg gccatgcacg tggcctaccg gagacatgag 3660
aagaagagga agttcatcaa gggggagata aagagtgaat ttaaggacat cgaggagatc 3720
aaaacccaga aggtccgcat cgaaggctcc ctgtggtgga cctacacaag cagcatcttc 3780
ttccgggtca tcttcgaagc cgccttcatg tacgtcttct atgtcatgta cgacggcttc 3840
tccatgcagc ggctggtgaa gtgcaacgcc tggccttgtc ccaacactgt ggactgcttt 3900
gtgtcccggc ccacggagaa gactgtcttc acagtgttca tgattgcagt gtctggaatt 3960
tgcatcctgc tgaatgtcac tgaattgtgt tatttgctaa ttagatattg ttctgggaag 4020
tcaaaaaagc cagtttaacg cattgcccag ttgttagatt aagaaataga cagcatgaga 4080
gggatgaggc aacccgtgct cagctgtcaa ggctcagtcg ctagcatttc ccaacacaaa 4140
gattctgacc ttaaatgcaa ccatttgaaa cccctgtagg cctcaggtga aactccagat 4200
gccacaatgg agctctgctc ccctaaagcc tcaaaacaaa ggcctaattc tatgcctgtc 4260
ttaattttct ttcacttaag ttagttccac tgagacccca ggctgttagg ggttattggt 4320
gtaaggtact ttcatatttt aaacagagga tatcggcatt tgtttctttc tctgaggaca 4380
agagaaaaaa gccaggttcc acagaggaca cagagaaggt ttgggtgtcc tcctggggtt 4440
ctttttgcca actttcccca cgttaaaggt gaacattggt tctttcattt gctttggaag 4500
ttttaatctc taacagtgga caaagttacc agtgccttaa actctgttac actttttgga 4560
agtgaaaact ttgtagtatg ataggttatt ttgatgtaaa gatgttctgg ataccattat 4620
atgttccccc tgtttcagag gctcagattg taatatgtaa atggtatgtc attcgctact 4680
atgatttaat ttgaaatatg gtcttttggt tatgaatact ttgcagcaca gctgagaggc 4740
tgtctgttgt attcattgtg gtcatagcac ctaacaacat tgtagcctca atcgagtgag 4800
acagactaga agttcctagt gatggcttat gatagcaaat ggcctcatgt caaatattta 4860
gatgtaattt tgtgtaagaa atacagactg gatgtaccac caactactac ctgtaatgac 4920
aggcctgtcc aacacatctc ccttttccat gactgtggta gccagcatcg gaaagaacgc 4980
tgatttaaag aggtcgcttg ggaattttat tgacacagta ccatttaatg gggaggacaa 5040
aatggggcag gggagggaga agtttctgtc gttaaaaaca gatttggaaa gactggactc 5100
taaagtctgt tgattaaaga tgagctttgt ctacttcaaa agtttgtttg cttacccctt 5160
cagcctccaa ttttttaagt gaaaatatag ctaataacat gtgaaaagaa tagaagctaa 5220
ggtttagata aatattgagc agatctatag gaagattgaa cctgaatatt gccattatgc 5280
ttgacatggt ttccaaaaaa tggtactcca catatttcag tgagggtaag tattttcctg 5340
ttgtcaagaa tagcattgta aaagcatttt gtaataataa agaatagctt taatgatatg 5400
cttgtaacta aaataatttt gtaatgtatc aaatacattt aaaacattaa aatataatct 5460
ctataataa 5469
<210> 6
<211> 12513
<212> DNA
<213> 人工序列
<220>
<223> 示例性扩增人GJB2基因组DNA序列,包括某些调控位点
<400> 6
gactgtgaac ttaaggcaca gcagagctgg ggctgctctt aaggccctgc tgtctctcct 60
cttagtaaca acaccatttc acatgaagtg acagtggtat cttttgttgc cctggaaatg 120
gaatacaaca atggctttcc aacttttctg tggcagagac ctacagacag aagtacattt 180
tacactggat ccaggacaca catcagtctg aaaacacaca catgaaccaa acgtttccta 240
aagcattact tatccttgct aatagcaaca cattctcata ttcttttata cttcatttaa 300
tttcatataa aaaagaaaag gaaaggaaag aaatctattt ctcagcccat taataaggtc 360
aggagcagca acaccagact agaagaaaag cttacctata gatttttctg ccacctcttg 420
agtgcgtcca gctttccgac aagtctcagt gccatctact gtgcgctctg ggtattgcaa 480
ttgctttttt tttttttttt tttttttttt tagaatgaga ctaagtcaga gaacacaaag 540
aacttctttc cccacagtgg agatggctct gaaagcgttt aaggaatagc ttagatgagt 600
ggctaacaca ttctcccggt tctgaattct aagaccacag actccatgtc cagtccccaa 660
agagaggctt tgcaagctac agaatacccc tctgactggg acctcaggag ctaaactgac 720
cacgtaattg gttctagaaa gtgaaacgtt ttaatttgaa acatccaaat gagcattttg 780
tgaaaagcta ctgccgtcca tcaaatacaa cacagccagg gagtcatcgc tctattgccc 840
ttgtcaatcc tacatctata gttttttttg ctacagcagt tcatgagtgt tgactctatt 900
ctaacttgtt ccagaagccc ttcaagatga tagatagcac aatatttttg tagccagagc 960
tagaatgtag agctcttttt ggcttccttg tgaatgatcc agaatttcca tgttggcaag 1020
ccaccataat ttacagaatt tactttttat attcaataga agtaaaaaaa atttacctat 1080
ttaaggagtt atagctctgg attcatttct gaccaaaatg tgctttttga cacaaataca 1140
attggaaatg tctttgtaat ttatccacag tctgcctaga taatcataaa agaactgcat 1200
ggatatattt gtgagtaaga gcacgtgtcc attcagcaaa accaaggaga tcaactaatt 1260
ctaccattgc cttgaaacgg agacacatct agcagtttga atttccccca aaagattgta 1320
tgtgtgaaaa taagaataga atgaggaaaa tttaaaagcc tatataataa tttcagtcac 1380
aacttggcaa ttagaatttt atgagatgtc tttaatttgg aagcaaagaa caattaaatt 1440
attgaaggct ggaatttttt tttaactctt tgaatggaac aacagatttt ccccaaaaga 1500
tttgacttta acaattttca gaaaacataa gtcagggtgt ggttcaatta cacagagaga 1560
aattgtagtg aaatagtgtt ccctgtaata attacccaca aaggagcaca gtggagccac 1620
tcctgcatta aaattacagt atcatatgta agttattatt aattaaccag agatgccagg 1680
agcttgtcag tttccaactg ctattttgag gagagctaaa gtttctcttt ttttgccagt 1740
tattattatt attaatattt caacagcaag gcaagaaaag ggaatgtggt ccattaacta 1800
atggctcttg aaaagacact caatgaatcc aacttgccct aaaactgcca agtggtagga 1860
cagtctcttc gcgtcttgca tcattttctg ccatcaccta cgtgtgattc gtgagtcgga 1920
aattcaacca agacatgttt aatgtatatt tagagcattc ttcccggcgg gaattcacgg 1980
tgccattcca tcaggcagtt ggcaagcagt cacttgaaat attaagaaat atgatttgtg 2040
tcacactgat ttattgcaaa acagcaactt ctttcttttt ggttcattta taaaacaact 2100
gtcaaattaa aatgccaaat agctttaaac attagcattt tcaccttata accttacaag 2160
tgcatcactt taaacatctg agtaaaagtt cagctcgatg acaatcacct gggatttacc 2220
tgcatggtac taagcatata tgtaaaaata ttactgatgg gtatctctgg cactctgaag 2280
tgacaaagtg tagccttcac agatctttgt cagttaatca tcaatagtta cctgaaaagt 2340
gcccacttgc catcattcaa gatcaaccag gcagacacca cagtgagttt tccatcaaaa 2400
aaccttctct atctggtcag tctctgcacg tcaatgagac aaaggtgtat gctgcacgca 2460
gcagtactat cctaagctcc ctgtgtcctc accatggggc tgggtggctg gggtggagga 2520
acacaggatt gggcttcagc ttctctaggg actggtacat taagagatga agacataaaa 2580
ggtgagaaaa acatggttta tttccaatgt ttccatttct gttaaaagta atgctttcaa 2640
cagaaaaaaa atgcagcaat ataagtgtgt aatttacaaa ataatttcag gatttcttta 2700
atcattaatt tgtggtgtca tctgttaact ggatttacgt ctaagctcat ttgtaaataa 2760
cttcaaatat ccaagccttc cctcaccctt ttcccacctc acctctcctc cttctcctcc 2820
cctacactgg aggacactat gtacatgcat ataatgtcct gccctagagg agtcctgagc 2880
ctacttggga agaaaacacc aactcacagg aaaacagcag aaatcacaca aaacagaata 2940
aaagcaagcg ctgatctgta agtgaagact taagtgctat aggacttcca gctacaaatc 3000
ctgaaaacac ggagtggctg tgataatacg actagccaac atcacacagt aattttgcac 3060
ataaggagaa ctaaatcaaa gaaaacaagg aaaagaaagt tgagcctata atcgtgatac 3120
aggcactaaa atctcaggtg acatttttca atgggggaaa gtcagtcaac ttccgatctc 3180
caaaccatct ttactagcga gcttcccaca atggttctag aaccttcctt cattccaacc 3240
caaccaggat tccaacagac tcataaacac cacagccttt gagaaattaa agggagaacc 3300
caccaaccgg cgccccactc cccaccccaa gtcacctctg gctcaaccaa gatgcgctca 3360
ggccaagaaa gctgccccac cccacaggct ttgcctgtca tttttaacaa gccgactcag 3420
cacatctctc agatgggcca tgcaaggctt ttcgcagctc ctggggcttt gcctcttcat 3480
gagcagacac tccctcttag actaagacct ggagctggaa agtaggtggt aaccgcggta 3540
caaaactcac gctcgtccct gcagaaactg cctaggtcgg cccatggcca cggggcgcca 3600
atttttcaag gaaaagtcaa tgctaataat ggtggcaatc acgggaaatc cattctgagg 3660
ccagatctga cttgtcagga ttaatcatca tttccactta acttcgaact gacctgggta 3720
aaaacgtgag cgcgagggga ccaggctgca cctctgacct ggctcccctc tgcaaaaatc 3780
gcgaagtggg tgcccgaggt ggggcggggg ttgggggaga cctccccggg agtccccacc 3840
cagcctgctc tgcacatctt agtccctcat ccgcttgcgc tgtgcaaatc tgtcttctgt 3900
catttgtatc gcaagacatc aaaatcccca accaaatgca aatactgaga cctcataatc 3960
tgagacaaag tttcacggta tccagaaagc ccccagcagg tgtgcagtgc agagccagcc 4020
ccccagcggt cttccgcaga atcctatcag tttccccctt tcgtgctgtg tgcatcgagc 4080
aggaaggggc ttggcaggtt ttacctgccc tctttccttt ctgaaaagtc tgggcctcct 4140
caccccgaaa ggagtcacct ccttgcagtt ccccagttgc gaaaagagga ggaagttggc 4200
tgggccgggg gccgcggggg gcaccctccg cagatggcgg gacccccctg ccggccatgg 4260
caaaaacgag gcttgtctct cccaccgccc ccaaccttag tccttggcac attgttgaaa 4320
gtaattgaat aaaatcggaa attcgagaag gcgttcgttc ggattggtga gattttgagg 4380
ggagaaagaa gcggggactt cgccggcacc agcggcgccc cctcctcggc caccgttaac 4440
ccccattcca gagggcactg ccccgccacc cagcctaggt ccccctgcga gagcctcgcg 4500
ggcccgcgca gcctccgcga ctcgaacaga tcttcagtcc ttggaggaat gcctgtttct 4560
ctaacaataa aaaattaaag aagcgctcat aaatgccaag tcctctcgca ctatgcggag 4620
tacagaggac aacgaccaca gccatccctg aaccccgccc acggcacagc gccggagccg 4680
gggtctgggg cgccgcttcc tggggggtcc cgactctcag ccgcccccgc ttcacccggg 4740
ccgccaaggg gctgggggag gcggcgctcg gggtaaccgg gggagactca gggcgctggg 4800
ggcacttggg gaactcatgg gggctcaaag gaactaggag atcgggacct cgaaggggac 4860
ttggggggtt cggggctttc gggggcggtc gggggttcgc ggacccggga agctctgagg 4920
acccagaggc cgggcgcgct ccgcccgcgg cgccgccccc tccgtaactt tcccagtctc 4980
cgagggaaga ggcggggtgt ggggtgcggt taaaaggcgc cacggcggga gacaggtgtt 5040
gcggccccgc agcgcccgcg cgctcctctc cccgactcgg agcccctcgg cggcgcccgg 5100
cccaggaccc gcctaggagc gcaggagccc cagcgcagag accccaacgc cgagaccccc 5160
gccccggccc cgccgcgctt cctcccgacg caggtgagcc cgccggcccc ggactgcccg 5220
gccaggaacc tggcgcgggg agggaccgcg agacccagag cggttgcccg gccgcgtggg 5280
tctcggggaa ccggggggct ggaccaacac acgtccttgg gccggggggc gggggccgcc 5340
ttctggagcg ggcgtttctg cggccgagct ccggagctgg aatggggcgg ccggggaagt 5400
ggacgcgatg gcaccgcccg gggtgcgagt ggggccgggc gcgcgcggga ggggaaaaag 5460
gcgcgggcga gccgccagcg cgaggtttgt ggtgtcgccg atgtcccttc ggggtactct 5520
agcgcagccg cctggctact tgacccactg ccaccaaacg ttttaaattc accgaaagct 5580
tagcttcgaa gcaaagctcc gtttcgccgg tgaagcagga agccttcgct gcaggaactg 5640
acctttacct cttggagcgg cttctgcaga aaaatccccg ggcagagatt tgggcggagt 5700
ttgcctagaa ctaacgcgga gccagccgat cccggcctac cccggggcca agatttcagt 5760
ggcttccctt tttcctaaac acttcacgag ggtctgtttc cgggctgtgc tccccgccta 5820
gaaggaaaat ttttaggacc cttgttcgcg aagaggtggt gtgcggctga gacccgcgtc 5880
ctcaggacgg ttccatcagt gcctcgatcc tgccccactg gaggaggaag gcagcccgaa 5940
cagcgctcac ctaactaaca gctgctgaga gctgggttcc gtggccatgc acctgggact 6000
gccttgagaa gcgtggtacg gccgtgtccc catgtgacct tagagtccct ttcgaaactg 6060
ctgtgcacag tcggtcacaa tttcagacac tggtgagaag ggtggaggaa ccctctgggg 6120
acagccaggc aaggtcgacc acccatcacc taagggtgga gaaatttaag gggtgaagag 6180
tcccttttgc cttttctgga tcctggtgat tcacctagtg tcttccctaa ggaactgaac 6240
caactcctcc gctggcctct ggcagccctc caggcggtgc aggatggcgt gggcccggta 6300
ggaagctgca tgtaaccgcc cagggtcggg aggccaggag ggcagctcct cctctgactt 6360
gaatattgaa aacaacttcg tcctgcttct gagcccctct taacccatga ccccctagcc 6420
cattggggag taaatcttaa tttactcctc ttcctgaaaa aggatcttta aaacaggtag 6480
cttcaactca agctttataa aataacaata tagggtttct cggaactgta tttttctcag 6540
ctgatggtaa ctggacaggt ctgtagaagg gtgtatgacc tgggtttggc aggtggaaga 6600
gggcaaagga taaacccctc ctcctgcagc cccatattct tggccaggtg tattgttgta 6660
aaccaggaga gagtttactt cggggagtat cctgttttcc actcagtgag ggccaatgaa 6720
gaatgtctaa ttccataaga tgcttttgtt aaaatcggaa tgttgctgtc ctcggtggtt 6780
ctgctgttgg gacgggactg gcctgagctg tgggtgctgt agcaggacaa ccagctcacc 6840
taagggcctc ccagtctgga ttatcaatgg gtcagtgctg aacctgggct aaaatattgt 6900
tttttccaat gatgttgtct ttcccaagct cagtgaagct aaatgtttca caggcctatg 6960
tcaatctgat gtaactttcg tggccacctc tctcctgtta gcctctgacc aaggtggcac 7020
tggatggttt ctgcctgacc ttggtgcccc gtggcagcga ctgtgggtca tgaaagacat 7080
tcactacgag cctgcttctg gagtccatca gaaaacggga tgcaacttgc ctaaaatgag 7140
gagaggagga tgcttttaag aaaaagaaga aggaggattc actaccagct ctgaagggtg 7200
gaaaagagat gattcatccg gattgtggag agggtggaat cttgtttagg agagcgttgg 7260
ttgtggcagg cagggtgtaa ctatgaatca gtgaagacaa ttcacatcct gggatgaaaa 7320
gaaggccatg ggctcacagg agattatcca ctggcctctc cacatccgct tgcagtaagg 7380
agtgtgggac tctcccaagc ttcagcgctg aactgcaatg cagtgacgtc gcttagctgg 7440
gccagtaacc gagggagttg aattttctgt cattttaaaa taatgtgtct tttaagaaac 7500
actttgaaat taaaaccaca gcccacaatt ataatgcact gttgcagcac ttatcaaaac 7560
agatatgcta actgagccat cagtgccagc ctgacagtga ggccaccaag ccatccacaa 7620
agcctacacg aaagtctgtg ctcacagtgg cttttctcca tgaagagggc attcctaacc 7680
tcttcctttc acgtaggagg aagcaaggtc ctttgtaaaa ttttaactcg gggtgcctca 7740
aatgtaaact taaccactgg taacaacagt ttcactgcta catgccacgt ctgtgaaaat 7800
tcattcaaga cattaaggaa agtggctcag cagagagact agacatctta tcctcacggt 7860
tctcctgtac ttggcctctc agcctttgag caaggttggc ccaagctagt atcggcccca 7920
gtggtacagc caaaacttga gactgcaaat ggatgcagct gttgaacgct gagtaacttc 7980
tgcagagtca ggaagaccca aggaagctct gcagaggatg caggggtacg gtcagaaccc 8040
ctgagtgcct ttcagctaac gaggacttta tgacactccc cagcacagca aatttttatg 8100
atgtgtttaa agattgggtg aattactcag gtgaacaagc tactttttat cagagaacac 8160
ctaaaaacac gttcaagagg gtttgggaac tatacattta atcctatgac aaactaagtt 8220
ggttctgtct tcacctgttt tggtgaggtt gtgtaagagt tggtgtttgc tcaggaagag 8280
atttaagcat gcttgcttac ccagactcag agaagtctcc ctgttctgtc ctagctagtg 8340
attcctgtgt tgtgtgcatt cgtcttttcc agagcaaacc gcccagagta gaagatggat 8400
tggggcacgc tgcagacgat cctggggggt gtgaacaaac actccaccag cattggaaag 8460
atctggctca ccgtcctctt catttttcgc attatgatcc tcgttgtggc tgcaaaggag 8520
gtgtggggag atgagcaggc cgactttgtc tgcaacaccc tgcagccagg ctgcaagaac 8580
gtgtgctacg atcactactt ccccatctcc cacatccggc tatgggccct gcagctgatc 8640
ttcgtgtcca cgccagcgct cctagtggcc atgcacgtgg cctaccggag acatgagaag 8700
aagaggaagt tcatcaaggg ggagataaag agtgaattta aggacatcga ggagatcaaa 8760
acccagaagg tccgcatcga aggctccctg tggtggacct acacaagcag catcttcttc 8820
cgggtcatct tcgaagccgc cttcatgtac gtcttctatg tcatgtacga cggcttctcc 8880
atgcagcggc tggtgaagtg caacgcctgg ccttgtccca acactgtgga ctgctttgtg 8940
tcccggccca cggagaagac tgtcttcaca gtgttcatga ttgcagtgtc tggaatttgc 9000
atcctgctga atgtcactga attgtgttat ttgctaatta gatattgttc tgggaagtca 9060
aaaaagccag tttaacgcat tgcccagttg ttagattaag aaatagacag catgagaggg 9120
atgaggcaac ccgtgctcag ctgtcaaggc tcagtcgcta gcatttccca acacaaagat 9180
tctgacctta aatgcaacca tttgaaaccc ctgtaggcct caggtgaaac tccagatgcc 9240
acaatggagc tctgctcccc taaagcctca aaacaaaggc ctaattctat gcctgtctta 9300
attttctttc acttaagtta gttccactga gaccccaggc tgttaggggt tattggtgta 9360
aggtactttc atattttaaa cagaggatat cggcatttgt ttctttctct gaggacaaga 9420
gaaaaaagcc aggttccaca gaggacacag agaaggtttg ggtgtcctcc tggggttctt 9480
tttgccaact ttccccacgt taaaggtgaa cattggttct ttcatttgct ttggaagttt 9540
taatctctaa cagtggacaa agttaccagt gccttaaact ctgttacact ttttggaagt 9600
gaaaactttg tagtatgata ggttattttg atgtaaagat gttctggata ccattatatg 9660
ttccccctgt ttcagaggct cagattgtaa tatgtaaatg gtatgtcatt cgctactatg 9720
atttaatttg aaatatggtc ttttggttat gaatactttg cagcacagct gagaggctgt 9780
ctgttgtatt cattgtggtc atagcaccta acaacattgt agcctcaatc gagtgagaca 9840
gactagaagt tcctagtgat ggcttatgat agcaaatggc ctcatgtcaa atatttagat 9900
gtaattttgt gtaagaaata cagactggat gtaccaccaa ctactacctg taatgacagg 9960
cctgtccaac acatctccct tttccatgac tgtggtagcc agcatcggaa agaacgctga 10020
tttaaagagg tcgcttggga attttattga cacagtacca tttaatgggg aggacaaaat 10080
ggggcagggg agggagaagt ttctgtcgtt aaaaacagat ttggaaagac tggactctaa 10140
agtctgttga ttaaagatga gctttgtcta cttcaaaagt ttgtttgctt accccttcag 10200
cctccaattt tttaagtgaa aatatagcta ataacatgtg aaaagaatag aagctaaggt 10260
ttagataaat attgagcaga tctataggaa gattgaacct gaatattgcc attatgcttg 10320
acatggtttc caaaaaatgg tactccacat atttcagtga gggtaagtat tttcctgttg 10380
tcaagaatag cattgtaaaa gcattttgta ataataaaga atagctttaa tgatatgctt 10440
gtaactaaaa taattttgta atgtatcaaa tacatttaaa acattaaaat ataatctcta 10500
taataattta aaatctaata tggttttaat agaacagcaa attttaattt catctatcac 10560
tttttatata aatacattaa tgttttatat ttcataacac caatgggtaa gttgccagag 10620
tgtctgaccc cattctgccc cagttacaga aaagcttctg tcaccagaaa gtttggtggg 10680
gaaggaaggg aggaagatga tttctaccta accccgtgcc cacctctacc aggtttttga 10740
ggcatatcag tctatggaca atgtggtgtt tggtctggaa acgtaccttg gtgaatgctg 10800
agttggctgg acatgacccg tttagctcct ggatgaatcc cagaagtgga ccttcaaaat 10860
gttactcata gcatgacctt ggctcactgc aacctctgcc tcccaggctc aagcgatcct 10920
cccacctcag cgtcccaagt agctgggacc actggagtgt gccaccacac tccactaatt 10980
ttttcatttt ttgtagaaac gaggtcccac tatattgccc agtctggtct cgaactcctg 11040
ggctgaaggg atccccctgc ctcagtctcc taaagtgcaa ggattacagg catgggccac 11100
cgcacctggc ctgaaactgc tttttattcc tcagtgccca cttccatggg aaataagcct 11160
gccaggtcag cctgtcccca tgggagtgac tgcctgctac ccccacaggc ttgcccggcc 11220
ctcgtgagcc tctcccagag acaccaccaa cagttctgtt ctttcatggt acaagatttc 11280
catccaagga tttcaaagca tttcacacat caataattag aagtattttc atagaggacc 11340
atacactttt aaaatggatt tcaaagaaca aaaaccagtc aactatcacc caggtaatag 11400
aaaatgggaa atggtttcta cctgacttcc aaaatgctct gcacatagac tgtgaaaata 11460
ggatttttta agctgggtgc agaggcttat acctataatc ccaacacttt gggaggctga 11520
gacgagagga tcacttgagc ccaggagttc aaaaccagcc tgggcaatat agggagacat 11580
tgtttctata aaaaataaaa atgttagcca ggcaggcgtg gtaacatgtg cctgtagtct 11640
cagctactca ggaggctgag gtgggaagat tgcttgaacc tgggaggtcc atgctgcagt 11700
gagctgagat tgtgccactg cactccagcc taggcgacag caagatcctg tcccaaacaa 11760
caacaacatc aaaaaacaca gaacttttaa aataagtaca ttcacttcta caagctatgt 11820
agattattac tctcaagcta ttaaaagacc aagccaaaat aattatgggc tactctcgac 11880
cacttgtagg aatggataga gaggtctggt cacatgcctg gaaattagag cttgagctct 11940
gaaaatgata atcctgacta tatctcaaag catcagtctg cactttgtat ggagcaagaa 12000
aaagccttgt ggaagcggcc tcccacccag ccgagccctc ggcgtggaca agctctgctt 12060
tttatgagca gtgggtgcag cctcgctgct ccctcctcct gtcaaaagac agtcacagct 12120
ggggtgagca gatcgggccc acttgggagg ccccaaggaa tatgctgcag gggtcgggcc 12180
tgagccaccc ccacgggttg gtctttgaca actagagagc agctgagagg tgggtaaaag 12240
ctcactcact taccctgacc tcagtgtcct catcttaaaa tgggtttcct gaatctttcc 12300
ccggcttagt ggcaatgaaa taagataatt tatgtaaacg ttctccacat agtaaagcac 12360
taagtaacat atgactgtca tctgttttcc actagacaga tcccaacctg gaagagtgac 12420
agatggtatt tcagatacaa gtgactcaag caaagcttga taaactgggg gctggaaaaa 12480
aatgcacatt tacacaaagc ctggagtaac tgc 12513
<210> 7
<211> 226
<212> PRT
<213> 人工序列
<220>
<223> 示例性人Connexin 26蛋白序列
<400> 7
Met Asp Trp Gly Thr Leu Gln Thr Ile Leu Gly Gly Val Asn Lys His
1               5                   10                  15
Ser Thr Ser Ile Gly Lys Ile Trp Leu Thr Val Leu Phe Ile Phe Arg
            20                  25                  30
Ile Met Ile Leu Val Val Ala Ala Lys Glu Val Trp Gly Asp Glu Gln
        35                  40                  45
Ala Asp Phe Val Cys Asn Thr Leu Gln Pro Gly Cys Lys Asn Val Cys
    50                  55                  60
Tyr Asp His Tyr Phe Pro Ile Ser His Ile Arg Leu Trp Ala Leu Gln
65                  70                  75                  80
Leu Ile Phe Val Ser Thr Pro Ala Leu Leu Val Ala Met His Val Ala
                85                  90                  95
Tyr Arg Arg His Glu Lys Lys Arg Lys Phe Ile Lys Gly Glu Ile Lys
            100                 105                 110
Ser Glu Phe Lys Asp Ile Glu Glu Ile Lys Thr Gln Lys Val Arg Ile
        115                 120                 125
Glu Gly Ser Leu Trp Trp Thr Tyr Thr Ser Ser Ile Phe Phe Arg Val
    130                 135                 140
Ile Phe Glu Ala Ala Phe Met Tyr Val Phe Tyr Val Met Tyr Asp Gly
145                 150                 155                 160
Phe Ser Met Gln Arg Leu Val Lys Cys Asn Ala Trp Pro Cys Pro Asn
                165                 170                 175
Thr Val Asp Cys Phe Val Ser Arg Pro Thr Glu Lys Thr Val Phe Thr
            180                 185                 190
Val Phe Met Ile Ala Val Ser Gly Ile Cys Ile Leu Leu Asn Val Thr
        195                 200                 205
Glu Leu Cys Tyr Leu Leu Ile Arg Tyr Cys Ser Gly Lys Ser Lys Lys
    210                 215                 220
Pro Val
225
<210> 8
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 示例性5' AAV ITR
<400> 8
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 9
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' AAV ITR
<400> 9
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag agagggagtg gccaa 145
<210> 10
<211> 277
<212> DNA
<213> 人工序列
<220>
<223> 示例性CBA启动子
<400> 10
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 60
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 120
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc 180
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 240
gcggcggccc tataaaaagc gaagcgcgcg gcgggcg 277
<210> 11
<211> 279
<212> DNA
<213> 人工序列
<220>
<223> 示例性CBA启动子
<400> 11
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 60
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 120
gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggagaggt 180
gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg 240
cggcggcggc cctataaaaa gcgaagcgcg cggcgggcg 279
<210> 12
<211> 658
<212> DNA
<213> 人工序列
<220>
<223> 示例性CMV/CBA增强子/启动子
<400> 12
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg 540
cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc 600
ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 658
<210> 13
<211> 660
<212> DNA
<213> 人工序列
<220>
<223> 示例性CMV/CBA增强子/启动子
<400> 13
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg 540
ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt 600
ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 660
<210> 14
<211> 1671
<212> DNA
<213> 人工序列
<220>
<223> 示例性CAG增强子/启动子
<400> 14
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg 540
cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc 600
ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg 660
agtcgctgcg ttgccttcgc cccgtgcccc gctccgcgcc gcctcgcgcc gcccgccccg 720
gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt ctcctccggg 780
ctgtaattag cgcttggttt aatgacggct cgtttctttt ctgtggctgc gtgaaagcct 840
taaagggctc cgggagggcc ctttgtgcgg gggggagcgg ctcggggggt gcgtgcgtgt 900
gtgtgtgcgt ggggagcgcc gcgtgcggcc cgcgctgccc ggcggctgtg agcgctgcgg 960
gcgcggcgcg gggctttgtg cgctccgcgt gtgcgcgagg ggagcgcggc cgggggcggt 1020
gccccgcggt gcgggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg 1080
gggggtgagc agggggtgtg ggcgcggcgg tcgggctgta acccccccct gcacccccct 1140
ccccgagttg ctgagcacgg cccggcttcg ggtgcggggc tccgtgcggg gcgtggcgcg 1200
gggctcgccg tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg 1260
cctcgggccg gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt 1320
cgaggcgcgg cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga 1380
cttcctttgt cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct 1440
agcgggcgcg gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt 1500
cgtgcgtcgc cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg 1560
gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc 1620
ggctctagag cctctgctaa ccatgttcat gccttcttct ttttcctaca g 1671
<210> 15
<211> 1673
<212> DNA
<213> 人工序列
<220>
<223> 示例性CAG增强子/启动子
<400> 15
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg ggtcgaggtg agccccacgt tctgcttcac tctccccatc 420
tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt ttgtgcagcg 480
atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg 540
ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt 600
ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 660
ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 720
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 780
ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 840
cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 900
gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc 960
gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg gccgggggcg 1020
gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt 1080
gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc 1140
ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg gggcgtggcg 1200
cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc 1260
cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc gccggcggct 1320
gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 1380
gacttccttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct 1440
ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc 1500
ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc tgtccgcggg 1560
gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg cgtgtgaccg 1620
gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta cag 1673
<210> 16
<211> 1725
<212> DNA
<213> 人工序列
<220>
<223> 示例性人ATOH1增强子-启动子
<400> 16
ctatggagtt tgcataacaa acgtttggca gctcgctctc ttacactcca ttaacaagct 60
gtaacatata gctgcaggtt gctataatct cattaatatt ttggaaactt gaatattgag 120
tatttctgag tgctcattcc ccatatgcca gccacttctg ccatgctgac tggttccttt 180
ctctccatta ttagcaatta gcttcttacc ttccaaagtc agatccaagg tatccaagat 240
actagcaaag gaatcaacta tgtgtgcaag ttaagcatgc ttaatatcac ccaaacaaac 300
aaagaggcag catttcttaa agtaatgaag atagataaat cgggttagtc ctttgcgaca 360
ctgctggtgc tttctagagt tttatatatt ttaagcagct tgctttatat tctgtctttg 420
cctcccaccc caccagcact tttatttgtg gagggttttg gctcgccaca ctttgggaaa 480
cttatttgat ttcacggaga gctgaaggaa gatcattttt ggcaacagac aagtttaaac 540
acgatttcta tgggacattg ctaactgggg cccctaagga gaaaggggaa actgagcgga 600
gaatgggtta aatccttgga agcaggggag aggcagggga ggagagaagt cggaggagta 660
taaagaaaag gacaggaacc aagaagcgtg ggggtggttt gccgtaatgt gagtgtttct 720
taattagaga acggttgaca atagagggtc tggcagaggc tcctggccgc ggtgcggagc 780
gtctggagcg gagcacgcgc tgtcagctgg tgagcgcact ctcctttcag gcagctcccc 840
ggggagctgt gcggccacat ttaacaccat catcacccct ccccggcctc ctcaacctcg 900
gcctcctcct cgtcgacagc cttccttggc ccccaccagc agagctcaca gtagcgagcg 960
tctctcgccg tctcccgcac tcggccgggg cctctctcct cccccagctg cgcagcggga 1020
gccgccactg cccactgcac ctcccagcaa ccagcccagc acgcaaagaa gctgcgcaaa 1080
gttaaagcca agcaatgcca aggggagggg aagctggagg cgggctttga gtggcttctg 1140
ggcgcctggc gggtccagaa tcgcccagag ccgcccgcgg tcgtgcacat ctgacccgag 1200
tcagcttggg caccagccga gagccggctc cgcaccgctc ccgcacccca gccgccgggg 1260
tggtgacaca caccggagtc gaattacagc cctgcaatta acatatgaat ctgacgaatt 1320
taaaagaagg aaaaaaaaaa aaaaacctga gcaggcttgg gagtcctctg cacacaagaa 1380
cttttctcgg ggtgtaaaaa ctctttgatt ggctgctcgc acgcgcctgc ccgcgccctc 1440
cattggctga gaagacacgc gaccggcgcg aggagggggt tgggagagga gcggggggag 1500
actgagtggc gcgtgccgct ttttaaaggg gcgcagcgcc ttcagcaacc ggagaagcat 1560
agttgcacgc gacctggtgt gtgatctccg agtgggtggg ggagggtcga ggagggaaaa 1620
aaaaataaga cgttgcagaa gagacccgga aagggccttt tttttggttg agctggtgtc 1680
ccagtgctgc ctccgatcct gagcctccga gcctttgcag tgcaa 1725
<210> 17
<211> 1553
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GJB2增强子-启动子
<400> 17
aagcttcggt gaatttaaaa cgtttggtgg cagtgggtca agtagccagg cggctgcgct 60
agagtacccc gaagggacat cggcgacacc acaaacctcg cgctggcggc tcgcccgcgc 120
ctttttcccc tcccgcgcgc gcccggcccc actcgcaccc cgggcggtgc catcgcgtcc 180
acttccccgg ccgccccatt ccagctccgg agctcggccg cagaaacgcc cgctccagaa 240
ggcggccccc gccccccggc ccaaggacgt gtgttggtcc agccccccgg ttccccgaga 300
cccacgcggc cgggcaaccg ctctgggtct cgcggtccct ccccgcgcca ggttcctggc 360
cgggcagtcc ggggccggcg ggctcacctg cgtcgggagg aagcgcggcg gggccggggc 420
gggggtctcg gcgttggggt ctctgcgctg gggctcctgc gctcctaggc gggtcctggg 480
ccgggcgccg ccgaggggct ccgagtcggg gagaggagcg cgcgggcgct gcggggccgc 540
aacacctgtc tcccgccgtg gcgcctttta accgcacccc acaccccgcc tcttccctcg 600
gagactggga aagttacgga gggggcggcg ccgcgggcgg agcgcgcccg gcctctgggt 660
cctcagagct tcccgggtcc gcgaaccccc gaccgccccc gaaagccccg aaccccccaa 720
gtccccttcg aggtcccgat ctcctagttc ctttgagccc ccatgagttc cccaagtgcc 780
cccagcgccc tgagtctccc ccggttaccc cgagcgccgc ctcccccagc cccttggcgg 840
cccgggtgaa gcgggggcgg ctgagagtcg ggacccccca ggaagcggcg ccccagaccc 900
cggctccggc gctgtgccgt gggcggggtt cagggatggc tgtggtcgtt gtcctctgta 960
ctccgcatag tgcgagagga cttggcattt atgagcgctt ctttaatttt ttattgttag 1020
agaaacaggc attcctccaa ggactgaaga tctgttcgag tcgcggaggc tgcgcgggcc 1080
cgcgaggctc tcgcaggggg acctaggctg ggtggcgggg cagtgccctc tggaatgggg 1140
gttaacggtg gccgaggagg gggcgccgct ggtgccggcg aagtccccgc ttctttctcc 1200
cctcaaaatc tcaccaatcc gaacgaacgc cttctcgaat ttccgatttt attcaattac 1260
tttcaacaat gtgccaagga ctaaggttgg gggcggtggg agagacaagc ctcgtttttg 1320
ccatggccgg caggggggtc ccgccatctg cggagggtgc cccccgcggc ccccggccca 1380
gccaacttcc tcctcttttc gcaactgggg aactgcaagg aggtgactcc tttcggggtg 1440
aggaggccca gacttttcag aaaggaaaga gggcaggtaa aacctgccaa gccccttcct 1500
gctcgatgca cacagcacga aagggggaaa ctgataggat tctgcggaag ctt 1553
<210> 18
<211> 381
<212> DNA
<213> 人工序列
<220>
<223> 示例性CMV增强子
<400> 18
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg g 381
<210> 19
<211> 1013
<212> DNA
<213> 人工序列
<220>
<223> 示例性SV-40合成内含子
<400> 19
ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120
ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 180
cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240
gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc 300
gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg gccgggggcg 360
gtgccccgcg gtgcgggggg gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt 420
gggggggtga gcagggggtg tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc 480
ctccccgagt tgctgagcac ggcccggctt cgggtgcggg gctccgtgcg gggcgtggcg 540
cggggctcgc cgtgccgggc ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc 600
cgcctcgggc cggggagggc tcgggggagg ggcgcggcgg cccccggagc gccggcggct 660
gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 720
gacttccttt gtcccaaatc tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct 780
ctagcgggcg cggggcgaag cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc 840
ttcgtgcgtc gccgcgccgc cgtccccttc tccctctcca gcctcggggc tgtccgcggg 900
gggacggctg ccttcggggg ggacggggca gggcggggtt cggcttctgg cgtgtgaccg 960
gcggctctag agcctctgct aaccatgttc atgccttctt ctttttccta cag 1013
<210> 20
<211> 178
<212> DNA
<213> 人工序列
<220>
<223> 示例性5' UTR序列
<400> 20
gttgcggccc cgcagcgccc gcgcgctcct ctccccgact cggagcccct cggcggcgcc 60
cggcccagga cccgcctagg agcgcaggag ccccagcgca gagaccccaa cgccgagacc 120
cccgccccgg ccccgccgcg cttcctcccg acgcagagca aaccgcccag agtagaag 178
<210> 21
<211> 206
<212> DNA
<213> 人工序列
<220>
<223> 示例性5' UTR序列
<400> 21
tttaggaccc ttgttcgcga agaggtggtg tgcggctgag acccgcgtcc tcaggacggt 60
tccatcagtg cctcgatcct gccccactgg aggaggaagg cagcccgaac agcgctcacc 120
taactaacag ctgctgagag ctgggttccg tggccatgca cctgggactg ccttgagaag 180
cgtgagcaaa ccgcccagag tagaag 206
<210> 22
<211> 1432
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' UTR序列
<400> 22
cgcattgccc agttgttaga ttaagaaata gacagcatga gagggatgag gcaacccgtg 60
ctcagctgtc aaggctcagt cgctagcatt tcccaacaca aagattctga ccttaaatgc 120
aaccatttga aacccctgta ggcctcaggt gaaactccag atgccacaat ggagcctctg 180
ctcccctaaa gcctcaaaac aaaggcctaa ttctatgcct gtcttaattt tctttcactt 240
aagttagttc cactgagacc ccaggctgtt aggggttatt ggtgtaaggt actttcatat 300
tttaaacaga ggatatcggc atttgtttct ttctctgagg acaagagaaa aaagccaggt 360
tccacagagg acacagagaa ggtttgggtg tcctcctggg gttctttttg ccaactttcc 420
ccacgttaaa ggtgaacatt ggttctttca tttgctttgg aagttttaat ctctaacagt 480
ggacaaagtt accagtgcct taaactctgt tacacttttt ggaagtgaaa actttgtagt 540
atgataggtt attttgatgt aaagatgttc tggataccat tatatgttcc ccctgtttca 600
gaggctcaga ttgtaatatg taaatggtat gtcattcgct actatgattt aatttgaaat 660
atggtctttt ggttatgaat actttgcagc acagctgaga ggctgtctgt tgtattcatt 720
gtggtcatag cacctaacaa cattgtagcc tcaatcgagt gagacagact agaagttcct 780
agtgatggct tatgatagca aatggcctca tgtcaaatat ttagatgtaa ttttgtgtaa 840
gaaatacaga ctggatgtac caccaactac tacctgtaat gacaggcctg tccaacacat 900
ctcccttttc catgactgtg gtagccagca tcggaaagaa cgctgattta aagaggtcgc 960
ttgggaattt tattgacaca gtaccattta atggggagga caaaatgggg caggggaggg 1020
agaagtttct gtcgttaaaa acagatttgg aaagactgga ctctaaagtc tgttgattaa 1080
agatgagctt tgtctacttc aaaagtttgt ttgcttaccc cttcagcctc caatttttta 1140
agtgaaaata tagctaataa catgtgaaaa gaatagaagc taaggtttag ataaatattg 1200
agcagatcta taggaagatt gaacctgaat attgccatta tgcttgacat ggtttccaaa 1260
aaatggtact ccacatattt cagtgagggt aagtattttc ctgttgtcaa gaatagcatt 1320
gtaaaagcat tttgtaataa taaagaatag ctttaatgat atgcttgtaa ctaaaataat 1380
tttgtaatgt atcaaataca tttaaaacat taaaatataa tctctataat aa 1432
<210> 23
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 示例性剪接供体内含子
<400> 23
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60
cagagaagac tcttgcgttt ct 82
<210> 24
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 示例性剪接接受体内含子
<400> 24
gataggcacc tattggtctt actgacatcc actttgcctt tctctccaca g 51
<210> 25
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 示例性bGH poly(A)信号序列
<400> 25
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 26
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 示例性SV40 poly(A)信号序列
<400> 26
aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60
aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120
ta 122
<210> 27
<211> 1044
<212> DNA
<213> 人工序列
<220>
<223> 示例性调控序列C3
<400> 27
cttcttctgg agtcttttct ggaataattc tgggagtggg ctcagcctgc gggagagtaa 60
catttttata acttgataga tgtagctgag atgcctccca gaggggagac ccgcctctcc 120
tccggcagct gtgcacgtag gcttgttccc agcagcctgg ccagggtggt ccacctggtg 180
tttctcatct tctttccccg gagcgctgac tcctgcgcgt cctcttggaa gactcttgac 240
aggacgggtg ttttatgggt gtgattcagt gtcctcttgc atcagttcaa tgtggtggtg 300
ttcaatcaac ccttgtagcg ttagcaaaat ttgctcaagt cattccgcag gaatgtctgt 360
gtcttgcttc caagaaagct tgtaagtgcc ggcaacaggc caagcagctc acaaacctga 420
ccacaagcct gtgagtaatt gtggggcagc acttagcagt cttttatttt cgacttatta 480
aagtctcatc ttggcctcac cttctccctg gaaggtggcg tgggtgggaa ccactgggtc 540
agatcttttt cacccttgcc gtggagccag tttcctgttg catgtggggg aagcaacatg 600
tggtgaagag tatagaaaac gaaaacatgt gggtacagta tgtataagtg gagggaacaa 660
actcataatt ccaactagtt tctcatgaga gactcatgaa tcattgtggt agttctcaat 720
ataaacttaa tctaggccgg atgtggtggc tcacacctgt aatctcagca ctctgggtgg 780
atcacttgag gtcaggagtt tgagaccagt ctgaccaaca tggagaaacc ccatcgctac 840
taaaaataca aaattatcca gatgtggtgg ctcacacctg taatcccagc actttgggag 900
gctgaggcgg gtggatcact tgaggtcagg agtttgagac cagcctgacc aacatggaga 960
aactgtgtct ctactaaaaa tacaaaatta gctgggcgtg gtgacgcatg cctgtaatcc 1020
cagctatttg gaggccgaag cagg 1044
<210> 28
<211> 1044
<212> DNA
<213> 人工序列
<220>
<223> 示例性调控序列D7
<400> 28
cttcttctgg agtcttttct ggaataattc tgggagtggg ctcagcctgc gggagagtaa 60
catttttata acttgataga tgtagctgag atgcctccca gaggggagac ccgcctctcc 120
tccggcagct gtgcacgtag gcttgttccc agcagcctgg ccagggtggt ccacctggtg 180
tttctcatct tctttccccg gagcgctgac tcctgcgcgt cctcttggaa gactcttgac 240
aggacgggtg ttttatgggt gtgattcagt gtcctcttgc atcagttcaa tgtggtggtg 300
ttcaatcaac ccttgtagcg ttagcaaaat ttgctcaagt cattccgcag gaatgtctgt 360
gtcttgcttc caagaaagct tgtaagtgcc ggcaacaggc caagcagctc acaaacctga 420
ccacaagcct gtgagtaatt gtggggcagc acttagcagt cttttatttt cgacttatta 480
aagtctcatc ttggcctcac cttctccctg gaaggtggcg tgggtgggaa ccactgggtc 540
agatcttttt cacccttgcc gtggagccag tttcctgttg catgtggggg aagcaacatg 600
tggtgaagag tatagaaaac gaaaacatgt gggtacagta tgtataagtg gagggaacaa 660
actcataatt ccaactagtt tctcatgaga gactcatgaa tcattgtggt agttctcaat 720
ataaacttaa tctaggccgg atgtggtggc tcacacctgt aatctcagca ctctgggtgg 780
atcacttgag gtcaggagtt tgagaccagt ctgaccaaca tggagaaacc ccatcgctac 840
taaaaataca aaattatcca gatgtggtgg ctcacacctg taatcccagc actttgggag 900
gctgaggcgg gtggatcact tgaggtcagg agtttgagac cagcctgacc aacatggaga 960
aactgtgtct ctactaaaaa tacaaaatta gctgggcgtg gtgacgcatg cctgtaatcc 1020
cagctatttg gaggccgaag cagg 1044
<210> 29
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点A
<400> 29
ttgtcgacgc ggccgcacgc gt 22
<210> 30
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点B
<400> 30
ctcctgggca acgtgctggt tattgtgacc ggtgccacc 39
<210> 31
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点C
<400> 31
taagagctcg ctgatcagcc tcga 24
<210> 32
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点D
<400> 32
aagcttgaat tcagctgacg tgcctcggac cgcctagg 38
<210> 33
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点E
<400> 33
taagagctc 9
<210> 34
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点F
<400> 34
gctgatcagc ctcga 15
<210> 35
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点G
<400> 35
ggcattccgg tactgttggt aaagccacca gcaaaccgcc cagagtagaa gaccggtggc 60
cacc 64
<210> 36
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点H
<400> 36
aagcttgaat tc 12
<210> 37
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点I
<400> 37
agctgacgtg cctcggaccg cctagg 26
<210> 38
<211> 159
<212> PRT
<213> 人工序列
<220>
<223> 示例性DHFR去稳定氨基酸序列
<400> 38
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1               5                   10                  15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
            20                  25                  30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
        35                  40                  45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
    50                  55                  60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65                  70                  75                  80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
                85                  90                  95
Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu
            100                 105                 110
Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr
        115                 120                 125
Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp
    130                 135                 140
Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145                 150                 155
<210> 39
<211> 483
<212> DNA
<213> 人工序列
<220>
<223> 示例性DHFR去稳定核苷酸序列
<400> 39
ggtaccatca gtctgattgc ggcgttagcg gtagattacg ttatcggcat ggaaaacgcc 60
atgccgtgga acctgcctgc cgatctcgcc tggtttaaac gcaacacctt aaataaaccc 120
gtgattatgg gccgccatac ctgggaatca atcggtcgtc cgttgccagg acgcaaaaat 180
attatcctca gcagtcaacc gagtacggac gatcgcgtaa cgtgggtgaa gtcggtggat 240
gaagccatcg cggcgtgtgg tgacgtacca gaaatcatgg tgattggcgg cggtcgcgtt 300
attgaacagt tcttgccaaa agcgcaaaaa ctgtatctga cgcatatcga cgcagaagtg 360
gaaggcgaca cccatttccc ggattacgag ccggatgact gggaatcggt attcagcgaa 420
ttccacgatg ctgatgcgca gaactctcac agctattgct ttgagattct ggagcggcga 480
taa 483
<210> 40
<211> 474
<212> DNA
<213> 人工序列
<220>
<223> 示例性去稳定域
<400> 40
atcagtctga ttgcggcgtt agcggtagat tacgttatcg gcatggaaaa cgccatgccg 60
tggaacctgc ctgccgatct cgcctggttt aaacgcaaca ccttaaataa acccgtgatt 120
atgggccgcc atacctggga atcaatcggt cgtccgttgc caggacgcaa aaatattatc 180
ctcagcagtc aaccgagtac ggacgatcgc gtaacgtggg tgaagtcggt ggatgaagcc 240
atcgcggcgt gtggtgacgt accagaaatc atggtgattg gcggcggtcg cgttattgaa 300
cagttcttgc caaaagcgca aaaactgtat ctgacgcata tcgacgcaga agtggaaggc 360
gacacccatt tcccggatta cgagccggat gactgggaat cggtattcag cgaattccac 420
gatgctgatg cgcagaactc tcacagctat tgctttgaga ttctggagcg gcga 474
<210> 41
<211> 112
<212> PRT
<213> 人工序列
<220>
<223> 示例性FKBP12去稳定肽氨基酸序列
<400> 41
Met Gly Val Glu Lys Gln Val Ile Arg Pro Gly Asn Gly Pro Lys Pro
1               5                   10                  15
Ala Pro Gly Gln Thr Val Thr Val His Cys Thr Gly Phe Gly Lys Asp
            20                  25                  30
Gly Asp Leu Ser Gln Lys Phe Trp Ser Thr Lys Asp Glu Gly Gln Lys
        35                  40                  45
Pro Phe Ser Phe Gln Ile Gly Lys Gly Ala Val Ile Lys Gly Trp Asp
    50                  55                  60
Glu Gly Val Ile Gly Met Gln Ile Gly Glu Val Ala Arg Leu Arg Cys
65                  70                  75                  80
Ser Ser Asp Tyr Ala Tyr Gly Ala Gly Gly Phe Pro Ala Trp Gly Ile
                85                  90                  95
Gln Pro Asn Ser Val Leu Asp Phe Glu Ile Glu Val Leu Ser Val Gln
            100                 105                 110
<210> 42
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 示例性3xFLAG标签序列
<400> 42
ggatcccggg ctgactacaa agaccatgac ggtgattata aagatcatga catcgactac 60
aaggatgacg atgacaag 78
<210> 43
<211> 2208
<212> DNA
<213> 人工序列
<220>
<223> 示例性AAV Anc80衣壳DNA序列
<400> 43
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acttgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaga gaccggtaga gcaatcaccc caggaaccag actcctcttc gggcatcggc 480
aagaaaggcc agcagcccgc gaagaagaga ctcaactttg ggcagacagg cgactcagag 540
tcagtgcccg accctcaacc actcggagaa ccccccgcag ccccctctgg tgtgggatct 600
aatacaatgg cagcaggcgg tggcgctcca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaacg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggccctcccc acctacaaca accacctcta caagcaaatc 780
tccagccaat cgggagcaag caccaacgac aacacctact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
atcaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcacc acgaccatcg ccaataacct taccagcacg 1020
gttcaggtct ttacggactc ggaataccag ctcccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctgc ctccgttccc ggcggacgtc ttcatgattc ctcagtacgg gtacctgact 1140
ctgaacaatg gcagtcaggc cgtgggccgt tcctccttct actgcctgga gtactttcct 1200
tctcaaatgc tgagaacggg caacaacttt gagttcagct acacgtttga ggacgtgcct 1260
tttcacagca gctacgcgca cagccaaagc ctggaccggc tgatgaaccc cctcatcgac 1320
cagtacctgt actacctgtc tcggactcag accacgagtg gtaccgcagg aaatcggacg 1380
ttgcaatttt ctcaggccgg gcctagtagc atggcgaatc aggccaaaaa ctggctaccc 1440
gggccctgct accggcagca acgcgtctcc aagacagcga atcaaaataa caacagcaac 1500
tttgcctgga ccggtgccac caagtatcat ctgaatggca gagactctct ggtaaatccc 1560
ggtcccgcta tggcaaccca caaggacgac gaagacaaat tttttccgat gagcggagtc 1620
ttaatatttg ggaaacaggg agctggaaat agcaacgtgg accttgacaa cgttatgata 1680
accagtgagg aagaaattaa aaccaccaac ccagtggcca cagaacagta cggcacggtg 1740
gccactaacc tgcaatcgtc aaacaccgct cctgctacag ggaccgtcaa cagtcaagga 1800
gccttacctg gcatggtctg gcagaaccgg gacgtgtacc tgcagggtcc tatctgggcc 1860
aagattcctc acacggacgg acactttcat ccctcgccgc tgatgggagg ctttggactg 1920
aaacacccgc ctcctcagat cctgattaag aatacacctg ttcccgcgaa tcctccaact 1980
accttcagtc cagctaagtt tgcgtcgttc atcacgcagt acagcaccgg acaggtcagc 2040
gtggaaattg aatgggagct gcagaaagaa aacagcaaac gctggaaccc agagattcaa 2100
tacacttcca actacaacaa atctacaaat gtggactttg ctgttgacac aaatggcgtt 2160
tattctgagc ctcgccccat cggcacccgt tacctcaccc gtaatctg 2208
<210> 44
<211> 736
<212> PRT
<213> 人工序列
<220>
<223> 示例性AAV Anc80衣壳氨基酸序列
<400> 44
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1               5                   10                  15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
            20                  25                  30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
        35                  40                  45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
    50                  55                  60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65                  70                  75                  80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
                85                  90                  95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
            100                 105                 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
        115                 120                 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
    130                 135                 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145                 150                 155                 160
Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
                165                 170                 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
            180                 185                 190
Ala Ala Pro Ser Gly Val Gly Ser Asn Thr Met Ala Ala Gly Gly Gly
        195                 200                 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
    210                 215                 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225                 230                 235                 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
                245                 250                 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Thr Asn Asp Asn Thr
            260                 265                 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
        275                 280                 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
    290                 295                 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305                 310                 315                 320
Val Lys Glu Val Thr Thr Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn
                325                 330                 335
Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro
            340                 345                 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
        355                 360                 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
    370                 375                 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385                 390                 395                 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Thr Phe
                405                 410                 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
            420                 425                 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg
        435                 440                 445
Thr Gln Thr Thr Ser Gly Thr Ala Gly Asn Arg Thr Leu Gln Phe Ser
    450                 455                 460
Gln Ala Gly Pro Ser Ser Met Ala Asn Gln Ala Lys Asn Trp Leu Pro
465                 470                 475                 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ala Asn Gln Asn
                485                 490                 495
Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn
            500                 505                 510
Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Thr His Lys
        515                 520                 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Leu Ile Phe Gly
    530                 535                 540
Lys Gln Gly Ala Gly Asn Ser Asn Val Asp Leu Asp Asn Val Met Ile
545                 550                 555                 560
Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln
                565                 570                 575
Tyr Gly Thr Val Ala Thr Asn Leu Gln Ser Ser Asn Thr Ala Pro Ala
            580                 585                 590
Thr Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln
        595                 600                 605
Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
    610                 615                 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625                 630                 635                 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
                645                 650                 655
Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr
            660                 665                 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
        675                 680                 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
    690                 695                 700
Tyr Asn Lys Ser Thr Asn Val Asp Phe Ala Val Asp Thr Asn Gly Val
705                 710                 715                 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
                725                 730                 735
<210> 45
<211> 2989
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 45
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtgac attgattatt 180
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt 240
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc 300
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg 360
tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 420
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca 480
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 540
taccatgggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 600
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 660
gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc 720
ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga 780
ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcgt 840
tgccttcgcc ccgtgccccg ctccgcgccg cctcgcgccg cccgccccgg ctctgactga 900
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 960
gcttggttta atgacggctc gtttcttttc tgtggctgcg tgaaagcctt aaagggctcc 1020
gggagggccc tttgtgcggg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggccc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1140
ggctttgtgc gctccgcgtg tgcgcgaggg gagcgcggcc gggggcggtg ccccgcggtg 1200
cgggggggct gcgaggggaa caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca 1260
gggggtgtgg gcgcggcggt cgggctgtaa cccccccctg cacccccctc cccgagttgc 1320
tgagcacggc ccggcttcgg gtgcggggct ccgtgcgggg cgtggcgcgg ggctcgccgt 1380
gccgggcggg gggtggcggc aggtgggggt gccgggcggg gcggggccgc ctcgggccgg 1440
ggagggctcg ggggaggggc gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc 1500
gagccgcagc cattgccttt tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc 1560
ccaaatctgt gcggagccga aatctgggag gcgccgccgc accccctcta gcgggcgcgg 1620
ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc 1680
gcgccgccgt ccccttctcc ctctccagcc tcggggctgt ccgcgggggg acggctgcct 1740
tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc 1800
ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca acgtgctggt 1860
tattgtgacc ggtgccacca tggattgggg cacgctgcag acgatcctgg ggggtgtgaa 1920
caaacactcc accagcattg gaaagatctg gctcaccgtc ctcttcattt ttcgcattat 1980
gatcctcgtt gtggctgcaa aggaggtgtg gggagatgag caggccgact ttgtctgcaa 2040
caccctgcag ccaggctgca agaacgtgtg ctacgatcac tacttcccca tctcccacat 2100
ccggctatgg gccctgcagc tgatcttcgt gtccacgcca gcgctcctag tggccatgca 2160
cgtggcctac cggagacatg agaagaagag gaagttcatc aagggggaga taaagagtga 2220
atttaaggac atcgaggaga tcaaaaccca gaaggtccgc atcgaaggct ccctgtggtg 2280
gacctacaca agcagcatct tcttccgggt catcttcgaa gccgccttca tgtacgtctt 2340
ctatgtcatg tacgacggct tctccatgca gcggctggtg aagtgcaacg cctggccttg 2400
tcccaacact gtggactgct ttgtgtcccg gcccacggag aagactgtct tcacagtgtt 2460
catgattgca gtgtctggaa tttgcatcct gctgaatgtc actgaattgt gttatttgct 2520
aattagatat tgttctggga agtcaaaaaa gccagtttaa gagctcgctg atcagcctcg 2580
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2640
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2700
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2760
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggaagc ttgaattcag 2820
ctgacgtgcc tcggaccgcc taggaggaac ccctagtgat ggagttggcc actccctctc 2880
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 2940
cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 2989
<210> 46
<211> 4421
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 46
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtgac attgattatt 180
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt 240
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc 300
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg 360
tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 420
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca 480
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 540
taccatgggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 600
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 660
gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc 720
ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga 780
ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcgt 840
tgccttcgcc ccgtgccccg ctccgcgccg cctcgcgccg cccgccccgg ctctgactga 900
ccgcgttact cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc 960
gcttggttta atgacggctc gtttcttttc tgtggctgcg tgaaagcctt aaagggctcc 1020
gggagggccc tttgtgcggg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg 1080
gggagcgccg cgtgcggccc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg 1140
ggctttgtgc gctccgcgtg tgcgcgaggg gagcgcggcc gggggcggtg ccccgcggtg 1200
cgggggggct gcgaggggaa caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca 1260
gggggtgtgg gcgcggcggt cgggctgtaa cccccccctg cacccccctc cccgagttgc 1320
tgagcacggc ccggcttcgg gtgcggggct ccgtgcgggg cgtggcgcgg ggctcgccgt 1380
gccgggcggg gggtggcggc aggtgggggt gccgggcggg gcggggccgc ctcgggccgg 1440
ggagggctcg ggggaggggc gcggcggccc ccggagcgcc ggcggctgtc gaggcgcggc 1500
gagccgcagc cattgccttt tatggtaatc gtgcgagagg gcgcagggac ttcctttgtc 1560
ccaaatctgt gcggagccga aatctgggag gcgccgccgc accccctcta gcgggcgcgg 1620
ggcgaagcgg tgcggcgccg gcaggaagga aatgggcggg gagggccttc gtgcgtcgcc 1680
gcgccgccgt ccccttctcc ctctccagcc tcggggctgt ccgcgggggg acggctgcct 1740
tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc 1800
ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca acgtgctggt 1860
tattgtgacc ggtgccacca tggattgggg cacgctgcag acgatcctgg ggggtgtgaa 1920
caaacactcc accagcattg gaaagatctg gctcaccgtc ctcttcattt ttcgcattat 1980
gatcctcgtt gtggctgcaa aggaggtgtg gggagatgag caggccgact ttgtctgcaa 2040
caccctgcag ccaggctgca agaacgtgtg ctacgatcac tacttcccca tctcccacat 2100
ccggctatgg gccctgcagc tgatcttcgt gtccacgcca gcgctcctag tggccatgca 2160
cgtggcctac cggagacatg agaagaagag gaagttcatc aagggggaga taaagagtga 2220
atttaaggac atcgaggaga tcaaaaccca gaaggtccgc atcgaaggct ccctgtggtg 2280
gacctacaca agcagcatct tcttccgggt catcttcgaa gccgccttca tgtacgtctt 2340
ctatgtcatg tacgacggct tctccatgca gcggctggtg aagtgcaacg cctggccttg 2400
tcccaacact gtggactgct ttgtgtcccg gcccacggag aagactgtct tcacagtgtt 2460
catgattgca gtgtctggaa tttgcatcct gctgaatgtc actgaattgt gttatttgct 2520
aattagatat tgttctggga agtcaaaaaa gccagtttaa gagctccgca ttgcccagtt 2580
gttagattaa gaaatagaca gcatgagagg gatgaggcaa cccgtgctca gctgtcaagg 2640
ctcagtcgct agcatttccc aacacaaaga ttctgacctt aaatgcaacc atttgaaacc 2700
cctgtaggcc tcaggtgaaa ctccagatgc cacaatggag cctctgctcc cctaaagcct 2760
caaaacaaag gcctaattct atgcctgtct taattttctt tcacttaagt tagttccact 2820
gagaccccag gctgttaggg gttattggtg taaggtactt tcatatttta aacagaggat 2880
atcggcattt gtttctttct ctgaggacaa gagaaaaaag ccaggttcca cagaggacac 2940
agagaaggtt tgggtgtcct cctggggttc tttttgccaa ctttccccac gttaaaggtg 3000
aacattggtt ctttcatttg ctttggaagt tttaatctct aacagtggac aaagttacca 3060
gtgccttaaa ctctgttaca ctttttggaa gtgaaaactt tgtagtatga taggttattt 3120
tgatgtaaag atgttctgga taccattata tgttccccct gtttcagagg ctcagattgt 3180
aatatgtaaa tggtatgtca ttcgctacta tgatttaatt tgaaatatgg tcttttggtt 3240
atgaatactt tgcagcacag ctgagaggct gtctgttgta ttcattgtgg tcatagcacc 3300
taacaacatt gtagcctcaa tcgagtgaga cagactagaa gttcctagtg atggcttatg 3360
atagcaaatg gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa tacagactgg 3420
atgtaccacc aactactacc tgtaatgaca ggcctgtcca acacatctcc cttttccatg 3480
actgtggtag ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg gaattttatt 3540
gacacagtac catttaatgg ggaggacaaa atggggcagg ggagggagaa gtttctgtcg 3600
ttaaaaacag atttggaaag actggactct aaagtctgtt gattaaagat gagctttgtc 3660
tacttcaaaa gtttgtttgc ttaccccttc agcctccaat tttttaagtg aaaatatagc 3720
taataacatg tgaaaagaat agaagctaag gtttagataa atattgagca gatctatagg 3780
aagattgaac ctgaatattg ccattatgct tgacatggtt tccaaaaaat ggtactccac 3840
atatttcagt gagggtaagt attttcctgt tgtcaagaat agcattgtaa aagcattttg 3900
taataataaa gaatagcttt aatgatatgc ttgtaactaa aataattttg taatgtatca 3960
aatacattta aaacattaaa atataatctc tataataagc tgatcagcct cgactgtgcc 4020
ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 4080
tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 4140
gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 4200
caatagcagg catgctgggg atgcggtggg ctctatggaa gcttgaattc agctgacgtg 4260
cctcggaccg cctaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct 4320
cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 4380
gcctcagtga gcgagcgagc gcgcagagag ggagtggcca a 4421
<210> 47
<211> 3938
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 47
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtaag cttcggtgaa 180
tttaaaacgt ttggtggcag tgggtcaagt agccaggcgg ctgcgctaga gtaccccgaa 240
gggacatcgg cgacaccaca aacctcgcgc tggcggctcg cccgcgcctt tttcccctcc 300
cgcgcgcgcc cggccccact cgcaccccgg gcggtgccat cgcgtccact tccccggccg 360
ccccattcca gctccggagc tcggccgcag aaacgcccgc tccagaaggc ggcccccgcc 420
ccccggccca aggacgtgtg ttggtccagc cccccggttc cccgagaccc acgcggccgg 480
gcaaccgctc tgggtctcgc ggtccctccc cgcgccaggt tcctggccgg gcagtccggg 540
gccggcgggc tcacctgcgt cgggaggaag cgcggcgggg ccggggcggg ggtctcggcg 600
ttggggtctc tgcgctgggg ctcctgcgct cctaggcggg tcctgggccg ggcgccgccg 660
aggggctccg agtcggggag aggagcgcgc gggcgctgcg gggccgcaac acctgtctcc 720
cgccgtggcg ccttttaacc gcaccccaca ccccgcctct tccctcggag actgggaaag 780
ttacggaggg ggcggcgccg cgggcggagc gcgcccggcc tctgggtcct cagagcttcc 840
cgggtccgcg aacccccgac cgcccccgaa agccccgaac cccccaagtc cccttcgagg 900
tcccgatctc ctagttcctt tgagccccca tgagttcccc aagtgccccc agcgccctga 960
gtctcccccg gttaccccga gcgccgcctc ccccagcccc ttggcggccc gggtgaagcg 1020
ggggcggctg agagtcggga ccccccagga agcggcgccc cagaccccgg ctccggcgct 1080
gtgccgtggg cggggttcag ggatggctgt ggtcgttgtc ctctgtactc cgcatagtgc 1140
gagaggactt ggcatttatg agcgcttctt taatttttta ttgttagaga aacaggcatt 1200
cctccaagga ctgaagatct gttcgagtcg cggaggctgc gcgggcccgc gaggctctcg 1260
cagggggacc taggctgggt ggcggggcag tgccctctgg aatgggggtt aacggtggcc 1320
gaggaggggg cgccgctggt gccggcgaag tccccgcttc tttctcccct caaaatctca 1380
ccaatccgaa cgaacgcctt ctcgaatttc cgattttatt caattacttt caacaatgtg 1440
ccaaggacta aggttggggg cggtgggaga gacaagcctc gtttttgcca tggccggcag 1500
gggggtcccg ccatctgcgg agggtgcccc ccgcggcccc cggcccagcc aacttcctcc 1560
tcttttcgca actggggaac tgcaaggagg tgactccttt cggggtgagg aggcccagac 1620
ttttcagaaa ggaaagaggg caggtaaaac ctgccaagcc ccttcctgct cgatgcacac 1680
agcacgaaag ggggaaactg ataggattct gcggaagctt ggcattccgg tactgttggt 1740
aaagccacca gcaaaccgcc cagagtagaa gaccggtggc caccatggat tggggcacgc 1800
tgcagacgat cctggggggt gtgaacaaac actccaccag cattggaaag atctggctca 1860
ccgtcctctt catttttcgc attatgatcc tcgttgtggc tgcaaaggag gtgtggggag 1920
atgagcaggc cgactttgtc tgcaacaccc tgcagccagg ctgcaagaac gtgtgctacg 1980
atcactactt ccccatctcc cacatccggc tatgggccct gcagctgatc ttcgtgtcca 2040
cgccagcgct cctagtggcc atgcacgtgg cctaccggag acatgagaag aagaggaagt 2100
tcatcaaggg ggagataaag agtgaattta aggacatcga ggagatcaaa acccagaagg 2160
tccgcatcga aggctccctg tggtggacct acacaagcag catcttcttc cgggtcatct 2220
tcgaagccgc cttcatgtac gtcttctatg tcatgtacga cggcttctcc atgcagcggc 2280
tggtgaagtg caacgcctgg ccttgtccca acactgtgga ctgctttgtg tcccggccca 2340
cggagaagac tgtcttcaca gtgttcatga ttgcagtgtc tggaatttgc atcctgctga 2400
atgtcactga attgtgttat ttgctaatta gatattgttc tgggaagtca aaaaagccag 2460
tttaagagct cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2520
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2580
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2640
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2700
gggctctatg gaagcttgaa ttccttcttc tggagtcttt tctggaataa ttctgggagt 2760
gggctcagcc tgcgggagag taacattttt ataacttgat agatgtagct gagatgcctc 2820
ccagagggga gacccgcctc tcctccggca gctgtgcacg taggcttgtt cccagcagcc 2880
tggccagggt ggtccacctg gtgtttctca tcttctttcc ccggagcgct gactcctgcg 2940
cgtcctcttg gaagactctt gacaggacgg gtgttttatg ggtgtgattc agtgtcctct 3000
tgcatcagtt caatgtggtg gtgttcaatc aacccttgta gcgttagcaa aatttgctca 3060
agtcattccg caggaatgtc tgtgtcttgc ttccaagaaa gcttgtaagt gccggcaaca 3120
ggccaagcag ctcacaaacc tgaccacaag cctgtgagta attgtggggc agcacttagc 3180
agtcttttat tttcgactta ttaaagtctc atcttggcct caccttctcc ctggaaggtg 3240
gcgtgggtgg gaaccactgg gtcagatctt tttcaccctt gccgtggagc cagtttcctg 3300
ttgcatgtgg gggaagcaac atgtggtgaa gagtatagaa aacgaaaaca tgtgggtaca 3360
gtatgtataa gtggagggaa caaactcata attccaacta gtttctcatg agagactcat 3420
gaatcattgt ggtagttctc aatataaact taatctaggc cggatgtggt ggctcacacc 3480
tgtaatctca gcactctggg tggatcactt gaggtcagga gtttgagacc agtctgacca 3540
acatggagaa accccatcgc tactaaaaat acaaaattat ccagatgtgg tggctcacac 3600
ctgtaatccc agcactttgg gaggctgagg cgggtggatc acttgaggtc aggagtttga 3660
gaccagcctg accaacatgg agaaactgtg tctctactaa aaatacaaaa ttagctgggc 3720
gtggtgacgc atgcctgtaa tcccagctat ttggaggccg aagcaggagc tgacgtgcct 3780
cggaccgcct aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3840
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3900
tcagtgagcg agcgagcgcg cagagaggga gtggccaa 3938
<210> 48
<211> 3916
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 48
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtaag cttcggtgaa 180
tttaaaacgt ttggtggcag tgggtcaagt agccaggcgg ctgcgctaga gtaccccgaa 240
gggacatcgg cgacaccaca aacctcgcgc tggcggctcg cccgcgcctt tttcccctcc 300
cgcgcgcgcc cggccccact cgcaccccgg gcggtgccat cgcgtccact tccccggccg 360
ccccattcca gctccggagc tcggccgcag aaacgcccgc tccagaaggc ggcccccgcc 420
ccccggccca aggacgtgtg ttggtccagc cccccggttc cccgagaccc acgcggccgg 480
gcaaccgctc tgggtctcgc ggtccctccc cgcgccaggt tcctggccgg gcagtccggg 540
gccggcgggc tcacctgcgt cgggaggaag cgcggcgggg ccggggcggg ggtctcggcg 600
ttggggtctc tgcgctgggg ctcctgcgct cctaggcggg tcctgggccg ggcgccgccg 660
aggggctccg agtcggggag aggagcgcgc gggcgctgcg gggccgcaac acctgtctcc 720
cgccgtggcg ccttttaacc gcaccccaca ccccgcctct tccctcggag actgggaaag 780
ttacggaggg ggcggcgccg cgggcggagc gcgcccggcc tctgggtcct cagagcttcc 840
cgggtccgcg aacccccgac cgcccccgaa agccccgaac cccccaagtc cccttcgagg 900
tcccgatctc ctagttcctt tgagccccca tgagttcccc aagtgccccc agcgccctga 960
gtctcccccg gttaccccga gcgccgcctc ccccagcccc ttggcggccc gggtgaagcg 1020
ggggcggctg agagtcggga ccccccagga agcggcgccc cagaccccgg ctccggcgct 1080
gtgccgtggg cggggttcag ggatggctgt ggtcgttgtc ctctgtactc cgcatagtgc 1140
gagaggactt ggcatttatg agcgcttctt taatttttta ttgttagaga aacaggcatt 1200
cctccaagga ctgaagatct gttcgagtcg cggaggctgc gcgggcccgc gaggctctcg 1260
cagggggacc taggctgggt ggcggggcag tgccctctgg aatgggggtt aacggtggcc 1320
gaggaggggg cgccgctggt gccggcgaag tccccgcttc tttctcccct caaaatctca 1380
ccaatccgaa cgaacgcctt ctcgaatttc cgattttatt caattacttt caacaatgtg 1440
ccaaggacta aggttggggg cggtgggaga gacaagcctc gtttttgcca tggccggcag 1500
gggggtcccg ccatctgcgg agggtgcccc ccgcggcccc cggcccagcc aacttcctcc 1560
tcttttcgca actggggaac tgcaaggagg tgactccttt cggggtgagg aggcccagac 1620
ttttcagaaa ggaaagaggg caggtaaaac ctgccaagcc ccttcctgct cgatgcacac 1680
agcacgaaag ggggaaactg ataggattct gcggaagctt ggcattccgg tactgttggt 1740
aaagccacca gcaaaccgcc cagagtagaa gaccggtggc caccatggat tggggcacgc 1800
tgcagacgat cctggggggt gtgaacaaac actccaccag cattggaaag atctggctca 1860
ccgtcctctt catttttcgc attatgatcc tcgttgtggc tgcaaaggag gtgtggggag 1920
atgagcaggc cgactttgtc tgcaacaccc tgcagccagg ctgcaagaac gtgtgctacg 1980
atcactactt ccccatctcc cacatccggc tatgggccct gcagctgatc ttcgtgtcca 2040
cgccagcgct cctagtggcc atgcacgtgg cctaccggag acatgagaag aagaggaagt 2100
tcatcaaggg ggagataaag agtgaattta aggacatcga ggagatcaaa acccagaagg 2160
tccgcatcga aggctccctg tggtggacct acacaagcag catcttcttc cgggtcatct 2220
tcgaagccgc cttcatgtac gtcttctatg tcatgtacga cggcttctcc atgcagcggc 2280
tggtgaagtg caacgcctgg ccttgtccca acactgtgga ctgctttgtg tcccggccca 2340
cggagaagac tgtcttcaca gtgttcatga ttgcagtgtc tggaatttgc atcctgctga 2400
atgtcactga attgtgttat ttgctaatta gatattgttc tgggaagtca aaaaagccag 2460
tttaagagct cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2520
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2580
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2640
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2700
gggctctatg gaagcttgaa ttccctgtaa agccaattcc aacccacttg taattaagag 2760
aaaatcccac ggttcctaat tgaaagtcct ttgttctatt tcttgggtat ttgtgtttta 2820
ggccttattt ttagatgcat cattaaagat ttttaaagtc ctttcaggca tcaggactga 2880
tgatgctgaa tgatggaggg ttgtggataa gtttttttgt ttttttttta accaggttaa 2940
aggctttcct gttatcctac tatgcttaat taagagctgt atttcttaat atcattggtg 3000
cctgattaga tttaactttt agatacagtc tgtaagattt ttgaaccaga aaaacctaaa 3060
taacttatga ctgttagcag tcatattcta gaagaagcaa atgtactgaa ttcttatgta 3120
cctaggattt taagggagta catacaaatc tttcctcagt agcaggtact ttatttttat 3180
aacacacaca tttaagctga gttaaatatg cagaactggt tgtacttctt tggcaggaaa 3240
agggaagctt aggatatctt gtgaccaact acctcttcct tctcaaataa ctggcaaata 3300
acttcaggaa aatccagtta tgttgtgtca tattgcaccc cctaggaagt actggattct 3360
tagtcttgag tgacttttaa ataaagctac ctttttctct ttcttacatc gcaagatctt 3420
caaatgtacc attcccgcac agagagtcca aggtaaaagg actgaaacca aactttgttt 3480
ttgtaagtat tttggtcagt gcaatgagtt cagagaccag gaggttaatg attgtgaagt 3540
cttgtcaaca gcaacaccgt gtatgacctg tggtgcttag atgttcagaa accccaaggt 3600
taaaatgtcc ctgaccacat atcaggcaaa aggaatgtaa ggaaaaccaa cttaatcctt 3660
ttgtcaagaa gtataaatga tgtatctttc caatcgggtt gcattgactt ttgggtccaa 3720
atagcttgtg tccacaggca tcttcagctg acgtgcctcg gaccgcctag gaggaacccc 3780
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3840
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3900
gagagggagt ggccaa 3916
<210> 49
<211> 2894
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 49
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtaag cttcggtgaa 180
tttaaaacgt ttggtggcag tgggtcaagt agccaggcgg ctgcgctaga gtaccccgaa 240
gggacatcgg cgacaccaca aacctcgcgc tggcggctcg cccgcgcctt tttcccctcc 300
cgcgcgcgcc cggccccact cgcaccccgg gcggtgccat cgcgtccact tccccggccg 360
ccccattcca gctccggagc tcggccgcag aaacgcccgc tccagaaggc ggcccccgcc 420
ccccggccca aggacgtgtg ttggtccagc cccccggttc cccgagaccc acgcggccgg 480
gcaaccgctc tgggtctcgc ggtccctccc cgcgccaggt tcctggccgg gcagtccggg 540
gccggcgggc tcacctgcgt cgggaggaag cgcggcgggg ccggggcggg ggtctcggcg 600
ttggggtctc tgcgctgggg ctcctgcgct cctaggcggg tcctgggccg ggcgccgccg 660
aggggctccg agtcggggag aggagcgcgc gggcgctgcg gggccgcaac acctgtctcc 720
cgccgtggcg ccttttaacc gcaccccaca ccccgcctct tccctcggag actgggaaag 780
ttacggaggg ggcggcgccg cgggcggagc gcgcccggcc tctgggtcct cagagcttcc 840
cgggtccgcg aacccccgac cgcccccgaa agccccgaac cccccaagtc cccttcgagg 900
tcccgatctc ctagttcctt tgagccccca tgagttcccc aagtgccccc agcgccctga 960
gtctcccccg gttaccccga gcgccgcctc ccccagcccc ttggcggccc gggtgaagcg 1020
ggggcggctg agagtcggga ccccccagga agcggcgccc cagaccccgg ctccggcgct 1080
gtgccgtggg cggggttcag ggatggctgt ggtcgttgtc ctctgtactc cgcatagtgc 1140
gagaggactt ggcatttatg agcgcttctt taatttttta ttgttagaga aacaggcatt 1200
cctccaagga ctgaagatct gttcgagtcg cggaggctgc gcgggcccgc gaggctctcg 1260
cagggggacc taggctgggt ggcggggcag tgccctctgg aatgggggtt aacggtggcc 1320
gaggaggggg cgccgctggt gccggcgaag tccccgcttc tttctcccct caaaatctca 1380
ccaatccgaa cgaacgcctt ctcgaatttc cgattttatt caattacttt caacaatgtg 1440
ccaaggacta aggttggggg cggtgggaga gacaagcctc gtttttgcca tggccggcag 1500
gggggtcccg ccatctgcgg agggtgcccc ccgcggcccc cggcccagcc aacttcctcc 1560
tcttttcgca actggggaac tgcaaggagg tgactccttt cggggtgagg aggcccagac 1620
ttttcagaaa ggaaagaggg caggtaaaac ctgccaagcc ccttcctgct cgatgcacac 1680
agcacgaaag ggggaaactg ataggattct gcggaagctt ggcattccgg tactgttggt 1740
aaagccacca gcaaaccgcc cagagtagaa gaccggtggc caccatggat tggggcacgc 1800
tgcagacgat cctggggggt gtgaacaaac actccaccag cattggaaag atctggctca 1860
ccgtcctctt catttttcgc attatgatcc tcgttgtggc tgcaaaggag gtgtggggag 1920
atgagcaggc cgactttgtc tgcaacaccc tgcagccagg ctgcaagaac gtgtgctacg 1980
atcactactt ccccatctcc cacatccggc tatgggccct gcagctgatc ttcgtgtcca 2040
cgccagcgct cctagtggcc atgcacgtgg cctaccggag acatgagaag aagaggaagt 2100
tcatcaaggg ggagataaag agtgaattta aggacatcga ggagatcaaa acccagaagg 2160
tccgcatcga aggctccctg tggtggacct acacaagcag catcttcttc cgggtcatct 2220
tcgaagccgc cttcatgtac gtcttctatg tcatgtacga cggcttctcc atgcagcggc 2280
tggtgaagtg caacgcctgg ccttgtccca acactgtgga ctgctttgtg tcccggccca 2340
cggagaagac tgtcttcaca gtgttcatga ttgcagtgtc tggaatttgc atcctgctga 2400
atgtcactga attgtgttat ttgctaatta gatattgttc tgggaagtca aaaaagccag 2460
tttaagagct cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2520
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2580
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2640
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2700
gggctctatg gaagcttgaa ttcagctgac gtgcctcgga ccgcctagga ggaaccccta 2760
gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca 2820
aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcaga 2880
gagggagtgg ccaa 2894
<210> 50
<211> 2987
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 50
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtgac attgattatt 180
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt 240
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc 300
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg 360
tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 420
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca 480
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 540
taccatgggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 600
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 660
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 720
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 780
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgttg 840
ccttcgcccc gtgccccgct ccgcgccgcc tcgcgccgcc cgccccggct ctgactgacc 900
gcgttactcc cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagcgc 960
ttggtttaat gacggctcgt ttcttttctg tggctgcgtg aaagccttaa agggctccgg 1020
gagggccctt tgtgcggggg ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg 1080
gagcgccgcg tgcggcccgc gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg 1140
ctttgtgcgc tccgcgtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg 1200
ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg tgcgtggggg ggtgagcagg 1260
gggtgtgggc gcggcggtcg ggctgtaacc cccccctgca cccccctccc cgagttgctg 1320
agcacggccc ggcttcgggt gcggggctcc gtgcggggcg tggcgcgggg ctcgccgtgc 1380
cgggcggggg gtggcggcag gtgggggtgc cgggcggggc ggggccgcct cgggccgggg 1440
agggctcggg ggaggggcgc ggcggccccc ggagcgccgg cggctgtcga ggcgcggcga 1500
gccgcagcca ttgcctttta tggtaatcgt gcgagagggc gcagggactt cctttgtccc 1560
aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac cccctctagc gggcgcgggg 1620
cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt gcgtcgccgc 1680
gccgccgtcc ccttctccct ctccagcctc ggggctgtcc gcggggggac ggctgccttc 1740
gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc tctagagcct 1800
ctgctaacca tgttcatgcc ttcttctttt tcctacagct cctgggcaac gtgctggtta 1860
ttgtgaccgg tgccaccatg gattggggca cgctgcagac gatcctgggg ggtgtgaaca 1920
aacactccac cagcattgga aagatctggc tcaccgtcct cttcattttt cgcattatga 1980
tcctcgttgt ggctgcaaag gaggtgtggg gagatgagca ggccgacttt gtctgcaaca 2040
ccctgcagcc aggctgcaag aacgtgtgct acgatcacta cttccccatc tcccacatcc 2100
ggctatgggc cctgcagctg atcttcgtgt ccacgccagc gctcctagtg gccatgcacg 2160
tggcctaccg gagacatgag aagaagagga agttcatcaa gggggagata aagagtgaat 2220
ttaaggacat cgaggagatc aaaacccaga aggtccgcat cgaaggctcc ctgtggtgga 2280
cctacacaag cagcatcttc ttccgggtca tcttcgaagc cgccttcatg tacgtcttct 2340
atgtcatgta cgacggcttc tccatgcagc ggctggtgaa gtgcaacgcc tggccttgtc 2400
ccaacactgt ggactgcttt gtgtcccggc ccacggagaa gactgtcttc acagtgttca 2460
tgattgcagt gtctggaatt tgcatcctgc tgaatgtcac tgaattgtgt tatttgctaa 2520
ttagatattg ttctgggaag tcaaaaaagc cagtttaaga gctcgctgat cagcctcgac 2580
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 2640
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 2700
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 2760
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggaagctt gaattcagct 2820
gacgtgcctc ggaccgccta ggaggaaccc ctagtgatgg agttggccac tccctctctg 2880
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc 2940
cgggcggcct cagtgagcga gcgagcgcgc agagagggag tggccaa 2987
<210> 51
<211> 4419
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 51
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctttgtc gacgcggccg cacgcgtgac attgattatt 180
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt 240
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc 300
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg 360
tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat 420
gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca 480
gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat 540
taccatgggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 600
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 660
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 720
agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 780
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgttg 840
ccttcgcccc gtgccccgct ccgcgccgcc tcgcgccgcc cgccccggct ctgactgacc 900
gcgttactcc cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagcgc 960
ttggtttaat gacggctcgt ttcttttctg tggctgcgtg aaagccttaa agggctccgg 1020
gagggccctt tgtgcggggg ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg 1080
gagcgccgcg tgcggcccgc gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg 1140
ctttgtgcgc tccgcgtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg 1200
ggggggctgc gaggggaaca aaggctgcgt gcggggtgtg tgcgtggggg ggtgagcagg 1260
gggtgtgggc gcggcggtcg ggctgtaacc cccccctgca cccccctccc cgagttgctg 1320
agcacggccc ggcttcgggt gcggggctcc gtgcggggcg tggcgcgggg ctcgccgtgc 1380
cgggcggggg gtggcggcag gtgggggtgc cgggcggggc ggggccgcct cgggccgggg 1440
agggctcggg ggaggggcgc ggcggccccc ggagcgccgg cggctgtcga ggcgcggcga 1500
gccgcagcca ttgcctttta tggtaatcgt gcgagagggc gcagggactt cctttgtccc 1560
aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac cccctctagc gggcgcgggg 1620
cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt gcgtcgccgc 1680
gccgccgtcc ccttctccct ctccagcctc ggggctgtcc gcggggggac ggctgccttc 1740
gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc tctagagcct 1800
ctgctaacca tgttcatgcc ttcttctttt tcctacagct cctgggcaac gtgctggtta 1860
ttgtgaccgg tgccaccatg gattggggca cgctgcagac gatcctgggg ggtgtgaaca 1920
aacactccac cagcattgga aagatctggc tcaccgtcct cttcattttt cgcattatga 1980
tcctcgttgt ggctgcaaag gaggtgtggg gagatgagca ggccgacttt gtctgcaaca 2040
ccctgcagcc aggctgcaag aacgtgtgct acgatcacta cttccccatc tcccacatcc 2100
ggctatgggc cctgcagctg atcttcgtgt ccacgccagc gctcctagtg gccatgcacg 2160
tggcctaccg gagacatgag aagaagagga agttcatcaa gggggagata aagagtgaat 2220
ttaaggacat cgaggagatc aaaacccaga aggtccgcat cgaaggctcc ctgtggtgga 2280
cctacacaag cagcatcttc ttccgggtca tcttcgaagc cgccttcatg tacgtcttct 2340
atgtcatgta cgacggcttc tccatgcagc ggctggtgaa gtgcaacgcc tggccttgtc 2400
ccaacactgt ggactgcttt gtgtcccggc ccacggagaa gactgtcttc acagtgttca 2460
tgattgcagt gtctggaatt tgcatcctgc tgaatgtcac tgaattgtgt tatttgctaa 2520
ttagatattg ttctgggaag tcaaaaaagc cagtttaaga gctccgcatt gcccagttgt 2580
tagattaaga aatagacagc atgagaggga tgaggcaacc cgtgctcagc tgtcaaggct 2640
cagtcgctag catttcccaa cacaaagatt ctgaccttaa atgcaaccat ttgaaacccc 2700
tgtaggcctc aggtgaaact ccagatgcca caatggagcc tctgctcccc taaagcctca 2760
aaacaaaggc ctaattctat gcctgtctta attttctttc acttaagtta gttccactga 2820
gaccccaggc tgttaggggt tattggtgta aggtactttc atattttaaa cagaggatat 2880
cggcatttgt ttctttctct gaggacaaga gaaaaaagcc aggttccaca gaggacacag 2940
agaaggtttg ggtgtcctcc tggggttctt tttgccaact ttccccacgt taaaggtgaa 3000
cattggttct ttcatttgct ttggaagttt taatctctaa cagtggacaa agttaccagt 3060
gccttaaact ctgttacact ttttggaagt gaaaactttg tagtatgata ggttattttg 3120
atgtaaagat gttctggata ccattatatg ttccccctgt ttcagaggct cagattgtaa 3180
tatgtaaatg gtatgtcatt cgctactatg atttaatttg aaatatggtc ttttggttat 3240
gaatactttg cagcacagct gagaggctgt ctgttgtatt cattgtggtc atagcaccta 3300
acaacattgt agcctcaatc gagtgagaca gactagaagt tcctagtgat ggcttatgat 3360
agcaaatggc ctcatgtcaa atatttagat gtaattttgt gtaagaaata cagactggat 3420
gtaccaccaa ctactacctg taatgacagg cctgtccaac acatctccct tttccatgac 3480
tgtggtagcc agcatcggaa agaacgctga tttaaagagg tcgcttggga attttattga 3540
cacagtacca tttaatgggg aggacaaaat ggggcagggg agggagaagt ttctgtcgtt 3600
aaaaacagat ttggaaagac tggactctaa agtctgttga ttaaagatga gctttgtcta 3660
cttcaaaagt ttgtttgctt accccttcag cctccaattt tttaagtgaa aatatagcta 3720
ataacatgtg aaaagaatag aagctaaggt ttagataaat attgagcaga tctataggaa 3780
gattgaacct gaatattgcc attatgcttg acatggtttc caaaaaatgg tactccacat 3840
atttcagtga gggtaagtat tttcctgttg tcaagaatag cattgtaaaa gcattttgta 3900
ataataaaga atagctttaa tgatatgctt gtaactaaaa taattttgta atgtatcaaa 3960
tacatttaaa acattaaaat ataatctcta taataagctg atcagcctcg actgtgcctt 4020
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 4080
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 4140
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 4200
atagcaggca tgctggggat gcggtgggct ctatggaagc ttgaattcag ctgacgtgcc 4260
tcggaccgcc taggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4320
ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4380
ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 4419
<210> 52
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> 示例性5' AAV ITR
<400> 52
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcct 119
<210> 53
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' AAV ITR
<400> 53
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag 130
<210> 54
<211> 900
<212> DNA
<213> 人工序列
<220>
<223> 示例性人SLC26A4增强子-启动子
<400> 54
cggaaggttg atgtacagag gtctgtattt tggagcctct tctgtattta cttcagaaca 60
ctaacaatca ggcgagaatg ttctggttta tcaaaccctt ccttctgcct ttcatcttaa 120
ccatgcatta gttttaacaa agttcatccc aacagaagac aaaacactga tgaggtagga 180
tagctccagc tcctcctccc tctcttctag tcttgatttc catgtagtcc agtttattcc 240
ttccctgatt gtccaggaga atgagaaaaa gaaaaaacag agtctagtgg gtaagaaagg 300
gccacctgga cggcttgatt tggattgtga aataaaacac acacacatgc acacgtagaa 360
taagtggcta aaatctgagt aaatcgtgaa ctctctgtat cctccaccca ttgaatactc 420
ctaaaagact ttctagaaat tcaaggactt attaatatag aaacctggcc attgttcctc 480
ttctcctccc catgtggtat gagagcacct gtggcaggct cccagagacc acggacctct 540
tcctctaggc gggctctgct cttctttaag gagtcccaca gggcctggcc cgcccctgac 600
ctcgcaaccc ttgagattag taacgggatg agtgaggatc cgggtggccc ctgcgtggca 660
gccagtaaga gtctcagcct tcccggttcg ggaaagggga agaatgcagg aggggtagga 720
tttctttcct gataggatcg gttgggaaag accgcagcct gtgtgtgtct ttcccttcga 780
ccaaggtgtc tgttgctccg taaataaaac gtcccactgc cttctgagag cgctataaag 840
gcagcggaag ggtagtccgc ggggcattcc gggcggggcg cgagcagaga caggtgagtt 900
<210> 55
<211> 1269
<212> DNA
<213> 人工序列
<220>
<223> 示例性人LGR5增强子-启动子
<400> 55
agggctattt gtacctcaac gagggcttct ctccaagaaa gccctgaatc cttttcctcc 60
tttttcctgc agattcacta taggacactt tttgaagcaa gagcatgcat tttccccctg 120
gcgctctgca gcggttctca gagcccagtg tcactcacat aggtgggact gctctcagtt 180
cagagagcgc tgggacactt aagatgaaaa gtccctggaa gttagcaaac agccatctgt 240
cactctggca tcgatttact aaaagtgact tctagggtat tctaaaccac ttttaaaaaa 300
caaatgagtc acttcgactt cctcaccccg caagagatag gaaggcagca gtggagtgct 360
cgctcaggag ctgtatttgt ttagcgatta gcctagagct ttgattttag ggcaaaagcg 420
agccagacag tgcggcagac gtaaggatca aaaaggccac ctatcattcg ccggggacgc 480
ctgcctcctt accctgataa cgtaactatt tctctgcata ggattttagt ttttgtgttt 540
ttgttttgtt ttattctgtt taatcacttc aagtatctca tccattattt gaagcgggct 600
cggaggaaac gtgccgcatc ctccagtcct tgtgcgtctg tttaggtctc tccgaagcag 660
gtccctctcg actcttagat ctgggtctcc agcacgcatg aaggggtaag ggtggggggg 720
tcccctattc cggcgcgcgg cgttgagcac tgaatcttcc aggcggaggc tcagtgggag 780
cgccgagaac tcgccagtac cgcgcgctgc ctgctgcctg ctgcctccca gcccaggact 840
tgggaaagga gggaggggac aagtggaggg aaagtggggc cgggcggggg gtgcctggga 900
agccaggctg cgctgacgtc actgggcgcg caattcgggc tggagcgctt taaaaaacga 960
gcgtgcaagc agagatgctg ctccacaccg ctcaggccgc gagcagcagc aaggcgcacc 1020
gccactgtcg ccgctgcagc cagggctgct ccgaaggccg gcgtggcggc aaccggcacc 1080
tctgtccccg ccgcgcttct cctcgccgcc cacgccgtgg ggtcaggaac gcggcgtctg 1140
gcgctgcaga cgcccgctga gttgcagaag cccacggagc ggcgcccggc gcgccacggc 1200
ccgtagcagt ccggtgctgc tctccgcccg cgtccggctc gtggccccct acttcgggca 1260
ccgaccggt 1269
<210> 56
<211> 463
<212> DNA
<213> 人工序列
<220>
<223> 示例性人SYN1增强子-启动子
<400> 56
tgcgtatgag tgcaagtggg ttttaggacc aggatgaggc ggggtggggg tgcctacctg 60
acgaccgacc ccgacccact ggacaagcac ccaaccccca ttccccaaat tgcgcatccc 120
ctatcagaga gggggagggg aaacaggatg cggcgaggcg cgtgcgcact gccagcttca 180
gcaccgcgga cagtgccttc gcccccgcct ggcggcgcgc gccaccgccg cctcagcact 240
gaaggcgcgc tgacgtcact cgccggtccc ccgcaaactc cccttcccgg ccaccttggt 300
cgcgtccgcg ccgccgccgg cccagccgga ccgcaccacg cgaggcgcga gatagggggg 360
cacgggcgcg accatctgcg ctgcggcgcc ggcgactcag cgctgcctca gtctgcggtg 420
ggcagcggag gagtcgtgtc gtgcctgaga gcgcagtcga gaa 463
<210> 57
<211> 2204
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GFAP增强子-启动子
<400> 57
cccacctccc tctctgtgct gggactcaca gagggagacc tcaggaggca gtctgtccat 60
cacatgtcca aatgcagagc ataccctggg ctgggcgcag tggcgcacaa ctgtaattcc 120
agcactttgg gaggctgatg tggaaggatc acttgagccc agaagttcta gaccagcctg 180
ggcaacatgg caagacccta tctctacaaa aaaagttaaa aaatcagcca cgtgtggtga 240
cacacacctg tagtcccagc tattcaggag gctgaggtga ggggatcact taaggctggg 300
aggttgaggc tgcagtgagt cgtggttgcg ccactgcact ccagcctggg caacagtgag 360
accctgtctc aaaagacaaa aaaaaaaaaa aaaaaaaaaa gaacatatcc tggtgtggag 420
taggggacgc tgctctgaca gaggctcggg ggcctgagct ggctctgtga gctggggagg 480
aggcagacag ccaggccttg tctgcaagca gacctggcag cattgggctg gccgcccccc 540
agggcctcct cttcatgccc agtgaatgac tcaccttggc acagacacaa tgttcggggt 600
gggcacagtg cctgcttccc gccgcacccc agcccccctc aaatgccttc cgagaagccc 660
attgagcagg gggcttgcat tgcaccccag cctgacagcc tggcatcttg ggataaaagc 720
agcacagccc cctaggggct gcccttgctg tgtggcgcca ccggcggtgg agaacaaggc 780
tctattcagc ctgtgcccag gaaaggggat caggggatgc ccaggcatgg acagtgggtg 840
gcaggggggg agaggagggc tgtctgcttc ccagaagtcc aaggacacaa atgggtgagg 900
ggactgggca gggttctgac cctgtgggac cagagtggag ggcgtagatg gacctgaagt 960
ctccagggac aacagggccc aggtctcagg ctcctagttg ggcccagtgg ctccagcgtt 1020
tccaaaccca tccatcccca gaggttcttc ccatctctcc aggctgatgt gtgggaactc 1080
gaggaaataa atctccagtg ggagacggag gggtggccag ggaaacgggg cgctgcagga 1140
ataaagacga gccagcacag ccagctcatg tgtaacggct ttgtggagct gtcaaggcct 1200
ggtctctggg agagaggcac agggaggcca gacaaggaag gggtgacctg gagggacaga 1260
tccaggggct aaagtcctga taaggcaaga gagtgccggc cccctcttgc cctatcagga 1320
cctccactgc cacatagagg ccatgattga cccttagaca aagggctggt gtccaatccc 1380
agcccccagc cccagaactc cagggaatga atgggcagag agcaggaatg tgggacatct 1440
gtgttcaagg gaaggactcc aggagtctgc tgggaatgag gcctagtagg aaatgaggtg 1500
gcccttgagg gtacagaaca ggttcattct tcgccaaatt cccagcacct tgcaggcact 1560
tacagctgag tgagataatg cctgggttat gaaatcaaaa agttggaaag caggtcagag 1620
gtcatctggt acagcccttc cttccctttt tttttttttt ttttgtgaga caaggtctct 1680
ctctgttgcc caggctggag tggcgcaaac acagctcact gcagcctcaa cctactgggc 1740
tcaagcaatc ctccagcctc agcctcccaa agtgctggga ttacaagcat gagccacccc 1800
actcagccct ttccttcctt tttaattgat gcataataat tgtaagtatt catcatggtc 1860
caaccaaccc tttcttgacc caccttccta gagagagggt cctcttgctt cagcggtcag 1920
ggccccagac ccatggtctg gctccaggta ccacctgcct catgcaggag ttggcgtgcc 1980
caggaagctc tgcctctggg cacagtgacc tcagtggggt gaggggagct ctccccatag 2040
ctgggctgcg gcccaacccc accccctcag gctatgccag ggggtgttgc caggggcacc 2100
cgggcatcgc cagtctagcc cactccttca taaagccctc gcatcccagg agcgagcaga 2160
gccagagcag gttggagagg agacgcatca cctccgctgc tcgc 2204
<210> 58
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于构建体定量的示例性Taqman探针
<400> 58
tctggctcac cgtcctcttc attt 24
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建体定量的示例性正向qPCR引物
<400> 59
caaacactcc accagcattg 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于构建体定量的示例性反向qPCR引物
<400> 60
cagccacaac gaggatcata 20
<210> 61
<211> 1010
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GJB2启动子
<400> 61
aagcttccgc agaatcctat cagtttcccc ctttcgtgct gtgtgcatcg agcaggaagg 60
ggcttggcag gttttacctg ccctctttcc tttctgaaaa gtctgggcct cctcaccccg 120
aaaggagtca cctccttgca gttccccagt tgcgaaaaga ggaggaagtt ggctgggccg 180
ggggccgcgg ggggcaccct ccgcagatgg cgggaccccc ctgccggcca tggcaaaaac 240
gaggcttgtc tctcccaccg cccccaacct tagtccttgg cacattgttg aaagtaattg 300
aataaaatcg gaaattcgag aaggcgttcg ttcggattgg tgagattttg aggggagaaa 360
gaagcgggga cttcgccggc accagcggcg ccccctcctc ggccaccgtt aacccccatt 420
ccagagggca ctgccccgcc acccagccta ggtccccctg cgagagcctc gcgggcccgc 480
gcagcctccg cgactcgaac agatcttcag tccttggagg aatgcctgtt tctctaacaa 540
taaaaaatta aagaagcgct cataaatgcc aagtcctctc gcactatgcg gagtacagag 600
gacaacgacc acagccatcc ctgaaccccg cccacggcac agcgccggag ccggggtctg 660
gggcgccgct tcctgggggg tcccgactct cagccgcccc cgcttcaccc gggccgccaa 720
ggggctgggg gaggcggcgc tcggggtaac cgggggagac tcagggcgct gggggcactt 780
ggggaactca tgggggctca aaggaactag gagatcggga cctcgaaggg gacttggggg 840
gttcggggct ttcgggggcg gtcgggggtt cgcggacccg ggaagctctg aggacccaga 900
ggccgggcgc gctccgcccg cggcgccgcc ccctccgtaa ctttcccagt ctccgaggga 960
agaggcgggg tgtggggtgc ggttaaaagg cgccacggcg ggagacaggt 1010
<210> 62
<211> 680
<212> DNA
<213> 人工序列
<220>
<223> 示例性人GFAP增强子-启动子
<400> 62
gaacatatcc tggtgtggag taggggacgc tgctctgaca gaggctcggg ggcctgagct 60
ggctctgtga gctggggagg aggcagacag ccaggccttg tctgcaagca gacctggcag 120
cattgggctg gccgcccccc agggcctcct cttcatgccc agtgaatgac tcaccttggc 180
acagacacaa tgttcggggt gggcacagtg cctgcttccc gccgcacccc agcccccctc 240
aaatgccttc cgagaagccc attgagcagg gggcttgcat tgcaccccag cctgacagcc 300
tggcatcttg ggataaaagc agcacagccc cctaggggct gcccttgctg tgtggcgcca 360
ccggcggtgg agaacaaggc tctattcagc ctgtgcccag gaaaggggat caggggatgc 420
ccaggcatgg acagtgggtg gcaggggggg agaggagggc tgtctgcttc ccagaagtcc 480
aaggacacaa atgggtgagg ggagctctcc ccatagctgg gctgcggccc aaccccaccc 540
cctcaggcta tgccaggggg tgttgccagg ggcacccggg catcgccagt ctagcccact 600
ccttcataaa gccctcgcat cccaggagcg agcagagcca gagcaggttg gagaggagac 660
gcatcacctc cgctgctcgc 680
<210> 63
<211> 382
<212> DNA
<213> 人工序列
<220>
<223> 示例性CMV增强子
<400> 63
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gt 382
<210> 64
<211> 245
<212> DNA
<213> 人工序列
<220>
<223> 示例性嵌合内含子
<400> 64
ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120
ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc 180
cttgaggggc tccgggagct agagcctctg ctaaccatgt tcatgccttc ttctttttcc 240
tacag 245
<210> 65
<211> 1044
<212> DNA
<213> 人工序列
<220>
<223> 示例性GJB2增强子
<400> 65
cttcttctgg agtcttttct ggaataattc tgggagtggg ctcagcctgc gggagagtaa 60
catttttata acttgataga tgtagctgag atgcctccca gaggggagac ccgcctctcc 120
tccggcagct gtgcacgtag gcttgttccc agcagcctgg ccagggtggt ccacctggtg 180
tttctcatct tctttccccg gagcgctgac tcctgcgcgt cctcttggaa gactcttgac 240
aggacgggtg ttttatgggt gtgattcagt gtcctcttgc atcagttcaa tgtggtggtg 300
ttcaatcaac ccttgtagcg ttagcaaaat ttgctcaagt cattccgcag gaatgtctgt 360
gtcttgcttc caagaaagct tgtaagtgcc ggcaacaggc caagcagctc acaaacctga 420
ccacaagcct gtgagtaatt gtggggcagc acttagcagt cttttatttt cgacttatta 480
aagtctcatc ttggcctcac cttctccctg gaaggtggcg tgggtgggaa ccactgggtc 540
agatcttttt cacccttgcc gtggagccag tttcctgttg catgtggggg aagcaacatg 600
tggtgaagag tatagaaaac gaaaacatgt gggtacagta tgtataagtg gagggaacaa 660
actcataatt ccaactagtt tctcatgaga gactcatgaa tcattgtggt agttctcaat 720
ataaacttaa tctaggccgg atgtggtggc tcacacctgt aatctcagca ctctgggtgg 780
atcacttgag gtcaggagtt tgagaccagt ctgaccaaca tggagaaacc ccatcgctac 840
taaaaataca aaattatcca gatgtggtgg ctcacacctg taatcccagc actttgggag 900
gctgaggcgg gtggatcact tgaggtcagg agtttgagac cagcctgacc aacatggaga 960
aactgtgtct ctactaaaaa tacaaaatta gctgggcgtg gtgacgcatg cctgtaatcc 1020
cagctatttg gaggccgaag cagg 1044
<210> 66
<211> 362
<212> DNA
<213> 人工序列
<220>
<223> 示例性5' UTR序列
<400> 66
gttgcggccc cgcagcgccc gcgcgctcct ctccccgact cggagcccct cggcggcgcc 60
cggcccagga cccgcctagg agcgcaggag ccccagcgca gagaccccaa cgccgagacc 120
cccgccccgg ccccgccgcg cttcctcccg acgcagttta ggacccttgt tcgcgaagag 180
gtggtgtgcg gctgagaccc gcgtcctcag gacggttcca tcagtgcctc gatcctgccc 240
cactggagga ggaaggcagc ccgaacagcg ctcacctaac taacagctgc tgagagctgg 300
gttccgtggc catgcacctg ggactgcctt gagaagcgtg agcaaaccgc ccagagtaga 360
ag 362
<210> 67
<211> 1407
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' UTR序列
<400> 67
gaaatagaca gcatgagagg gatgaggcaa cccgtgctca gctgtcaagg ctcagtcgct 60
agcatttccc aacacaaaga ttctgacctt aaatgcaacc atttgaaacc cctgtaggcc 120
tcaggtgaaa ctccagatgc cacaatggag ctctgctccc ctaaagcctc aaaacaaagg 180
cctaattcta tgcctgtctt aattttcttt cacttaagtt agttccactg agaccccagg 240
ctgttagggg ttattggtgt aaggtacttt catattttaa acagaggata tcggcatttg 300
tttctttctc tgaggacaag agaaaaaagc caggttccac agaggacaca gagaaggttt 360
gggtgtcctc ctggggttct ttttgccaac tttccccacg ttaaaggtga acattggttc 420
tttcatttgc tttggaagtt ttaatctcta acagtggaca aagttaccag tgccttaaac 480
tctgttacac tttttggaag tgaaaacttt gtagtatgat aggttatttt gatgtaaaga 540
tgttctggat accattatat gttccccctg tttcagaggc tcagattgta atatgtaaat 600
ggtatgtcat tcgctactat gatttaattt gaaatatggt cttttggtta tgaatacttt 660
gcagcacagc tgagaggctg tctgttgtat tcattgtggt catagcacct aacaacattg 720
tagcctcaat cgagtgagac agactagaag ttcctagtga tggcttatga tagcaaatgg 780
cctcatgtca aatatttaga tgtaattttg tgtaagaaat acagactgga tgtaccacca 840
actactacct gtaatgacag gcctgtccaa cacatctccc ttttccatga ctgtggtagc 900
cagcatcgga aagaacgctg atttaaagag gtcgcttggg aattttattg acacagtacc 960
atttaatggg gaggacaaaa tggggcaggg gagggagaag tttctgtcgt taaaaacaga 1020
tttggaaaga ctggactcta aagtctgttg attaaagatg agctttgtct acttcaaaag 1080
tttgtttgct taccccttca gcctccaatt ttttaagtga aaatatagct aataacatgt 1140
gaaaagaata gaagctaagg tttagataaa tattgagcag atctatagga agattgaacc 1200
tgaatattgc cattatgctt gacatggttt ccaaaaaatg gtactccaca tatttcagtg 1260
agggtaagta ttttcctgtt gtcaagaata gcattgtaaa agcattttgt aataataaag 1320
aatagcttta atgatatgct tgtaactaaa ataattttgt aatgtatcaa atacatttaa 1380
aacattaaaa tataatctct ataataa 1407
<210> 68
<211> 1248
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' UTR序列
<400> 68
cgcattgccc agttgttaga ttaagaaata gacagcatga gagggatgag gcaacccgtg 60
ctcagctgtc aaggctcagt cgctagcatt tcccaacaca aagattctga ccttaaatgc 120
aaccatttga aacccctgta ggcctcaggt gaaactccag atgccacaat ggagcctctg 180
ctcccctaaa gcctcaaaac aaaggcctaa ttctatgcct gtcttaattt tctttcactt 240
aagttagttc cactgagacc ccaggctgtt aggggttatt ggtgtaaggt actttcatat 300
tttaaacaga ggatatcggc atttgtttct ttctctgagg acaagagaaa aaagccaggt 360
tccacagagg acacagagaa ggtttgggtg tcctcctggg gttctttttg ccaactttcc 420
ccacgttaaa ggtgaacatt ggttctttca tttgctttgg aagttttaat ctctaacagt 480
ggacaaagtt accagtgcct taaactctgt tacacttttt ggaagtgaaa actttgtagt 540
atgataggtt attttgatgt aaagatgttc tggataccat tatatgttcc ccctgtttca 600
gaggctcaga ttgtaatatg taaatggtat gtcattcgct actatgattt aatttgaaat 660
atggtctttt ggttatgaat actttgcagc acagctgaga ggctgtctgt tgtattcatt 720
gtggtcatag cacctaacaa cattgtagcc tcaatcgagt gagacagact agaagttcct 780
agtgatggct tatgatagca aatggcctca tgtcaaatat ttagatgtaa ttttgtgtaa 840
gaaatacaga ctggatgtac caccaactac tacctgtaat gacaggcctg tccaacacat 900
ctcccttttc catgactgtg gtagccagca tcggaaagaa cgctgattta aagaggtcgc 960
ttgggaattt tattgacaca gtaccattta atggggagga caaaatgggg caggggaggg 1020
agaagtttct gtcgttaaaa acagatttgg aaagactgga ctctaaagtc tgttgattaa 1080
agatgagctt tgtctacttc aaaagtttgt ttgcttaccc cttcagcctc caatttttta 1140
agtgaaaata tagctaataa catgtgaaaa gaatagaagc taaggtttag ataaatattg 1200
agcagatcta taggaagatt gaacctgaat attgccatta tgcttgac 1248
<210> 69
<211> 1372
<212> DNA
<213> 人工序列
<220>
<223> 示例性3' UTR序列
<400> 69
gagctcagtg tgagttctac cattgccaaa ctcgagcagt gaattctacc agtgccatag 60
gatccagtgt gagttctacc attgccaaag gtacccagtg aattctacca gtgccatagt 120
taaccgcatt gcccagttgt tagattaaga aatagacagc atgagaggga tgaggcaacc 180
cgtgctcagc tgtcaaggct cagtcgctag catttcccaa cacaaagatt ctgaccttaa 240
atgcaaccat ttgaaacccc tgtaggcctc aggtgaaact ccagatgcca caatggagcc 300
tctgctcccc taaagcctca aaacaaaggc ctaattctat gcctgtctta attttctttc 360
acttaagtta gttccactga gaccccaggc tgttaggggt tattggtgta aggtactttc 420
atattttaaa cagaggatat cggcatttgt ttctttctct gaggacaaga gaaaaaagcc 480
aggttccaca gaggacacag agaaggtttg ggtgtcctcc tggggttctt tttgccaact 540
ttccccacgt taaaggtgaa cattggttct ttcatttgct ttggaagttt taatctctaa 600
cagtggacaa agttaccagt gccttaaact ctgttacact ttttggaagt gaaaactttg 660
tagtatgata ggttattttg atgtaaagat gttctggata ccattatatg ttccccctgt 720
ttcagaggct cagattgtaa tatgtaaatg gtatgtcatt cgctactatg atttaatttg 780
aaatatggtc ttttggttat gaatactttg cagcacagct gagaggctgt ctgttgtatt 840
cattgtggtc atagcaccta acaacattgt agcctcaatc gagtgagaca gactagaagt 900
tcctagtgat ggcttatgat agcaaatggc ctcatgtcaa atatttagat gtaattttgt 960
gtaagaaata cagactggat gtaccaccaa ctactacctg taatgacagg cctgtccaac 1020
acatctccct tttccatgac tgtggtagcc agcatcggaa agaacgctga tttaaagagg 1080
tcgcttggga attttattga cacagtacca tttaatgggg aggacaaaat ggggcagggg 1140
agggagaagt ttctgtcgtt aaaaacagat ttggaaagac tggactctaa agtctgttga 1200
ttaaagatga gctttgtcta cttcaaaagt ttgtttgctt accccttcag cctccaattt 1260
tttaagtgaa aatatagcta ataacatgtg aaaagaatag aagctaaggt ttagataaat 1320
attgagcaga tctataggaa gattgaacct gaatattgcc attatgcttg ac 1372
<210> 70
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点J
<400> 70
gcggccgcac gcgt 14
<210> 71
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点K
<400> 71
gcggccgcac gcgtggt 17
<210> 72
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点L
<400> 72
ctcctgggca acgtgctggt tattgtgacc ggt 33
<210> 73
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点M
<400> 73
cgctagccac c 11
<210> 74
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点N
<400> 74
accggtcgct agccacc 17
<210> 75
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点O
<400> 75
gagctcgctg atcagcctcg a 21
<210> 76
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点P
<400> 76
aagcttgaat tcagctgacg tgcctcggac cgct 34
<210> 77
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 示例性接头序列
<400> 77
ggatcccggg ct 12
<210> 78
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 78
agtgtgagtt ctaccattgc caaa 24
<210> 79
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 79
agtgaattct accagtgcca ta 22
<210> 80
<211> 124
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 80
gagctcagtg tgagttctac cattgccaaa ctcgagcagt gaattctacc agtgccatag 60
gatccagtgt gagttctacc attgccaaag gtacccagtg aattctacca gtgccatagt 120
taac 124
<210> 81
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 具有终止密码子的示例性3xFLAG tag序列
<400> 81
gactacaaag accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat 60
gacaagtaa 69
<210> 82
<211> 4786
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 82
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtgacattg attattgact agttattaat agtaatcaat tacggggtca 180
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 240
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 300
acgccaatag ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac 360
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 420
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 480
tacatctacg tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt 540
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 600
attttgtgca gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg 660
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 720
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 780
cgcggcgggc gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 900
cttctcctcc gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc 960
tgcgtgaaag ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg 1020
ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct 1080
gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc 1140
ggccgggggc ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg 1200
ggtgtgtgcg tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc 1260
cctgcacccc cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc 1320
ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg 1380
cggggcgggg ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gcccccggag 1440
cgccggcggc tgtcgaggcg cggcgagccg cagccattgc cttttatggt aatcgtgcga 1500
gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg 1560
ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc gccggcagga aggaaatggg 1620
cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg 1680
ctgtccgcgg ggggacggct gccttcgggg gggacggggc agggcggggt tcggcttctg 1740
gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt catgccttct tctttttcct 1800
acagctcctg ggcaacgtgc tggttattgt gaccggtgtt gcggccccgc agcgcccgcg 1860
cgctcctctc cccgactcgg agcccctcgg cggcgcccgg cccaggaccc gcctaggagc 1920
gcaggagccc cagcgcagag accccaacgc cgagaccccc gccccggccc cgccgcgctt 1980
cctcccgacg cagtttagga cccttgttcg cgaagaggtg gtgtgcggct gagacccgcg 2040
tcctcaggac ggttccatca gtgcctcgat cctgccccac tggaggagga aggcagcccg 2100
aacagcgctc acctaactaa cagctgctga gagctgggtt ccgtggccat gcacctggga 2160
ctgccttgag aagcgtgagc aaaccgccca gagtagaagc gctagccacc atggattggg 2220
gcacgctgca gacgatcctg gggggtgtga acaaacactc caccagcatt ggaaagatct 2280
ggctcaccgt cctcttcatt tttcgcatta tgatcctcgt tgtggctgca aaggaggtgt 2340
ggggagatga gcaggccgac tttgtctgca acaccctgca gccaggctgc aagaacgtgt 2400
gctacgatca ctacttcccc atctcccaca tccggctatg ggccctgcag ctgatcttcg 2460
tgtccacgcc agcgctccta gtggccatgc acgtggccta ccggagacat gagaagaaga 2520
ggaagttcat caagggggag ataaagagtg aatttaagga catcgaggag atcaaaaccc 2580
agaaggtccg catcgaaggc tccctgtggt ggacctacac aagcagcatc ttcttccggg 2640
tcatcttcga agccgccttc atgtacgtct tctatgtcat gtacgacggc ttctccatgc 2700
agcggctggt gaagtgcaac gcctggcctt gtcccaacac tgtggactgc tttgtgtccc 2760
ggcccacgga gaagactgtc ttcacagtgt tcatgattgc agtgtctgga atttgcatcc 2820
tgctgaatgt cactgaattg tgttatttgc taattagata ttgttctggg aagtcaaaaa 2880
agccagttgg atcccgggct gactacaaag accatgacgg tgattataaa gatcatgaca 2940
tcgactacaa ggatgacgat gacaagtaag aaatagacag catgagaggg atgaggcaac 3000
ccgtgctcag ctgtcaaggc tcagtcgcta gcatttccca acacaaagat tctgacctta 3060
aatgcaacca tttgaaaccc ctgtaggcct caggtgaaac tccagatgcc acaatggagc 3120
tctgctcccc taaagcctca aaacaaaggc ctaattctat gcctgtctta attttctttc 3180
acttaagtta gttccactga gaccccaggc tgttaggggt tattggtgta aggtactttc 3240
atattttaaa cagaggatat cggcatttgt ttctttctct gaggacaaga gaaaaaagcc 3300
aggttccaca gaggacacag agaaggtttg ggtgtcctcc tggggttctt tttgccaact 3360
ttccccacgt taaaggtgaa cattggttct ttcatttgct ttggaagttt taatctctaa 3420
cagtggacaa agttaccagt gccttaaact ctgttacact ttttggaagt gaaaactttg 3480
tagtatgata ggttattttg atgtaaagat gttctggata ccattatatg ttccccctgt 3540
ttcagaggct cagattgtaa tatgtaaatg gtatgtcatt cgctactatg atttaatttg 3600
aaatatggtc ttttggttat gaatactttg cagcacagct gagaggctgt ctgttgtatt 3660
cattgtggtc atagcaccta acaacattgt agcctcaatc gagtgagaca gactagaagt 3720
tcctagtgat ggcttatgat agcaaatggc ctcatgtcaa atatttagat gtaattttgt 3780
gtaagaaata cagactggat gtaccaccaa ctactacctg taatgacagg cctgtccaac 3840
acatctccct tttccatgac tgtggtagcc agcatcggaa agaacgctga tttaaagagg 3900
tcgcttggga attttattga cacagtacca tttaatgggg aggacaaaat ggggcagggg 3960
agggagaagt ttctgtcgtt aaaaacagat ttggaaagac tggactctaa agtctgttga 4020
ttaaagatga gctttgtcta cttcaaaagt ttgtttgctt accccttcag cctccaattt 4080
tttaagtgaa aatatagcta ataacatgtg aaaagaatag aagctaaggt ttagataaat 4140
attgagcaga tctataggaa gattgaacct gaatattgcc attatgcttg acatggtttc 4200
caaaaaatgg tactccacat atttcagtga gggtaagtat tttcctgttg tcaagaatag 4260
cattgtaaaa gcattttgta ataataaaga atagctttaa tgatatgctt gtaactaaaa 4320
taattttgta atgtatcaaa tacatttaaa acattaaaat ataatctcta taataagagc 4380
tcgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc 4440
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga 4500
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga 4560
cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat 4620
ggaagcttga attcagctga cgtgcctcgg accgctagga acccctagtg atggagttgg 4680
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 4740
gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 4786
<210> 83
<211> 4018
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 83
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtgacattg attattgact agttattaat agtaatcaat tacggggtca 180
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 240
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 300
acgccaatag ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac 360
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 420
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 480
tacatctacg tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt 540
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 600
attttgtgca gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg 660
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 720
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 780
cgcggcgggc gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 900
cttctcctcc gggctgtaat tagcgcttgg tttaatgacg gcttgtttct tttctgtggc 960
tgcgtgaaag ccttgagggg ctccgggagc tagagcctct gctaaccatg ttcatgcctt 1020
cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgaccggtg ttgcggcccc 1080
gcagcgcccg cgcgctcctc tccccgactc ggagcccctc ggcggcgccc ggcccaggac 1140
ccgcctagga gcgcaggagc cccagcgcag agaccccaac gccgagaccc ccgccccggc 1200
cccgccgcgc ttcctcccga cgcagtttag gacccttgtt cgcgaagagg tggtgtgcgg 1260
ctgagacccg cgtcctcagg acggttccat cagtgcctcg atcctgcccc actggaggag 1320
gaaggcagcc cgaacagcgc tcacctaact aacagctgct gagagctggg ttccgtggcc 1380
atgcacctgg gactgccttg agaagcgtga gcaaaccgcc cagagtagaa gcgctagcca 1440
ccatggattg gggcacgctg cagacgatcc tggggggtgt gaacaaacac tccaccagca 1500
ttggaaagat ctggctcacc gtcctcttca tttttcgcat tatgatcctc gttgtggctg 1560
caaaggaggt gtggggagat gagcaggccg actttgtctg caacaccctg cagccaggct 1620
gcaagaacgt gtgctacgat cactacttcc ccatctccca catccggcta tgggccctgc 1680
agctgatctt cgtgtccacg ccagcgctcc tagtggccat gcacgtggcc taccggagac 1740
atgagaagaa gaggaagttc atcaaggggg agataaagag tgaatttaag gacatcgagg 1800
agatcaaaac ccagaaggtc cgcatcgaag gctccctgtg gtggacctac acaagcagca 1860
tcttcttccg ggtcatcttc gaagccgcct tcatgtacgt cttctatgtc atgtacgacg 1920
gcttctccat gcagcggctg gtgaagtgca acgcctggcc ttgtcccaac actgtggact 1980
gctttgtgtc ccggcccacg gagaagactg tcttcacagt gttcatgatt gcagtgtctg 2040
gaatttgcat cctgctgaat gtcactgaat tgtgttattt gctaattaga tattgttctg 2100
ggaagtcaaa aaagccagtt ggatcccggg ctgactacaa agaccatgac ggtgattata 2160
aagatcatga catcgactac aaggatgacg atgacaagta agaaatagac agcatgagag 2220
ggatgaggca acccgtgctc agctgtcaag gctcagtcgc tagcatttcc caacacaaag 2280
attctgacct taaatgcaac catttgaaac ccctgtaggc ctcaggtgaa actccagatg 2340
ccacaatgga gctctgctcc cctaaagcct caaaacaaag gcctaattct atgcctgtct 2400
taattttctt tcacttaagt tagttccact gagaccccag gctgttaggg gttattggtg 2460
taaggtactt tcatatttta aacagaggat atcggcattt gtttctttct ctgaggacaa 2520
gagaaaaaag ccaggttcca cagaggacac agagaaggtt tgggtgtcct cctggggttc 2580
tttttgccaa ctttccccac gttaaaggtg aacattggtt ctttcatttg ctttggaagt 2640
tttaatctct aacagtggac aaagttacca gtgccttaaa ctctgttaca ctttttggaa 2700
gtgaaaactt tgtagtatga taggttattt tgatgtaaag atgttctgga taccattata 2760
tgttccccct gtttcagagg ctcagattgt aatatgtaaa tggtatgtca ttcgctacta 2820
tgatttaatt tgaaatatgg tcttttggtt atgaatactt tgcagcacag ctgagaggct 2880
gtctgttgta ttcattgtgg tcatagcacc taacaacatt gtagcctcaa tcgagtgaga 2940
cagactagaa gttcctagtg atggcttatg atagcaaatg gcctcatgtc aaatatttag 3000
atgtaatttt gtgtaagaaa tacagactgg atgtaccacc aactactacc tgtaatgaca 3060
ggcctgtcca acacatctcc cttttccatg actgtggtag ccagcatcgg aaagaacgct 3120
gatttaaaga ggtcgcttgg gaattttatt gacacagtac catttaatgg ggaggacaaa 3180
atggggcagg ggagggagaa gtttctgtcg ttaaaaacag atttggaaag actggactct 3240
aaagtctgtt gattaaagat gagctttgtc tacttcaaaa gtttgtttgc ttaccccttc 3300
agcctccaat tttttaagtg aaaatatagc taataacatg tgaaaagaat agaagctaag 3360
gtttagataa atattgagca gatctatagg aagattgaac ctgaatattg ccattatgct 3420
tgacatggtt tccaaaaaat ggtactccac atatttcagt gagggtaagt attttcctgt 3480
tgtcaagaat agcattgtaa aagcattttg taataataaa gaatagcttt aatgatatgc 3540
ttgtaactaa aataattttg taatgtatca aatacattta aaacattaaa atataatctc 3600
tataataaga gctcgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt 3660
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 3720
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 3780
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 3840
ggtgggctct atggaagctt gaattcagct gacgtgcctc ggaccgctag gaacccctag 3900
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 3960
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4018
<210> 84
<211> 4508
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 84
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtgacattg attattgact agttattaat agtaatcaat tacggggtca 180
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 240
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 300
acgccaatag ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac 360
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 420
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 480
tacatctacg tattagtcat cgctattacc atgggtaagc ttccgcagaa tcctatcagt 540
ttcccccttt cgtgctgtgt gcatcgagca ggaaggggct tggcaggttt tacctgccct 600
ctttcctttc tgaaaagtct gggcctcctc accccgaaag gagtcacctc cttgcagttc 660
cccagttgcg aaaagaggag gaagttggct gggccggggg ccgcgggggg caccctccgc 720
agatggcggg acccccctgc cggccatggc aaaaacgagg cttgtctctc ccaccgcccc 780
caaccttagt ccttggcaca ttgttgaaag taattgaata aaatcggaaa ttcgagaagg 840
cgttcgttcg gattggtgag attttgaggg gagaaagaag cggggacttc gccggcacca 900
gcggcgcccc ctcctcggcc accgttaacc cccattccag agggcactgc cccgccaccc 960
agcctaggtc cccctgcgag agcctcgcgg gcccgcgcag cctccgcgac tcgaacagat 1020
cttcagtcct tggaggaatg cctgtttctc taacaataaa aaattaaaga agcgctcata 1080
aatgccaagt cctctcgcac tatgcggagt acagaggaca acgaccacag ccatccctga 1140
accccgccca cggcacagcg ccggagccgg ggtctggggc gccgcttcct ggggggtccc 1200
gactctcagc cgcccccgct tcacccgggc cgccaagggg ctgggggagg cggcgctcgg 1260
ggtaaccggg ggagactcag ggcgctgggg gcacttgggg aactcatggg ggctcaaagg 1320
aactaggaga tcgggacctc gaaggggact tggggggttc ggggctttcg ggggcggtcg 1380
ggggttcgcg gacccgggaa gctctgagga cccagaggcc gggcgcgctc cgcccgcggc 1440
gccgccccct ccgtaacttt cccagtctcc gagggaagag gcggggtgtg gggtgcggtt 1500
aaaaggcgcc acggcgggag acaggtctcc tgggcaacgt gctggttatt gtgaccggtg 1560
ttgcggcccc gcagcgcccg cgcgctcctc tccccgactc ggagcccctc ggcggcgccc 1620
ggcccaggac ccgcctagga gcgcaggagc cccagcgcag agaccccaac gccgagaccc 1680
ccgccccggc cccgccgcgc ttcctcccga cgcagtttag gacccttgtt cgcgaagagg 1740
tggtgtgcgg ctgagacccg cgtcctcagg acggttccat cagtgcctcg atcctgcccc 1800
actggaggag gaaggcagcc cgaacagcgc tcacctaact aacagctgct gagagctggg 1860
ttccgtggcc atgcacctgg gactgccttg agaagcgtga gcaaaccgcc cagagtagaa 1920
gcgctagcca ccatggattg gggcacgctg cagacgatcc tggggggtgt gaacaaacac 1980
tccaccagca ttggaaagat ctggctcacc gtcctcttca tttttcgcat tatgatcctc 2040
gttgtggctg caaaggaggt gtggggagat gagcaggccg actttgtctg caacaccctg 2100
cagccaggct gcaagaacgt gtgctacgat cactacttcc ccatctccca catccggcta 2160
tgggccctgc agctgatctt cgtgtccacg ccagcgctcc tagtggccat gcacgtggcc 2220
taccggagac atgagaagaa gaggaagttc atcaaggggg agataaagag tgaatttaag 2280
gacatcgagg agatcaaaac ccagaaggtc cgcatcgaag gctccctgtg gtggacctac 2340
acaagcagca tcttcttccg ggtcatcttc gaagccgcct tcatgtacgt cttctatgtc 2400
atgtacgacg gcttctccat gcagcggctg gtgaagtgca acgcctggcc ttgtcccaac 2460
actgtggact gctttgtgtc ccggcccacg gagaagactg tcttcacagt gttcatgatt 2520
gcagtgtctg gaatttgcat cctgctgaat gtcactgaat tgtgttattt gctaattaga 2580
tattgttctg ggaagtcaaa aaagccagtt ggatcccggg ctgactacaa agaccatgac 2640
ggtgattata aagatcatga catcgactac aaggatgacg atgacaagta agaaatagac 2700
agcatgagag ggatgaggca acccgtgctc agctgtcaag gctcagtcgc tagcatttcc 2760
caacacaaag attctgacct taaatgcaac catttgaaac ccctgtaggc ctcaggtgaa 2820
actccagatg ccacaatgga gctctgctcc cctaaagcct caaaacaaag gcctaattct 2880
atgcctgtct taattttctt tcacttaagt tagttccact gagaccccag gctgttaggg 2940
gttattggtg taaggtactt tcatatttta aacagaggat atcggcattt gtttctttct 3000
ctgaggacaa gagaaaaaag ccaggttcca cagaggacac agagaaggtt tgggtgtcct 3060
cctggggttc tttttgccaa ctttccccac gttaaaggtg aacattggtt ctttcatttg 3120
ctttggaagt tttaatctct aacagtggac aaagttacca gtgccttaaa ctctgttaca 3180
ctttttggaa gtgaaaactt tgtagtatga taggttattt tgatgtaaag atgttctgga 3240
taccattata tgttccccct gtttcagagg ctcagattgt aatatgtaaa tggtatgtca 3300
ttcgctacta tgatttaatt tgaaatatgg tcttttggtt atgaatactt tgcagcacag 3360
ctgagaggct gtctgttgta ttcattgtgg tcatagcacc taacaacatt gtagcctcaa 3420
tcgagtgaga cagactagaa gttcctagtg atggcttatg atagcaaatg gcctcatgtc 3480
aaatatttag atgtaatttt gtgtaagaaa tacagactgg atgtaccacc aactactacc 3540
tgtaatgaca ggcctgtcca acacatctcc cttttccatg actgtggtag ccagcatcgg 3600
aaagaacgct gatttaaaga ggtcgcttgg gaattttatt gacacagtac catttaatgg 3660
ggaggacaaa atggggcagg ggagggagaa gtttctgtcg ttaaaaacag atttggaaag 3720
actggactct aaagtctgtt gattaaagat gagctttgtc tacttcaaaa gtttgtttgc 3780
ttaccccttc agcctccaat tttttaagtg aaaatatagc taataacatg tgaaaagaat 3840
agaagctaag gtttagataa atattgagca gatctatagg aagattgaac ctgaatattg 3900
ccattatgct tgacatggtt tccaaaaaat ggtactccac atatttcagt gagggtaagt 3960
attttcctgt tgtcaagaat agcattgtaa aagcattttg taataataaa gaatagcttt 4020
aatgatatgc ttgtaactaa aataattttg taatgtatca aatacattta aaacattaaa 4080
atataatctc tataataaga gctcgctgat cagcctcgac tgtgccttct agttgccagc 4140
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 4200
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 4260
tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg 4320
ctggggatgc ggtgggctct atggaagctt gaattcagct gacgtgcctc ggaccgctag 4380
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4440
gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 4500
gcgcgcag 4508
<210> 85
<211> 4178
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 85
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtgacattg attattgact agttattaat agtaatcaat tacggggtca 180
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 240
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 300
acgccaatag ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac 360
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 420
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 480
tacatctacg tattagtcat cgctattacc atgggtgaac atatcctggt gtggagtagg 540
ggacgctgct ctgacagagg ctcgggggcc tgagctggct ctgtgagctg gggaggaggc 600
agacagccag gccttgtctg caagcagacc tggcagcatt gggctggccg ccccccaggg 660
cctcctcttc atgcccagtg aatgactcac cttggcacag acacaatgtt cggggtgggc 720
acagtgcctg cttcccgccg caccccagcc cccctcaaat gccttccgag aagcccattg 780
agcagggggc ttgcattgca ccccagcctg acagcctggc atcttgggat aaaagcagca 840
cagcccccta ggggctgccc ttgctgtgtg gcgccaccgg cggtggagaa caaggctcta 900
ttcagcctgt gcccaggaaa ggggatcagg ggatgcccag gcatggacag tgggtggcag 960
ggggggagag gagggctgtc tgcttcccag aagtccaagg acacaaatgg gtgaggggag 1020
ctctccccat agctgggctg cggcccaacc ccaccccctc aggctatgcc agggggtgtt 1080
gccaggggca cccgggcatc gccagtctag cccactcctt cataaagccc tcgcatccca 1140
ggagcgagca gagccagagc aggttggaga ggagacgcat cacctccgct gctcgcctcc 1200
tgggcaacgt gctggttatt gtgaccggtg ttgcggcccc gcagcgcccg cgcgctcctc 1260
tccccgactc ggagcccctc ggcggcgccc ggcccaggac ccgcctagga gcgcaggagc 1320
cccagcgcag agaccccaac gccgagaccc ccgccccggc cccgccgcgc ttcctcccga 1380
cgcagtttag gacccttgtt cgcgaagagg tggtgtgcgg ctgagacccg cgtcctcagg 1440
acggttccat cagtgcctcg atcctgcccc actggaggag gaaggcagcc cgaacagcgc 1500
tcacctaact aacagctgct gagagctggg ttccgtggcc atgcacctgg gactgccttg 1560
agaagcgtga gcaaaccgcc cagagtagaa gcgctagcca ccatggattg gggcacgctg 1620
cagacgatcc tggggggtgt gaacaaacac tccaccagca ttggaaagat ctggctcacc 1680
gtcctcttca tttttcgcat tatgatcctc gttgtggctg caaaggaggt gtggggagat 1740
gagcaggccg actttgtctg caacaccctg cagccaggct gcaagaacgt gtgctacgat 1800
cactacttcc ccatctccca catccggcta tgggccctgc agctgatctt cgtgtccacg 1860
ccagcgctcc tagtggccat gcacgtggcc taccggagac atgagaagaa gaggaagttc 1920
atcaaggggg agataaagag tgaatttaag gacatcgagg agatcaaaac ccagaaggtc 1980
cgcatcgaag gctccctgtg gtggacctac acaagcagca tcttcttccg ggtcatcttc 2040
gaagccgcct tcatgtacgt cttctatgtc atgtacgacg gcttctccat gcagcggctg 2100
gtgaagtgca acgcctggcc ttgtcccaac actgtggact gctttgtgtc ccggcccacg 2160
gagaagactg tcttcacagt gttcatgatt gcagtgtctg gaatttgcat cctgctgaat 2220
gtcactgaat tgtgttattt gctaattaga tattgttctg ggaagtcaaa aaagccagtt 2280
ggatcccggg ctgactacaa agaccatgac ggtgattata aagatcatga catcgactac 2340
aaggatgacg atgacaagta agaaatagac agcatgagag ggatgaggca acccgtgctc 2400
agctgtcaag gctcagtcgc tagcatttcc caacacaaag attctgacct taaatgcaac 2460
catttgaaac ccctgtaggc ctcaggtgaa actccagatg ccacaatgga gctctgctcc 2520
cctaaagcct caaaacaaag gcctaattct atgcctgtct taattttctt tcacttaagt 2580
tagttccact gagaccccag gctgttaggg gttattggtg taaggtactt tcatatttta 2640
aacagaggat atcggcattt gtttctttct ctgaggacaa gagaaaaaag ccaggttcca 2700
cagaggacac agagaaggtt tgggtgtcct cctggggttc tttttgccaa ctttccccac 2760
gttaaaggtg aacattggtt ctttcatttg ctttggaagt tttaatctct aacagtggac 2820
aaagttacca gtgccttaaa ctctgttaca ctttttggaa gtgaaaactt tgtagtatga 2880
taggttattt tgatgtaaag atgttctgga taccattata tgttccccct gtttcagagg 2940
ctcagattgt aatatgtaaa tggtatgtca ttcgctacta tgatttaatt tgaaatatgg 3000
tcttttggtt atgaatactt tgcagcacag ctgagaggct gtctgttgta ttcattgtgg 3060
tcatagcacc taacaacatt gtagcctcaa tcgagtgaga cagactagaa gttcctagtg 3120
atggcttatg atagcaaatg gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa 3180
tacagactgg atgtaccacc aactactacc tgtaatgaca ggcctgtcca acacatctcc 3240
cttttccatg actgtggtag ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg 3300
gaattttatt gacacagtac catttaatgg ggaggacaaa atggggcagg ggagggagaa 3360
gtttctgtcg ttaaaaacag atttggaaag actggactct aaagtctgtt gattaaagat 3420
gagctttgtc tacttcaaaa gtttgtttgc ttaccccttc agcctccaat tttttaagtg 3480
aaaatatagc taataacatg tgaaaagaat agaagctaag gtttagataa atattgagca 3540
gatctatagg aagattgaac ctgaatattg ccattatgct tgacatggtt tccaaaaaat 3600
ggtactccac atatttcagt gagggtaagt attttcctgt tgtcaagaat agcattgtaa 3660
aagcattttg taataataaa gaatagcttt aatgatatgc ttgtaactaa aataattttg 3720
taatgtatca aatacattta aaacattaaa atataatctc tataataaga gctcgctgat 3780
cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 3840
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 3900
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 3960
gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggaagctt 4020
gaattcagct gacgtgcctc ggaccgctag gaacccctag tgatggagtt ggccactccc 4080
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 4140
tttgcccggg cggcctcagt gagcgagcga gcgcgcag 4178
<210> 86
<211> 3798
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 86
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtggtgaac atatcctggt gtggagtagg ggacgctgct ctgacagagg 180
ctcgggggcc tgagctggct ctgtgagctg gggaggaggc agacagccag gccttgtctg 240
caagcagacc tggcagcatt gggctggccg ccccccaggg cctcctcttc atgcccagtg 300
aatgactcac cttggcacag acacaatgtt cggggtgggc acagtgcctg cttcccgccg 360
caccccagcc cccctcaaat gccttccgag aagcccattg agcagggggc ttgcattgca 420
ccccagcctg acagcctggc atcttgggat aaaagcagca cagcccccta ggggctgccc 480
ttgctgtgtg gcgccaccgg cggtggagaa caaggctcta ttcagcctgt gcccaggaaa 540
ggggatcagg ggatgcccag gcatggacag tgggtggcag ggggggagag gagggctgtc 600
tgcttcccag aagtccaagg acacaaatgg gtgaggggag ctctccccat agctgggctg 660
cggcccaacc ccaccccctc aggctatgcc agggggtgtt gccaggggca cccgggcatc 720
gccagtctag cccactcctt cataaagccc tcgcatccca ggagcgagca gagccagagc 780
aggttggaga ggagacgcat cacctccgct gctcgcctcc tgggcaacgt gctggttatt 840
gtgaccggtg ttgcggcccc gcagcgcccg cgcgctcctc tccccgactc ggagcccctc 900
ggcggcgccc ggcccaggac ccgcctagga gcgcaggagc cccagcgcag agaccccaac 960
gccgagaccc ccgccccggc cccgccgcgc ttcctcccga cgcagtttag gacccttgtt 1020
cgcgaagagg tggtgtgcgg ctgagacccg cgtcctcagg acggttccat cagtgcctcg 1080
atcctgcccc actggaggag gaaggcagcc cgaacagcgc tcacctaact aacagctgct 1140
gagagctggg ttccgtggcc atgcacctgg gactgccttg agaagcgtga gcaaaccgcc 1200
cagagtagaa gcgctagcca ccatggattg gggcacgctg cagacgatcc tggggggtgt 1260
gaacaaacac tccaccagca ttggaaagat ctggctcacc gtcctcttca tttttcgcat 1320
tatgatcctc gttgtggctg caaaggaggt gtggggagat gagcaggccg actttgtctg 1380
caacaccctg cagccaggct gcaagaacgt gtgctacgat cactacttcc ccatctccca 1440
catccggcta tgggccctgc agctgatctt cgtgtccacg ccagcgctcc tagtggccat 1500
gcacgtggcc taccggagac atgagaagaa gaggaagttc atcaaggggg agataaagag 1560
tgaatttaag gacatcgagg agatcaaaac ccagaaggtc cgcatcgaag gctccctgtg 1620
gtggacctac acaagcagca tcttcttccg ggtcatcttc gaagccgcct tcatgtacgt 1680
cttctatgtc atgtacgacg gcttctccat gcagcggctg gtgaagtgca acgcctggcc 1740
ttgtcccaac actgtggact gctttgtgtc ccggcccacg gagaagactg tcttcacagt 1800
gttcatgatt gcagtgtctg gaatttgcat cctgctgaat gtcactgaat tgtgttattt 1860
gctaattaga tattgttctg ggaagtcaaa aaagccagtt ggatcccggg ctgactacaa 1920
agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg atgacaagta 1980
agaaatagac agcatgagag ggatgaggca acccgtgctc agctgtcaag gctcagtcgc 2040
tagcatttcc caacacaaag attctgacct taaatgcaac catttgaaac ccctgtaggc 2100
ctcaggtgaa actccagatg ccacaatgga gctctgctcc cctaaagcct caaaacaaag 2160
gcctaattct atgcctgtct taattttctt tcacttaagt tagttccact gagaccccag 2220
gctgttaggg gttattggtg taaggtactt tcatatttta aacagaggat atcggcattt 2280
gtttctttct ctgaggacaa gagaaaaaag ccaggttcca cagaggacac agagaaggtt 2340
tgggtgtcct cctggggttc tttttgccaa ctttccccac gttaaaggtg aacattggtt 2400
ctttcatttg ctttggaagt tttaatctct aacagtggac aaagttacca gtgccttaaa 2460
ctctgttaca ctttttggaa gtgaaaactt tgtagtatga taggttattt tgatgtaaag 2520
atgttctgga taccattata tgttccccct gtttcagagg ctcagattgt aatatgtaaa 2580
tggtatgtca ttcgctacta tgatttaatt tgaaatatgg tcttttggtt atgaatactt 2640
tgcagcacag ctgagaggct gtctgttgta ttcattgtgg tcatagcacc taacaacatt 2700
gtagcctcaa tcgagtgaga cagactagaa gttcctagtg atggcttatg atagcaaatg 2760
gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa tacagactgg atgtaccacc 2820
aactactacc tgtaatgaca ggcctgtcca acacatctcc cttttccatg actgtggtag 2880
ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg gaattttatt gacacagtac 2940
catttaatgg ggaggacaaa atggggcagg ggagggagaa gtttctgtcg ttaaaaacag 3000
atttggaaag actggactct aaagtctgtt gattaaagat gagctttgtc tacttcaaaa 3060
gtttgtttgc ttaccccttc agcctccaat tttttaagtg aaaatatagc taataacatg 3120
tgaaaagaat agaagctaag gtttagataa atattgagca gatctatagg aagattgaac 3180
ctgaatattg ccattatgct tgacatggtt tccaaaaaat ggtactccac atatttcagt 3240
gagggtaagt attttcctgt tgtcaagaat agcattgtaa aagcattttg taataataaa 3300
gaatagcttt aatgatatgc ttgtaactaa aataattttg taatgtatca aatacattta 3360
aaacattaaa atataatctc tataataaga gctcgctgat cagcctcgac tgtgccttct 3420
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3480
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3540
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3600
agcaggcatg ctggggatgc ggtgggctct atggaagctt gaattcagct gacgtgcctc 3660
ggaccgctag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 3720
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 3780
gagcgagcga gcgcgcag 3798
<210> 87
<211> 4745
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 87
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtgacattg attattgact agttattaat agtaatcaat tacggggtca 180
ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 240
ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 300
acgccaatag ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac 360
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 420
aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 480
tacatctacg tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt 540
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt 600
attttgtgca gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg 660
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 720
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 780
cgcggcgggc gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc 840
gccgcccgcc ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc 900
cttctcctcc gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc 960
tgcgtgaaag ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg 1020
ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct 1080
gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc 1140
ggccgggggc ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg 1200
ggtgtgtgcg tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc 1260
cctgcacccc cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc 1320
ggggcgtggc gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg 1380
cggggcgggg ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gcccccggag 1440
cgccggcggc tgtcgaggcg cggcgagccg cagccattgc cttttatggt aatcgtgcga 1500
gagggcgcag ggacttcctt tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg 1560
ccgcaccccc tctagcgggc gcggggcgaa gcggtgcggc gccggcagga aggaaatggg 1620
cggggagggc cttcgtgcgt cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg 1680
ctgtccgcgg ggggacggct gccttcgggg gggacggggc agggcggggt tcggcttctg 1740
gcgtgtgacc ggcggctcta gagcctctgc taaccatgtt catgccttct tctttttcct 1800
acagctcctg ggcaacgtgc tggttattgt gaccggtgtt gcggccccgc agcgcccgcg 1860
cgctcctctc cccgactcgg agcccctcgg cggcgcccgg cccaggaccc gcctaggagc 1920
gcaggagccc cagcgcagag accccaacgc cgagaccccc gccccggccc cgccgcgctt 1980
cctcccgacg cagtttagga cccttgttcg cgaagaggtg gtgtgcggct gagacccgcg 2040
tcctcaggac ggttccatca gtgcctcgat cctgccccac tggaggagga aggcagcccg 2100
aacagcgctc acctaactaa cagctgctga gagctgggtt ccgtggccat gcacctggga 2160
ctgccttgag aagcgtgagc aaaccgccca gagtagaagc gctagccacc atggattggg 2220
gcacgctgca gacgatcctg gggggtgtga acaaacactc caccagcatt ggaaagatct 2280
ggctcaccgt cctcttcatt tttcgcatta tgatcctcgt tgtggctgca aaggaggtgt 2340
ggggagatga gcaggccgac tttgtctgca acaccctgca gccaggctgc aagaacgtgt 2400
gctacgatca ctacttcccc atctcccaca tccggctatg ggccctgcag ctgatcttcg 2460
tgtccacgcc agcgctccta gtggccatgc acgtggccta ccggagacat gagaagaaga 2520
ggaagttcat caagggggag ataaagagtg aatttaagga catcgaggag atcaaaaccc 2580
agaaggtccg catcgaaggc tccctgtggt ggacctacac aagcagcatc ttcttccggg 2640
tcatcttcga agccgccttc atgtacgtct tctatgtcat gtacgacggc ttctccatgc 2700
agcggctggt gaagtgcaac gcctggcctt gtcccaacac tgtggactgc tttgtgtccc 2760
ggcccacgga gaagactgtc ttcacagtgt tcatgattgc agtgtctgga atttgcatcc 2820
tgctgaatgt cactgaattg tgttatttgc taattagata ttgttctggg aagtcaaaaa 2880
agccagttgg atcccgggct gactacaaag accatgacgg tgattataaa gatcatgaca 2940
tcgactacaa ggatgacgat gacaagtaag agctcagtgt gagttctacc attgccaaac 3000
tcgagcagtg aattctacca gtgccatagg atccagtgtg agttctacca ttgccaaagg 3060
tacccagtga attctaccag tgccatagtt aaccgcattg cccagttgtt agattaagaa 3120
atagacagca tgagagggat gaggcaaccc gtgctcagct gtcaaggctc agtcgctagc 3180
atttcccaac acaaagattc tgaccttaaa tgcaaccatt tgaaacccct gtaggcctca 3240
ggtgaaactc cagatgccac aatggagcct ctgctcccct aaagcctcaa aacaaaggcc 3300
taattctatg cctgtcttaa ttttctttca cttaagttag ttccactgag accccaggct 3360
gttaggggtt attggtgtaa ggtactttca tattttaaac agaggatatc ggcatttgtt 3420
tctttctctg aggacaagag aaaaaagcca ggttccacag aggacacaga gaaggtttgg 3480
gtgtcctcct ggggttcttt ttgccaactt tccccacgtt aaaggtgaac attggttctt 3540
tcatttgctt tggaagtttt aatctctaac agtggacaaa gttaccagtg ccttaaactc 3600
tgttacactt tttggaagtg aaaactttgt agtatgatag gttattttga tgtaaagatg 3660
ttctggatac cattatatgt tccccctgtt tcagaggctc agattgtaat atgtaaatgg 3720
tatgtcattc gctactatga tttaatttga aatatggtct tttggttatg aatactttgc 3780
agcacagctg agaggctgtc tgttgtattc attgtggtca tagcacctaa caacattgta 3840
gcctcaatcg agtgagacag actagaagtt cctagtgatg gcttatgata gcaaatggcc 3900
tcatgtcaaa tatttagatg taattttgtg taagaaatac agactggatg taccaccaac 3960
tactacctgt aatgacaggc ctgtccaaca catctccctt ttccatgact gtggtagcca 4020
gcatcggaaa gaacgctgat ttaaagaggt cgcttgggaa ttttattgac acagtaccat 4080
ttaatgggga ggacaaaatg gggcagggga gggagaagtt tctgtcgtta aaaacagatt 4140
tggaaagact ggactctaaa gtctgttgat taaagatgag ctttgtctac ttcaaaagtt 4200
tgtttgctta ccccttcagc ctccaatttt ttaagtgaaa atatagctaa taacatgtga 4260
aaagaataga agctaaggtt tagataaata ttgagcagat ctataggaag attgaacctg 4320
aatattgcca ttatgcttga cgctgatcag cctcgactgt gccttctagt tgccagccat 4380
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc 4440
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg 4500
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg 4560
gggatgcggt gggctctatg gaagcttgaa ttcagctgac gtgcctcgga ccgctaggaa 4620
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg 4680
cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg 4740
cgcag 4745
<210> 88
<211> 4712
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 88
ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60
ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcctg 120
cggccgcacg cgtcttcttc tggagtcttt tctggaataa ttctgggagt gggctcagcc 180
tgcgggagag taacattttt ataacttgat agatgtagct gagatgcctc ccagagggga 240
gacccgcctc tcctccggca gctgtgcacg taggcttgtt cccagcagcc tggccagggt 300
ggtccacctg gtgtttctca tcttctttcc ccggagcgct gactcctgcg cgtcctcttg 360
gaagactctt gacaggacgg gtgttttatg ggtgtgattc agtgtcctct tgcatcagtt 420
caatgtggtg gtgttcaatc aacccttgta gcgttagcaa aatttgctca agtcattccg 480
caggaatgtc tgtgtcttgc ttccaagaaa gcttgtaagt gccggcaaca ggccaagcag 540
ctcacaaacc tgaccacaag cctgtgagta attgtggggc agcacttagc agtcttttat 600
tttcgactta ttaaagtctc atcttggcct caccttctcc ctggaaggtg gcgtgggtgg 660
gaaccactgg gtcagatctt tttcaccctt gccgtggagc cagtttcctg ttgcatgtgg 720
gggaagcaac atgtggtgaa gagtatagaa aacgaaaaca tgtgggtaca gtatgtataa 780
gtggagggaa caaactcata attccaacta gtttctcatg agagactcat gaatcattgt 840
ggtagttctc aatataaact taatctaggc cggatgtggt ggctcacacc tgtaatctca 900
gcactctggg tggatcactt gaggtcagga gtttgagacc agtctgacca acatggagaa 960
accccatcgc tactaaaaat acaaaattat ccagatgtgg tggctcacac ctgtaatccc 1020
agcactttgg gaggctgagg cgggtggatc acttgaggtc aggagtttga gaccagcctg 1080
accaacatgg agaaactgtg tctctactaa aaatacaaaa ttagctgggc gtggtgacgc 1140
atgcctgtaa tcccagctat ttggaggccg aagcaggaag cttccgcaga atcctatcag 1200
tttccccctt tcgtgctgtg tgcatcgagc aggaaggggc ttggcaggtt ttacctgccc 1260
tctttccttt ctgaaaagtc tgggcctcct caccccgaaa ggagtcacct ccttgcagtt 1320
ccccagttgc gaaaagagga ggaagttggc tgggccgggg gccgcggggg gcaccctccg 1380
cagatggcgg gacccccctg ccggccatgg caaaaacgag gcttgtctct cccaccgccc 1440
ccaaccttag tccttggcac attgttgaaa gtaattgaat aaaatcggaa attcgagaag 1500
gcgttcgttc ggattggtga gattttgagg ggagaaagaa gcggggactt cgccggcacc 1560
agcggcgccc cctcctcggc caccgttaac ccccattcca gagggcactg ccccgccacc 1620
cagcctaggt ccccctgcga gagcctcgcg ggcccgcgca gcctccgcga ctcgaacaga 1680
tcttcagtcc ttggaggaat gcctgtttct ctaacaataa aaaattaaag aagcgctcat 1740
aaatgccaag tcctctcgca ctatgcggag tacagaggac aacgaccaca gccatccctg 1800
aaccccgccc acggcacagc gccggagccg gggtctgggg cgccgcttcc tggggggtcc 1860
cgactctcag ccgcccccgc ttcacccggg ccgccaaggg gctgggggag gcggcgctcg 1920
gggtaaccgg gggagactca gggcgctggg ggcacttggg gaactcatgg gggctcaaag 1980
gaactaggag atcgggacct cgaaggggac ttggggggtt cggggctttc gggggcggtc 2040
gggggttcgc ggacccggga agctctgagg acccagaggc cgggcgcgct ccgcccgcgg 2100
cgccgccccc tccgtaactt tcccagtctc cgagggaaga ggcggggtgt ggggtgcggt 2160
taaaaggcgc cacggcggga gacaggtgtt gcggccccgc agcgcccgcg cgctcctctc 2220
cccgactcgg agcccctcgg cggcgcccgg cccaggaccc gcctaggagc gcaggagccc 2280
cagcgcagag accccaacgc cgagaccccc gccccggccc cgccgcgctt cctcccgacg 2340
cagagcaaac cgcccagagt agaagaccgg tcgctagcca ccatggattg gggcacgctg 2400
cagacgatcc tggggggtgt gaacaaacac tccaccagca ttggaaagat ctggctcacc 2460
gtcctcttca tttttcgcat tatgatcctc gttgtggctg caaaggaggt gtggggagat 2520
gagcaggccg actttgtctg caacaccctg cagccaggct gcaagaacgt gtgctacgat 2580
cactacttcc ccatctccca catccggcta tgggccctgc agctgatctt cgtgtccacg 2640
ccagcgctcc tagtggccat gcacgtggcc taccggagac atgagaagaa gaggaagttc 2700
atcaaggggg agataaagag tgaatttaag gacatcgagg agatcaaaac ccagaaggtc 2760
cgcatcgaag gctccctgtg gtggacctac acaagcagca tcttcttccg ggtcatcttc 2820
gaagccgcct tcatgtacgt cttctatgtc atgtacgacg gcttctccat gcagcggctg 2880
gtgaagtgca acgcctggcc ttgtcccaac actgtggact gctttgtgtc ccggcccacg 2940
gagaagactg tcttcacagt gttcatgatt gcagtgtctg gaatttgcat cctgctgaat 3000
gtcactgaat tgtgttattt gctaattaga tattgttctg ggaagtcaaa aaagccagtt 3060
ggatcccggg ctgactacaa agaccatgac ggtgattata aagatcatga catcgactac 3120
aaggatgacg atgacaagta agaaatagac agcatgagag ggatgaggca acccgtgctc 3180
agctgtcaag gctcagtcgc tagcatttcc caacacaaag attctgacct taaatgcaac 3240
catttgaaac ccctgtaggc ctcaggtgaa actccagatg ccacaatgga gctctgctcc 3300
cctaaagcct caaaacaaag gcctaattct atgcctgtct taattttctt tcacttaagt 3360
tagttccact gagaccccag gctgttaggg gttattggtg taaggtactt tcatatttta 3420
aacagaggat atcggcattt gtttctttct ctgaggacaa gagaaaaaag ccaggttcca 3480
cagaggacac agagaaggtt tgggtgtcct cctggggttc tttttgccaa ctttccccac 3540
gttaaaggtg aacattggtt ctttcatttg ctttggaagt tttaatctct aacagtggac 3600
aaagttacca gtgccttaaa ctctgttaca ctttttggaa gtgaaaactt tgtagtatga 3660
taggttattt tgatgtaaag atgttctgga taccattata tgttccccct gtttcagagg 3720
ctcagattgt aatatgtaaa tggtatgtca ttcgctacta tgatttaatt tgaaatatgg 3780
tcttttggtt atgaatactt tgcagcacag ctgagaggct gtctgttgta ttcattgtgg 3840
tcatagcacc taacaacatt gtagcctcaa tcgagtgaga cagactagaa gttcctagtg 3900
atggcttatg atagcaaatg gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa 3960
tacagactgg atgtaccacc aactactacc tgtaatgaca ggcctgtcca acacatctcc 4020
cttttccatg actgtggtag ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg 4080
gaattttatt gacacagtac catttaatgg ggaggacaaa atggggcagg ggagggagaa 4140
gtttctgtcg ttaaaaacag atttggaaag actggactct aaagtctgtt gattaaagat 4200
gagctttgtc tacttcaaaa gtttgtttgc ttaccccttc agcctccaat tttttaagtg 4260
aaaatatagc taataacatg tgaaaagaat agaagctaag gtttagataa atattgagca 4320
gatctatagg aagattgaac ctgaatattg ccattatgct tgacatggtt tccaaaaaat 4380
ggtactccac atatttcagt gagggtaagt attttcctgt tgtcaagaat agcattgtaa 4440
aagcattttg taataataaa gaatagcttt aatgatatgc ttgtaactaa aataattttg 4500
taatgtatca aatacattta aaacattaaa atataatctc tataataaaa gcttgaattc 4560
agctgacgtg cctcggaccg ctaggaaccc ctagtgatgg agttggccac tccctctctg 4620
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc 4680
cgggcggcct cagtgagcga gcgagcgcgc ag 4712
<210> 89
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 示例性sNRP poly(A)信号序列
<400> 89
aaataaaata cgaaatg 17
<210> 90
<211> 1188
<212> DNA
<213> 人工序列
<220>
<223> 示例性GDF6启动子
<400> 90
ccacaggtaa ctccgtcggc gtccacaggg gggcaggaga taccatactg cacagttgta 60
cgtcttccat ctgtttggtg tagaaaaatc taaccactac aagaatgcca cgggcactgt 120
ggcagacaga agcagcgcta cgccgcatcg cctttcagcg tgcaggccca ggaatgagcg 180
aggcagtggg cggggaagac aggcacgggg aatctgggga cagataaagg aaactcgtga 240
tggggcgagg ctgggctgaa gagaaacaga ttggggtaga gctgcaaagg gaggggtcca 300
ctggaaggcg aggggggagg ccgggaagag agagggtggg aaggcagtgt gagatgggag 360
ggcagtgtga gaagaaaagc aggctgggga agagggattg gaatgcagaa ggaacttggg 420
gaaggaggaa gtcctgcagg cgggagggaa agaagagagg gggagcagct aaagtctgcg 480
tcagaagagg ttggggactg cgagaggaga ggctggggcc tgcaggggag cgcagcagct 540
tttagcatcg atccaaactc taaagactcg tggcctttgc ctgacctcga gggtcgggaa 600
tagacgcctg tctttgtgga gagcgatacc caaccgagaa aatggggctg ttccgagctg 660
ggccctgcgc ctggcccagg gcgaggcttc tctggctccg ggctggcccc tgaggggcag 720
cacgcagcct gcagcagagg cgcctgctcc aagctgtctc ttgggggcgc cgccgccgct 780
tccctcctcc ggggccgctc gctcccagga aagtggaggc ggctggcgag gaccgagagc 840
cggggccgcg ctgcggaggg accacacctc cgggagttcg agggggaccc tggcgcggcg 900
ggccagcctt tcgggccggc agcgcccgcc ttcccccggt cagcgcttgc ggcccgcgcc 960
gcgcgcaccg cccggcaacc ccgcgcgcgt cccgcggggg cgctgcgtct tcctgccaca 1020
ccggcgcacc gcggcccctc tcccccacac ctccggcccg caccacccgg ctctcctccc 1080
accctcccca cccctcctct gccctccctc cccattcctc ccctcccggc gaggggcggg 1140
agggggcgtg gcggggccgg ggtttgtgtg gctgggaccc ggctcctc 1188
<210> 91
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> 示例性hGJB2基础启动子
<400> 91
aagctctgag gacccagagg ccgggcgcgc tccgcccgcg gcgccgcccc ctccgtaact 60
ttcccagtct ccgagggaag aggcggggtg tggggtgcgg ttaaaaggcg ccacggcggg 120
agacaggt 128
<210> 92
<211> 9
<212> DNA
<213> 人工序列
<220>
<223> 示例性克隆位点Q
<400> 92
ctcaccggt 9
<210> 93
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 合成条形码A
<400> 93
gtgtcacc 8
<210> 94
<211> 6787
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 94
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtggtcca caggtaactc cgtcggcgtc cacagggggg 180
caggagatac catactgcac agttgtacgt cttccatctg tttggtgtag aaaaatctaa 240
ccactacaag aatgccacgg gcactgtggc agacagaagc agcgctacgc cgcatcgcct 300
ttcagcgtgc aggcccagga atgagcgagg cagtgggcgg ggaagacagg cacggggaat 360
ctggggacag ataaaggaaa ctcgtgatgg ggcgaggctg ggctgaagag aaacagattg 420
gggtagagct gcaaagggag gggtccactg gaaggcgagg ggggaggccg ggaagagaga 480
gggtgggaag gcagtgtgag atgggagggc agtgtgagaa gaaaagcagg ctggggaaga 540
gggattggaa tgcagaagga acttggggaa ggaggaagtc ctgcaggcgg gagggaaaga 600
agagaggggg agcagctaaa gtctgcgtca gaagaggttg gggactgcga gaggagaggc 660
tggggcctgc aggggagcgc agcagctttt agcatcgatc caaactctaa agactcgtgg 720
cctttgcctg acctcgaggg tcgggaatag acgcctgtct ttgtggagag cgatacccaa 780
ccgagaaaat ggggctgttc cgagctgggc cctgcgcctg gcccagggcg aggcttctct 840
ggctccgggc tggcccctga ggggcagcac gcagcctgca gcagaggcgc ctgctccaag 900
ctgtctcttg ggggcgccgc cgccgcttcc ctcctccggg gccgctcgct cccaggaaag 960
tggaggcggc tggcgaggac cgagagccgg ggccgcgctg cggagggacc acacctccgg 1020
gagttcgagg gggaccctgg cgcggcgggc cagcctttcg ggccggcagc gcccgccttc 1080
ccccggtcag cgcttgcggc ccgcgccgcg cgcaccgccc ggcaaccccg cgcgcgtccc 1140
gcgggggcgc tgcgtcttcc tgccacaccg gcgcaccgcg gcccctctcc cccacacctc 1200
cggcccgcac cacccggctc tcctcccacc ctccccaccc ctcctctgcc ctccctcccc 1260
attcctcccc tcccggcgag gggcgggagg gggcgtggcg gggccggggt ttgtgtggct 1320
gggacccggc tcctcaagct ctgaggaccc agaggccggg cgcgctccgc ccgcggcgcc 1380
gccccctccg taactttccc agtctccgag ggaagaggcg gggtgtgggg tgcggttaaa 1440
aggcgccacg gcgggagaca ggtctcaccg gtgtgtcacc gttgcggccc cgcagcgccc 1500
gcgcgctcct ctccccgact cggagcccct cggcggcgcc cggcccagga cccgcctagg 1560
agcgcaggag ccccagcgca gagaccccaa cgccgagacc cccgccccgg ccccgccgcg 1620
cttcctcccg acgcagttta ggacccttgt tcgcgaagag gtggtgtgcg gctgagaccc 1680
gcgtcctcag gacggttcca tcagtgcctc gatcctgccc cactggagga ggaaggcagc 1740
ccgaacagcg ctcacctaac taacagctgc tgagagctgg gttccgtggc catgcacctg 1800
ggactgcctt gagaagcgtg agcaaaccgc ccagagtaga agcgctagcc accatggatt 1860
ggggcacgct gcagacgatc ctggggggtg tgaacaaaca ctccaccagc attggaaaga 1920
tctggctcac cgtcctcttc atttttcgca ttatgatcct cgttgtggct gcaaaggagg 1980
tgtggggaga tgagcaggcc gactttgtct gcaacaccct gcagccaggc tgcaagaacg 2040
tgtgctacga tcactacttc cccatctccc acatccggct atgggccctg cagctgatct 2100
tcgtgtccac gccagcgctc ctagtggcca tgcacgtggc ctaccggaga catgagaaga 2160
agaggaagtt catcaagggg gagataaaga gtgaatttaa ggacatcgag gagatcaaaa 2220
cccagaaggt ccgcatcgaa ggctccctgt ggtggaccta cacaagcagc atcttcttcc 2280
gggtcatctt cgaagccgcc ttcatgtacg tcttctatgt catgtacgac ggcttctcca 2340
tgcagcggct ggtgaagtgc aacgcctggc cttgtcccaa cactgtggac tgctttgtgt 2400
cccggcccac ggagaagact gtcttcacag tgttcatgat tgcagtgtct ggaatttgca 2460
tcctgctgaa tgtcactgaa ttgtgttatt tgctaattag atattgttct gggaagtcaa 2520
aaaagccagt tggatcccgg gctgactaca aagaccatga cggtgattat aaagatcatg 2580
acatcgacta caaggatgac gatgacaagt aagaaataga cagcatgaga gggatgaggc 2640
aacccgtgct cagctgtcaa ggctcagtcg ctagcatttc ccaacacaaa gattctgacc 2700
ttaaatgcaa ccatttgaaa cccctgtagg cctcaggtga aactccagat gccacaatgg 2760
agctctgctc ccctaaagcc tcaaaacaaa ggcctaattc tatgcctgtc ttaattttct 2820
ttcacttaag ttagttccac tgagacccca ggctgttagg ggttattggt gtaaggtact 2880
ttcatatttt aaacagagga tatcggcatt tgtttctttc tctgaggaca agagaaaaaa 2940
gccaggttcc acagaggaca cagagaaggt ttgggtgtcc tcctggggtt ctttttgcca 3000
actttcccca cgttaaaggt gaacattggt tctttcattt gctttggaag ttttaatctc 3060
taacagtgga caaagttacc agtgccttaa actctgttac actttttgga agtgaaaact 3120
ttgtagtatg ataggttatt ttgatgtaaa gatgttctgg ataccattat atgttccccc 3180
tgtttcagag gctcagattg taatatgtaa atggtatgtc attcgctact atgatttaat 3240
ttgaaatatg gtcttttggt tatgaatact ttgcagcaca gctgagaggc tgtctgttgt 3300
attcattgtg gtcatagcac ctaacaacat tgtagcctca atcgagtgag acagactaga 3360
agttcctagt gatggcttat gatagcaaat ggcctcatgt caaatattta gatgtaattt 3420
tgtgtaagaa atacagactg gatgtaccac caactactac ctgtaatgac aggcctgtcc 3480
aacacatctc ccttttccat gactgtggta gccagcatcg gaaagaacgc tgatttaaag 3540
aggtcgcttg ggaattttat tgacacagta ccatttaatg gggaggacaa aatggggcag 3600
gggagggaga agtttctgtc gttaaaaaca gatttggaaa gactggactc taaagtctgt 3660
tgattaaaga tgagctttgt ctacttcaaa agtttgtttg cttacccctt cagcctccaa 3720
ttttttaagt gaaaatatag ctaataacat gtgaaaagaa tagaagctaa ggtttagata 3780
aatattgagc agatctatag gaagattgaa cctgaatatt gccattatgc ttgacatggt 3840
ttccaaaaaa tggtactcca catatttcag tgagggtaag tattttcctg ttgtcaagaa 3900
tagcattgta aaagcatttt gtaataataa agaatagctt taatgatatg cttgtaacta 3960
aaataatttt gtaatgtatc aaatacattt aaaacattaa aatataatct ctataataag 4020
agctcgctga tcagcctcga ctgtgccttc tagttgccag ccatctgttg tttgcccctc 4080
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 4140
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 4200
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 4260
tatggaagct tgaattcagc tgacgtgcct cggaccgcta ggaaccccta gtgatggagt 4320
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4380
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4440
ggcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatacgtc 4500
aaagcaacca tagtacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 4560
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 4620
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 4680
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt tgggtgatgg 4740
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 4800
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcgggcta 4860
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 4920
ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt tatggtgcac 4980
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 5040
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5100
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 5160
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgaacaata aaactgtctg 5220
cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcgaggc 5280
cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct cgcgataatg 5340
tcgggcaatc aggtgcgaca atctatcgct tgtatgggaa gcccgatgcg ccagagttgt 5400
ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg gtcagactaa 5460
actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt actcctgatg 5520
atgcatggtt actcaccact gcgatccccg gaaaaacagc attccaggta ttagaagaat 5580
atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc cggttgcatt 5640
cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc gctcaggcgc 5700
aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag cgtaatggct 5760
ggcctgttga acaagtctgg aaagaaatgc ataaactttt gccattctca ccggattcag 5820
tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg aaattaatag 5880
gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt gccatcctat 5940
ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa aaatatggta 6000
ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag tttttctaat 6060
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 6120
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 6180
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 6240
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 6300
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 6360
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 6420
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 6480
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 6540
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 6600
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 6660
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 6720
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 6780
cacatgt 6787
<210> 95
<211> 1513
<212> DNA
<213> 人工序列
<220>
<223> 示例性IGFBP2启动子
<400> 95
aagaaacttg cccgagttta cacagctagt aaatggttgc attagtcagg acagctagcc 60
tatattacaa taacaaccct ctcaaatcct aatggcttaa aacaacagag gtttaattta 120
tactcattag ctgttcaagg caggaggctc tattctctaa tccatacagt cactcaggat 180
ccaggctggt ggagaccctg ccatattgta gcctcaccat ttaaaacatg aagaagatag 240
aaagtgagga gtcatgtagg ttttgttccg ttgcctcagg ctaggagtga caggtcactt 300
catctcactc acagctcact gcccacaact agtcacttgt gactgtgcga gttaagcttc 360
tgtgtgtgaa ggaaggaaaa gagaatggga taaaggtgaa catcagcagg ctctaccaca 420
gtagtttgaa ccaagacttg agcctaggtc atgtggcttc agaatctttg ctcttaatca 480
cactaaacag cctctgtaag tcatctttcc ttcatccagt gcctaagaac atgcagtcca 540
atgccctcat ccttcagaag aacttgagtg aactcagaga aattgagtag agtgccacag 600
catgcccaag gccacacacc ctgaggttgg cagtaggtcc tgagttagag ttgtcatttc 660
ttggctcccc tggtagtagt ggaaaggtaa ggttttgaca tactagttgg atgaccacgg 720
gcaggtcact taaattgtct aagcatcgtt tgacccttgt aagaattaaa tgaaatagca 780
cctgtaaaag tgtctgcacg gacttactgc tgttagtttt gttcctttct tcctgttgtc 840
actgcacttc cctgcctgtt acccaggcca tgcagaccag ccaggccttc gacttacagt 900
gcggataaga ttccaaatct ccacggctgg tttccatgct ttcttccagg cttctgagga 960
ccctgtgctc tggtttcttc tatttctttt ctattacttt tctgttactc ttgagcacac 1020
ttgctggaag caatatgcat ccagttctcc ctctcttgcc tcattacact ttgcagaaca 1080
actccaatcc cttccaacca agtagtccct ttgaatttct tgtcacccaa ggaatctctc 1140
tgacaggggt ctttgttagg gtcacacccc aggagatggt tgattatggc tgagtccagc 1200
ctggaatgat gggggttggg ggcagcttgg gtagatgact cagtaaatca aacagaacaa 1260
tgaaaggagg tcatgcttgt ccatctgcat tattgaagac agccataaat ggccttaccc 1320
cagagcgggt ctgtcacacc tggagagctg atctgacctc tccaagaccc ctgcaactga 1380
gtgttctggg atctgtcctg caacaagtgc ctcgagattt gtaggtgggg gcccagaggg 1440
agggggtctg cagacgaagg gggcaggttt tgcggggcac ttagggttct cataggttgt 1500
agtcacgagc tcc 1513
<210> 96
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 示例性合成条形码B
<400> 96
cacaacct 8
<210> 97
<211> 7112
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 97
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtggtaag aaacttgccc gagtttacac agctagtaaa 180
tggttgcatt agtcaggaca gctagcctat attacaataa caaccctctc aaatcctaat 240
ggcttaaaac aacagaggtt taatttatac tcattagctg ttcaaggcag gaggctctat 300
tctctaatcc atacagtcac tcaggatcca ggctggtgga gaccctgcca tattgtagcc 360
tcaccattta aaacatgaag aagatagaaa gtgaggagtc atgtaggttt tgttccgttg 420
cctcaggcta ggagtgacag gtcacttcat ctcactcaca gctcactgcc cacaactagt 480
cacttgtgac tgtgcgagtt aagcttctgt gtgtgaagga aggaaaagag aatgggataa 540
aggtgaacat cagcaggctc taccacagta gtttgaacca agacttgagc ctaggtcatg 600
tggcttcaga atctttgctc ttaatcacac taaacagcct ctgtaagtca tctttccttc 660
atccagtgcc taagaacatg cagtccaatg ccctcatcct tcagaagaac ttgagtgaac 720
tcagagaaat tgagtagagt gccacagcat gcccaaggcc acacaccctg aggttggcag 780
taggtcctga gttagagttg tcatttcttg gctcccctgg tagtagtgga aaggtaaggt 840
tttgacatac tagttggatg accacgggca ggtcacttaa attgtctaag catcgtttga 900
cccttgtaag aattaaatga aatagcacct gtaaaagtgt ctgcacggac ttactgctgt 960
tagttttgtt cctttcttcc tgttgtcact gcacttccct gcctgttacc caggccatgc 1020
agaccagcca ggccttcgac ttacagtgcg gataagattc caaatctcca cggctggttt 1080
ccatgctttc ttccaggctt ctgaggaccc tgtgctctgg tttcttctat ttcttttcta 1140
ttacttttct gttactcttg agcacacttg ctggaagcaa tatgcatcca gttctccctc 1200
tcttgcctca ttacactttg cagaacaact ccaatccctt ccaaccaagt agtccctttg 1260
aatttcttgt cacccaagga atctctctga caggggtctt tgttagggtc acaccccagg 1320
agatggttga ttatggctga gtccagcctg gaatgatggg ggttgggggc agcttgggta 1380
gatgactcag taaatcaaac agaacaatga aaggaggtca tgcttgtcca tctgcattat 1440
tgaagacagc cataaatggc cttaccccag agcgggtctg tcacacctgg agagctgatc 1500
tgacctctcc aagacccctg caactgagtg ttctgggatc tgtcctgcaa caagtgcctc 1560
gagatttgta ggtgggggcc cagagggagg gggtctgcag acgaaggggg caggttttgc 1620
ggggcactta gggttctcat aggttgtagt cacgagctcc aagctctgag gacccagagg 1680
ccgggcgcgc tccgcccgcg gcgccgcccc ctccgtaact ttcccagtct ccgagggaag 1740
aggcggggtg tggggtgcgg ttaaaaggcg ccacggcggg agacaggtct caccggtcac 1800
aacctgttgc ggccccgcag cgcccgcgcg ctcctctccc cgactcggag cccctcggcg 1860
gcgcccggcc caggacccgc ctaggagcgc aggagcccca gcgcagagac cccaacgccg 1920
agacccccgc cccggccccg ccgcgcttcc tcccgacgca gtttaggacc cttgttcgcg 1980
aagaggtggt gtgcggctga gacccgcgtc ctcaggacgg ttccatcagt gcctcgatcc 2040
tgccccactg gaggaggaag gcagcccgaa cagcgctcac ctaactaaca gctgctgaga 2100
gctgggttcc gtggccatgc acctgggact gccttgagaa gcgtgagcaa accgcccaga 2160
gtagaagcgc tagccaccat ggattggggc acgctgcaga cgatcctggg gggtgtgaac 2220
aaacactcca ccagcattgg aaagatctgg ctcaccgtcc tcttcatttt tcgcattatg 2280
atcctcgttg tggctgcaaa ggaggtgtgg ggagatgagc aggccgactt tgtctgcaac 2340
accctgcagc caggctgcaa gaacgtgtgc tacgatcact acttccccat ctcccacatc 2400
cggctatggg ccctgcagct gatcttcgtg tccacgccag cgctcctagt ggccatgcac 2460
gtggcctacc ggagacatga gaagaagagg aagttcatca agggggagat aaagagtgaa 2520
tttaaggaca tcgaggagat caaaacccag aaggtccgca tcgaaggctc cctgtggtgg 2580
acctacacaa gcagcatctt cttccgggtc atcttcgaag ccgccttcat gtacgtcttc 2640
tatgtcatgt acgacggctt ctccatgcag cggctggtga agtgcaacgc ctggccttgt 2700
cccaacactg tggactgctt tgtgtcccgg cccacggaga agactgtctt cacagtgttc 2760
atgattgcag tgtctggaat ttgcatcctg ctgaatgtca ctgaattgtg ttatttgcta 2820
attagatatt gttctgggaa gtcaaaaaag ccagttggat cccgggctga ctacaaagac 2880
catgacggtg attataaaga tcatgacatc gactacaagg atgacgatga caagtaagaa 2940
atagacagca tgagagggat gaggcaaccc gtgctcagct gtcaaggctc agtcgctagc 3000
atttcccaac acaaagattc tgaccttaaa tgcaaccatt tgaaacccct gtaggcctca 3060
ggtgaaactc cagatgccac aatggagctc tgctccccta aagcctcaaa acaaaggcct 3120
aattctatgc ctgtcttaat tttctttcac ttaagttagt tccactgaga ccccaggctg 3180
ttaggggtta ttggtgtaag gtactttcat attttaaaca gaggatatcg gcatttgttt 3240
ctttctctga ggacaagaga aaaaagccag gttccacaga ggacacagag aaggtttggg 3300
tgtcctcctg gggttctttt tgccaacttt ccccacgtta aaggtgaaca ttggttcttt 3360
catttgcttt ggaagtttta atctctaaca gtggacaaag ttaccagtgc cttaaactct 3420
gttacacttt ttggaagtga aaactttgta gtatgatagg ttattttgat gtaaagatgt 3480
tctggatacc attatatgtt ccccctgttt cagaggctca gattgtaata tgtaaatggt 3540
atgtcattcg ctactatgat ttaatttgaa atatggtctt ttggttatga atactttgca 3600
gcacagctga gaggctgtct gttgtattca ttgtggtcat agcacctaac aacattgtag 3660
cctcaatcga gtgagacaga ctagaagttc ctagtgatgg cttatgatag caaatggcct 3720
catgtcaaat atttagatgt aattttgtgt aagaaataca gactggatgt accaccaact 3780
actacctgta atgacaggcc tgtccaacac atctcccttt tccatgactg tggtagccag 3840
catcggaaag aacgctgatt taaagaggtc gcttgggaat tttattgaca cagtaccatt 3900
taatggggag gacaaaatgg ggcaggggag ggagaagttt ctgtcgttaa aaacagattt 3960
ggaaagactg gactctaaag tctgttgatt aaagatgagc tttgtctact tcaaaagttt 4020
gtttgcttac cccttcagcc tccaattttt taagtgaaaa tatagctaat aacatgtgaa 4080
aagaatagaa gctaaggttt agataaatat tgagcagatc tataggaaga ttgaacctga 4140
atattgccat tatgcttgac atggtttcca aaaaatggta ctccacatat ttcagtgagg 4200
gtaagtattt tcctgttgtc aagaatagca ttgtaaaagc attttgtaat aataaagaat 4260
agctttaatg atatgcttgt aactaaaata attttgtaat gtatcaaata catttaaaac 4320
attaaaatat aatctctata ataagagctc gctgatcagc ctcgactgtg ccttctagtt 4380
gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 4440
ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 4500
ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 4560
ggcatgctgg ggatgcggtg ggctctatgg aagcttgaat tcagctgacg tgcctcggac 4620
cgctaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4680
gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4740
gagcgagcgc gcagctgcct gcaggggcgc ctgatgcggt attttctcct tacgcatctg 4800
tgcggtattt cacaccgcat acgtcaaagc aaccatagta cgcgccctgt agcggcgcat 4860
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 4920
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 4980
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 5040
ccaaaaaact tgatttgggt gatggttcac gtagtgggcc atcgccctga tagacggttt 5100
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 5160
caacactcaa ccctatctcg ggctattctt ttgatttata agggattttg ccgatttcgg 5220
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 5280
taacgtttac aattttatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa 5340
gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg 5400
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac 5460
cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt ttataggtta 5520
atgtcatgaa caataaaact gtctgcttac ataaacagta atacaagggg tgttatgagc 5580
catattcaac gggaaacgtc gaggccgcga ttaaattcca acatggatgc tgatttatat 5640
gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta tcgcttgtat 5700
gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt tgccaatgat 5760
gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct tccgaccatc 5820
aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat ccccggaaaa 5880
acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctg 5940
gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt taacagcgat 6000
cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt tgatgcgagt 6060
gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga aatgcataaa 6120
cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact tgataacctt 6180
atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagac 6240
cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc ttcattacag 6300
aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt gcagtttcat 6360
ttgatgctcg atgagttttt ctaatctcat gaccaaaatc ccttaacgtg agttttcgtt 6420
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct 6480
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc 6540
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc 6600
aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc 6660
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc 6720
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg 6780
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata 6840
cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta 6900
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc 6960
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg 7020
atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt 7080
cctggccttt tgctggcctt ttgctcacat gt 7112
<210> 98
<211> 1097
<212> DNA
<213> 人工序列
<220>
<223> RBP7启动子
<400> 98
cccatggctc tgttaaaatc aaagaaacat cttttccaac agccctttca aactcctcat 60
cgcatctcac tggctgattc agtcatttaa acctgcttct ccctaaagct gatcactggc 120
taagctaata gggtttccgg gattggttta gcctgatact aatccaggtc taccttcagg 180
agccagacca aactgcctat tggcattgca ttcttgcagt agggagggga ggtatggatg 240
gtgtggagtc caccacaagg tccatgccag tctttgctga accagcatca gactccatca 300
agcaacagat gagaggttcc atgataaagt ggccctcagc aatccccatc cattgctgtc 360
taggaagaac agtgcttgta cacaggttta ggacctcagt cttggctgta atcttctggt 420
ttactttgcc agcaccaaac agaaggaaag aaagggctca aatttgacca aataaattat 480
gcttctcctt ccagagataa ccttgagtcc tgtctaggaa gatattagaa ttgtaaagaa 540
aaaaaaaatt actccttatc ctatggcaag tggagtctat gtctacttca gctgaaatta 600
aatcctgtcc ataatagatg acccttgctc aagctggcca gaagccatac caaccagcac 660
gaaggttaaa actattatta gttttttctg tgattttcat tttcaggcca agttttagaa 720
caataagatt ttaagaatag gaagtaagta agatttctgc atatcctgtt ctcttagtca 780
gctgaatttt tttttttttt tttttagtcc taactcagcc tcccaaagtg ctgggattac 840
aggcgtgagc caccgcacca agcctggaat ctatgtctta cagttatgag aatcaacagc 900
tagctcatta tgggcaaggt gatgtcactc tggcttctca atgaaaatgg catttctccc 960
ttggaaaagg tcatagccag tcagtcagtc agtcacggga gcgcagcggc ttctaggggt 1020
gagtgggacc cacgcggccc cacctgctcc tcccgcgcgc ggccccaccc ccctgccccg 1080
ccccgcctgg tttatag 1097
<210> 99
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 合成条形码C
<400> 99
cgtgtgtt 8
<210> 100
<211> 6696
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 100
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtggtccc atggctctgt taaaatcaaa gaaacatctt 180
ttccaacagc cctttcaaac tcctcatcgc atctcactgg ctgattcagt catttaaacc 240
tgcttctccc taaagctgat cactggctaa gctaataggg tttccgggat tggtttagcc 300
tgatactaat ccaggtctac cttcaggagc cagaccaaac tgcctattgg cattgcattc 360
ttgcagtagg gaggggaggt atggatggtg tggagtccac cacaaggtcc atgccagtct 420
ttgctgaacc agcatcagac tccatcaagc aacagatgag aggttccatg ataaagtggc 480
cctcagcaat ccccatccat tgctgtctag gaagaacagt gcttgtacac aggtttagga 540
cctcagtctt ggctgtaatc ttctggttta ctttgccagc accaaacaga aggaaagaaa 600
gggctcaaat ttgaccaaat aaattatgct tctccttcca gagataacct tgagtcctgt 660
ctaggaagat attagaattg taaagaaaaa aaaaattact ccttatccta tggcaagtgg 720
agtctatgtc tacttcagct gaaattaaat cctgtccata atagatgacc cttgctcaag 780
ctggccagaa gccataccaa ccagcacgaa ggttaaaact attattagtt ttttctgtga 840
ttttcatttt caggccaagt tttagaacaa taagatttta agaataggaa gtaagtaaga 900
tttctgcata tcctgttctc ttagtcagct gaattttttt tttttttttt ttagtcctaa 960
ctcagcctcc caaagtgctg ggattacagg cgtgagccac cgcaccaagc ctggaatcta 1020
tgtcttacag ttatgagaat caacagctag ctcattatgg gcaaggtgat gtcactctgg 1080
cttctcaatg aaaatggcat ttctcccttg gaaaaggtca tagccagtca gtcagtcagt 1140
cacgggagcg cagcggcttc taggggtgag tgggacccac gcggccccac ctgctcctcc 1200
cgcgcgcggc cccacccccc tgccccgccc cgcctggttt atagaagctc tgaggaccca 1260
gaggccgggc gcgctccgcc cgcggcgccg ccccctccgt aactttccca gtctccgagg 1320
gaagaggcgg ggtgtggggt gcggttaaaa ggcgccacgg cgggagacag gtctcaccgg 1380
tcgtgtgttg ttgcggcccc gcagcgcccg cgcgctcctc tccccgactc ggagcccctc 1440
ggcggcgccc ggcccaggac ccgcctagga gcgcaggagc cccagcgcag agaccccaac 1500
gccgagaccc ccgccccggc cccgccgcgc ttcctcccga cgcagtttag gacccttgtt 1560
cgcgaagagg tggtgtgcgg ctgagacccg cgtcctcagg acggttccat cagtgcctcg 1620
atcctgcccc actggaggag gaaggcagcc cgaacagcgc tcacctaact aacagctgct 1680
gagagctggg ttccgtggcc atgcacctgg gactgccttg agaagcgtga gcaaaccgcc 1740
cagagtagaa gcgctagcca ccatggattg gggcacgctg cagacgatcc tggggggtgt 1800
gaacaaacac tccaccagca ttggaaagat ctggctcacc gtcctcttca tttttcgcat 1860
tatgatcctc gttgtggctg caaaggaggt gtggggagat gagcaggccg actttgtctg 1920
caacaccctg cagccaggct gcaagaacgt gtgctacgat cactacttcc ccatctccca 1980
catccggcta tgggccctgc agctgatctt cgtgtccacg ccagcgctcc tagtggccat 2040
gcacgtggcc taccggagac atgagaagaa gaggaagttc atcaaggggg agataaagag 2100
tgaatttaag gacatcgagg agatcaaaac ccagaaggtc cgcatcgaag gctccctgtg 2160
gtggacctac acaagcagca tcttcttccg ggtcatcttc gaagccgcct tcatgtacgt 2220
cttctatgtc atgtacgacg gcttctccat gcagcggctg gtgaagtgca acgcctggcc 2280
ttgtcccaac actgtggact gctttgtgtc ccggcccacg gagaagactg tcttcacagt 2340
gttcatgatt gcagtgtctg gaatttgcat cctgctgaat gtcactgaat tgtgttattt 2400
gctaattaga tattgttctg ggaagtcaaa aaagccagtt ggatcccggg ctgactacaa 2460
agaccatgac ggtgattata aagatcatga catcgactac aaggatgacg atgacaagta 2520
agaaatagac agcatgagag ggatgaggca acccgtgctc agctgtcaag gctcagtcgc 2580
tagcatttcc caacacaaag attctgacct taaatgcaac catttgaaac ccctgtaggc 2640
ctcaggtgaa actccagatg ccacaatgga gctctgctcc cctaaagcct caaaacaaag 2700
gcctaattct atgcctgtct taattttctt tcacttaagt tagttccact gagaccccag 2760
gctgttaggg gttattggtg taaggtactt tcatatttta aacagaggat atcggcattt 2820
gtttctttct ctgaggacaa gagaaaaaag ccaggttcca cagaggacac agagaaggtt 2880
tgggtgtcct cctggggttc tttttgccaa ctttccccac gttaaaggtg aacattggtt 2940
ctttcatttg ctttggaagt tttaatctct aacagtggac aaagttacca gtgccttaaa 3000
ctctgttaca ctttttggaa gtgaaaactt tgtagtatga taggttattt tgatgtaaag 3060
atgttctgga taccattata tgttccccct gtttcagagg ctcagattgt aatatgtaaa 3120
tggtatgtca ttcgctacta tgatttaatt tgaaatatgg tcttttggtt atgaatactt 3180
tgcagcacag ctgagaggct gtctgttgta ttcattgtgg tcatagcacc taacaacatt 3240
gtagcctcaa tcgagtgaga cagactagaa gttcctagtg atggcttatg atagcaaatg 3300
gcctcatgtc aaatatttag atgtaatttt gtgtaagaaa tacagactgg atgtaccacc 3360
aactactacc tgtaatgaca ggcctgtcca acacatctcc cttttccatg actgtggtag 3420
ccagcatcgg aaagaacgct gatttaaaga ggtcgcttgg gaattttatt gacacagtac 3480
catttaatgg ggaggacaaa atggggcagg ggagggagaa gtttctgtcg ttaaaaacag 3540
atttggaaag actggactct aaagtctgtt gattaaagat gagctttgtc tacttcaaaa 3600
gtttgtttgc ttaccccttc agcctccaat tttttaagtg aaaatatagc taataacatg 3660
tgaaaagaat agaagctaag gtttagataa atattgagca gatctatagg aagattgaac 3720
ctgaatattg ccattatgct tgacatggtt tccaaaaaat ggtactccac atatttcagt 3780
gagggtaagt attttcctgt tgtcaagaat agcattgtaa aagcattttg taataataaa 3840
gaatagcttt aatgatatgc ttgtaactaa aataattttg taatgtatca aatacattta 3900
aaacattaaa atataatctc tataataaga gctcgctgat cagcctcgac tgtgccttct 3960
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 4020
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 4080
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 4140
agcaggcatg ctggggatgc ggtgggctct atggaagctt gaattcagct gacgtgcctc 4200
ggaccgctag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 4260
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 4320
gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 4380
tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 4440
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 4500
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 4560
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 4620
gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 4680
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 4740
ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 4800
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 4860
atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 4920
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 4980
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 5040
tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 5100
gttaatgtca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat 5160
gagccatatt caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt 5220
atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt 5280
gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa 5340
tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac 5400
catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg 5460
aaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc 5520
gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag 5580
cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc 5640
gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca 5700
taaacttttg ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa 5760
ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc 5820
agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt 5880
acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt 5940
tcatttgatg ctcgatgagt ttttctaatc tcatgaccaa aatcccttaa cgtgagtttt 6000
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 6060
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 6120
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 6180
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 6240
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 6300
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 6360
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 6420
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 6480
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 6540
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 6600
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 6660
ggttcctggc cttttgctgg ccttttgctc acatgt 6696
<210> 101
<211> 735
<212> DNA
<213> 人工序列
<220>
<223> GJB6启动子
<400> 101
aaatagcttc caacgtttcc accccaccag cccttgcacc actccctgta ctggccctga 60
gctttctagt cttgactgaa aagcggggag gcaatgtggt ctctcctggt gcactgtccc 120
gaggaaggcc tgctccgctt ccccggagga gtcttcaaag gatggaggta attaataaaa 180
acaacccctg tacctcctct aagtggtcat taattaataa agaacctcca ggctcctata 240
ggagaggtct gtgcaccccg cgggctatga gaaggctgga tcacccagaa agactgagga 300
tgtgtcctgg caaaaacaca gcctgcccct cacactgctc cccacgggtg cactagggag 360
gaagagttcc ctcgagggcc tgagcaggcg ccccacacct gcacccgtgc agagggggct 420
gggcccgccc tctgcgctcc cgagggagag ccctaccccc tgcatccccg gtaccccgtt 480
ccctccaagg gccggaaaga gggccccgcg cactgtgcac ttcttagggg tcccccaccc 540
tgcgcccccg ccacgggaaa aaggtccccg ctctgcgcat ccggccccgg agggacagcc 600
ccggtcctgc actccttgct cctcaggggg acggtccgcg cccagcggct agtgcgcccc 660
gggtaggtgg gggcgggggg ctcgtcgagt gacagcgctc gcctcccgca gcccgcccga 720
gccgcgtcag ggcag 735
<210> 102
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 示例性合成条形码D
<400> 102
tcgtgggt 8
<210> 103
<211> 6334
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 103
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtggtaaa tagcttccaa cgtttccacc ccaccagccc 180
ttgcaccact ccctgtactg gccctgagct ttctagtctt gactgaaaag cggggaggca 240
atgtggtctc tcctggtgca ctgtcccgag gaaggcctgc tccgcttccc cggaggagtc 300
ttcaaaggat ggaggtaatt aataaaaaca acccctgtac ctcctctaag tggtcattaa 360
ttaataaaga acctccaggc tcctatagga gaggtctgtg caccccgcgg gctatgagaa 420
ggctggatca cccagaaaga ctgaggatgt gtcctggcaa aaacacagcc tgcccctcac 480
actgctcccc acgggtgcac tagggaggaa gagttccctc gagggcctga gcaggcgccc 540
cacacctgca cccgtgcaga gggggctggg cccgccctct gcgctcccga gggagagccc 600
taccccctgc atccccggta ccccgttccc tccaagggcc ggaaagaggg ccccgcgcac 660
tgtgcacttc ttaggggtcc cccaccctgc gcccccgcca cgggaaaaag gtccccgctc 720
tgcgcatccg gccccggagg gacagccccg gtcctgcact ccttgctcct cagggggacg 780
gtccgcgccc agcggctagt gcgccccggg taggtggggg cggggggctc gtcgagtgac 840
agcgctcgcc tcccgcagcc cgcccgagcc gcgtcagggc agaagctctg aggacccaga 900
ggccgggcgc gctccgcccg cggcgccgcc ccctccgtaa ctttcccagt ctccgaggga 960
agaggcgggg tgtggggtgc ggttaaaagg cgccacggcg ggagacaggt ctcaccggtt 1020
cgtgggtgtt gcggccccgc agcgcccgcg cgctcctctc cccgactcgg agcccctcgg 1080
cggcgcccgg cccaggaccc gcctaggagc gcaggagccc cagcgcagag accccaacgc 1140
cgagaccccc gccccggccc cgccgcgctt cctcccgacg cagtttagga cccttgttcg 1200
cgaagaggtg gtgtgcggct gagacccgcg tcctcaggac ggttccatca gtgcctcgat 1260
cctgccccac tggaggagga aggcagcccg aacagcgctc acctaactaa cagctgctga 1320
gagctgggtt ccgtggccat gcacctggga ctgccttgag aagcgtgagc aaaccgccca 1380
gagtagaagc gctagccacc atggattggg gcacgctgca gacgatcctg gggggtgtga 1440
acaaacactc caccagcatt ggaaagatct ggctcaccgt cctcttcatt tttcgcatta 1500
tgatcctcgt tgtggctgca aaggaggtgt ggggagatga gcaggccgac tttgtctgca 1560
acaccctgca gccaggctgc aagaacgtgt gctacgatca ctacttcccc atctcccaca 1620
tccggctatg ggccctgcag ctgatcttcg tgtccacgcc agcgctccta gtggccatgc 1680
acgtggccta ccggagacat gagaagaaga ggaagttcat caagggggag ataaagagtg 1740
aatttaagga catcgaggag atcaaaaccc agaaggtccg catcgaaggc tccctgtggt 1800
ggacctacac aagcagcatc ttcttccggg tcatcttcga agccgccttc atgtacgtct 1860
tctatgtcat gtacgacggc ttctccatgc agcggctggt gaagtgcaac gcctggcctt 1920
gtcccaacac tgtggactgc tttgtgtccc ggcccacgga gaagactgtc ttcacagtgt 1980
tcatgattgc agtgtctgga atttgcatcc tgctgaatgt cactgaattg tgttatttgc 2040
taattagata ttgttctggg aagtcaaaaa agccagttgg atcccgggct gactacaaag 2100
accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat gacaagtaag 2160
aaatagacag catgagaggg atgaggcaac ccgtgctcag ctgtcaaggc tcagtcgcta 2220
gcatttccca acacaaagat tctgacctta aatgcaacca tttgaaaccc ctgtaggcct 2280
caggtgaaac tccagatgcc acaatggagc tctgctcccc taaagcctca aaacaaaggc 2340
ctaattctat gcctgtctta attttctttc acttaagtta gttccactga gaccccaggc 2400
tgttaggggt tattggtgta aggtactttc atattttaaa cagaggatat cggcatttgt 2460
ttctttctct gaggacaaga gaaaaaagcc aggttccaca gaggacacag agaaggtttg 2520
ggtgtcctcc tggggttctt tttgccaact ttccccacgt taaaggtgaa cattggttct 2580
ttcatttgct ttggaagttt taatctctaa cagtggacaa agttaccagt gccttaaact 2640
ctgttacact ttttggaagt gaaaactttg tagtatgata ggttattttg atgtaaagat 2700
gttctggata ccattatatg ttccccctgt ttcagaggct cagattgtaa tatgtaaatg 2760
gtatgtcatt cgctactatg atttaatttg aaatatggtc ttttggttat gaatactttg 2820
cagcacagct gagaggctgt ctgttgtatt cattgtggtc atagcaccta acaacattgt 2880
agcctcaatc gagtgagaca gactagaagt tcctagtgat ggcttatgat agcaaatggc 2940
ctcatgtcaa atatttagat gtaattttgt gtaagaaata cagactggat gtaccaccaa 3000
ctactacctg taatgacagg cctgtccaac acatctccct tttccatgac tgtggtagcc 3060
agcatcggaa agaacgctga tttaaagagg tcgcttggga attttattga cacagtacca 3120
tttaatgggg aggacaaaat ggggcagggg agggagaagt ttctgtcgtt aaaaacagat 3180
ttggaaagac tggactctaa agtctgttga ttaaagatga gctttgtcta cttcaaaagt 3240
ttgtttgctt accccttcag cctccaattt tttaagtgaa aatatagcta ataacatgtg 3300
aaaagaatag aagctaaggt ttagataaat attgagcaga tctataggaa gattgaacct 3360
gaatattgcc attatgcttg acatggtttc caaaaaatgg tactccacat atttcagtga 3420
gggtaagtat tttcctgttg tcaagaatag cattgtaaaa gcattttgta ataataaaga 3480
atagctttaa tgatatgctt gtaactaaaa taattttgta atgtatcaaa tacatttaaa 3540
acattaaaat ataatctcta taataagagc tcgctgatca gcctcgactg tgccttctag 3600
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 3660
tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 3720
ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 3780
caggcatgct ggggatgcgg tgggctctat ggaagcttga attcagctga cgtgcctcgg 3840
accgctagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3900
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 3960
gcgagcgagc gcgcagctgc ctgcaggggc gcctgatgcg gtattttctc cttacgcatc 4020
tgtgcggtat ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc 4080
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 4140
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 4200
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 4260
ccccaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt 4320
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 4380
aacaacactc aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc 4440
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 4500
attaacgttt acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 4560
aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 4620
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 4680
accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt 4740
taatgtcatg aacaataaaa ctgtctgctt acataaacag taatacaagg ggtgttatga 4800
gccatattca acgggaaacg tcgaggccgc gattaaattc caacatggat gctgatttat 4860
atgggtataa atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc tatcgcttgt 4920
atgggaagcc cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc gttgccaatg 4980
atgttacaga tgagatggtc agactaaact ggctgacgga atttatgcct cttccgacca 5040
tcaagcattt tatccgtact cctgatgatg catggttact caccactgcg atccccggaa 5100
aaacagcatt ccaggtatta gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc 5160
tggcagtgtt cctgcgccgg ttgcattcga ttcctgtttg taattgtcct tttaacagcg 5220
atcgcgtatt tcgtctcgct caggcgcaat cacgaatgaa taacggtttg gttgatgcga 5280
gtgattttga tgacgagcgt aatggctggc ctgttgaaca agtctggaaa gaaatgcata 5340
aacttttgcc attctcaccg gattcagtcg tcactcatgg tgatttctca cttgataacc 5400
ttatttttga cgaggggaaa ttaataggtt gtattgatgt tggacgagtc ggaatcgcag 5460
accgatacca ggatcttgcc atcctatgga actgcctcgg tgagttttct ccttcattac 5520
agaaacggct ttttcaaaaa tatggtattg ataatcctga tatgaataaa ttgcagtttc 5580
atttgatgct cgatgagttt ttctaatctc atgaccaaaa tcccttaacg tgagttttcg 5640
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5700
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5760
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5820
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5880
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5940
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 6000
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 6060
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 6120
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 6180
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 6240
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 6300
ttcctggcct tttgctggcc ttttgctcac atgt 6334
<210> 104
<211> 1316
<212> DNA
<213> 人工序列
<220>
<223> PARM1启动子
<400> 104
tgtacaggag atagtcaggg aattagtaat tttcaaagag gtgactttga attcaaactt 60
aaatatcatc ttcagctgaa acaaagaagg ggtgcagtta tgaggaagtg accaggtaaa 120
gcatggcaaa caaaggtaaa gtttgttatg cgtatttaag tcagagccct ctccattgat 180
aagagtttcc agtaatttag tgccatcctt ttcttgctat agagttctcg tctctatctg 240
agcacgcaaa aataacatgc tttcttgctt tcttgaagtt gggcatggcc attgacttgc 300
cttagcccat atttttctgt gaagtggtct tcaaaaacct atatttctgc catagagtca 360
cttacttaac ctgccctatt taaaggggct aatgcctgat agaatgtcgc tgcataactc 420
catctgtgtg tggtccctgc atccatgaca accaaaaccc agatgcagaa attgttccta 480
atcacataga ttaccctaga aaccggaagg gccttgaagt caaaagcatt cagagaacat 540
gctgaacaaa ttgaatttgc agtttatctg gccagggagg atggagaggg gatgggcact 600
tggtctgagt attttttgtt tctcattcca acagaaatta ctagatttac caaaaaatct 660
acaagtggta gtgtgataga gtcaggcaga ggaattgacc atagataagg tgctcaggac 720
tcctagagtc agcttctggt atgtgagaaa gaagtgagaa cagagcccat ggcatatgaa 780
gaagatatta cagaaaaaag aaagctgcct tccacgcaaa tcatttcttt acaaaggctt 840
gttaactcct gcagtgccaa gaagctgaat gcagcggcag acatcctggt tcgggcccca 900
ggaagctcag ccgggtttaa tgtggatgag ggtttaatga tgtacacgca gaagtgtttt 960
gacaaatgaa gaaggtcctc attcttggaa catgtgccgg ttctccgagg gaactcctaa 1020
aaggctgtaa gctcatgtag gaaaagctga gctagattcc taagggcaga gatgtgctca 1080
catttctttg catccctagt tcccagcaca gtgcaaggcg ctgcaaacat ttgctgaacc 1140
cagggtctcg tgtcttgact gtccagcaga ggccgctctg ggccggggct ctcgggacct 1200
gagggctgag agaaggaagg ccagggggtg gcccagtcat cgccgcgggg cccgggtggg 1260
aggggtttgg cagcggcagg cgcggcggcg gcggcggagg cggaggcggc cccggg 1316
<210> 105
<211> 8
<212> DNA
<213> 人工序列
<220>
<223> 示例性合成条形码E
<400> 105
gcaaactg 8
<210> 106
<211> 6915
<212> DNA
<213> 人工序列
<220>
<223> 示例性构建体序列
<400> 106
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct gcggccgcac gcgtggttgt acaggagata gtcagggaat tagtaatttt 180
caaagaggtg actttgaatt caaacttaaa tatcatcttc agctgaaaca aagaaggggt 240
gcagttatga ggaagtgacc aggtaaagca tggcaaacaa aggtaaagtt tgttatgcgt 300
atttaagtca gagccctctc cattgataag agtttccagt aatttagtgc catccttttc 360
ttgctataga gttctcgtct ctatctgagc acgcaaaaat aacatgcttt cttgctttct 420
tgaagttggg catggccatt gacttgcctt agcccatatt tttctgtgaa gtggtcttca 480
aaaacctata tttctgccat agagtcactt acttaacctg ccctatttaa aggggctaat 540
gcctgataga atgtcgctgc ataactccat ctgtgtgtgg tccctgcatc catgacaacc 600
aaaacccaga tgcagaaatt gttcctaatc acatagatta ccctagaaac cggaagggcc 660
ttgaagtcaa aagcattcag agaacatgct gaacaaattg aatttgcagt ttatctggcc 720
agggaggatg gagaggggat gggcacttgg tctgagtatt ttttgtttct cattccaaca 780
gaaattacta gatttaccaa aaaatctaca agtggtagtg tgatagagtc aggcagagga 840
attgaccata gataaggtgc tcaggactcc tagagtcagc ttctggtatg tgagaaagaa 900
gtgagaacag agcccatggc atatgaagaa gatattacag aaaaaagaaa gctgccttcc 960
acgcaaatca tttctttaca aaggcttgtt aactcctgca gtgccaagaa gctgaatgca 1020
gcggcagaca tcctggttcg ggccccagga agctcagccg ggtttaatgt ggatgagggt 1080
ttaatgatgt acacgcagaa gtgttttgac aaatgaagaa ggtcctcatt cttggaacat 1140
gtgccggttc tccgagggaa ctcctaaaag gctgtaagct catgtaggaa aagctgagct 1200
agattcctaa gggcagagat gtgctcacat ttctttgcat ccctagttcc cagcacagtg 1260
caaggcgctg caaacatttg ctgaacccag ggtctcgtgt cttgactgtc cagcagaggc 1320
cgctctgggc cggggctctc gggacctgag ggctgagaga aggaaggcca gggggtggcc 1380
cagtcatcgc cgcggggccc gggtgggagg ggtttggcag cggcaggcgc ggcggcggcg 1440
gcggaggcgg aggcggcccc gggaagctct gaggacccag aggccgggcg cgctccgccc 1500
gcggcgccgc cccctccgta actttcccag tctccgaggg aagaggcggg gtgtggggtg 1560
cggttaaaag gcgccacggc gggagacagg tctcaccggt gcaaactggt tgcggccccg 1620
cagcgcccgc gcgctcctct ccccgactcg gagcccctcg gcggcgcccg gcccaggacc 1680
cgcctaggag cgcaggagcc ccagcgcaga gaccccaacg ccgagacccc cgccccggcc 1740
ccgccgcgct tcctcccgac gcagtttagg acccttgttc gcgaagaggt ggtgtgcggc 1800
tgagacccgc gtcctcagga cggttccatc agtgcctcga tcctgcccca ctggaggagg 1860
aaggcagccc gaacagcgct cacctaacta acagctgctg agagctgggt tccgtggcca 1920
tgcacctggg actgccttga gaagcgtgag caaaccgccc agagtagaag cgctagccac 1980
catggattgg ggcacgctgc agacgatcct ggggggtgtg aacaaacact ccaccagcat 2040
tggaaagatc tggctcaccg tcctcttcat ttttcgcatt atgatcctcg ttgtggctgc 2100
aaaggaggtg tggggagatg agcaggccga ctttgtctgc aacaccctgc agccaggctg 2160
caagaacgtg tgctacgatc actacttccc catctcccac atccggctat gggccctgca 2220
gctgatcttc gtgtccacgc cagcgctcct agtggccatg cacgtggcct accggagaca 2280
tgagaagaag aggaagttca tcaaggggga gataaagagt gaatttaagg acatcgagga 2340
gatcaaaacc cagaaggtcc gcatcgaagg ctccctgtgg tggacctaca caagcagcat 2400
cttcttccgg gtcatcttcg aagccgcctt catgtacgtc ttctatgtca tgtacgacgg 2460
cttctccatg cagcggctgg tgaagtgcaa cgcctggcct tgtcccaaca ctgtggactg 2520
ctttgtgtcc cggcccacgg agaagactgt cttcacagtg ttcatgattg cagtgtctgg 2580
aatttgcatc ctgctgaatg tcactgaatt gtgttatttg ctaattagat attgttctgg 2640
gaagtcaaaa aagccagttg gatcccgggc tgactacaaa gaccatgacg gtgattataa 2700
agatcatgac atcgactaca aggatgacga tgacaagtaa gaaatagaca gcatgagagg 2760
gatgaggcaa cccgtgctca gctgtcaagg ctcagtcgct agcatttccc aacacaaaga 2820
ttctgacctt aaatgcaacc atttgaaacc cctgtaggcc tcaggtgaaa ctccagatgc 2880
cacaatggag ctctgctccc ctaaagcctc aaaacaaagg cctaattcta tgcctgtctt 2940
aattttcttt cacttaagtt agttccactg agaccccagg ctgttagggg ttattggtgt 3000
aaggtacttt catattttaa acagaggata tcggcatttg tttctttctc tgaggacaag 3060
agaaaaaagc caggttccac agaggacaca gagaaggttt gggtgtcctc ctggggttct 3120
ttttgccaac tttccccacg ttaaaggtga acattggttc tttcatttgc tttggaagtt 3180
ttaatctcta acagtggaca aagttaccag tgccttaaac tctgttacac tttttggaag 3240
tgaaaacttt gtagtatgat aggttatttt gatgtaaaga tgttctggat accattatat 3300
gttccccctg tttcagaggc tcagattgta atatgtaaat ggtatgtcat tcgctactat 3360
gatttaattt gaaatatggt cttttggtta tgaatacttt gcagcacagc tgagaggctg 3420
tctgttgtat tcattgtggt catagcacct aacaacattg tagcctcaat cgagtgagac 3480
agactagaag ttcctagtga tggcttatga tagcaaatgg cctcatgtca aatatttaga 3540
tgtaattttg tgtaagaaat acagactgga tgtaccacca actactacct gtaatgacag 3600
gcctgtccaa cacatctccc ttttccatga ctgtggtagc cagcatcgga aagaacgctg 3660
atttaaagag gtcgcttggg aattttattg acacagtacc atttaatggg gaggacaaaa 3720
tggggcaggg gagggagaag tttctgtcgt taaaaacaga tttggaaaga ctggactcta 3780
aagtctgttg attaaagatg agctttgtct acttcaaaag tttgtttgct taccccttca 3840
gcctccaatt ttttaagtga aaatatagct aataacatgt gaaaagaata gaagctaagg 3900
tttagataaa tattgagcag atctatagga agattgaacc tgaatattgc cattatgctt 3960
gacatggttt ccaaaaaatg gtactccaca tatttcagtg agggtaagta ttttcctgtt 4020
gtcaagaata gcattgtaaa agcattttgt aataataaag aatagcttta atgatatgct 4080
tgtaactaaa ataattttgt aatgtatcaa atacatttaa aacattaaaa tataatctct 4140
ataataagag ctcgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt 4200
tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa 4260
taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg 4320
gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg 4380
gtgggctcta tggaagcttg aattcagctg acgtgcctcg gaccgctagg aacccctagt 4440
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 4500
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagctg 4560
cctgcagggg cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 4620
catacgtcaa agcaaccata gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 4680
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 4740
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 4800
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgatttg 4860
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 4920
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 4980
tcgggctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 5040
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttta 5100
tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagcc ccgacacccg 5160
ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc ttacagacaa 5220
gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc 5280
gcgagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat gaacaataaa 5340
actgtctgct tacataaaca gtaatacaag gggtgttatg agccatattc aacgggaaac 5400
gtcgaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg 5460
cgataatgtc gggcaatcag gtgcgacaat ctatcgcttg tatgggaagc ccgatgcgcc 5520
agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt 5580
cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac 5640
tcctgatgat gcatggttac tcaccactgc gatccccgga aaaacagcat tccaggtatt 5700
agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg 5760
gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc 5820
tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg 5880
taatggctgg cctgttgaac aagtctggaa agaaatgcat aaacttttgc cattctcacc 5940
ggattcagtc gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa 6000
attaataggt tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc 6060
catcctatgg aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa 6120
atatggtatt gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt 6180
tttctaatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc 6240
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct 6300
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa 6360
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag 6420
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc 6480
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg 6540
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca 6600
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat 6660
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg 6720
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc 6780
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc 6840
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc 6900
cttttgctca catgt 6915
<210> 107
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 107
tccacatgga gttgctgtta ca 22
<210> 108
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 108
ccgtggttct accctgtggt a 21
<210> 109
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 109
ctatctgcac tagatgcacc tta 23
<210> 110
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 110
cacaagatcg gatctacggg tt 22
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 111
ctgagtgtag gatgtttaca 20
<210> 112
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 示例性mRNA去稳定域序列
<400> 112
cacaaaccat tatgtgctgc ta 22
附图简述
图1小图(A)描绘了简化内源性AAV基因组;小图(B)描绘了能够表达GJB2基因的简化重组AAV(rAAV)构建体。
图2A-2O显示小图(A)-(O),其描绘了包含GJB2基因的替代示例性rAAV构建体。图2A描绘了包含5’ITR、CAG启动子、编码hGJB2基因的核酸、bGH polyA和3’ITR的rAAV构建体。图2B描绘了包含5’ITR、CAG启动子、编码hGJB2基因的核酸、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2C描绘了包含5’ITR、GJB2启动子、编码hGJB2基因的核酸、bGH polyA、C3域和5’ITR的rAAV构建体。图2D描绘了包含5’ITR、GJB2启动子、编码hGJB2基因的核酸、bGHpolyA、D7域和3’ITR的rAAV构建体。图2E描绘了包含5’ITR、GJB2启动子、hGJB2基因、bGHpolyA和3’ITR的rAAV构建体。图2F描绘了包含5’ITR、CAG启动子、5’UTR、hGJB2基因、FLAG标签、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2G描绘了包含5’ITR、smCBA启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2H描绘了包含5’ITR、包含CMV启动子和hGJB2启动子的启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签,3’UTR、bGH polyA和3’ITR的rAAV构建体。图2I描绘了包含5’ITR、包含CMV启动子和GFAP启动子的启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2J描绘了包含5’ITR、GFAP内耳支持细胞特异性启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2K描绘了包含5’ITR、CAG启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签、去稳定化域、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2L描绘了包含5’ITR、包含hGJB2增强子和hGJB2启动子的启动子、5’UTR、编码hGJB2基因的核酸、FLAG标签、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2M描绘了包含5’ITR、CAG启动子、5’UTR、hGJB2启动子、hGJB2基因、FLAG标签、microRNA调控靶位点、3’UTR、bGH polyA和3’ITR的rAAV构建体。图2N描绘了包含5’ITR、包含内耳支持细胞特异性启动子和hGJB2最小启动子的启动子、编码hGJB2基因的核酸、FLAG标签、5’UTR、bGH polyA和3’ITR的rAAV构建体。图2O描绘了包含5’ITR、CAG启动子、编码hGJB2基因的核酸、FLAG标签、T2A元件、编码eGFP的核酸、bGH polyA和3’ITR的rAAV构建体。
图3描绘了来自已经暴露于本文所述的示例性构建体的HEK293FT细胞的connexin26(Cx26)/GJB2蛋白的表达。小图(A)描绘了已用包含CAG启动子的示例性rAAV构建体转染的HEK293FT细胞中的Cx26蛋白表达,对应于Vinculin和Cx26的条带被标记。小图(B)描绘了在HEK293FT细胞中的GJB2蛋白表达,这些细胞已用包含由如所标注的CAG、CMVe-GJB2p或smCBA启动子/增强子序列驱动的具有GJB2 5’UTR和3’UTR序列的hGJB2编码序列的示例性构建体转染,对应于GAPDH和GJB2-FLAG的条带被标记。小图(C)描绘了HEK293FT细胞中的GJB2蛋白表达,这些细胞已用包含构建体的示例性rAAV颗粒转导,该构建体包含由如所标注的CAG、CMV-GJB2p或smCBA启动子/增强子序列驱动的具有GJB2 5’UTR和3’UTR序列的hGJB2编码序列,对应于GAPDH和GJB2-FLAG的条带被标记,阳性对照是不具有GJB2 5’UTR或3’UTR的由CAG启动子/增强子驱动的hGJB2编码序列。
图4描绘了已用示例性rAAV构建体转导的HEK293FT细胞和野生型新生儿CD1外植体中的GJB2 mRNA表达的定量PCR(qPCR)结果。
图5,小图(A)和(B)描绘了HEK293T细胞中在各种示例性启动子的作用下的eGFP蛋白表达,转染后72小时对细胞进行分选和定量。
图6描绘了用示例性rAAVAnc80颗粒转导的P2小鼠耳蜗外植体中的FLAG蛋白表达,该颗粒包含由如所标注的CAG、CMV-GJB2p或smCBA启动子/增强子序列驱动的构建体,外植体在72小时后被固定,FLAG的免疫染色标注为绿色,毛细胞标志物Myo7a的免疫染色标注为红色,并且核标志物DAPI标注为蓝色。小图(A)描绘了用AAVAnc80-CAG.5UTR.hGJB2.3F.3UTR(SEQ ID NO:82)以5.8E9 vg/外植体转导的示例性外植体。小图(B)描绘了用AAVAnc80-smCBA.5UTR.hGJB2.3F.3UTR(SEQ ID NO:83)以1.4E10 vg/外植体转导的示例性外植体。小图(C)描绘了用AAVAnc80-CMVeGJB2p.5UTR.hGJB2.3F.3UTR(SEQID NO:84)以1.8E10 vg/外植体转导的示例性外植体。
图7描绘了用CAG.5UTR.hGJB2.FLAG.miRTS.3UTR(SEQ ID NO:87)、CAG.5UTR.hGJB2.FLAG.3UTR(SEQ ID NO:82)或CAG.5UTR.hGJB2.FLAG.GFP构建体转染的HEK293FT细胞中GJB2蛋白的体外表达。CAG.5UTR.hGJB2.FLAG.miRTS.3UTR包括3UTR中miR-182和miR-183的miRNA靶向位点(miRTS),以允许在调控性miR-182和/或miR-183存在下的外源性hGJB2敲低。为了确认miRNA对构建体的调控,用包含hGJB2的质粒转染HEK293FT细胞,并任选地用(+)或不用(-)表达miR-182和miR-183的质粒共同转染。转染后72小时,收获细胞用于蛋白质和RNA分析。小图(A)描绘了使用western印迹分析的示例性GJB2蛋白水平;小图(B)描绘了使用qPCR分析的示例性GJB2 mRNA水平。
图8例示了根据本公开的方面的用于将流体递送到内耳的装置的透视图。
图9例示了根据本公开的方面的弯针子组件的侧视图。
图10例示了根据本公开的方面的用于将流体递送到内耳的装置的透视图。
图11例示了根据本公开的方面的耦合至设备远端的弯针子组件的透视图。
图12描绘了野生型小鼠(p20)中connexin 26的体外表达,这些小鼠经施用包含CAG.hGJB2.F.GFP(图2O中提供的示意图)的rAAVAnc80颗粒到耳蜗中。施用后10天,检测到支持细胞和内毛细胞中connexin 26的表达。通过鬼笔环肽对肌动蛋白丝和毛细胞静纤毛束进行的免疫染色标注为蓝色,GFP标注为绿色,FLAG标注为紫色,并且内源性connexin 26标注为红色。SC-支持细胞;IHC-内毛细胞;OHC-外毛细胞。
定义
本公开的范围由所附权利要求书界定并且不受本文所描述的某些实施方案限制。阅读本说明书的本领域技术人员将意识到可以等效于此类所描述的实施方案或以其他方式处于权利要求书的范围内的各种修改。一般而言,除非另有明确指示,否则本文所用的术语与其在本领域中所理解的含义一致。下文提供了某些术语的明确定义;在本说明书通篇,在特定情况下这些和其他术语的含义对于本领域技术人员来说将从上下文显而易见。
在权利要求书中使用诸如“第一”、“第二”、“第三”等顺序术语修饰权利要求元素本身并不意味着一个权利要求元素相对于另一个权利要求元素的任何优先权、优先级或顺序或者执行方法动作的时间顺序,而仅用作将具有特定名称的一个权利要求元素与具有相同名称(但使用顺序术语)的另一个元素区分开以区分所述权利要求元素的标签。
除非相反地明确指示,否则如本文所用,冠词“一个”和“一种”应理解为包括复数指示物。除非相反地指示或从上下文另外显而易见,否则如果在给定的产物或过程中存在、采用或以其他方式涉及一个、多于一个或所有组成员,那么就认为满足在组的一个或多个成员之间包括“或”的权利要求或描述。在一些实施方案中,在给定的产物或过程中存在、采用或以其他方式涉及组的仅一个成员。在一些实施方案中,在给定的产物或过程中存在、采用或以其他方式涉及多于一个或所有组成员。应了解,除非另有指示或除非本领域普通技术人员将显而易见出现矛盾或不一致,否则本公开涵盖将来自一个或多个所列权利要求的一个或多个限制、元素、条款、描述性术语等引入从属于同一独立权利要求(或相关的任何其他权利要求)的另一权利要求中的所有变化、组合和排列。在元素以清单(例如,以马库什组(Markush group)或类似格式)呈现的情况下,应了解,还公开了元素的每个子组,并且可以从所述组中去除任何元素。应了解,一般而言,在实施方案或方面称作“包含”特定元素、特征等的情况下,某些实施方案或方面“由此类元素、特征等组成”或“基本上由此类元素、特征等组成”。为简单起见,那些实施方案并未在每种情况下在本文中用如此多的词语特定阐述。还应了解,任何实施方案或方面可以从权利要求书中明确排除,无论本说明书中是否叙述特定排除情况。
在本说明书通篇,每当多核苷酸或多肽由字母序列(例如,A、C、G和T,在多核苷酸的情况下分别表示腺苷、胞苷、鸟苷和胸苷)表示时,此类多核苷酸或多肽从左至右以5'至3'或N端至C端的顺序呈现。
施用:如本文所用,术语“施用”通常是指向受试者或***施用组合物以实现药剂向受试者或***的递送。在一些实施方案中,药剂是组合物或包含于组合物中;在一些实施方案中,通过组合物或其一种或多种组分的代谢产生药剂。本领域普通技术人员将意识到在适当情况下可以用于向受试者(例如,人)施用的多种途径。例如,在一些实施方案中,施用可以是全身或局部。在一些实施方案中,全身施用可以是静脉内。在一些实施方案中,施用可以是局部。局部施用可以涉及递送至耳蜗外淋巴,经由例如,在小管造口术(canalostomy)之后注射穿过圆窗膜或注射至鼓阶中,中阶注射穿过内淋巴、外淋巴和/或内淋巴。在一些实施方案中,施用可以仅涉及单个剂量。在一些实施方案中,施用可以涉及施加固定数目的剂量。在一些实施方案中,施用可以涉及间歇性(例如,时间上隔开的多个剂量)给药和/或周期性(例如,由共同的时间段隔开的个体剂量)给药。在一些实施方案中,施用可以涉及连续给药(例如,灌注)持续至少所选的时间段。
等位基因:如本文所用,术语“等位基因”是指特定多态基因组基因座的两个或更多个现有遗传变体中的一者。
改善:如本文所用,术语“改善”是指受试者的状态的预防、减轻或缓和,或状态的好转。改善可以包括但不要求疾病、病症或病况的完全恢复或完全预防。
氨基酸:在最广泛的意义上,如本文所用,术语“氨基酸”是指可以例如经由形成一个或多个肽键而并入多肽链中的任何化合物和/或物质。在一些实施方案中,氨基酸具有通用结构,例如,H2N-C(H)(R)-COOH。在一些实施方案中,氨基酸是天然存在的氨基酸。在一些实施方案中,氨基酸是非天然氨基酸;在一些实施方案中,氨基酸是D-氨基酸;在一些实施方案中,氨基酸是L-氨基酸。“标准氨基酸”是指天然存在的肽中通常发现的二十种标准L-氨基酸中的任一者。“非标准氨基酸”是指除标准氨基酸以外的任何氨基酸,无论以合成方式制备还是从天然来源获得。在一些实施方案中,氨基酸,包括多肽中的羧基和/或氨基端氨基酸,与如上文所示的通用结构相比可以含有结构修饰。举例来说,在一些实施方案中,氨基酸可以通过与通用结构相比进行甲基化、酰胺化、乙酰化、聚乙二醇化、糖基化、磷酸化和/或取代(例如,氨基、羧酸基、一个或多个质子、和/或羟基)而修饰。在一些实施方案中,与含有其他方面相同的未修饰的氨基酸的多肽相比,此类修饰可以例如改变含有修饰的氨基酸的多肽的循环半衰期。在一些实施方案中,与含有其他方面相同的未修饰的氨基酸的多肽相比,此类修饰并不显著改变含有修饰的氨基酸的多肽的相关活性。
大约或约:如本文所用,术语“大约”或“约”可以应用于一个或多个感兴趣的值,包括与规定参考值类似的值。在一些实施方案中,除非另有规定或从上下文另外显而易见(此类数值将超过可能值的100%的情况除外),否则术语“大约”或“约”是指处于规定参考值的±10%(大于或小于)以内的值的范围。举例来说,在一些实施方案中,术语“大约”或“约”可以涵盖处于参考值的10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小以内的值的范围。
相关:如本文所用,术语“相关”将两个事件或实体描述为彼此“相关”,条件是一者的存在、水平和/或形式与另一者的存在、水平和/或形式相关联。举例来说,特定实体(例如,多肽、遗传印记、代谢物、微生物等)应视为与特定疾病、病症或病况相关,条件是所述实体的存在、水平和/或形式与疾病、病症或病况的发生率和/或易感性(例如,在相关群体中)相关联。在一些实施方案中,两个或更多个实体在物理上彼此“相关”,条件是所述实体直接或间接相互作用,使得它们彼此和/或保持彼此物理接近。在一些实施方案中,彼此物理相关的两个或更多个实体彼此共价连接;在一些实施方案中,彼此物理相关的两个或更多个实体彼此不共价连接,但以非共价方式相关,例如,借助于氢键、范德华相互作用(van derWaals interaction)、疏水相互作用、磁性和它们的组合。
生物活性:如本文所用,术语“生物活性”是指由感兴趣的试剂或实体达成的可观测的生物作用或结果。举例来说,在一些实施方案中,特异性结合相互作用是生物活性。在一些实施方案中,生物途径或事件的调控(例如,诱导、增强或抑制)是生物活性。在一些实施方案中,经由检测由感兴趣的生物途径或事件产生的直接或间接产物来评估生物活性的存在或程度。
细胞选择性启动子:如本文所用,术语“细胞选择性启动子”是指在某些细胞类型中具有主要活性的启动子(例如,特定基因的转录仅发生在表达与组织特异性启动子结合的转录调控和/或控制蛋白的细胞内)。在一些方面,内耳支持细胞选择性启动子是在内耳的一种或多种支持细胞中具有主要活性的启动子。
特征部分:如本文所用,术语“特征部分”在最广泛的意义上是指物质的一部分,其存在(或不存在)与物质的特定特征、属性或活性的存在(或不存在)相关联。在一些实施方案中,物质的特征部分是在给定的物质中以及在共享特定特征、属性或活性的相关物质中发现,而非在不共享特定特征、属性或活性的那些物质中发现的部分。在一些实施方案中,特征部分与完整物质共享至少一个功能特征。举例来说,在一些实施方案中,蛋白质或多肽的“特征部分”是含有氨基酸的连续段或氨基酸的连续段的集的部分,它们合在一起是蛋白质或多肽的特征。在一些实施方案中,每个此类连续段一般含有至少2、5、10、15、20、50个或更多个氨基酸。一般而言,物质(例如,蛋白质、抗体等)的特征部分是除上文指定的序列和/或结构同一性以外,与相关完整物质共享至少一个功能特征的部分。在一些实施方案中,特征部分可以是生物活性的。
特征序列:如本文所用,术语“特征序列”是在多肽或核酸家族的所有成员中发现的序列,并且因此可以由本领域普通技术人员用于定义家族的成员。
特征序列元件:如本文所用,短语“特征序列元件”是指在聚合物中(例如,在多肽或核酸中)发现的代表该聚合物的特征部分的序列元件。在一些实施方案中,特征序列元件的存在与聚合物的特定活性或特性的存在或水平相关。在一些实施方案中,特征序列元件的存在(或不存在)将特定聚合物定义为此类聚合物的特定家族或组的成员(或非成员)。特征序列元件通常包含至少两个单体(例如,氨基酸或核苷酸)。在一些实施方案中,特征序列元件包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50个或更多个单体(例如,连续连接的单体)。在一些实施方案中,特征序列元件包括由一个或多个间隔物区隔开的至少第一段和第二段连续单体,间隔物区的长度在共享序列元件的聚合物之间可能变化或可能不变化。
组合疗法:如本文所用,术语“组合疗法”是指受试者同时暴露于两种或更多种治疗方案(例如,两种或更多种治疗剂)的那些情况。在一些实施方案中,可以同时施用两种或更多种药剂。在一些实施方案中,可以贯序施用两种或更多种药剂。在一些实施方案中,可以在重叠的给药方案中施用两种或更多种药剂。
可比的:如本文所用,术语“可比的”是指两种或更多种药剂、实体、情形、条件集、受试者、群体等可能彼此不相同但足够相似以允许在其之间进行比较,使得本领域技术人员将了解可以基于所观察到的差异或相似性合理地得出结论。在一些实施方案中,可比的药剂、实体、情形、条件集、受试者、群体等的集的特征在于多个基本上相同的特征和一个或少量不同特征。本领域普通技术人员将了解,在上下文中,在任何给定情况下需要何种程度的同一性以将两种或更多种此类药剂、实体、情形、条件集、受试者、群体等视为可比的。举例来说,本领域普通技术人员将了解,当特征在于足够数目和类型的基本上相同的特征时,药剂、实体、情形、条件集、受试者、群体等的集彼此可比,以确保以下合理的结论:在环境、刺激、药剂、实体、情形、条件集、受试者、群体等的不同集下或使用该不同集所获得的结果或所观察到的现象的差异由那些不同特征的变化所引起或指示那些不同特征的变化。
构建体:如本文所用,术语“构建体”是指包含能够携带至少一个异源多核苷酸的多核苷酸的组合物。在一些实施方案中,构建体可以是质粒、转座子、粘粒、人工染色体(例如,人的人工染色体(HAC)、酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1衍生人工染色体(PAC))或病毒构建体,以及任何
Figure BDA0004046106460000091
质粒。构建体可以例如包括足以用于表达的顺式作用元件;用于表达的其他元件可以由宿主灵长类动物细胞或在体外表达***中提供。构建体可以包括当与适当控制元件相关时能够复制的任何遗传元件(例如,质粒、转座子、粘粒、人工染色体或病毒构建体等)。因此,在一些实施方案中,“构建体”可以包括克隆和/或表达构建体和/或病毒构建体(例如,腺相关病毒(AAV)构建体、腺病毒构建体、慢病毒构建体或逆转录病毒构建体)。
保守:如本文所用,术语“保守”是指描述保守氨基酸取代的情况,包括氨基酸残基由具有类似化学特性(例如,电荷或疏水性)的侧链R基团的另一个氨基酸残基取代。一般而言,保守氨基酸取代将基本上不改变蛋白质的感兴趣的功能特性,例如,受体结合至配体的能力。具有类似化学特性的侧链的氨基酸组的实例包括:脂肪族侧链,诸如甘氨酸(Gly,G)、丙氨酸(Ala,A)、缬氨酸(Val,V)、亮氨酸(Leu,L)和异亮氨酸(Ile,I);脂肪族羟基侧链,诸如丝氨酸(Ser,S)和苏氨酸(Thr,T);含酰胺侧链,诸如天冬酰胺(Asn,N)和谷氨酰胺(Gln,Q);芳香族侧链,诸如苯丙氨酸(Phe,F)、酪氨酸(Tyr,Y)和色氨酸(Trp,W);碱性侧链,诸如赖氨酸(Lys,K)、精氨酸(Arg,R)和组氨酸(His,H);酸性侧链,诸如天冬氨酸(Asp,D)和谷氨酸(Glu,E);以及含硫侧链,诸如半胱氨酸(Cys,C)和甲硫氨酸(Met,M)。保守氨基酸取代基团包括例如缬氨酸/亮氨酸/异亮氨酸(Val/Leu/Ile,V/L/I)、苯丙氨酸/酪氨酸(Phe/Tyr,F/Y)、赖氨酸/精氨酸(Lys/Arg,K/R)、丙氨酸/缬氨酸(Ala/Val,A/V)、谷氨酸盐/天冬氨酸盐(Glu/Asp,E/D)和天冬酰胺/谷氨酰胺(Asn/Gln,N/Q)。在一些实施方案中,保守氨基酸取代可以是用丙氨酸取代蛋白质中的任何原生残基,例如,用于丙氨酸扫描诱变中。在一些实施方案中,进行保守取代,其在Gonnet etal.,1992,Science 256:1443-1445中公开的PAM250对数似然矩阵中具有正值,其通过引用以其整体并入本文。在一些实施方案中,取代是适度保守取代,其中取代在PAM250对数似然矩阵中具有非负值。本领域技术人员将了解,来自不同物种的相同蛋白质之间不保守的氨基酸的变化(例如,取代、添加、缺失等)不太可能对蛋白质的功能有影响,并且因此应选择这些氨基酸进行突变。在来自不同物种的相同蛋白质之间保守的氨基酸不应改变(例如,缺失、添加、取代等),因为这些突变更有可能引起蛋白质功能的变化。
Figure BDA0004046106460000101
Figure BDA0004046106460000111
对照:如本文所用,术语“对照”是指“对照”作为比较结果的标准的技术上理解的含义。通常,对照用于通过分离变量以得出关于此类变量的结论来增强实验中的完整性。在一些实施方案中,对照是与测试反应或测定同时进行以提供比较的反应或测定。举例来说,在一个实验中,应用“测试”(即,正在测试的变量)。在第二个实验中,不应用“对照”(正在测试的变量)。在一些实施方案中,对照是历史对照(例如,先前进行的测试或测定,或先前已知的量或结果)。在一些实施方案中,对照是或包括印刷或以其他方式保存的记录。在一些实施方案中,对照是阳性对照。在一些实施方案中,对照是阴性对照。
确定、测量、评价、评估、测定和分析:如本文所用,术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”可以互换使用以指代任何形式的测量,并且包括确定元素是否存在。这些术语包括定量和/或定性确定。测定可以是相对或绝对的。举例来说,在一些实施方案中,“对存在的测定”可以是确定所存在的某物的量和/或确定它是否存在。
工程化:一般来说,如本文所用,术语“工程化”是指已经由人工操纵的方面。举例来说,如果已经操纵细胞或生物体以便改变它的遗传信息(例如,通过例如转化、交配、体细胞杂交、转染、转导或其他机制已经引入先前不存在的新遗传物质,或者通过例如取代或缺失突变或通过交配方案改变或去除先前存在的遗传物质),则该细胞或生物体视为“工程化”。按照惯例并且如本领域技术人员所了解,工程化多核苷酸或细胞的后代通常仍称为“工程化”,即使实际操纵是对先前的实体进行的。
赋形剂:如本文所用,术语“赋形剂”是指可以包含在药物组合物中,例如以提供或有助于期望稠度或稳定作用的无活性(例如,非治疗性)药剂。在一些实施方案中,适合的药物赋形剂可以包括例如淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂乳粉、甘油、丙烯、乙二醇、水、乙醇等。
表达:如本文所用,术语核酸序列的“表达”是指从核酸序列产生任何基因产物(例如转录物,例如mRNA,例如多肽等)。在一些实施方案中,基因产物可以是转录物。在一些实施方案中,基因产物可以是多肽。在一些实施方案中,核酸序列的表达涉及以下一项或多项:(1)从DNA序列产生RNA模板(例如,通过转录);(2)RNA转录物的加工(例如,通过剪接、编辑、5’帽形成和/或3’末端形成);(3)RNA翻译成多肽或蛋白质;和/或(4)多肽或蛋白质的翻译后修饰。
侧翼:如本文所用,术语“侧翼”是指相对于参考品末端的位置。更具体地,在提到参考核酸序列时,“侧翼”是指具有参考核酸序列的上游和下游序列。在一些方面,侧翼参考核酸序列具有第一序列或一系列位于参考核酸5’末端附近的核苷酸残基,以及第二序列或一系列位于参考核酸3’末端附近的核苷酸残基。在一些方面,上游和/或下游侧翼序列紧邻参考的核酸序列。在一些方面,上游和/或下游侧翼序列与参考的核酸序列之间存在中间的核酸。
功能性:如本文所用,术语“功能性”描述某物以展现表征其的特性和/或活性的形式存在。举例来说,在一些方面,“功能性”生物分子是呈展现表征其的特性和/或活性的形式的生物分子。在一些此类方面,功能性生物分子相对于另一个非功能性生物分子的特征在于“非功能性”型式不展现与“功能性”分子相同或等效的特性和/或活性。生物分子可以具有一种功能、两种功能(即,双功能性)或多种功能(即,多功能性)。
基因:如本文所用,术语“基因”是指染色体中编码基因产物(例如RNA产物,例如多肽产物)的DNA序列。在一些实施方案中,基因包括编码序列(即,编码特定产物的序列)。在一些实施方案中,基因包括非编码序列。在一些特定实施方案中,基因可以包括编码(例如,外显子)和非编码(例如,内含子)序列两者。在一些实施方案中,基因可以包括例如可以控制或影响基因表达的一个或多个方面(例如,细胞类型特异性表达、诱导性表达等)的一个或多个调控序列(例如,启动子、增强子等)和/或内含子序列。如本文所用,术语“基因”一般是指编码多肽或其片段的核酸的一部分;如本领域普通技术人员从上下文将显而易见的是,该术语可以任选地涵盖调控序列。这个定义不旨在排除将术语“基因”应用于非蛋白质编码表达单元,而旨在澄清在大多数情况下,如本文件中所用的术语是指多肽编码核酸。在一些实施方案中,基因可以编码多肽,但那种多肽可能不具有功能性,例如,基因变体可以编码相对于野生型基因不以相同方式发挥功能或根本不发挥功能的多肽。在一些实施方案中,基因可以编码转录物,在一些实施方案中,该转录物的毒性可能超过阈值水平。在一些实施方案中,基因可以编码多肽,但那种多肽可能不具有功能性和/或毒性可能超过阈值水平。
听力损失:如本文所用,术语“听力损失”可以用于指活生物体部分或完全无法听到。在一些实施方案中,听力损失可能是后天性的。在一些实施方案中,听力损失可能是遗传性的。在一些实施方案中,听力损失可能是基因的。在一些实施方案中,听力损失可能因疾病或创伤(例如,身体创伤、用一种或多种药剂治疗导致听力损失等)所致。在一些实施方案中,听力损失可能归因于一种或多种已知遗传原因和/或综合征。在一些实施方案中,听力损失可能是未知病因。在一些实施方案中,听力损失可能或可能不通过使用助听器或其他治疗而减轻。
异源:如本文所用,术语“异源”可以用于指与另一个区域和/或另一个分子相比特定分子的一个或多个区域。在一些实施方案中,异源多肽域是指多肽域不是一起天然存在(例如,在同一多肽中)的事实。举例来说,在人工生成的融合蛋白中,来自一个多肽的多肽域可以融合至来自不同多肽的多肽域。在此类融合蛋白中,两个多肽域将视为彼此“异源”,因为它们不是一起天然存在的。
同一性:如本文所用,术语“同一性”是指聚合物分子之间,例如,核酸分子(例如,DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。在一些实施方案中,如果聚合物分子的序列至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同,则该聚合物分子视为“基本上相同”。两个核酸或多肽序列的百分比同一性的计算例如可以通过比对两个序列以用于最佳比较的目的来进行(例如,可以在第一序列和第二序列中的一者或两者中引入空位以用于最佳比对,并且出于比较目的可以忽略不相同的序列)。在一些实施方案中,出于比较目的比对的序列的长度是参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%;然后比较相应位置处的核苷酸。当第一序列中的位置与第二序列中的相应位置由相同残基(例如,核苷酸或氨基酸)占据时,那么两个分子(即,第一和第二)在该位置处相同。两个序列之间的百分比同一性是由正在比较的两个序列共享的相同位置的数目的函数,考虑空位的数目和每个空位的长度,需要引入空位以用于两个序列的最佳比对。序列的比较和两个序列之间的百分比同一性的确定可以使用数学算法来完成。举例来说,两个核苷酸序列之间的百分比同一性可以使用Meyers和Miller(CABIOS,1989,4:11-17,其通过引用其整体并入本文)的算法来确定,该算法已经并入ALIGN程序(2.0版)中。在一些实施方案中,用ALIGN程序进行的核酸序列比较使用PAM120权重残基表、空位长度罚分12和空位罚分4。
抑制性核酸:如本文所用,术语“抑制性核酸”是指与靶基因,包括靶DNA或RNA(例如,靶mRNA(例如,connexin基因产物,例如,connexin mRNA,例如,GJB2 mRNA))特异性杂交的核酸序列。因此,在一些实施方案中,抑制性核酸抑制靶基因的表达和/或活性。在一些实施方案中,抑制性核酸是短干扰RNA(siRNA)、短发夹RNA(shRNA)、microRNA(miRNA)、反义寡核苷酸、向导RNA(gRNA)或核酶。在一些实施方案中,抑制性核酸的长度在约10个核苷酸至约30个核苷酸之间(例如,约10个核苷酸至约28个核苷酸、约10个核苷酸至约26个核苷酸、约10个核苷酸至约24个核苷酸、约10个核苷酸至约22个核苷酸、约10个核苷酸至约20个核苷酸、约10个核苷酸至约18个核苷酸、约10个核苷酸至约16个核苷酸、约10个核苷酸至约14个核苷酸、约10个核苷酸至约12个核苷酸、约12个核苷酸至约30个核苷酸、约12个核苷酸至约28个核苷酸、约12个核苷酸至约26个核苷酸、约12个核苷酸至约24个核苷酸、约12个核苷酸至约22个核苷酸、约12个核苷酸至约20个核苷酸、约12个核苷酸至约18个核苷酸、约12个核苷酸至约16个核苷酸、约12个核苷酸至约14个核苷酸、约16个核苷酸至约30个核苷酸、约16个核苷酸至约28个核苷酸、约16个核苷酸至约26个核苷酸、约16个核苷酸至约24个核苷酸、约16个核苷酸至约22个核苷酸、约16个核苷酸至约20个核苷酸、约16个核苷酸至约18个核苷酸、约18个核苷酸至约30个核苷酸、约18个核苷酸至约28个核苷酸、约18个核苷酸至约26个核苷酸、约18个核苷酸至约24个核苷酸、约18个核苷酸至约22个核苷酸、约18个核苷酸至约20个核苷酸、约20个核苷酸至约30个核苷酸、约20个核苷酸至约28个核苷酸、约20个核苷酸至约26个核苷酸、约20个核苷酸至约24个核苷酸、约20个核苷酸至约22个核苷酸、约22个核苷酸至约30个核苷酸、约22个核苷酸至约28个核苷酸、约22个核苷酸至约26个核苷酸、约22个核苷酸至约24个核苷酸、约24个核苷酸至约30个核苷酸、约24个核苷酸至约28个核苷酸、约24个核苷酸至约26个核苷酸、约26个核苷酸至约30个核苷酸、约26个核苷酸至约28个核苷酸、约28个核苷酸至约30个核苷酸,或11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)。在一些实施方案中,抑制性核酸是靶向GJB2的抑制性RNA。在一些此类实施方案中,抑制性GJB2 RNA与包含GJB2的RNA分子上的靶标特异性杂交。在一些此类实施方案中,GJB2抑制性RNA包括,例如,抑制性核酸是短干扰RNA(siRNA)、短发夹RNA(shRNA)、microRNA(miRNA)、反义寡核苷酸、向导RNA(gRNA)或核酶。在一些实施方案中,抑制性GJB2 RNA的杂交减少GJB2基因产物的表达。本文提供了适用于GJB2抑制的示例性抑制性RNA序列。
改善、增加、增强、抑制或减少:如本文所用,术语“改善”、“增加”、“增强”、“抑制”、“减少”或它们的语法等效词指示相对于基线或其他参考测量的值。在一些实施方案中,值与基线或其他参考测量具有统计显著差异。在一些实施方案中,适当参考测量可以是或包括特定***中(例如,在单个个体中),在不存在/存在特定药剂或治疗(例如,之前和/或之后)其他方面可比的条件下的测量,或在适当可比的参考药剂存在下的测量。在一些实施方案中,适当参考测量可以是或包括在已知或预期以特定方式响应的可比***中在相关药剂或治疗存在下的测量。在一些实施方案中,适当参考是阴性参考;在一些实施方案中,适当参考是阳性参考。
敲低:如本文所用,术语“敲低”是指一种或多种基因产物的表达的降低。在一些实施方案中,抑制性核酸实现敲低。在一些实施方案中,本文所述的基因组编辑***实现敲低。
敲除:如本文所用,术语“敲除”是指一种或多种基因产物的表达的消融。在一些实施方案中,本文所述的基因组编辑***实现敲除。
microRNA:如本文所用,术语“microRNA”或“miRNA”是指参与控制基因表达的一类生物分子。成熟miRNA通常是18-25个核苷酸的非编码RNA,其调控包括与该miRNA互补的序列的mRNA的表达。已知这些小RNA分子通过调控mRNA的稳定性和/或翻译来控制基因表达。在一些方面,miRNA与靶mRNA的3’UTR结合并抑制翻译。miRNA还可以与靶mRNA结合,并通过RNAi途径介导基因沉默。miRNA还可以通过引起染色质凝聚来调控基因表达。
在一些方面,microRNA的长度在约10个核苷酸至约30个核苷酸之间(例如,约10个核苷酸至约28个核苷酸、约10个核苷酸至约26个核苷酸、约10个核苷酸至约24个核苷酸、约10个核苷酸至约22个核苷酸、约10个核苷酸至约20个核苷酸、约10个核苷酸至约18个核苷酸、约10个核苷酸至约16个核苷酸、约10个核苷酸至约14个核苷酸、约10个核苷酸至约12个核苷酸、约12个核苷酸至约30个核苷酸、约12个核苷酸至约28个核苷酸、约12个核苷酸至约26个核苷酸、约12个核苷酸至约24个核苷酸、约12个核苷酸至约22个核苷酸、约12个核苷酸至约20个核苷酸、约12个核苷酸至约18个核苷酸、约12个核苷酸至约16个核苷酸、约12个核苷酸至约14个核苷酸、约16个核苷酸至约30个核苷酸、约16个核苷酸至约28个核苷酸、约16个核苷酸至约26个核苷酸、约16个核苷酸至约24个核苷酸、约16个核苷酸至约22个核苷酸、约16个核苷酸至约20个核苷酸、约16个核苷酸至约18个核苷酸、约18个核苷酸至约30个核苷酸、约18个核苷酸至约28个核苷酸、约18个核苷酸至约26个核苷酸、约18个核苷酸至约24个核苷酸、约18个核苷酸至约22个核苷酸、约18个核苷酸至约20个核苷酸、约20个核苷酸至约30个核苷酸、约20个核苷酸至约28个核苷酸、约20个核苷酸至约26个核苷酸、约20个核苷酸至约24个核苷酸、约20个核苷酸至约22个核苷酸、约22个核苷酸至约30个核苷酸、约22个核苷酸至约28个核苷酸、约22个核苷酸至约26个核苷酸、约22个核苷酸至约24个核苷酸、约24个核苷酸至约30个核苷酸、约24个核苷酸至约28个核苷酸、约24个核苷酸至约26个核苷酸、约26个核苷酸至约30个核苷酸、约26个核苷酸至约28个核苷酸、约28个核苷酸至约30个核苷酸,或11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)。
microRNA调控靶位点:如本文所用,术语“microRNA调控靶位点”或“miRTS”是指直接与mRNA转录物上的miRNA相互作用的序列。miRTS通常存在于mRNA的3’非翻译区(UTR),但也可能存在于编码序列中,或5’UTR中。miRTS不需要与miRNA完美互补,通常与miRNA仅具有很少碱基互补,并且往往含有一种或多种错配。miRTS可能是能够由miRNA充分结合的任何序列,miRTS可操作连接的基因的翻译由miRNA沉默机制诸如RNA诱导的沉默复合体(RISC)阻遏。在一些方面,将miRTS包括在包含多核苷酸(例如,治疗性多核苷酸)的核酸构建体中可能导致治疗性多核苷酸在转录后降解。在一些方面,将miRTS包括在包含多核苷酸(例如,治疗性多核苷酸)的核酸构建体中可能导致表达miRNA的细胞中治疗性多核苷酸的表达降低。
核酸:如本文所用,术语“核酸”在最广泛的意义上是指并入或可以并入寡核苷酸链中的任何化合物和/或物质。在一些实施方案中,核酸是经由磷酸二酯键并入或可以并入寡核苷酸链中的化合物和/或物质。如从上下文将显而易见,在一些实施方案中,“核酸”是指个别核酸残基(例如,核苷酸和/或核苷);在一些实施方案中,“核酸”是指包含个别核酸残基的寡核苷酸链。在一些实施方案中,“核酸”是或包含RNA;在一些实施方案中,“核酸”是或包含DNA。在一些实施方案中,核酸是、包含或由一个或多个天然核酸残基组成。在一些实施方案中,核酸是、包含或由一个或多个核酸类似物组成。在一些实施方案中,核酸类似物与核酸的不同之处在于它不利用磷酸二酯主链。替代地或另外地,在一些实施方案中,核酸具有一个或多个硫代磷酸酯和/或5’-N-亚磷酰胺键而非磷酸二酯键。在一些实施方案中,核酸是、包含或由一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)组成。在一些实施方案中,核酸是、包含或由一个或多个核苷类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基和其组合)组成。在一些实施方案中,与天然核酸中的那些相比,核酸包含一个或多个修饰的糖(例如,2’-氟核糖、核糖、2’-脱氧核糖、***糖和己糖)。在一些实施方案中,核酸具有编码功能基因产物,诸如RNA或蛋白质的核苷酸序列。在一些实施方案中,核酸包括一个或多个内含子。在一些实施方案中,通过从天然来源分离、通过基于互补模板(体内或体外)聚合进行的酶促合成、在重组细胞或***中繁殖,以及化学合成中的一种或多种制备核酸。在一些实施方案中,核酸为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基长。在一些实施方案中,核酸是部分或完全单链的;在一些实施方案中,核酸是部分或完全双链的。在一些实施方案中,核酸具有包含至少一个元件的核苷酸序列,该至少一个元件编码多肽或与编码多肽的序列互补。在一些实施方案中,核酸具有酶活性。
可操作地连接:如本文所用,是指并置,其中所描述的组分处于允许组分以它们的预期方式发挥功能的关系。“可操作地连接”至功能元件的控制元件以在与控制元件相容的条件下达成功能元件的表达和/或活性的方式相关。在一些实施方案中,“可操作地连接”的控制元件与感兴趣的编码元件相连(例如,共价连接);在一些实施方案中,控制元件与感兴趣的功能元件反式作用或以其他方式作用于感兴趣的功能元件。在一些实施方案中,“可操作地连接”是指调控序列与异源核酸序列之间的功能性连接促成后者的表达。举例来说,当第一核酸序列与第二核酸序列处于功能关系时,第一核酸序列与第二核酸序列可操作地连接。在一些实施方案中,例如,功能性连接可以包括转录控制。举例来说,如果启动子影响编码序列的转录或表达,那么启动子可操作地连接至编码序列。可操作地连接的DNA序列可以彼此相连,并且例如在有必要连接两个蛋白质编码区时,处于同一阅读框中。
药物组合物:如本文所用,术语“药物组合物”是指其中活性剂与一种或多种药学上可接受的载体一起配制的组合物。在一些实施方案中,活性剂以适于在治疗方案中施用的单位剂量存在,当向相关群体施用时,该治疗方案显示出实现预定治疗作用的统计显著概率。在一些实施方案中,药物组合物可以专门配制成以固体或液体形式施用,包括适于例如施用的那些,例如可注射配制剂,例如水性或非水性溶液或悬浮液,或设计成向耳道施用的液滴。在一些实施方案中,药物组合物可以配制成经由在特定器官或区室中注射,例如直接注射至耳中,或全身,例如静脉内施用。在一些实施方案中,配制剂可以是或包含浸液(水性或非水性溶液或悬浮液)、片剂、大丸剂、粉末、颗粒、糊剂、胶囊、粉末等。在一些实施方案中,活性剂可以是或包含分离的、纯化的或纯的化合物。
药学上可接受:如本文所用,例如关于用于配制如本文所公开的药物组合物的载体、稀释剂或赋形剂可以使用的术语“药学上可接受”意指载体、稀释剂或赋形剂与组合物的其他成分相容并且对其接受者无害。
药学上可接受的载体:如本文所用,术语“药学上可接受的载体”意指将主题化合物从一个器官或身体部分携带或转运至另一个器官或身体部分中所涉及的药学上可接受的材料、组合物或媒介物,诸如液体或固体填充剂、稀释剂、赋形剂或溶剂包囊材料。在与配制剂的其他成分相容并且对患者无害的意义上,每种载体必须是“可接受的”。可以充当药学上可接受的载体的材料的一些实例包括:糖,诸如乳糖、葡萄糖和蔗糖;淀粉,诸如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,诸如羧甲基纤维素钠、乙基纤维素和醋酸纤维素;粉状黄蓍胶;麦芽;明胶;滑石;赋形剂,诸如可可脂和栓剂蜡;油,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二醇,诸如丙二醇;多元醇,诸如甘油、山梨糖醇、甘露糖醇和聚乙二醇;酯,诸如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,诸如氢氧化镁和氢氧化铝;海藻酸;无热原水;等渗盐水;林格氏溶液;乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酐;以及药物配制剂中所采用的其他无毒相容物质。
多腺苷酸化:如本文所用,“多腺苷酸化”是指多腺苷酸部分或其修饰的变体共价连接至信使RNA分子。在真核生物体中,大多数信使RNA(mRNA)分子在3’末端进行多腺苷酸化。在一些实施方案中,3’poly(A)尾是经由酶类多腺苷酸聚合酶的作用添加至前体mRNA中的腺嘌呤核苷酸长序列(例如,50、60、70、100、200、500、1000、2000、3000、4000或5000)。在高等真核生物中,poly(A)尾可以添加至含有特异性序列、多腺苷酸化信号或“poly(A)序列”的转录物上。poly(A)尾和与其结合的蛋白质有助于保护mRNA免受外切核酸酶的降解。多腺苷酸化可以影响转录终止、mRNA从细胞核输出以及翻译。通常,多腺苷酸化在DNA转录成RNA之后立即在细胞核中发生,但另外也可以稍后在细胞质中发生。转录已经终止之后,可以经由与RNA聚合酶相关的内切核酸酶复合物的作用使mRNA链裂解。裂解位点可以由在裂解位点附近的碱基序列AAUAAA的存在来表征。mRNA已经裂解之后,可以将腺苷残基添加至裂解位点的游离3’末端。如本文所用,“poly(A)序列”是触发mRNA的内切核酸酶裂解以及一系列腺苷添加至裂解的mRNA的3’末端的序列。
多肽:如本文所用,术语“多肽”是指通常由肽键连接的残基(例如,氨基酸)的任何聚合链。在一些实施方案中,多肽具有自然界中存在的氨基酸序列。在一些实施方案中,多肽具有自然界中不存在的氨基酸序列。在一些实施方案中,多肽具有经由人工作用而设计和/或产生的工程化的氨基酸序列。在一些实施方案中,多肽可以包含或由天然氨基酸、非天然氨基酸或两者组成。在一些实施方案中,多肽可以包括例如修饰或附接至一个或多个氨基酸侧链的一个或多个侧基或其他修饰,所述侧基或其他修饰在多肽的N端、在多肽的C端或它们的任何组合。在一些实施方案中,此类侧基或修饰可以是乙酰化、酰胺化、脂化、甲基化、聚乙二醇化等,包括它们的组合。在一些实施方案中,多肽可以含有L-氨基酸、D-氨基酸或两者,并且可以含有本领域中已知的多种氨基酸修饰或类似物中的任一者。在一些实施方案中,可用的修饰可以是或包括例如末端乙酰化、酰胺化、甲基化等。在一些实施方案中,蛋白质可以包含天然氨基酸、非天然氨基酸、合成氨基酸和它们的组合。术语“肽”一般用于指长度小于约100个氨基酸、小于约50个氨基酸、小于20个氨基酸或小于10个氨基酸的多肽。在一些实施方案中,蛋白质是抗体、抗体片段、其生物活性部分和/或其特征部分。
多核苷酸:如本文所用,术语“多核苷酸”是指核酸的任何聚合物链。在一些实施方案中,多核苷酸是或包含RNA;在一些实施方案中,多核苷酸是或包含DNA。在一些实施方案中,多核苷酸是、包含或由一个或多个天然核酸残基组成。在一些实施方案中,多核苷酸是、包含或由一个或多个核酸类似物组成。在一些实施方案中,多核苷酸类似物与核酸的不同之处在于它不利用磷酸二酯主链。替代地或另外地,在一些实施方案中,多核苷酸具有一个或多个硫代磷酸酯和/或5’-N-亚磷酰胺键而非磷酸二酯键。在一些实施方案中,多核苷酸是、包含或由一个或多个天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)组成。在一些实施方案中,多核苷酸是、包含或由一个或多个核苷类似物(例如,2-氨基腺苷、2-硫胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟嘌呤、2-硫胞苷、甲基化碱基、嵌入碱基和它们的组合)组成。在一些实施方案中,与天然核酸中的那些相比,多核苷酸包含一个或多个修饰的糖(例如,2’-氟核糖、核糖、2’-脱氧核糖、***糖和己糖)。在一些实施方案中,多核苷酸具有编码功能基因产物,诸如RNA或蛋白质的核苷酸序列。在一些实施方案中,多核苷酸包括一个或多个内含子。在一些实施方案中,通过从天然来源分离、通过基于互补模板(体内或体外)聚合进行的酶促合成、在重组细胞或***中繁殖,以及化学合成中的一种或多种方式制备多核苷酸。在一些实施方案中,多核苷酸为至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基长。在一些实施方案中,多核苷酸是部分或完全单链的;在一些实施方案中,多核苷酸是部分或完全双链的。在一些实施方案中,多核苷酸具有包含至少一个元件的核苷酸序列,该至少一个元件编码多肽或是编码多肽的序列的互补物。在一些实施方案中,多核苷酸具有酶活性。
启动子:如本文所用,术语“启动子”是指核酸序列,其功能是控制一种或多种编码序列(例如,基因或转基因,例如编码治疗性多肽)的转录,位于编码序列转录起始位点转录方向的上游。在一些方面,通过存在DNA依赖性RNA聚合酶的结合位点、转录起始位点或其他DNA序列(例如,转录因子结合位点、阻遏物和/或激活蛋白结合位点或直接或间接作用于调控从启动子转录的量的其他核苷酸序列)对启动子进行结构鉴定。在一些方面,启动子可以包括天然存在的启动子序列、其功能片段或天然存在的启动子序列的突变体或其功能片段。
蛋白质:如本文所用,术语“蛋白质”是指多肽(即,一串由肽键彼此连接的至少两个氨基酸)。蛋白质可以包括除氨基酸以外的部分(例如,可以是糖蛋白、蛋白聚糖等)和/或可以按其他方式加工或修饰。本领域普通技术人员将了解,“蛋白质”可以是由细胞产生的完整多肽链(带有或不带有信号序列),或者可以是其特征部分。本领域普通技术人员将了解,蛋白质有时可以包括多于一条多肽链,例如由一个或多个二硫键连接或以其他方式相关。
重组:如本文所用,术语“重组”旨在指代通过重组方式设计、工程化、制备、表达、创造、制造和/或分离的多肽,诸如使用转染至宿主细胞中的重组表达构建体表达的多肽;从重组、组合人多肽文库分离的多肽;从动物(例如,小鼠、兔、绵羊、鱼等)分离的多肽,所述动物是转基因的或以其他方式操纵以表达编码和/或引导多肽或其一个或多个组分、部分、元件或域的表达的一个或多个基因或基因组分;和/或通过任何其他方式制备、表达、创造或分离的多肽,所述方式涉及将所选核酸序列元件彼此剪接或接合,化学合成所选序列元件,和/或以其他方式产生编码和/或引导多肽或其一个或多个组分、部分、元件或域的表达的核酸。在一些实施方案中,此类所选序列元件中的一者或多者在自然界中发现。在一些实施方案中,此类所选序列元件中的一者或多者在计算机中设计。在一些实施方案中,一个或多个此类所选序列元件由已知序列元件的诱变(例如,体内或体外)产生,所述已知序列元件例如来自天然或合成来源,诸如在感兴趣的源生物体(例如,人、小鼠等)的种系中。
参考:如本文所用,术语“参考”描述了进行比较所相对的标准或对照。举例来说,在一些实施方案中,将感兴趣的药剂、动物、个体、群体、样品、序列或值与参考或对照药剂、动物、个体、群体、样品、序列或值进行比较。在一些实施方案中,与感兴趣的测试或确定基本上同时测试和/或确定参考或对照。在一些实施方案中,参考或对照是历史参考或对照,任选地在有形介质中体现。通常,如本领域技术人员将了解,在与评估中的那些可比的条件或环境下确定或表征参考或对照。本领域技术人员将了解何时存在足够的相似性来证明与特定可能参考或对照的依赖性和/或比较。在一些实施方案中,参考是阴性对照参考;在一些实施方案中,参考是阳性对照参考。
调控元件:如本文所用,术语“调控元件”或“调控序列”是指以某种方式调控一个或多个特定基因的表达的DNA非编码区。在一些实施方案中,此类基因与给定调控元件并列或“邻近”。在一些实施方案中,此类基因位于距给定调控元件相当远的位置。在一些实施方案中,调控元件损害或增强一个或多个基因的转录。在一些实施方案中,调控元件可以与所调控的基因顺式定位。在一些实施方案中,调控元件可以与所调控的基因反式定位。举例来说,在一些实施方案中,调控序列是指调控可操作地连接至调控序列的基因产物的表达的核酸序列。在一些此类实施方案中,这个序列可以是调控基因产物的表达的增强子序列和其他调控元件。
样品:如本文所用,术语“样品”通常是指获得自或衍生自感兴趣的来源的材料的等分试样。在一些实施方案中,感兴趣的来源是生物或环境来源。在一些实施方案中,感兴趣的来源可以是或包含细胞或生物体,诸如微生物(例如,病毒)、植物或动物(例如,人)。在一些实施方案中,感兴趣的来源是或包含生物组织或流体。在一些实施方案中,生物组织或流体可以是或包含羊水、房水、腹水、胆汁、骨髓、血液、乳汁、脑脊髓液、耵聍、乳糜、食糜、***液、内淋巴、渗出液、粪便、胃酸、胃液、淋巴、粘液、心包液、外淋巴、腹膜液、肋膜液、脓液、稀粘液、唾液、皮脂、***、血清、***垢、痰液、滑液、汗液、泪液、尿液、***分泌物、玻璃状液、呕吐物和/或它们的组合或组分。在一些实施方案中,生物流体可以是或包含细胞内液、细胞外液、血管内液(血浆)、间隙液、淋巴液和/或跨细胞液。在一些实施方案中,生物流体可以是或包含植物渗出液。在一些实施方案中,生物组织或样品可以通过例如抽吸、活检(例如,细针或组织活检)、拭子(例如,口腔、鼻腔、皮肤或***拭子)、刮擦、手术、清洗或灌洗(例如,支气管肺泡、导管、鼻腔、眼部、口腔、子宫、***或其他清洗或灌洗)而获得。在一些实施方案中,生物样品是或包含从个体获得的细胞。在一些实施方案中,样品是通过任何适当方式直接从感兴趣的来源获得的“初级样品”。在一些实施方案中,如从上下文将显而易见,术语“样品”是指通过处理初级样品(例如,通过去除初级样品的一种或多种组分和/或通过向初级样品中添加一种或多种试剂)而获得的制剂。举例来说,使用半透膜过滤。此类“经过处理的样品”可以包含例如从样品中提取或通过对初级样品进行一种或多种技术,诸如核酸的扩增或逆转录、某些组分的分离和/或纯化等而获得的核酸或蛋白质。
选择性表达:如本文所用,术语“选择性表达”或“选择性地表达”是指主要在某些特定细胞类型(例如,内耳细胞,例如,内耳支持细胞)中表达感兴趣的编码序列、基因、转基因或多核苷酸(例如,治疗性多核苷酸)。
受试者:如本文所用,术语“受试者”是指生物体,通常是哺乳动物(例如,人,在一些实施方案中包括产前人形态)。在一些实施方案中,受试者罹患相关疾病、病症或病况。在一些实施方案中,受试者易患疾病、病症或病况。在一些实施方案中,受试者展现疾病、病症或病况的一种或多种症状或特征。在一些实施方案中,受试者不展现疾病、病症或病况的任何症状或特征。在一些实施方案中,受试者是具有表征对疾病、病症或病况的易感性或风险的一种或多种特征的人。在一些实施方案中,受试者是患者。在一些实施方案中,受试者是正在施用和/或已经施用诊断和/或疗法的个体。
基本上:如本文所用,术语“基本上”是指展现感兴趣的特征或特性的全部或接近全部范围或程度的定性条件。本领域普通技术人员将了解,生物和化学现象极少(如果有的话)完成和/或进行至完成或者达成或避免绝对结果。因此,术语“基本上”在本文中用于捕捉许多生物和化学现象中固有的潜在完整性缺乏。
支持细胞:如本文所用,术语“支持细胞(support cell)”、“支持细胞(supportingcell)”、“内耳支持细胞”或“内耳支持细胞”是指维持内耳结构和维持内耳感觉上皮环境的内耳细胞。在一些方面,内耳支持细胞包括但不限于内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure BDA0004046106460000241
器官细胞(KO)、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)、成纤维细胞和侧壁的其他细胞。
治疗:如本文所用,术语“治疗(treatment)”(也称为“治疗(treat)”或“治疗(treating)”)是指部分或完全减轻、改善、消除、逆转、缓解、抑制特定疾病、病症和/或病况的一种或多种症状、特征和/或病因,延迟其发作,降低其严重性,和/或减少其发生率的疗法的任何施用。在一些实施方案中,此类治疗可以针对不展现相关疾病、病症和/或病况的体征的受试者和/或仅展现疾病、病症和/或病况的早期体征的受试者。替代地或另外地,此类治疗可以针对展现相关疾病、病症和/或病况的一种或多种既定体征的受试者。在一些实施方案中,治疗可以针对已经诊断为患有相关疾病、病症和/或病况的受试者。在一些实施方案中,治疗可以针对已知具有与给定疾病、病症和/或病况的发展风险增加统计学上相关的一个或多个易感因素的受试者。
变体:如本文所用,术语“变体”是指在某种程度上不同于另一种型式的某物的型式,例如,基因序列。为了确定某物是否是变体,通常选择参考型式并且变体相对于那种参考型式是不同的。在一些实施方案中,变体可以具有与野生型序列相同或不同(例如,增加或减少)的活性或功能性水平。举例来说,在一些实施方案中,如果对变体进行例如密码子优化以抵抗例如抑制性核酸(例如,miRNA)的降解,那么所述变体与野生型序列相比可以具有改善的功能性。此类变体在本文中称作功能获得变体。在一些实施方案中,变体具有引起负向结果的活性或功能性降低或消除或活性变化(例如,增加的电活性引起慢性去极化,导致细胞死亡)。此类变体在本文中称作功能丧失变体。举例来说,在一些实施方案中,GJB2基因序列是野生型序列,其编码功能性蛋白并且存在于基因组含有GJB2基因的物种的大多数成员中。在一些此类实施方案中,功能获得变体可以是相对于野生型GJB2基因序列含有一个或多个核苷酸差异的GJB2的基因序列。在一些实施方案中,功能获得变体是编码转录物或多肽的密码子优化的序列,该转录物或多肽相比其相应野生型(例如,非密码子优化)型式可以具有改善的特性(例如对降解的易感性较低,例如对miRNA介导的降解的易感性较低)。在一些实施方案中,功能丧失变体具有一个或多个变化,使得转录物或多肽相对于野生型转录物和/或多肽在某种程度上有缺陷(例如,功能降低、无功能)。举例来说,在一些实施方案中,GJB2序列中的突变产生无功能或在其他方面有缺陷的connexin 26(Cx26)蛋白。
某些实施方案的详细描述
听力损失
一般来说,耳朵可以描述为包括:外耳、中耳、内耳、听(听觉)神经和听觉***(在声音从耳朵传播至脑中时处理声音)。除检测声音以外,耳朵还帮助保持平衡。因此,在一些实施方案中,内耳的病症可能导致听力损失、耳鸣、眩晕、失衡或其组合。
听力损失可能是遗传因素、环境因素或遗传因素与环境因素的组合的结果。患有耳鸣的所有人中约一半——他们的听觉***中出现幻觉噪音(鸣响(ringing)、蜂鸣(buzzing)、唧唧声(chirping)、嗡嗡声(humming)或敲击声(beating))——还对某些声音频率和音量范围具有过度的敏感/降低的耐受,称为听觉过敏(hyperacusis,也拼写为hyperacousis)。多种非综合征和综合征相关听力损失将是本领域技术人员已知的(例如,DFNB1和DFNA3,或分别为Bart-Pumphrey综合征、豪猪样鱼鳞病伴耳聋(hystrix-likeichthyosis with deafness,HID)、掌跖角化病伴耳聋(palmoplantar keratoderma withdeafness)、角膜炎-鱼鳞病-耳聋(KID)综合征和Vohwinkel综合征)。听力损伤或损失的环境原因可能包括,例如,某些药物,出生前或出生后的特定感染,和/或长期暴露于嘈杂的噪音中。在一些实施方案中,听力损失可能是由影响耳朵特定部位的噪音、耳毒性药剂、老年性聋、疾病、感染或癌症引起的。在一些实施方案中,缺血性损伤可能通过病理生理机制引起听力损失。在一些实施方案中,内在异常,如在耳蜗解剖学或生理学中起重要作用的基因的先天突变,或支持细胞和/或毛细胞中的遗传或解剖学变化,可能导致或促成听力损失。
听力损失和/或耳聋是最常见的人感觉缺陷之一,并且可能因许多原因而发生。在一些实施方案中,受试者可能出生时患有听力损失或听不见,而其它人可能随时间推移慢慢失去听力。约3600万美国成年人报告一定程度的听力损失,其中三分之一的60岁以上的人和85岁以上的一半人经历听力损失。每1,000名儿童中约有1.5名出生时患有极重度听力损失,并且另外每1,000名儿童中有两名至三名出生时患有部分听力损失(Smith et al.,2005,Lancet 365:879-890,其通过引用以其整体并入本文)。这些病例中超过一半归因于遗传基础(Di Domenico,et al.,2011,J.Cell.Physiol.226:2494-2499,其通过引用以其整体并入本文)。
当前,听力损失的治疗由轻度至重度损失的听力放大和重度至极重度损失的耳蜗植入组成(Kral and O’Donoghue,2010,N.Engl.J.Med.363:1438-1450,其通过引用以其整体并入本文)。此领域中的新近研究已经集中于耳蜗毛细胞再生,适用于最常见的听力损失形式,包括老年性聋、噪音损伤、感染和耳中毒。仍然需要可以修复和/或减轻听力问题的根源的有效治疗,诸如基因疗法(参见例如WO 2018/039375、WO 2019/165292和PCT归档申请US2019/060328,其每一篇通过引用以其整体并入本文)。
在一些实施方案中,非综合征性听力损失和/或耳聋与其它体征和症状无关。在一些实施方案中,综合征性听力损失和/或耳聋与身体其它部位的异常一起发生。约70%至80%的遗传性听力损失和/或耳聋病例是非综合征的;其余病例常常由特定遗传性综合征引起。非综合征性耳聋和/或听力损失可以具有不同遗传模式,并且可以在任何年龄发生。非综合征性耳聋和/或听力损失的类型一般根据它们的遗传模式命名。举例来说,常染色体显性形式指定为DFNA,常染色体隐性形式为DFNB,并且X连锁形式为DFN。每种类型还按照首次描述的顺序进行编号。举例来说,DFNA1是第一个描述的常染色体显性类型的非综合征性耳聋。75%与80%之间的遗传所致听力损失和/或耳聋病例以常染色体隐性模式遗传,意味着每个细胞中的基因的两个拷贝均具有突变。通常,患有常染色体隐性听力损失和/或耳聋的个体的父母双方是突变基因的一个拷贝的携带者,但不受这种形式的听力损失影响。另外20%至25%的非综合征性听力损失和/或耳聋病例是常染色体显性的,意味着每个细胞中改变的基因的一个拷贝足以导致耳聋和/或听力损失。患有常染色体显性耳聋和/或听力损失的人最常从耳聋和/或听力损失的父母继承基因的改变的拷贝。1%至2%之间的耳聋和/或听力损失病例显示X连锁遗传模式,意味着导致所述疾患的突变基因位于X染色体(两条性染色体之一)上。患有X连锁非综合征性听力损失和/或耳聋的男性相比继承相同基因突变的拷贝的女性往往在一生中更早发展成更严重的听力损失。X连锁遗传的特征在于父辈不能将X连锁性状传给它们的儿子。在美国,由线粒体DNA变化引起的线粒体非综合征性耳聋在小于1%的病例中发生。改变的线粒体DNA从母辈传给她的所有儿子和女儿。这种类型的耳聋并不继承自父辈。综合征性和非综合征性耳聋和/或听力损失的原因是复杂的。研究人员已经鉴定出超过30个当改变时与综合征性和/或非综合征性耳聋和/或听力损失相关的基因;然而,这些基因中的一些尚未完全表征。同一基因的不同突变可能与不同类型的耳聋和/或听力损失相关,并且一些基因与综合征性和非综合征性耳聋和/或听力损失均相关。
在一些实施方案中,耳聋和/或听力损失可以是传导性的(起因于耳道或中耳)、感觉神经性的(起因于内耳或听觉神经)或混合性的。在一些实施方案中,非综合征性耳聋和/或听力损失与内耳结构的损伤引起的永久性听力损失(感觉神经性耳聋)相关联。在一些实施方案中,感觉神经性听力损失可能归因于不良毛细胞功能。在一些实施方案中,感觉神经性听力损伤涉及第八脑神经(前庭耳蜗神经)或脑的听觉部分。在一些此类实施方案中,仅脑的听觉中枢受影响。在此种情况下,可能发生皮质性耳聋,其中可能听到正常阈值下的声音,但所感知的声音质量不良以致无法理解言语。由中耳变化引起的听力损失称为传导性听力损失。非综合征性耳聋和/或听力损失的一些形式涉及内耳和中耳两者的变化,称为混合性听力损失。在儿童学会说话前存在的听力损失和/或耳聋可以归类为学语前性或先天性的。在言语发育后发生的听力损失和/或耳聋可以归类为学语后性。大多数与综合征性或非综合征性听力损失有关的常染色体隐性基因座导致学语前性重度至极重度听力损失。
如本领域技术人员所知,毛细胞是脊椎动物耳朵的听觉***和前庭***两者的感觉受器。毛细胞检测环境中的运动,并且在哺乳动物中,毛细胞位于耳朵的耳蜗内的Corti器官中。已知哺乳动物的耳朵具有两种类型的毛细胞-内毛细胞和外毛细胞。外毛细胞可以经由毛细胞束的机械运动或电驱动的毛细胞胞体运动来放大低水平的声音频率。内毛细胞将耳蜗液中的振动转换为听觉神经传递至脑的电信号。在一些实施方案中,毛细胞可能在出生时异常,或在个体的一生中受损伤。在一些实施方案中,外毛细胞可能能够再生。在一些实施方案中,内毛细胞在患病或损伤后不能再生。在一些实施方案中,感觉神经性听力损失是归因于毛细胞异常。
如本领域技术人员所知,毛细胞并不孤立存在,并且它们的功能受到可以统称作支持细胞的多种细胞支持。支持细胞可以实现众多功能,并且包括许多细胞类型,包括但不限于Hensen细胞、Deiters细胞、柱细胞、Claudius细胞、内指状细胞和边缘细胞。在一些实施方案中,感觉神经性听力损失是归因于支持细胞异常。在一些实施方案中,支持细胞可能在出生时异常,或在个体的一生中受损。在一些实施方案中,支持细胞可能能够再生。在一些实施方案中,某些支持细胞可能不能再生。
间隙连接β-2(GJB2)
GJB2基因在整个哺乳动物类中高度保守,编码connexin 26(Cx26)(也被称为间隙连接β-2(GJB2)蛋白)。connexin 26是间隙连接蛋白家族的成员,该家族也被称为connexin家族。缝隙连接蛋白是专门的蛋白质,参与细胞内通讯。人GJB2基因的突变与听力损失和耳聋有关(Amorini et al.,Ann.Hum.Genet.79(5):341-349,2015;Qing et al.,Genet.TestMol.Biomarkers 19(1):52-58,2015)。
人GJB2基因位于染色体13q12上。它含有从可变转录起始点开始的两个转录异构体,这两者均含有两个外显子和单个内含子,涵盖总共约5千碱基(kb)(分别为约5469或4675个核苷酸)(NCBI基因ID 2706,NCBI参考序列:NG_008358.1)。两种人GJB2 mRNA异构体包括第二外显子,其在外显子2中完全编码全长connexin 26。这个编码序列是约681个核苷酸,并且编码长度为226个氨基酸的connexin 26。
connexin 26的单体包括由两个细胞外环和一个较短的细胞内环连接的四个跨膜螺旋,N端和C端位于质膜的细胞膜侧。细胞间的间隙连接可以以同体和/或异体的方式形成。Connexin 26已被证明形成功能性同体通道,以及与至少connexin 30、connexin 32、connexin 46和connexin 50形成功能性异体通道。在一些实施方案中,GJB2基因相关的感觉神经性听力损失(例如,非综合征或综合征)可能归因于GJB2和可变connexin蛋白编码基因的复合杂合突变。用connexin 26创建的间隙连接在细胞间转运钾离子和某些其他小分子。Connexin 26有助于维持细胞内钾离子的正确水平,并且是耳蜗中某些细胞成熟所需的。
人GJB2基因在一些组织中表达,但已知其参与表皮和内耳的重要细胞内稳态功能。在内耳内,connexin 26由corti器官内的所有支持细胞类型合成,包括内和外柱细胞、根细胞、齿间细胞、来自底层***的纤维细胞以及来自血管纹的基底和中间细胞。此外,已知connexin 26存在于侧壁的***和螺旋神经节的1型神经元中。
人的GJB2基因具有确定的128bp长的基底启动子,恰在最丰富的异构体的典型第一外显子的上游。这个序列包括TATA盒和两个GC盒,已知它们由Sp1和Sp3 TF结合。
GJB2有超过200个确定的突变,这些突变显示出一定程度的致病性,GJB2基因的各种突变与听力损失有关(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)。例如,在65.5%的来自西西里岛东部的患者上发现c.35delG等位基因(Amoriniet al.,Ann.Hum.Genet.79(5):341-349,2015)。在患有非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失的受试者中检测到的GJB2基因的其他示例性突变,以及对编码GJB2的核酸进行测序的方法描述于,例如,Snoeckx et al.,Am.J.Hum.Genet 77:945-957,2005;Welch et al.,Am.J.Med.Genet A143:1567-1573,2007;Zelante et al.,Hum.Mol.Genet.6:1605-1609,1997;和Tsukada et al.,Annals of Otology,Rhinology&Laryngology.2015,Vol.124(5S)61S-76S,其每一篇通过引用以其整体并入本文。检测基因突变的方法是本领域中众所周知的。此类技术的非限制性实例包括:实时聚合酶链反应(RT-PCR)、PCR、Sanger测序、新一代测序、Southern印迹和Northern印迹。
与感觉神经性听力损失伴非综合征或综合征表现有关的多种疾病状态已与人GJB2基因的特定突变有关(参见Nickel&Forge,Curr Opin Otolaryngol Head NeckSurg.2008Oct;16(5):452-7,其通过引用以其整体并入本文)。导致综合征性或非综合征性听力损失的人GBJ2基因突变各不相同,从去除整个GJB2或GJB2基因调控区的大缺失,到数以百计的小规模改变,包括无义、错义、***缺失(导致相移)和剪接位点的点突变。
在一些实施方案中,GJB2基因突变诸如Gly59Ser和Asn52Lys与Bart-Pumphrey综合征相关联。由皮肤增厚、疣样生长和一般先天性中度至极重度感觉神经性听力损失的表现所定义的综合征。在其他实施方案中,GJB2基因突变诸如Aspn50Asn与豪猪样鱼鳞病伴耳聋和角膜炎-鱼鳞病-耳聋综合征相关联。这些综合征与干燥鳞片状皮肤相关联,一般是先天性极重度感觉神经性听力损失,并且在角膜炎-鱼鳞病-耳聋综合征中,还有角膜的额外炎症。
在一些实施方案中,GJB2基因错义突变与掌跖角化症伴耳聋相关联。一种与手掌和足底皮肤较厚,以及轻度到极重度的感觉神经性听力损失相关联的综合征,开始于儿童早期并随着时间的推移而加重,受累个体可能特别难以听到高音调声音。而在其他实施方案中,GJB2基因错义突变与Vohwinkel综合征相关联。一种与皮肤异常(例如,他们的手指和脚趾周围的纤维组织带较厚,可能切断到手指的血液循环并导致自发性截肢)和感觉神经性听力损失相关联的综合征。
在一些实施方案中,GJB2基因突变与非综合征性听力损失相关联,其可能以显性(例如,DFNA3)或隐性(DFNB1)遗传。在一些实施方案中,功能丧失GJB2基因突变与非综合征性DFNB1相关联,其以常染色体隐性遗传,并表现为轻度到极重度听力损失,一般是学语前性并且不随着时间的推移变得更严重。据估计,在美国和欧盟,DFNB1存在于每100,000名活产的约14人中。据推测,DFNB1听力损伤的早期但并非总是先天性发作可能随后是听力损失的快速发展。一般而言,DFNB1专利的治疗选项包括教育、助听器和人工耳蜗。患者通常没有额外的症状,并且活到正常的寿命。据估计,在许多第一世界国家(例如,美国、法国、英国和澳大利亚),DFNB1占先天性重度到极重度的常染色体隐性非综合征性听力损失的约50%。
在一些实施方案中,GJB2基因突变导致的感觉神经性听力损失以常染色体显性方式遗传为非综合征性DFNA3。这些突变通常是显性阴性错义突变,阻止必要的功能性间隙连接的形成。这种疾病状态表现为听力损失,可以是学语前性,也可以是学语后性,从轻度到极重度不等,一般随着时间的推移变得更加严重。
GJB2多核苷酸
除其他事项外,本公开提供了多核苷酸,例如,包含GJB2基因或其特征部分的多核苷酸,以及包括此类多核苷酸的组合物和利用此类多核苷酸和/或组合物的方法。
在一些实施方案中,包含GJB2基因或其特征部分的多核苷酸可以是DNA或RNA。在一些实施方案中,DNA可以是基因组DNA或cDNA。在一些实施方案中,RNA可以是mRNA。在一些实施方案中,多核苷酸包含GJB2基因的外显子和/或内含子。
在一些实施方案中,基因产物由包括GJB2基因或其特征部分的多核苷酸表达。在一些实施方案中,此类多核苷酸的表达可以利用一个或多个控制元件(例如,启动子、增强子、剪接位点、多腺苷酸化位点、翻译起始位点等)。因此,在一些实施方案中,本文提供的多核苷酸可以包括一个或多个控制元件。
在一些实施方案中,GJB2基因是哺乳动物GJB2基因。在一些实施方案中,GJB2基因是鼠GJB2基因。在一些实施方案中,GJB2基因是灵长类GJB2基因。在一些实施方案中,GJB2基因是人GJB2基因。示例性人GJB2编码cDNA序列是或包括SEQ ID NO:1或SEQ ID NO:2的序列。具有非翻译区的示例性人GJB2剪接cDNA序列是或包括SEQ ID NO:3的序列。具有非翻译区的可变转录起始点示例性人GJB2剪接cDNA序列是或包括SEQ ID NO:4的序列。示例性人GJB2基因组DNA序列可以见于SEQ ID NO:5。
示例性人GJB2 cDNA编码序列(SEQ ID NO:1)
ATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTT
示例性人GJB2 cDNA编码序列(SEQ ID NO:2)
ATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAA
示例性剪接人GJB2异构体1cDNA,包括非翻译区序列(SEQ ID NO:3)
GTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGAGCAAACCGCCCAGAGTAGAAGATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAACGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAA
示例性剪接人GJB2异构体X1 cDNA,包括非翻译区序列(SEQ ID NO:4)
TTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAACGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAA
示例性人GJB2基因组DNA序列(SEQ ID NO:5)GTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGGTGAGCCCGCCGGCCCCGGACTGCCCGGCCAGGAACCTGGCGCGGGGAGGGACCGCGAGACCCAGAGCGGTTGCCCGGCCGCGTGGGTCTCGGGGAACCGGGGGGCTGGACCAACACACGTCCTTGGGCCGGGGGGCGGGGGCCGCCTTCTGGAGCGGGCGTTTCTGCGGCCGAGCTCCGGAGCTGGAATGGGGCGGCCGGGGAAGTGGACGCGATGGCACCGCCCGGGGTGCGAGTGGGGCCGGGCGCGCGCGGGAGGGGAAAAAGGCGCGGGCGAGCCGCCAGCGCGAGGTTTGTGGTGTCGCCGATGTCCCTTCGGGGTACTCTAGCGCAGCCGCCTGGCTACTTGACCCACTGCCACCAAACGTTTTAAATTCACCGAAAGCTTAGCTTCGAAGCAAAGCTCCGTTTCGCCGGTGAAGCAGGAAGCCTTCGCTGCAGGAACTGACCTTTACCTCTTGGAGCGGCTTCTGCAGAAAAATCCCCGGGCAGAGATTTGGGCGGAGTTTGCCTAGAACTAACGCGGAGCCAGCCGATCCCGGCCTACCCCGGGGCCAAGATTTCAGTGGCTTCCCTTTTTCCTAAACACTTCACGAGGGTCTGTTTCCGGGCTGTGCTCCCCGCCTAGAAGGAAAATTTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGGTACGGCCGTGTCCCCATGTGACCTTAGAGTCCCTTTCGAAACTGCTGTGCACAGTCGGTCACAATTTCAGACACTGGTGAGAAGGGTGGAGGAACCCTCTGGGGACAGCCAGGCAAGGTCGACCACCCATCACCTAAGGGTGGAGAAATTTAAGGGGTGAAGAGTCCCTTTTGCCTTTTCTGGATCCTGGTGATTCACCTAGTGTCTTCCCTAAGGAACTGAACCAACTCCTCCGCTGGCCTCTGGCAGCCCTCCAGGCGGTGCAGGATGGCGTGGGCCCGGTAGGAAGCTGCATGTAACCGCCCAGGGTCGGGAGGCCAGGAGGGCAGCTCCTCCTCTGACTTGAATATTGAAAACAACTTCGTCCTGCTTCTGAGCCCCTCTTAACCCATGACCCCCTAGCCCATTGGGGAGTAAATCTTAATTTACTCCTCTTCCTGAAAAAGGATCTTTAAAACAGGTAGCTTCAACTCAAGCTTTATAAAATAACAATATAGGGTTTCTCGGAACTGTATTTTTCTCAGCTGATGGTAACTGGACAGGTCTGTAGAAGGGTGTATGACCTGGGTTTGGCAGGTGGAAGAGGGCAAAGGATAAACCCCTCCTCCTGCAGCCCCATATTCTTGGCCAGGTGTATTGTTGTAAACCAGGAGAGAGTTTACTTCGGGGAGTATCCTGTTTTCCACTCAGTGAGGGCCAATGAAGAATGTCTAATTCCATAAGATGCTTTTGTTAAAATCGGAATGTTGCTGTCCTCGGTGGTTCTGCTGTTGGGACGGGACTGGCCTGAGCTGTGGGTGCTGTAGCAGGACAACCAGCTCACCTAAGGGCCTCCCAGTCTGGATTATCAATGGGTCAGTGCTGAACCTGGGCTAAAATATTGTTTTTTCCAATGATGTTGTCTTTCCCAAGCTCAGTGAAGCTAAATGTTTCACAGGCCTATGTCAATCTGATGTAACTTTCGTGGCCACCTCTCTCCTGTTAGCCTCTGACCAAGGTGGCACTGGATGGTTTCTGCCTGACCTTGGTGCCCCGTGGCAGCGACTGTGGGTCATGAAAGACATTCACTACGAGCCTGCTTCTGGAGTCCATCAGAAAACGGGATGCAACTTGCCTAAAATGAGGAGAGGAGGATGCTTTTAAGAAAAAGAAGAAGGAGGATTCACTACCAGCTCTGAAGGGTGGAAAAGAGATGATTCATCCGGATTGTGGAGAGGGTGGAATCTTGTTTAGGAGAGCGTTGGTTGTGGCAGGCAGGGTGTAACTATGAATCAGTGAAGACAATTCACATCCTGGGATGAAAAGAAGGCCATGGGCTCACAGGAGATTATCCACTGGCCTCTCCACATCCGCTTGCAGTAAGGAGTGTGGGACTCTCCCAAGCTTCAGCGCTGAACTGCAATGCAGTGACGTCGCTTAGCTGGGCCAGTAACCGAGGGAGTTGAATTTTCTGTCATTTTAAAATAATGTGTCTTTTAAGAAACACTTTGAAATTAAAACCACAGCCCACAATTATAATGCACTGTTGCAGCACTTATCAAAACAGATATGCTAACTGAGCCATCAGTGCCAGCCTGACAGTGAGGCCACCAAGCCATCCACAAAGCCTACACGAAAGTCTGTGCTCACAGTGGCTTTTCTCCATGAAGAGGGCATTCCTAACCTCTTCCTTTCACGTAGGAGGAAGCAAGGTCCTTTGTAAAATTTTAACTCGGGGTGCCTCAAATGTAAACTTAACCACTGGTAACAACAGTTTCACTGCTACATGCCACGTCTGTGAAAATTCATTCAAGACATTAAGGAAAGTGGCTCAGCAGAGAGACTAGACATCTTATCCTCACGGTTCTCCTGTACTTGGCCTCTCAGCCTTTGAGCAAGGTTGGCCCAAGCTAGTATCGGCCCCAGTGGTACAGCCAAAACTTGAGACTGCAAATGGATGCAGCTGTTGAACGCTGAGTAACTTCTGCAGAGTCAGGAAGACCCAAGGAAGCTCTGCAGAGGATGCAGGGGTACGGTCAGAACCCCTGAGTGCCTTTCAGCTAACGAGGACTTTATGACACTCCCCAGCACAGCAAATTTTTATGATGTGTTTAAAGATTGGGTGAATTACTCAGGTGAACAAGCTACTTTTTATCAGAGAACACCTAAAAACACGTTCAAGAGGGTTTGGGAACTATACATTTAATCCTATGACAAACTAAGTTGGTTCTGTCTTCACCTGTTTTGGTGAGGTTGTGTAAGAGTTGGTGTTTGCTCAGGAAGAGATTTAAGCATGCTTGCTTACCCAGACTCAGAGAAGTCTCCCTGTTCTGTCCTAGCTAGTGATTCCTGTGTTGTGTGCATTCGTCTTTTCCAGAGCAAACCGCCCAGAGTAGAAGATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAACGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAA示例性扩展的人GJB2基因组DNA序列,包括某些调控区(SEQ ID NO: 6)GACTGTGAACTTAAGGCACAGCAGAGCTGGGGCTGCTCTTAAGGCCCTGCTGTCTCTCCTCTTAGTAACAACACCATTTCACATGAAGTGACAGTGGTATCTTTTGTTGCCCTGGAAATGGAATACAACAATGGCTTTCCAACTTTTCTGTGGCAGAGACCTACAGACAGAAGTACATTTTACACTGGATCCAGGACACACATCAGTCTGAAAACACACACATGAACCAAACGTTTCCTAAAGCATTACTTATCCTTGCTAATAGCAACACATTCTCATATTCTTTTATACTTCATTTAATTTCATATAAAAAAGAAAAGGAAAGGAAAGAAATCTATTTCTCAGCCCATTAATAAGGTCAGGAGCAGCAACACCAGACTAGAAGAAAAGCTTACCTATAGATTTTTCTGCCACCTCTTGAGTGCGTCCAGCTTTCCGACAAGTCTCAGTGCCATCTACTGTGCGCTCTGGGTATTGCAATTGCTTTTTTTTTTTTTTTTTTTTTTTTTTTAGAATGAGACTAAGTCAGAGAACACAAAGAACTTCTTTCCCCACAGTGGAGATGGCTCTGAAAGCGTTTAAGGAATAGCTTAGATGAGTGGCTAACACATTCTCCCGGTTCTGAATTCTAAGACCACAGACTCCATGTCCAGTCCCCAAAGAGAGGCTTTGCAAGCTACAGAATACCCCTCTGACTGGGACCTCAGGAGCTAAACTGACCACGTAATTGGTTCTAGAAAGTGAAACGTTTTAATTTGAAACATCCAAATGAGCATTTTGTGAAAAGCTACTGCCGTCCATCAAATACAACACAGCCAGGGAGTCATCGCTCTATTGCCCTTGTCAATCCTACATCTATAGTTTTTTTTGCTACAGCAGTTCATGAGTGTTGACTCTATTCTAACTTGTTCCAGAAGCCCTTCAAGATGATAGATAGCACAATATTTTTGTAGCCAGAGCTAGAATGTAGAGCTCTTTTTGGCTTCCTTGTGAATGATCCAGAATTTCCATGTTGGCAAGCCACCATAATTTACAGAATTTACTTTTTATATTCAATAGAAGTAAAAAAAATTTACCTATTTAAGGAGTTATAGCTCTGGATTCATTTCTGACCAAAATGTGCTTTTTGACACAAATACAATTGGAAATGTCTTTGTAATTTATCCACAGTCTGCCTAGATAATCATAAAAGAACTGCATGGATATATTTGTGAGTAAGAGCACGTGTCCATTCAGCAAAACCAAGGAGATCAACTAATTCTACCATTGCCTTGAAACGGAGACACATCTAGCAGTTTGAATTTCCCCCAAAAGATTGTATGTGTGAAAATAAGAATAGAATGAGGAAAATTTAAAAGCCTATATAATAATTTCAGTCACAACTTGGCAATTAGAATTTTATGAGATGTCTTTAATTTGGAAGCAAAGAACAATTAAATTATTGAAGGCTGGAATTTTTTTTTAACTCTTTGAATGGAACAACAGATTTTCCCCAAAAGATTTGACTTTAACAATTTTCAGAAAACATAAGTCAGGGTGTGGTTCAATTACACAGAGAGAAATTGTAGTGAAATAGTGTTCCCTGTAATAATTACCCACAAAGGAGCACAGTGGAGCCACTCCTGCATTAAAATTACAGTATCATATGTAAGTTATTATTAATTAACCAGAGATGCCAGGAGCTTGTCAGTTTCCAACTGCTATTTTGAGGAGAGCTAAAGTTTCTCTTTTTTTGCCAGTTATTATTATTATTAATATTTCAACAGCAAGGCAAGAAAAGGGAATGTGGTCCATTAACTAATGGCTCTTGAAAAGACACTCAATGAATCCAACTTGCCCTAAAACTGCCAAGTGGTAGGACAGTCTCTTCGCGTCTTGCATCATTTTCTGCCATCACCTACGTGTGATTCGTGAGTCGGAAATTCAACCAAGACATGTTTAATGTATATTTAGAGCATTCTTCCCGGCGGGAATTCACGGTGCCATTCCATCAGGCAGTTGGCAAGCAGTCACTTGAAATATTAAGAAATATGATTTGTGTCACACTGATTTATTGCAAAACAGCAACTTCTTTCTTTTTGGTTCATTTATAAAACAACTGTCAAATTAAAATGCCAAATAGCTTTAAACATTAGCATTTTCACCTTATAACCTTACAAGTGCATCACTTTAAACATCTGAGTAAAAGTTCAGCTCGATGACAATCACCTGGGATTTACCTGCATGGTACTAAGCATATATGTAAAAATATTACTGATGGGTATCTCTGGCACTCTGAAGTGACAAAGTGTAGCCTTCACAGATCTTTGTCAGTTAATCATCAATAGTTACCTGAAAAGTGCCCACTTGCCATCATTCAAGATCAACCAGGCAGACACCACAGTGAGTTTTCCATCAAAAAACCTTCTCTATCTGGTCAGTCTCTGCACGTCAATGAGACAAAGGTGTATGCTGCACGCAGCAGTACTATCCTAAGCTCCCTGTGTCCTCACCATGGGGCTGGGTGGCTGGGGTGGAGGAACACAGGATTGGGCTTCAGCTTCTCTAGGGACTGGTACATTAAGAGATGAAGACATAAAAGGTGAGAAAAACATGGTTTATTTCCAATGTTTCCATTTCTGTTAAAAGTAATGCTTTCAACAGAAAAAAAATGCAGCAATATAAGTGTGTAATTTACAAAATAATTTCAGGATTTCTTTAATCATTAATTTGTGGTGTCATCTGTTAACTGGATTTACGTCTAAGCTCATTTGTAAATAACTTCAAATATCCAAGCCTTCCCTCACCCTTTTCCCACCTCACCTCTCCTCCTTCTCCTCCCCTACACTGGAGGACACTATGTACATGCATATAATGTCCTGCCCTAGAGGAGTCCTGAGCCTACTTGGGAAGAAAACACCAACTCACAGGAAAACAGCAGAAATCACACAAAACAGAATAAAAGCAAGCGCTGATCTGTAAGTGAAGACTTAAGTGCTATAGGACTTCCAGCTACAAATCCTGAAAACACGGAGTGGCTGTGATAATACGACTAGCCAACATCACACAGTAATTTTGCACATAAGGAGAACTAAATCAAAGAAAACAAGGAAAAGAAAGTTGAGCCTATAATCGTGATACAGGCACTAAAATCTCAGGTGACATTTTTCAATGGGGGAAAGTCAGTCAACTTCCGATCTCCAAACCATCTTTACTAGCGAGCTTCCCACAATGGTTCTAGAACCTTCCTTCATTCCAACCCAACCAGGATTCCAACAGACTCATAAACACCACAGCCTTTGAGAAATTAAAGGGAGAACCCACCAACCGGCGCCCCACTCCCCACCCCAAGTCACCTCTGGCTCAACCAAGATGCGCTCAGGCCAAGAAAGCTGCCCCACCCCACAGGCTTTGCCTGTCATTTTTAACAAGCCGACTCAGCACATCTCTCAGATGGGCCATGCAAGGCTTTTCGCAGCTCCTGGGGCTTTGCCTCTTCATGAGCAGACACTCCCTCTTAGACTAAGACCTGGAGCTGGAAAGTAGGTGGTAACCGCGGTACAAAACTCACGCTCGTCCCTGCAGAAACTGCCTAGGTCGGCCCATGGCCACGGGGCGCCAATTTTTCAAGGAAAAGTCAATGCTAATAATGGTGGCAATCACGGGAAATCCATTCTGAGGCCAGATCTGACTTGTCAGGATTAATCATCATTTCCACTTAACTTCGAACTGACCTGGGTAAAAACGTGAGCGCGAGGGGACCAGGCTGCACCTCTGACCTGGCTCCCCTCTGCAAAAATCGCGAAGTGGGTGCCCGAGGTGGGGCGGGGGTTGGGGGAGACCTCCCCGGGAGTCCCCACCCAGCCTGCTCTGCACATCTTAGTCCCTCATCCGCTTGCGCTGTGCAAATCTGTCTTCTGTCATTTGTATCGCAAGACATCAAAATCCCCAACCAAATGCAAATACTGAGACCTCATAATCTGAGACAAAGTTTCACGGTATCCAGAAAGCCCCCAGCAGGTGTGCAGTGCAGAGCCAGCCCCCCAGCGGTCTTCCGCAGAATCCTATCAGTTTCCCCCTTTCGTGCTGTGTGCATCGAGCAGGAAGGGGCTTGGCAGGTTTTACCTGCCCTCTTTCCTTTCTGAAAAGTCTGGGCCTCCTCACCCCGAAAGGAGTCACCTCCTTGCAGTTCCCCAGTTGCGAAAAGAGGAGGAAGTTGGCTGGGCCGGGGGCCGCGGGGGGCACCCTCCGCAGATGGCGGGACCCCCCTGCCGGCCATGGCAAAAACGAGGCTTGTCTCTCCCACCGCCCCCAACCTTAGTCCTTGGCACATTGTTGAAAGTAATTGAATAAAATCGGAAATTCGAGAAGGCGTTCGTTCGGATTGGTGAGATTTTGAGGGGAGAAAGAAGCGGGGACTTCGCCGGCACCAGCGGCGCCCCCTCCTCGGCCACCGTTAACCCCCATTCCAGAGGGCACTGCCCCGCCACCCAGCCTAGGTCCCCCTGCGAGAGCCTCGCGGGCCCGCGCAGCCTCCGCGACTCGAACAGATCTTCAGTCCTTGGAGGAATGCCTGTTTCTCTAACAATAAAAAATTAAAGAAGCGCTCATAAATGCCAAGTCCTCTCGCACTATGCGGAGTACAGAGGACAACGACCACAGCCATCCCTGAACCCCGCCCACGGCACAGCGCCGGAGCCGGGGTCTGGGGCGCCGCTTCCTGGGGGGTCCCGACTCTCAGCCGCCCCCGCTTCACCCGGGCCGCCAAGGGGCTGGGGGAGGCGGCGCTCGGGGTAACCGGGGGAGACTCAGGGCGCTGGGGGCACTTGGGGAACTCATGGGGGCTCAAAGGAACTAGGAGATCGGGACCTCGAAGGGGACTTGGGGGGTTCGGGGCTTTCGGGGGCGGTCGGGGGTTCGCGGACCCGGGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGGTGAGCCCGCCGGCCCCGGACTGCCCGGCCAGGAACCTGGCGCGGGGAGGGACCGCGAGACCCAGAGCGGTTGCCCGGCCGCGTGGGTCTCGGGGAACCGGGGGGCTGGACCAACACACGTCCTTGGGCCGGGGGGCGGGGGCCGCCTTCTGGAGCGGGCGTTTCTGCGGCCGAGCTCCGGAGCTGGAATGGGGCGGCCGGGGAAGTGGACGCGATGGCACCGCCCGGGGTGCGAGTGGGGCCGGGCGCGCGCGGGAGGGGAAAAAGGCGCGGGCGAGCCGCCAGCGCGAGGTTTGTGGTGTCGCCGATGTCCCTTCGGGGTACTCTAGCGCAGCCGCCTGGCTACTTGACCCACTGCCACCAAACGTTTTAAATTCACCGAAAGCTTAGCTTCGAAGCAAAGCTCCGTTTCGCCGGTGAAGCAGGAAGCCTTCGCTGCAGGAACTGACCTTTACCTCTTGGAGCGGCTTCTGCAGAAAAATCCCCGGGCAGAGATTTGGGCGGAGTTTGCCTAGAACTAACGCGGAGCCAGCCGATCCCGGCCTACCCCGGGGCCAAGATTTCAGTGGCTTCCCTTTTTCCTAAACACTTCACGAGGGTCTGTTTCCGGGCTGTGCTCCCCGCCTAGAAGGAAAATTTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGGTACGGCCGTGTCCCCATGTGACCTTAGAGTCCCTTTCGAAACTGCTGTGCACAGTCGGTCACAATTTCAGACACTGGTGAGAAGGGTGGAGGAACCCTCTGGGGACAGCCAGGCAAGGTCGACCACCCATCACCTAAGGGTGGAGAAATTTAAGGGGTGAAGAGTCCCTTTTGCCTTTTCTGGATCCTGGTGATTCACCTAGTGTCTTCCCTAAGGAACTGAACCAACTCCTCCGCTGGCCTCTGGCAGCCCTCCAGGCGGTGCAGGATGGCGTGGGCCCGGTAGGAAGCTGCATGTAACCGCCCAGGGTCGGGAGGCCAGGAGGGCAGCTCCTCCTCTGACTTGAATATTGAAAACAACTTCGTCCTGCTTCTGAGCCCCTCTTAACCCATGACCCCCTAGCCCATTGGGGAGTAAATCTTAATTTACTCCTCTTCCTGAAAAAGGATCTTTAAAACAGGTAGCTTCAACTCAAGCTTTATAAAATAACAATATAGGGTTTCTCGGAACTGTATTTTTCTCAGCTGATGGTAACTGGACAGGTCTGTAGAAGGGTGTATGACCTGGGTTTGGCAGGTGGAAGAGGGCAAAGGATAAACCCCTCCTCCTGCAGCCCCATATTCTTGGCCAGGTGTATTGTTGTAAACCAGGAGAGAGTTTACTTCGGGGAGTATCCTGTTTTCCACTCAGTGAGGGCCAATGAAGAATGTCTAATTCCATAAGATGCTTTTGTTAAAATCGGAATGTTGCTGTCCTCGGTGGTTCTGCTGTTGGGACGGGACTGGCCTGAGCTGTGGGTGCTGTAGCAGGACAACCAGCTCACCTAAGGGCCTCCCAGTCTGGATTATCAATGGGTCAGTGCTGAACCTGGGCTAAAATATTGTTTTTTCCAATGATGTTGTCTTTCCCAAGCTCAGTGAAGCTAAATGTTTCACAGGCCTATGTCAATCTGATGTAACTTTCGTGGCCACCTCTCTCCTGTTAGCCTCTGACCAAGGTGGCACTGGATGGTTTCTGCCTGACCTTGGTGCCCCGTGGCAGCGACTGTGGGTCATGAAAGACATTCACTACGAGCCTGCTTCTGGAGTCCATCAGAAAACGGGATGCAACTTGCCTAAAATGAGGAGAGGAGGATGCTTTTAAGAAAAAGAAGAAGGAGGATTCACTACCAGCTCTGAAGGGTGGAAAAGAGATGATTCATCCGGATTGTGGAGAGGGTGGAATCTTGTTTAGGAGAGCGTTGGTTGTGGCAGGCAGGGTGTAACTATGAATCAGTGAAGACAATTCACATCCTGGGATGAAAAGAAGGCCATGGGCTCACAGGAGATTATCCACTGGCCTCTCCACATCCGCTTGCAGTAAGGAGTGTGGGACTCTCCCAAGCTTCAGCGCTGAACTGCAATGCAGTGACGTCGCTTAGCTGGGCCAGTAACCGAGGGAGTTGAATTTTCTGTCATTTTAAAATAATGTGTCTTTTAAGAAACACTTTGAAATTAAAACCACAGCCCACAATTATAATGCACTGTTGCAGCACTTATCAAAACAGATATGCTAACTGAGCCATCAGTGCCAGCCTGACAGTGAGGCCACCAAGCCATCCACAAAGCCTACACGAAAGTCTGTGCTCACAGTGGCTTTTCTCCATGAAGAGGGCATTCCTAACCTCTTCCTTTCACGTAGGAGGAAGCAAGGTCCTTTGTAAAATTTTAACTCGGGGTGCCTCAAATGTAAACTTAACCACTGGTAACAACAGTTTCACTGCTACATGCCACGTCTGTGAAAATTCATTCAAGACATTAAGGAAAGTGGCTCAGCAGAGAGACTAGACATCTTATCCTCACGGTTCTCCTGTACTTGGCCTCTCAGCCTTTGAGCAAGGTTGGCCCAAGCTAGTATCGGCCCCAGTGGTACAGCCAAAACTTGAGACTGCAAATGGATGCAGCTGTTGAACGCTGAGTAACTTCTGCAGAGTCAGGAAGACCCAAGGAAGCTCTGCAGAGGATGCAGGGGTACGGTCAGAACCCCTGAGTGCCTTTCAGCTAACGAGGACTTTATGACACTCCCCAGCACAGCAAATTTTTATGATGTGTTTAAAGATTGGGTGAATTACTCAGGTGAACAAGCTACTTTTTATCAGAGAACACCTAAAAACACGTTCAAGAGGGTTTGGGAACTATACATTTAATCCTATGACAAACTAAGTTGGTTCTGTCTTCACCTGTTTTGGTGAGGTTGTGTAAGAGTTGGTGTTTGCTCAGGAAGAGATTTAAGCATGCTTGCTTACCCAGACTCAGAGAAGTCTCCCTGTTCTGTCCTAGCTAGTGATTCCTGTGTTGTGTGCATTCGTCTTTTCCAGAGCAAACCGCCCAGAGTAGAAGATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAACGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAATTTAAAATCTAATATGGTTTTAATAGAACAGCAAATTTTAATTTCATCTATCACTTTTTATATAAATACATTAATGTTTTATATTTCATAACACCAATGGGTAAGTTGCCAGAGTGTCTGACCCCATTCTGCCCCAGTTACAGAAAAGCTTCTGTCACCAGAAAGTTTGGTGGGGAAGGAAGGGAGGAAGATGATTTCTACCTAACCCCGTGCCCACCTCTACCAGGTTTTTGAGGCATATCAGTCTATGGACAATGTGGTGTTTGGTCTGGAAACGTACCTTGGTGAATGCTGAGTTGGCTGGACATGACCCGTTTAGCTCCTGGATGAATCCCAGAAGTGGACCTTCAAAATGTTACTCATAGCATGACCTTGGCTCACTGCAACCTCTGCCTCCCAGGCTCAAGCGATCCTCCCACCTCAGCGTCCCAAGTAGCTGGGACCACTGGAGTGTGCCACCACACTCCACTAATTTTTTCATTTTTTGTAGAAACGAGGTCCCACTATATTGCCCAGTCTGGTCTCGAACTCCTGGGCTGAAGGGATCCCCCTGCCTCAGTCTCCTAAAGTGCAAGGATTACAGGCATGGGCCACCGCACCTGGCCTGAAACTGCTTTTTATTCCTCAGTGCCCACTTCCATGGGAAATAAGCCTGCCAGGTCAGCCTGTCCCCATGGGAGTGACTGCCTGCTACCCCCACAGGCTTGCCCGGCCCTCGTGAGCCTCTCCCAGAGACACCACCAACAGTTCTGTTCTTTCATGGTACAAGATTTCCATCCAAGGATTTCAAAGCATTTCACACATCAATAATTAGAAGTATTTTCATAGAGGACCATACACTTTTAAAATGGATTTCAAAGAACAAAAACCAGTCAACTATCACCCAGGTAATAGAAAATGGGAAATGGTTTCTACCTGACTTCCAAAATGCTCTGCACATAGACTGTGAAAATAGGATTTTTTAAGCTGGGTGCAGAGGCTTATACCTATAATCCCAACACTTTGGGAGGCTGAGACGAGAGGATCACTTGAGCCCAGGAGTTCAAAACCAGCCTGGGCAATATAGGGAGACATTGTTTCTATAAAAAATAAAAATGTTAGCCAGGCAGGCGTGGTAACATGTGCCTGTAGTCTCAGCTACTCAGGAGGCTGAGGTGGGAAGATTGCTTGAACCTGGGAGGTCCATGCTGCAGTGAGCTGAGATTGTGCCACTGCACTCCAGCCTAGGCGACAGCAAGATCCTGTCCCAAACAACAACAACATCAAAAAACACAGAACTTTTAAAATAAGTACATTCACTTCTACAAGCTATGTAGATTATTACTCTCAAGCTATTAAAAGACCAAGCCAAAATAATTATGGGCTACTCTCGACCACTTGTAGGAATGGATAGAGAGGTCTGGTCACATGCCTGGAAATTAGAGCTTGAGCTCTGAAAATGATAATCCTGACTATATCTCAAAGCATCAGTCTGCACTTTGTATGGAGCAAGAAAAAGCCTTGTGGAAGCGGCCTCCCACCCAGCCGAGCCCTCGGCGTGGACAAGCTCTGCTTTTTATGAGCAGTGGGTGCAGCCTCGCTGCTCCCTCCTCCTGTCAAAAGACAGTCACAGCTGGGGTGAGCAGATCGGGCCCACTTGGGAGGCCCCAAGGAATATGCTGCAGGGGTCGGGCCTGAGCCACCCCCACGGGTTGGTCTTTGACAACTAGAGAGCAGCTGAGAGGTGGGTAAAAGCTCACTCACTTACCCTGACCTCAGTGTCCTCATCTTAAAATGGGTTTCCTGAATCTTTCCCCGGCTTAGTGGCAATGAAATAAGATAATTTATGTAAACGTTCTCCACATAGTAAAGCACTAAGTAACATATGACTGTCATCTGTTTTCCACTAGACAGATCCCAACCTGGAAGAGTGACAGATGGTATTTCAGATACAAGTGACTCAAGCAAAGCTTGATAAACTGGGGGCTGGAAAAAAATGCACATTTACACAAAGCCTGGAGTAACTGC
表1:对应于SEQ ID NO: 5中的内含子和外显子的核苷酸
Figure BDA0004046106460000431
Figure BDA0004046106460000441
表2:对应于SEQ ID NO:6中的内含子和外显子的核苷酸
Figure BDA0004046106460000442
本公开认识到多核苷酸序列的某些变化不影响其表达或由所述多核苷酸编码的蛋白质。在一些实施方案中,多核苷酸包含具有一个或多个沉默突变的GJB2基因。在一些实施方案中,本公开提供了包含具有一个或多个沉默突变的GJB2基因,例如,具有不同于SEQID NO:1、2、3、4、5或6的序列但与功能性GJB2基因编码相同氨基酸序列的GJB2基因的多核苷酸。在一些实施方案中,本公开提供了包含具有不同于SEQ ID NO:1、2、3、4、5或6的序列的GJB2基因的多核苷酸,其编码包含一个或多个突变的氨基酸序列(例如,与功能性GJB2基因产生的氨基酸序列相比不同的氨基酸序列),其中一个或多个突变是保守氨基酸取代。在一些实施方案中,本公开提供了包含具有不同于SEQ ID NO:1、2、3、4、5或6的序列的GJB2基因的多核苷酸,其编码包含一个或多个突变的氨基酸序列(例如,与从功能性GJB2基因产生的氨基酸序列相比不同的氨基酸序列),其中一个或多个突变不在GJB2基因或编码的connexin 26蛋白的特征部分中。在一些实施方案中,根据本公开的多核苷酸包含与SEQ IDNO:1、2、3、4、5或6的序列至少85%、至少90%、至少95%、至少98%或至少99%相同的GJB2基因。在一些实施方案中,根据本公开的多核苷酸包含与SEQ ID NO:1、2、3、4、5或6的序列相同的GJB2基因。正如本领域可以理解的,可以对SEQ ID NO:1、2、3、4、5或6进行优化(例如,密码子优化)以实现在动物,例如,哺乳动物,例如,人中增加或最佳的表达。
由GJB2基因编码的多肽
除其他事项外,本公开提供了由GJB2基因或其特征部分编码的多肽。在一些实施方案中,GJB2基因是哺乳动物GJB2基因。在一些实施方案中,GJB2基因是鼠GJB2基因。在一些实施方案中,GJB2基因是灵长类GJB2基因。在一些实施方案中,GJB2基因是人GJB2基因。
在一些实施方案中,多肽包含connexin 26蛋白或其特征部分。在一些实施方案中,connexin 26蛋白或其特征部分是哺乳动物connexin 26蛋白或其特征部分,例如,灵长类connexin 26蛋白或其特征部分。在一些实施方案中,connexin 26蛋白或其特征部分是人connexin 26蛋白或其特征部分。
在一些实施方案中,本文提供的多肽包含翻译后修饰。在一些实施方案中,本文提供的connexin 26蛋白或其特征部分包含翻译后修饰。在一些实施方案中,翻译后修饰可以包括但不限于糖基化(例如,N-连接糖基化、O-连接糖基化)、磷酸化、乙酰化、酰胺化、羟基化、甲基化、泛素化、硫酸化和/或其组合。示例性人connexin 26蛋白序列是或包括SEQ IDNO:7的序列。
示例性人Connexin 26蛋白序列(SEQ ID NO:7)
MDWGTLQTILGGVNKHSTSIGKIWLTVLFIFRIMILVVAAKEVWGDEQADFVCNTLQPGCKNVCYDHYFPISHIRLWALQLIFVSTPALLVAMHVAYRRHEKKRKFIKGEIKSEFKDIEEIKTQKVRIEGSLWWTYTSSIFFRVIFEAAFMYVFYVMYDGFSMQRLVKCNAWPCPNTVDCFVSRPTEKTVFTVFMIAVSGICILLNVTELCYLLIRYCSGKSKKPV
本公开认识到本文所述的多肽(例如,包括connexin 26或其特征部分)的氨基酸序列的某些突变将不影响该多肽的表达、折叠或活性。在一些实施方案中,多肽(例如,包括connexin 26或其特征部分)包含一个或多个突变,其中一个或多个突变是保守氨基酸取代。在一些实施方案中,根据本公开的多肽包括与SEQ ID NO:7的序列至少85%、至少90%、至少95%、至少98%或至少99%相同的connexin 26或其特征部分。在一些实施方案中,根据本公开的多肽包括与SEQ ID NO:7的序列相同的connexin 26或其特征部分。在一些实施方案中,根据本公开的多肽包括与SEQ ID NO:7的序列至少85%、至少90%、至少95%、至少98%或至少99%相同的connexin 26或其特征部分。在一些实施方案中,根据本公开的多肽包括与SEQ ID NO:7的序列相同的connexin 26蛋白或其特征部分。
构建体
除其他事项外,本公开提供了本文所述的一些多核苷酸是多核苷酸构建体。根据本公开的多核苷酸构建体包括本领域已知的所有那些多核苷酸,包括掺有包含GJB2基因或其特征部分的多核苷酸的粘粒、质粒(例如,裸露的或包含在脂质体中)和病毒构建体(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒构建体)。本领域的技术人员将能够选择合适的构建体以及细胞,用于制造本文所述的多核苷酸中的任一者。在一些实施方案中,构建体是质粒(即,可以在细胞内自主复制的环状DNA分子)。在一些实施方案中,构建体可以是粘粒(例如,pWE或sCos系列)。
在一些实施方案中,构建体是病毒构建体。在一些实施方案中,病毒构建体是慢病毒、逆转录病毒、腺病毒或腺相关病毒构建体。在一些实施方案中,构建体是腺相关病毒(AAV)构建体(参见,例如,Asokan et al.,Mol.Ther.20:699-7080,2012,其通过引用以其整体并入本文)。在一些实施方案中,病毒构建体是腺病毒构建体。在一些实施方案中,病毒构建体也可以基于或衍生自甲病毒属。甲病毒属包括辛德比斯(Sindbis)(和VEEV)病毒、奥拉病毒(Aura virus)、Babanki病毒、巴马森林病毒(Barmah Forest virus)、贝巴鲁病毒(Bebaru virus)、卡巴斯欧病毒(Cabassou virus)、基孔肯雅病毒(Chikungunya virus)、东方马脑炎病毒(Eastern equine encephalitis virus)、埃弗格赖德病毒(Evergladesvirus)、摩根堡病毒(Fort Morgan virus)、盖他病毒(Getah virus)、高地J病毒(Highlands J virus)、克泽拉格齐病毒(Kyzylagach virus)、马雅罗病毒(Mayarovirus)、米曲病毒(Me Tri virus)、米德尔堡病毒(Middelburg virus)、莫斯达斯佩德拉斯病毒(Mosso das Pedras virus)、穆坎博病毒(Mucambo virus)、恩杜穆病毒(Ndumuvirus)、奥尼昂-尼昂病毒(O’nyong-nyong virus)、皮克孙纳病毒(Pixuna virus)、里奥内格罗病毒(Rio Negro virus)、罗氏河病毒(Ross River virus)、鲑鱼胰腺病病毒(Salmonpancreas disease virus)、塞姆利基森林病毒(Semliki Forest virus)、南方象海豹病毒(Southern elephant seal virus)、托纳特病毒(Tonate virus)、特罗卡拉病毒(Trocaravirus)、乌纳病毒(Una virus)、委内瑞拉马脑炎病毒(Venezuelan equine encephalitisvirus)、西方马脑炎病毒(Western equine encephalitis virus)和瓦塔罗阿病毒(Whataroa virus)。一般而言,这类病毒的基因组编码可在宿主细胞的细胞质中翻译d非结构蛋白(例如,复制体)和结构蛋白(例如,衣壳和包膜)。罗斯河病毒、辛德比斯病毒、塞姆利基森林病毒(SFV)和委内瑞拉马脑炎病毒(VEEV)已经全部用来开发用于编码序列递送的病毒构建体。假型病毒可以通过结合甲病毒包膜糖蛋白和逆转录病毒衣壳来形成。甲病毒构建体的实例可以见于美国公布号20150050243、20090305344和20060177819中;构建体和其制造方法通过引用每篇出版物以其整体并入本文。
本文提供的构建体可以有不同的尺寸。在一些实施方案中,构建体是质粒并且可以包括高达约1kb、高达约2kb、高达约3kb、高达约4kb、高达约5kb、高达约6kb、高达约7kb、高达约8kb、高达约9kb、高达约10kb、高达约11kb、高达约12kb、高达约13kb、高达约14kb,或高达约15kb的总长度。在一些实施方案中,构建体是质粒并且可以具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约1kb至约11kb、约1kb至约12kb、约1kb至约13kb、约1kb至约14kb,或约1kb至约15kb的范围内的总长度。
在一些实施方案中,构建体是病毒构建体并且可以具有高达10kb的核苷酸总数。在一些实施方案中,病毒构建体可以具有在约1kb至约2kb,1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约2kb至约9kb、约2kb至约10kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约3kb至约9kb、约3kb至约10kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约4kb至约9kb、约4kb至约10kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约5kb至约9kb、约5kb至约10kb、约6kb至约7kb、约6kb至约8kb、约6kb至约9kb、约6kb至约10kb、约7kb至约8kb、约7kb至约9kb、约7kb至约10kb、约8kb至约9kb、约8kb至约10kb,或约9kb至约10kb的范围内的核苷酸总数。
在一些实施方案中,构建体是慢病毒构建体并且可以具有高达8kb的核苷酸总数。在一些实例中,慢病毒构建体可以具有约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约8kb、约6kb至约7kb,或约7kb至约8kb的核苷酸总数。
在一些实施方案中,构建体是腺病毒构建体并且可以具有高达8kb的核苷酸总数。在一些实施方案中,腺病毒构建体可以具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约7kb、约6kb至约8kb,或约7kb至约8kb的范围内的核苷酸总数。
本文所述的构建体中的任一者可以进一步包括控制序列,例如,选自下组的控制序列:转录起始序列、转录终止序列、启动子序列、增强子序列、RNA剪接序列、多腺苷酸化(poly(A))序列、Kozak共有序列和/或可以容纳转录前或转录后的调控和/或控制元件的其他非翻译区。在一些实施方案中,启动子可以是原生启动子、组成型启动子、诱导型启动子和/或组织特异性启动子。控制序列的非限制性实例在本文中描述。
AAV颗粒
除其他事项外,本公开提供了AAV颗粒,其包含本文所述的编码GJB2基因或其特征部分的构建体,以及本文所述的衣壳。在一些实施方案中,AAV颗粒可以描述为具有血清型,这是构建体株和衣壳株的描述。例如,在一些实施方案中,AAV颗粒可以描述为AAV2,其中该颗粒具有AAV2衣壳和包含特征性AAV2反向末端重复(ITR)的构建体。在一些实施方案中,AAV颗粒可以描述为假型,其中衣壳和构建体衍生自不同的AAV株,例如,AAV2/9将指包含利用AAV2 ITR的构建体和AAV9衣壳的AAV颗粒。在一些方面,AAV衣壳是Anc80衣壳(例如,Anc80L65衣壳)。
AAV构建体
本公开提供了包含GJB2基因或其特征部分的多核苷酸构建体。在本文所述的一些实施方案中,包含GJB2基因或其特征部分的多核苷酸可以包含在AAV颗粒中。
在一些实施方案中,多核苷酸构建体包含衍生自天然存在的AAV基因组构建体或从其修饰的一个或多个组分。在一些实施方案中,衍生自AAV构建体的序列是AAV1构建体、AAV2构建体、AAV3构建体、AAV4构建体、AAV5构建体、AAV6构建体、AAV7构建体、AAV8构建体、AAV9构建体、AAV2.7m8构建体、AAV8BP2构建体、AAV293构建体或AAV Anc80构建体。可以用于本文中的额外示例性AAV构建体在本领域是已知的。参见,例如,Kanaan et al.,Mol.Ther.Nucleic Acids 8:184-197,2017;Li et al.,Mol.Ther.16(7):1252-1260,2008;Adachi et al.,Nat.Commun.5:3075,2014;Isgrig et al.,Nat.Commun.10(1):427,2019;和Gao et al.,J.Virol.78(12):6381-6388,2004;其每一篇通过引用以其整体并入本文。
在一些实施方案中,所提供的构建体包含编码序列,例如GJB2基因或其特征部分,一个或多个调控和/或控制序列,以及任选地5’和3’AAV衍生反向末端重复(ITR)。在其中利用5’和3’AAV衍生ITR的一些实施方案中,多核苷酸构建体可以称为重组AAV(rAAV)构建体。在一些实施方案中,将所提供的rAAV构建体包装到AAV衣壳中以形成AAV颗粒。在一些方面,AAV衣壳是Anc80衣壳(例如,Anc80L65衣壳)。
在一些实施方案中,AAV衍生序列(其包含在多核苷酸构建体中)通常包括顺式作用的5’和3’ITR序列(参见,例如,B.J.Carter,in“Handbook of Parvoviruses,”ed.,P.Tijsser,CRC Press,pp.155 168,1990,其通过引用以其整体并入本文)。典型的AAV2衍生ITR序列的长度为约145个核苷酸。在一些实施方案中,将典型ITR序列的至少80%(例如,至少85%,至少90%或至少95%)掺入本文提供的构建体中。修饰这些ITR序列的能力在本领域的技术范围内。(参见,例如,文本诸如Sambrook et al.,“Molecular Cloning.ALaboratory Manual”,2d ed.,Cold Spring Harbor Laboratory,New York,1989;andK.Fisher et al.,J Virol.70:520 532,1996,其每一篇通过引用以其整体并入本文)。在一些实施方案中,本文所述的编码序列和/或构建体中的任一者侧翼为是5’和3’AAV ITR序列。AAV ITR序列可以获得自任何已知的AAV,包括目前鉴定的AAV类型。
在一些实施方案中,根据本公开和以本领域已知的模式描述的多核苷酸构建体(参见,例如,Asokan et al.,Mol.Ther.20:699-7080,2012,其通过引用以其整体并入本文)通常由编码序列或其一部分、至少一个和/或控制序列,以及任选地5’和3’AAV反向末端重复(ITR)组成。在一些实施方案中,所提供的构建体可以包装到衣壳中以形成AAV颗粒。AAV颗粒可以递送到选定的靶细胞。在一些实施方案中,所提供的构建体包含额外的任选编码序列,该编码序列是与构建体序列异源的核酸序列(例如,抑制性核酸序列),其编码感兴趣的多肽、蛋白质、功能性RNA分子(例如,miRNA、miRNA抑制剂)或其他基因产物。在一些实施方案中,核酸编码序列以允许编码序列在靶组织的细胞中转录、翻译和/或表达的方式与和/或控制组分操作连接。
如图1小图(A)所示,未修饰的AAV内源性基因组包括侧翼为ITR的两个开放阅读框,“cap”和“rep”。如图1小图(B)所示,示例性rAAV构建体类似地包括侧翼为编码区,例如,编码序列(例如,GJB2基因)的ITR。在一些实施方案中,rAAV构建体还包含以允许编码序列在用质粒构建体转染或用本公开产生的病毒感染的细胞中转录、翻译和/或表达的方式与该编码序列可操作地连接的常规控制元件。在一些实施方案中,rAAV构建体任选地包含启动子(如图1,小图(B)所示)、增强子、非翻译区(例如,5’UTR、3’UTR)、Kozak序列、内部核糖体进入位点(IRES)、剪接位点(例如,接受***点、供***点)、多腺苷酸化位点(如图1,小图(B)所示),或其任何组合。
在一些方面,rAAV构建体包含5’ITR、启动子、hGJB2基因、polyA和3’ITR(如图2A和2E中所示)。在一些方面,rAAV构建体包含5’ITR、启动子、hGJB2基因、3’UTR、polyA和3’ITR(如图2B中所示)。在一些方面,rAAV构建体包含5’ITR、启动子、hGJB2基因、C3域、polyA和3’ITR(如图2C中所示)。在一些方面,rAAV构建体包含5’ITR、启动子、hGJB2基因、D7域、polyA和3’ITR(如图2D中所示)。在一些方面,rAAV构建体包含5’ITR、启动子、5’UTR、hGJB2基因、任选的FLAG标签、3’UTR、polyA和3’ITR(如图2F-2J、2L和2N中所示)。在一些方面,rAAV构建体包含5’ITR、启动子、5’UTR、hGJB2基因、任选的FLAG标签、3’UTR、microRNA调控靶位点、polyA和3’ITR(如图2M中所示)。此类额外元件在本文中进一步描述。
在一些实施方案中,构建体是rAAV构建体。在一些实施方案中,rAAV构建体可以包括至少500bp、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb,或至少4.5kb。在一些实施方案中,AAV构建体可以包括至多7.5kb、至多7kb、至多6.5kb、至多6kb、至多5.5kb、至多4.5kb、至多4kb、至多3.5kb、至多3kb,或至多2.5kb。在一些实施方案中,AAV构建体可以包括约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约3kb至约4kb或约4kb至约5kb。
本文所述的构建体中的任一者可以进一步包括调控和/或控制序列,例如,选自下组的控制序列:转录起始序列、转录终止序列、启动子序列、增强子序列、RNA剪接序列、多腺苷酸化(poly(A))序列、Kozak共有序列和/或其任何组合。在一些实施方案中,启动子可以是原生启动子、组成型启动子、诱导型启动子和/或组织特异性启动子。控制序列的非限制性实例在本文中描述。
示例性构建体组分
反向末端重复(ITR)
构建体的AAV衍生序列通常包含顺式作用的5’和3’ITR(参见,例如,B.J.Carter,in“Handbook of Parvoviruses”,ed.,P.Tijsser,CRC Press,pp.155 168(1990),其通过引用以其整体并入本文)。一般而言,ITR能够形成发夹。形成发夹的能力可以促进ITR自引发的能力,允许的第二DNA链的引物酶非依赖性合成。ITR还在AAV构建体(例如,编码序列,例如,GJB2基因)整合到受试者细胞的基因组中起作用。ITR也可以帮助AAV构建体在AAV颗粒中高效衣壳化。
本公开的rAAV颗粒(例如,AAV2/Anc80颗粒)可以包含rAAV构建体,其包含编码序列(例如,GJB2基因)和侧翼为5’和3’AAV ITR序列的相关元件。在一些实施方案中,ITR是或包含约145个核酸。在一些方面,ITR是或包含约119个核酸。在一些方面,ITR是或包含约130个核酸。在一些实施方案中,使用编码ITR的全部或基本上全部序列。AAV ITR序列可以获得自任何已知的AAV,包括目前鉴定的哺乳动物AAV类型。在一些实施方案中,ITR是AAV2 ITR。
本公开中所采用的构建体分子的实例是含有转基因的“顺式作用”构建体,其中所选转基因序列和相关调控元件侧接有5’或“左”和3’或“右”AAV ITR序列。5’和左的命名是指ITR序列相对于在有义方向上从左至右阅读的整个构建体的位置。举例来说,在一些实施方案中,当以有义取向线性描绘构建体时,5’或左ITR是最接近给定构建体的启动子(与多腺苷酸化序列相反)的ITR。同时,3’和右的命名是指ITR序列相对于在有义方向上从左至右阅读的整个构建体的位置。举例来说,在一些实施方案中,当以有义取向线性描绘构建体时,3’或右ITR是最接近给定构建体的多腺苷酸化序列(与启动子序列相反)的ITR。依照有义股以5’至3’的顺序描绘如本文所提供的ITR。因此,本领域技术人员将了解,当从有义方向转变为反义方向时,5’或“左”取向的ITR也可以描绘为3’或“右”ITR。此外,本领域技术人员完全有能力将给定的有义ITR序列(例如,5’/左AAV ITR)转换为反义序列(例如,3’/右ITR序列)。本领域普通技术人员将了解如何修饰给定的ITR序列以用作5’/左或3'/右ITR或其反义型式。
例如,在一些实施方案中,ITR(例如,5’ITR)可以具有根据SEQ ID NO:8的序列。在一些实施方案中,ITR(例如,3’ITR)可以具有根据SEQ ID NO:9的序列。在一些实施方案中,ITR包括如本领域已知的一个或多个修饰,例如截短、删除、取代或***。在一些实施方案中,ITR包含少于145个核苷酸,例如127、130、134或141个核苷酸。例如,在一些实施方案中,ITR包含110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144或145个核苷酸。在一些方面,ITR包含约119个核苷酸。在一些方面,ITR包含约130个核苷酸。在一些实施方案中,ITR(例如,5’ITR)可以具有根据SEQ ID NO:52的序列。在一些实施方案中,ITR(例如,3’ITR)可以具有根据SEQ ID NO:53的序列。
5’AAV ITR序列的非限制性实例包括SEQ ID NO:8或52。3’AAV ITR序列的非限制性实例包括SEQ ID NO:9或53。在一些实施方案中,5’和3’AAV ITR(例如,SEQ ID NO:8和9,或SEQ ID NO:52和53)侧翼是编码序列的一部分,例如GJB2基因(例如SEQ ID NO:1,2,3,4,5或6)的全部或一部分。修饰这些ITR序列的能力在本领域的技术范围内。(参见,例如,文本诸如“Molecular Cloning.A Laboratory Manual”,2d ed.,Cold Spring HarborLaboratory,New York(1989);和K.Fisher et al.,J Virol.,70:520 532(1996),其每一篇通过引用以其整体并入本文)。在一些实施方案中,5’ITR序列与由SEQ ID NO:8表示的5’ITR序列至少85%、90%、95%、98%或99%相同。在一些实施方案中,3’ITR序列与由SEQ IDNO:9表示的3’ITR序列至少85%、90%、95%、98%或99%相同。在一些实施方案中,5’ITR序列与由SEQ ID NO:52表示的5’ITR序列至少85%、90%、95%、98%或99%相同。在一些实施方案中,3’ITR序列与由SEQ ID NO:53表示的3’ITR序列至少85%、90%、95%、98%或99%相同。
示例性5’AAV ITR(SEQ ID NO:8)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT
示例性3’AAV ITR(SEQ ID NO:9)
AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性5’AAV ITR(SEQ ID NO:52)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT
示例性3’AAV ITR(SEQ ID NO:53)
AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
启动子
在一些方面,本公开涉及包含细胞选择性启动子的构建体,该启动子可以用于调控(例如,增加)细胞(例如,内耳细胞,例如,支持细胞)中的connexin 26蛋白的表达。在一些方面,构建体提供了可能与一些细胞(例如,内耳细胞,例如,毛细胞)中的connexin 26的表达相关联的降低的毒性。
在一些实施方案中,构建体(例如,rAAV构建体)包含启动子。术语“启动子”是指由酶/蛋白质识别的DNA序列,其可以促进和/或起始可操作连接的基因(例如,GJB2基因)的转录。例如,启动子通常是指例如,RNA聚合酶和/或任何相关因子与之结合的核苷酸序列并且可以从该序列起始转录。因此,在一些实施方案中,构建体(例如,rAAV构建体)包括与本文所述的非限制性示例启动子之一可操作地连接的启动子。
在一些实施方案中,启动子是诱导型启动子、组成型启动子、哺乳动物细胞启动子、病毒启动子、嵌合启动子、工程化启动子、组织特异性启动子或本领域内已知的任何其他类型的启动子。在一些实施方案中,启动子是RNA聚合酶II启动子,诸如哺乳动物RNA聚合酶II启动子。在一些实施方案中,启动子是RNA聚合酶III启动子,包括但不限于HI启动子、人U6启动子、小鼠U6启动子、或猪U6启动子。启动子一般将是能够在内耳细胞中促进转录的启动子。在一些实施方案中,启动子是耳蜗特异性启动子或耳蜗定向启动子。在一些实施方案中,启动子是毛细胞特异性启动子或支持细胞特异性启动子。
各种各样的启动子在本领域是已知的,其可以在本文中使用。可以用于本文中的启动子的非限制性实例包括:人EF1α、人巨细胞病毒(CMV)(美国专利号5,168,062,通过引用以其整体并入本文)、人泛素C(UBC)、小鼠磷酸甘油酯激酶1、多瘤腺病毒、猿猴病毒40(SV40)、β-球蛋白、β-肌动蛋白、α-胎蛋白、γ-球蛋白、β-干扰素、γ-谷氨酰转移酶、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒(Rous sarcoma virus)、大鼠胰岛素、甘油醛-3-磷酸脱氢酶、金属硫蛋白II(MT II)、淀粉酶、组织蛋白酶、MI毒蕈碱受体、逆转录病毒LTR(例如,人T细胞白血病病毒HTLV)、AAV ITR、白介素-2、胶原酶、血小板源性生长因子、腺病毒5E2、基质溶解素、鼠类MX基因、葡萄糖调控蛋白(GRP78和GRP94)、α-2-巨球蛋白、波形蛋白、MHC I类基因H-2K b、HSP70、增殖蛋白、肿瘤坏死因子、促甲状腺激素a基因、免疫球蛋白轻链、T细胞受体、HLADQa和DQ、白介素-2受体、MHC II类、MHC II类HLA-DRa、肌肉肌酸激酶、前白蛋白(转甲状腺素蛋白)、弹性蛋白酶I、白蛋白基因、c-fos、c-HA-ras、神经细胞粘附分子(NCAM)、H2B(TH2B)组蛋白、大鼠生长激素、人血清淀粉样蛋白(SAA)、肌钙蛋白I(TN I)、杜兴氏肌肉失养症(duchenne muscular dystrophy)、人免疫缺陷病毒、ATOH1、GJB2、SLC26A4、LGR5、SYN1、GFAP、GDF6、IGFBP2、RBP7、GJB6、PARM1和长臂猿白血病病毒(GALV)启动子。启动子的其他实例在本领域中是已知的。参见,例如,Lodish,Molecular CellBiology,Freeman and Company,New York 2007,其每一篇通过引用以其整体并入本文。在一些实施方案中,启动子是CMV立即早期启动子。在一些实施方案中,启动子是CBA启动子。在一些实施方案中,启动子是CAG启动子或CAG/CBA启动子。在一些实施方案中,启动子包含或由SEQ ID NO:10组成。在一些实施方案中,启动子包含或由SEQ ID NO:11组成。在某些实施方案中,启动子包含SEQ ID NO:12中例举的CMV/CBA增强子/启动子构建体。在某些实施方案中,启动子包含SEQ ID NO:13中例举的CMV/CBA增强子/启动子构建体。在某些实施方案中,启动子包含SEQ ID NO:14中例举的CAG启动子或CMV/CBA/SV-40增强子/启动子构建体。在某些实施方案中,启动子包含SEQ ID NO:15中例举的CAG启动子或CMV/CBA/SV-40增强子/启动子构建体。在一些方面,启动子包含SEQ ID NO:16的ATOH1增强子/启动子构建体。在一些方面,启动子包含SEQ ID NO:17的GJB2增强子/启动子构建体。在一些方面,启动子包含SEQ ID NO:61的GJB2增强子/启动子构建体。在一些方面,启动子是包含在SEQ IDNO:54内的内源性人SLC26A4增强子-启动子序列。在一些方面,启动子是包含在SEQ ID NO:55内的内源性人LGR5增强子-启动子序列。在一些方面,启动子是包含在SEQ ID NO:56内的内源性人SYN1增强子-启动子序列。在一些方面,启动子是包含在SEQ ID NO:57或SEQ IDNO:62内的内源性人GFAP增强子-启动子序列。在一些方面,启动子是包含在SEQ ID NO:95内的内源性人IGFBP2增强子-启动子序列。在某些方面,启动子是SEQ ID NO:98中所列的内源性人RBP7启动子。在某些方面,启动子是SEQ ID NO:101中所列的内源性人GJB6启动子。在某些方面,启动子是SEQ ID NO:104中所列的内源性人PARM1启动子。
在一些方面,启动子包含GJB6和hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:91的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,启动子包含IGFBP2启动子和hGJB2最小启动子。在一些方面,IGFBP2启动子包含与SEQ ID NO:95具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,IGFBP2具有SEQ ID NO:95的核酸序列,并且hGJB2最小启动子具有SEQID NO:91的核酸序列。
在一些方面,启动子包含RBP7启动子和hGJB2最小启动子。在一些方面,RBP7启动子包含与SEQ ID NO:98具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,RBP7具有SEQ ID NO:98的核酸序列,并且hGJB2最小启动子具有SEQ IDNO:91的核酸序列。
在一些方面,该启动子包含GJB6启动子和hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:101具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:101的核酸序列,并且hGJB2最小启动子具有SEQ IDNO:91的核酸序列。
在一些方面,该启动子包含PARM1启动子和hGJB2最小启动子。在一些方面,PARM1启动子包含与SEQ ID NO:104具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,PARM1具有SEQ ID NO:104的核酸序列,并且hGJB2最小启动子具有SEQID NO:91的核酸序列。
在一些实施方案中,启动子序列与由SEQ ID NO:10表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:11表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:91表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%相同。在一些方面,启动子是包含在SEQ ID NO:90内的内源性人GDF6启动子序列。在一些方面,启动子序列与由SEQ ID NO:95表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:98表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:101表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:104表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
在一些方面,增强子-启动子序列与由SEQ ID NO:12表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:13表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:14表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:15表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:16表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:17表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:61表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:54表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:55表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:56表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,增强子-启动子序列与由SEQ ID NO:57或SEQ ID NO:62表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子序列与由SEQ ID NO:90表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
术语“组成型”启动子是指当与编码蛋白质(例如,connexin 26蛋白)的核酸可操作地连接时,在大多数或所有生理条件下使RNA于细胞中从该核酸转录的核苷酸序列。
组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子(参见,例如,Boshart et al.,Cell 41:521-530,1985,通过引用以其整体并入本文)、SV40启动子、二氢叶酸还原酶启动子,β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EFl-α启动子(Invitrogen)。在一些方面,启动子是组成型启动子。在一些方面,组成型启动子是CAG启动子、CBA启动子、CMV启动子、CMV/CBA增强子/启动子或CB7启动子。在一些方面,CMV/CBA增强子/启动子包含与SEQ ID NO:12或13具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸。在一些方面,CMV/CBA增强子/启动子包含SEQ ID NO:12的核酸。在一些方面,CMV/CBA增强子/启动子包含SEQ ID NO:13的核酸。在一些方面,CBA启动子包含与SEQ ID NO:10或11具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸。在一些方面,CBA启动子包含SEQ ID NO:10的核酸。在一些方面,CBA启动子包含SEQ IDNO:11的核酸。
在一些方面,CMV启动子包含与SEQ ID NO:14或15具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸。在一些方面,CMV启动子包含SEQ ID NO:14的核酸。在一些方面,CMV启动子包含SEQ ID NO:15的核酸。
诱导型启动子允许调控基因表达并且可以通过外源提供的化合物、环境因素(诸如温度)、或特定生理状态(例如急性期)的存在、细胞的特定分化状态或仅在复制细胞中调控。诱导型启动子和可诱导型***可以从多种商业来源获得,包括但不限于Invitrogen、Clontech和Ariad。诱导型启动子的额外实例在本领域中是已知的。
由外源性提供的化合物调控的诱导型启动子的实例包括锌可诱导型绵羊金属硫蛋白(MT)启动子、***(dexamethasone,Dex)可诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子***(WO 98/10088,通过引用以其整体并入本文);蜕皮激素昆虫启动子(No et al.,Proc.Natl.Acad Sci.US.A.93:3346-3351,1996,通过引用以其整体并入本文)、四环素可阻遏型***(Gossen et al.,Proc.Natl.Acad Sci.US.A.89:5547-5551,1992,通过引用以其整体并入本文)、四环素可诱导型***(Gossen et al.,Science 268:1766-1769,1995,还参见Harvey et al.,Curr.Opin.Chem.Biol.2:512-518,1998,其每一篇通过引用以其整体并入本文)、RU486可诱导型***(Wang et al.,Nat.Biotech.15:239-243,1997,和Wang et al.,Gene Ther.4:432-441,1997,其每一篇通过引用以其整体并入本文)和雷帕霉素可诱导型***(Magari et al.,J Clin.Invest.100:2865-2872,1997,通过引用以其整体并入本文)。
术语“组织特异性”启动子是指仅在某些特定细胞类型和/或组织中有活性的启动子(例如,特异性基因的转录仅在表达结合至组织特异性启动子的转录调控和/或控制蛋白的细胞内发生)。
在一些实施方案中,调控和/或控制序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控和/或控制序列结合以组织特异性方式诱导转录的组织特异性转录因子。
在一些实施方案中,组织特异性启动子是耳蜗特异性启动子。在一些实施方案中,组织特异性启动子是耳蜗毛细胞特异性启动子。耳蜗毛细胞特异性启动子的非限制性实例包括但不限于:ATOH1启动子、POU4F3启动子、LHX3启动子、MYO7A启动子、MYO6启动子、α9ACHR启动子和αl0ACHR启动子。在一些实施方案中,启动子是耳蜗毛细胞特异性启动子,诸如PRESTIN启动子或ONCOMOD启动子。参见例如Zheng et al.,Nature 405:149-155,2000;Tian et al.,Dev.Dyn.23l:199-203,2004;和Ryan et al.,Adv.Otorhinolaryngol.66:99-115,2009,其每一篇通过引用以其整体并入本文。
在一些实施方案中,组织特异性启动子是耳细胞特异性启动子。在一些实施方案中,组织特异性启动子是内耳细胞特异性启动子。在一些实施方案中,启动子是组织特异性启动子的特征片段。内耳非感觉细胞特异性启动子的非限制性实例包括但不限于:GJB2、GJB6、SLC26A4、TECTA、DFNA5、COCH、NDP、SYN1、GFAP、PLP、TAK1、IGFBP2、RBP7、GDF6、PARM1或SOX21。在一些实施方案中,耳蜗非感觉细胞特异性启动子可以是内耳支持细胞特异性启动子。内耳支持细胞特异性启动子的非限制性实例包括但不限于:SOX2、FGFR3、PROX1、GLAST1、LGR5、HES1、HES5、NOTCH1、JAG1、CDKN1A、CDKN1B、SOX10、P75、CD44、HEY2、LFNG或S100b。
在一些方面,细胞选择性启动子是耳细胞选择性启动子。在一些方面,细胞选择性启动子是内耳细胞选择性启动子。在一些方面,一个启动子是一个细胞选择性启动子的特征片段。在一些方面,启动子是一种支持性细胞选择性启动子。在一些方面,该启动子是一个内耳支持性细胞选择性启动子。
在一些方面,该启动子是支持性细胞选择性启动子。在一些方面,该启动子是毛细胞选择性启动子。在一些方面,支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure BDA0004046106460000601
器官细胞(KO)、外侧大上皮嵴细胞(LGER)和OC90+细胞(OC90)中的一种或多种。
在一些方面,支持细胞选择性启动子选自GJB6、GDF6、PARM1、RBP7和IGFBP2中的一种或多种。
在一些方面,启动子是内耳内侧支持细胞选择性启动子。在一些方面,内耳内侧支持细胞选自外侧大上皮嵴细胞和内沟细胞中的一种或多种。在一些方面,内耳内侧支持细胞选择性启动子选自GJB6、IGFBP2、GDF6、PARM1和GFAP中的一种或多种。在一些方面,启动子是内耳感觉上皮支持细胞选择性启动子。在一些方面,感觉上皮支持细胞选自内柱细胞、外柱细胞、dieter细胞和内指状细胞中的一种或多种。在一些方面,内耳感觉上皮支持细胞选择性启动子选自GJB6、IGFBP2、RBP7、GDF6、PARM1和GFAP中的一种或多种。
在一些方面,内耳支持细胞选择性启动子是GJB2启动子。在一些方面,GJB2增强子/启动子包含与SEQ ID NO:17具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,GJB2增强子/启动子包含SEQID NO:17的核酸序列。在一些方面,GJB2启动子包含与SEQ ID NO:61具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%同一性的核酸序列。在一些方面,GJB2启动子包含SEQ ID NO:61的核酸序列。在一些方面,GJB2最小启动子包括与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%同一性的核酸序列。在一些方面,GJB2最小启动子包含SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子是GJB6启动子。在一些方面,GJB6启动子包含与SEQ ID NO:101具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,GJB6启动子包含SEQ ID NO:101的核酸序列。
在一些方面,内耳支持细胞选择性启动子是SLC26A4启动子。在一些方面,SLC26A4启动子包含与SEQ ID NO:54具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,SLC26A4启动子包含SEQ ID NO:54的核酸序列。
在一些方面,内耳支持细胞选择性启动子是GFAP启动子。在一些方面,GFAP启动子包含与SEQ ID NO:57具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,GFAP启动子包含SEQ ID NO:57的核酸序列。在一些方面,GFAP启动子包含与SEQ ID NO:62具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,GFAP启动子包含SEQ ID NO:62的核酸序列。
在一些方面,内耳支持细胞选择性启动子是IGFBP2启动子。在一些方面,IGFBP2启动子包含与SEQ ID NO:95具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%同一性的核酸序列。在一些方面,IGFBP2启动子包含SEQ ID NO:95的核酸序列。
在一些方面,内耳支持细胞选择性启动子是RBP7启动子。在一些方面,RBP7启动子包含与SEQ ID NO:98具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,RBP7启动子包含SEQ ID NO:98的核酸序列。
在一些方面,内耳支持细胞选择性启动子是GDF6启动子。在一些方面,GDF6启动子包含与SEQ ID NO:90具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,GDF6启动子包含SEQ ID NO:90的核酸序列。
在一些方面,内耳支持细胞选择性启动子是PARM1启动子。在一些方面,PARM1启动子包含与SEQ ID NO:40具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,PARM1启动子包含SEQ ID NO:40的核酸序列。
在一些方面,内耳支持细胞选择性启动子是LGR5启动子。在一些方面,LGR5启动子包含与SEQ ID NO:55具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,LGR5启动子包含SEQ ID NO:55的核酸序列。
在一些方面,内耳支持细胞选择性启动子是ATOH1启动子。在一些方面,ATOH1启动子包含与SEQ ID NO:16具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,ATOH1启动子包含SEQ ID NO:16的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含GJB6和hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ IDNO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:91的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含IGFBP2启动子和hGJB2最小启动子。在一些方面,IGFBP2启动子包含与SEQ ID NO:95具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,IGFBP2具有SEQ ID NO:95的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含RBP7启动子和hGJB2最小启动子。在一些方面,RBP7启动子包含与SEQ ID NO:98具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,RBP7具有SEQ ID NO:98的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含GJB6启动子和hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:101具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:101的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含PARM1启动子和hGJB2最小启动子。在一些方面,PARM1启动子包含与SEQ ID NO:104具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,PARM1具有SEQ ID NO:104的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含GJB6和hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ IDNO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:91的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含IGFBP2启动子和hGJB2最小启动子。在一些方面,IGFBP2启动子包含与SEQ ID NO:95具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,IGFBP2具有SEQ ID NO:95的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含RBP7启动子和hGJB2最小启动子。在一些方面,RBP7启动子包含与SEQ ID NO:98具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,RBP7具有SEQ ID NO:98的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含一个GJB6启动子和一个hGJB2最小启动子。在一些方面,GJB6启动子包含与SEQ ID NO:101具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ ID NO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,GJB6具有SEQ ID NO:101的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些方面,内耳支持细胞选择性启动子包含一个PARM1启动子和一个hGJB2最小启动子。在一些方面,PARM1启动子包含与SEQ ID NO:104具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列,并且hGJB2最小启动子包含与SEQ IDNO:91具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的核酸序列。在一些方面,PARM1具有SEQ ID NO:104的核酸序列,并且hGJB2最小启动子具有SEQ ID NO:91的核酸序列。
在一些实施方案中,提供的AAV构建体包含选自CAG、CBA、CMV或CB7启动子的启动子序列。在本文所述的治疗性组合物中的任一者的一些实施方案中,第一或唯一AAV构建体进一步包含选自耳蜗和/或内耳特异性启动子的至少一个启动子序列。
示例性CBA启动子(SEQ ID NO:10)
GTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCG
示例性CBA启动子(SEQ ID NO:11)
GTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCG
示例性CMV/CBA增强子/启动子(SEQ ID NO:12)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCG
示例性CMV/CBA增强子/启动子(SEQ ID NO:13)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCG
示例性CAG增强子/启动子(SEQ ID NO:14)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG
示例性CAG增强子/启动子(SEQ ID NO:15)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG
在某些实施方案中,启动子是SEQ ID NO:16中所列的内源性人ATOH1增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:16表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:16内的内源性人ATOH1增强子-启动子序列。
示例性人ATOH1增强子-启动子(SEQ ID NO:16)
CTATGGAGTTTGCATAACAAACGTTTGGCAGCTCGCTCTCTTACACTCCATTAACAAGCTGTAACATATAGCTGCAGGTTGCTATAATCTCATTAATATTTTGGAAACTTGAATATTGAGTATTTCTGAGTGCTCATTCCCCATATGCCAGCCACTTCTGCCATGCTGACTGGTTCCTTTCTCTCCATTATTAGCAATTAGCTTCTTACCTTCCAAAGTCAGATCCAAGGTATCCAAGATACTAGCAAAGGAATCAACTATGTGTGCAAGTTAAGCATGCTTAATATCACCCAAACAAACAAAGAGGCAGCATTTCTTAAAGTAATGAAGATAGATAAATCGGGTTAGTCCTTTGCGACACTGCTGGTGCTTTCTAGAGTTTTATATATTTTAAGCAGCTTGCTTTATATTCTGTCTTTGCCTCCCACCCCACCAGCACTTTTATTTGTGGAGGGTTTTGGCTCGCCACACTTTGGGAAACTTATTTGATTTCACGGAGAGCTGAAGGAAGATCATTTTTGGCAACAGACAAGTTTAAACACGATTTCTATGGGACATTGCTAACTGGGGCCCCTAAGGAGAAAGGGGAAACTGAGCGGAGAATGGGTTAAATCCTTGGAAGCAGGGGAGAGGCAGGGGAGGAGAGAAGTCGGAGGAGTATAAAGAAAAGGACAGGAACCAAGAAGCGTGGGGGTGGTTTGCCGTAATGTGAGTGTTTCTTAATTAGAGAACGGTTGACAATAGAGGGTCTGGCAGAGGCTCCTGGCCGCGGTGCGGAGCGTCTGGAGCGGAGCACGCGCTGTCAGCTGGTGAGCGCACTCTCCTTTCAGGCAGCTCCCCGGGGAGCTGTGCGGCCACATTTAACACCATCATCACCCCTCCCCGGCCTCCTCAACCTCGGCCTCCTCCTCGTCGACAGCCTTCCTTGGCCCCCACCAGCAGAGCTCACAGTAGCGAGCGTCTCTCGCCGTCTCCCGCACTCGGCCGGGGCCTCTCTCCTCCCCCAGCTGCGCAGCGGGAGCCGCCACTGCCCACTGCACCTCCCAGCAACCAGCCCAGCACGCAAAGAAGCTGCGCAAAGTTAAAGCCAAGCAATGCCAAGGGGAGGGGAAGCTGGAGGCGGGCTTTGAGTGGCTTCTGGGCGCCTGGCGGGTCCAGAATCGCCCAGAGCCGCCCGCGGTCGTGCACATCTGACCCGAGTCAGCTTGGGCACCAGCCGAGAGCCGGCTCCGCACCGCTCCCGCACCCCAGCCGCCGGGGTGGTGACACACACCGGAGTCGAATTACAGCCCTGCAATTAACATATGAATCTGACGAATTTAAAAGAAGGAAAAAAAAAAAAAAACCTGAGCAGGCTTGGGAGTCCTCTGCACACAAGAACTTTTCTCGGGGTGTAAAAACTCTTTGATTGGCTGCTCGCACGCGCCTGCCCGCGCCCTCCATTGGCTGAGAAGACACGCGACCGGCGCGAGGAGGGGGTTGGGAGAGGAGCGGGGGGAGACTGAGTGGCGCGTGCCGCTTTTTAAAGGGGCGCAGCGCCTTCAGCAACCGGAGAAGCATAGTTGCACGCGACCTGGTGTGTGATCTCCGAGTGGGTGGGGGAGGGTCGAGGAGGGAAAAAAAAATAAGACGTTGCAGAAGAGACCCGGAAAGGGCCTTTTTTTTGGTTGAGCTGGTGTCCCAGTGCTGCCTCCGATCCTGAGCCTCCGAGCCTTTGCAGTGCAA
在某些实施方案中,启动子是SEQ ID NO:17或SEQ ID NO:61中所列的内源性人GJB2增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:17或SEQ IDNO:61表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:61内的内源性人GJB2增强子-启动子序列。在一些方面,启动子是SEQ ID NO:91的GJB2最小启动子。在一些方面,启动子与SEQ ID NO:91至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%相同。
示例性人GJB2增强子-启动子(SEQ ID NO:17)
AAGCTTCGGTGAATTTAAAACGTTTGGTGGCAGTGGGTCAAGTAGCCAGGCGGCTGCGCTAGAGTACCCCGAAGGGACATCGGCGACACCACAAACCTCGCGCTGGCGGCTCGCCCGCGCCTTTTTCCCCTCCCGCGCGCGCCCGGCCCCACTCGCACCCCGGGCGGTGCCATCGCGTCCACTTCCCCGGCCGCCCCATTCCAGCTCCGGAGCTCGGCCGCAGAAACGCCCGCTCCAGAAGGCGGCCCCCGCCCCCCGGCCCAAGGACGTGTGTTGGTCCAGCCCCCCGGTTCCCCGAGACCCACGCGGCCGGGCAACCGCTCTGGGTCTCGCGGTCCCTCCCCGCGCCAGGTTCCTGGCCGGGCAGTCCGGGGCCGGCGGGCTCACCTGCGTCGGGAGGAAGCGCGGCGGGGCCGGGGCGGGGGTCTCGGCGTTGGGGTCTCTGCGCTGGGGCTCCTGCGCTCCTAGGCGGGTCCTGGGCCGGGCGCCGCCGAGGGGCTCCGAGTCGGGGAGAGGAGCGCGCGGGCGCTGCGGGGCCGCAACACCTGTCTCCCGCCGTGGCGCCTTTTAACCGCACCCCACACCCCGCCTCTTCCCTCGGAGACTGGGAAAGTTACGGAGGGGGCGGCGCCGCGGGCGGAGCGCGCCCGGCCTCTGGGTCCTCAGAGCTTCCCGGGTCCGCGAACCCCCGACCGCCCCCGAAAGCCCCGAACCCCCCAAGTCCCCTTCGAGGTCCCGATCTCCTAGTTCCTTTGAGCCCCCATGAGTTCCCCAAGTGCCCCCAGCGCCCTGAGTCTCCCCCGGTTACCCCGAGCGCCGCCTCCCCCAGCCCCTTGGCGGCCCGGGTGAAGCGGGGGCGGCTGAGAGTCGGGACCCCCCAGGAAGCGGCGCCCCAGACCCCGGCTCCGGCGCTGTGCCGTGGGCGGGGTTCAGGGATGGCTGTGGTCGTTGTCCTCTGTACTCCGCATAGTGCGAGAGGACTTGGCATTTATGAGCGCTTCTTTAATTTTTTATTGTTAGAGAAACAGGCATTCCTCCAAGGACTGAAGATCTGTTCGAGTCGCGGAGGCTGCGCGGGCCCGCGAGGCTCTCGCAGGGGGACCTAGGCTGGGTGGCGGGGCAGTGCCCTCTGGAATGGGGGTTAACGGTGGCCGAGGAGGGGGCGCCGCTGGTGCCGGCGAAGTCCCCGCTTCTTTCTCCCCTCAAAATCTCACCAATCCGAACGAACGCCTTCTCGAATTTCCGATTTTATTCAATTACTTTCAACAATGTGCCAAGGACTAAGGTTGGGGGCGGTGGGAGAGACAAGCCTCGTTTTTGCCATGGCCGGCAGGGGGGTCCCGCCATCTGCGGAGGGTGCCCCCCGCGGCCCCCGGCCCAGCCAACTTCCTCCTCTTTTCGCAACTGGGGAACTGCAAGGAGGTGACTCCTTTCGGGGTGAGGAGGCCCAGACTTTTCAGAAAGGAAAGAGGGCAGGTAAAACCTGCCAAGCCCCTTCCTGCTCGATGCACACAGCACGAAAGGGGGAAACTGATAGGATTCTGCGGAAGCTT
示例性人GJB2启动子(SEQ ID NO: 61)
AAGCTTCCGCAGAATCCTATCAGTTTCCCCCTTTCGTGCTGTGTGCATCGAGCAGGAAGGGGCTTGGCAGGTTTTACCTGCCCTCTTTCCTTTCTGAAAAGTCTGGGCCTCCTCACCCCGAAAGGAGTCACCTCCTTGCAGTTCCCCAGTTGCGAAAAGAGGAGGAAGTTGGCTGGGCCGGGGGCCGCGGGGGGCACCCTCCGCAGATGGCGGGACCCCCCTGCCGGCCATGGCAAAAACGAGGCTTGTCTCTCCCACCGCCCCCAACCTTAGTCCTTGGCACATTGTTGAAAGTAATTGAATAAAATCGGAAATTCGAGAAGGCGTTCGTTCGGATTGGTGAGATTTTGAGGGGAGAAAGAAGCGGGGACTTCGCCGGCACCAGCGGCGCCCCCTCCTCGGCCACCGTTAACCCCCATTCCAGAGGGCACTGCCCCGCCACCCAGCCTAGGTCCCCCTGCGAGAGCCTCGCGGGCCCGCGCAGCCTCCGCGACTCGAACAGATCTTCAGTCCTTGGAGGAATGCCTGTTTCTCTAACAATAAAAAATTAAAGAAGCGCTCATAAATGCCAAGTCCTCTCGCACTATGCGGAGTACAGAGGACAACGACCACAGCCATCCCTGAACCCCGCCCACGGCACAGCGCCGGAGCCGGGGTCTGGGGCGCCGCTTCCTGGGGGGTCCCGACTCTCAGCCGCCCCCGCTTCACCCGGGCCGCCAAGGGGCTGGGGGAGGCGGCGCTCGGGGTAACCGGGGGAGACTCAGGGCGCTGGGGGCACTTGGGGAACTCATGGGGGCTCAAAGGAACTAGGAGATCGGGACCTCGAAGGGGACTTGGGGGGTTCGGGGCTTTCGGGGGCGGTCGGGGGTTCGCGGACCCGGGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGT
示例性人GJB2最小启动子(SEQ ID NO:91)
AAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGT
在某些实施方案中,启动子是SEQ ID NO:54中所列的内源性人SLC26A4增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:54表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:54内的内源性人SLC26A4增强子-启动子序列。
示例性人SLC26A4增强子-启动子(SEQ ID NO:54)
CGGAAGGTTGATGTACAGAGGTCTGTATTTTGGAGCCTCTTCTGTATTTACTTCAGAACACTAACAATCAGGCGAGAATGTTCTGGTTTATCAAACCCTTCCTTCTGCCTTTCATCTTAACCATGCATTAGTTTTAACAAAGTTCATCCCAACAGAAGACAAAACACTGATGAGGTAGGATAGCTCCAGCTCCTCCTCCCTCTCTTCTAGTCTTGATTTCCATGTAGTCCAGTTTATTCCTTCCCTGATTGTCCAGGAGAATGAGAAAAAGAAAAAACAGAGTCTAGTGGGTAAGAAAGGGCCACCTGGACGGCTTGATTTGGATTGTGAAATAAAACACACACACATGCACACGTAGAATAAGTGGCTAAAATCTGAGTAAATCGTGAACTCTCTGTATCCTCCACCCATTGAATACTCCTAAAAGACTTTCTAGAAATTCAAGGACTTATTAATATAGAAACCTGGCCATTGTTCCTCTTCTCCTCCCCATGTGGTATGAGAGCACCTGTGGCAGGCTCCCAGAGACCACGGACCTCTTCCTCTAGGCGGGCTCTGCTCTTCTTTAAGGAGTCCCACAGGGCCTGGCCCGCCCCTGACCTCGCAACCCTTGAGATTAGTAACGGGATGAGTGAGGATCCGGGTGGCCCCTGCGTGGCAGCCAGTAAGAGTCTCAGCCTTCCCGGTTCGGGAAAGGGGAAGAATGCAGGAGGGGTAGGATTTCTTTCCTGATAGGATCGGTTGGGAAAGACCGCAGCCTGTGTGTGTCTTTCCCTTCGACCAAGGTGTCTGTTGCTCCGTAAATAAAACGTCCCACTGCCTTCTGAGAGCGCTATAAAGGCAGCGGAAGGGTAGTCCGCGGGGCATTCCGGGCGGGGCGCGAGCAGAGACAGGTGAGTT
在某些实施方案中,启动子是SEQ ID NO:55中所列的内源性人LGR5增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:55表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:55内的内源性人LGR5增强子-启动子序列。
示例性人LGR5增强子-启动子(SEQ ID NO:55)
AGGGCTATTTGTACCTCAACGAGGGCTTCTCTCCAAGAAAGCCCTGAATCCTTTTCCTCCTTTTTCCTGCAGATTCACTATAGGACACTTTTTGAAGCAAGAGCATGCATTTTCCCCCTGGCGCTCTGCAGCGGTTCTCAGAGCCCAGTGTCACTCACATAGGTGGGACTGCTCTCAGTTCAGAGAGCGCTGGGACACTTAAGATGAAAAGTCCCTGGAAGTTAGCAAACAGCCATCTGTCACTCTGGCATCGATTTACTAAAAGTGACTTCTAGGGTATTCTAAACCACTTTTAAAAAACAAATGAGTCACTTCGACTTCCTCACCCCGCAAGAGATAGGAAGGCAGCAGTGGAGTGCTCGCTCAGGAGCTGTATTTGTTTAGCGATTAGCCTAGAGCTTTGATTTTAGGGCAAAAGCGAGCCAGACAGTGCGGCAGACGTAAGGATCAAAAAGGCCACCTATCATTCGCCGGGGACGCCTGCCTCCTTACCCTGATAACGTAACTATTTCTCTGCATAGGATTTTAGTTTTTGTGTTTTTGTTTTGTTTTATTCTGTTTAATCACTTCAAGTATCTCATCCATTATTTGAAGCGGGCTCGGAGGAAACGTGCCGCATCCTCCAGTCCTTGTGCGTCTGTTTAGGTCTCTCCGAAGCAGGTCCCTCTCGACTCTTAGATCTGGGTCTCCAGCACGCATGAAGGGGTAAGGGTGGGGGGGTCCCCTATTCCGGCGCGCGGCGTTGAGCACTGAATCTTCCAGGCGGAGGCTCAGTGGGAGCGCCGAGAACTCGCCAGTACCGCGCGCTGCCTGCTGCCTGCTGCCTCCCAGCCCAGGACTTGGGAAAGGAGGGAGGGGACAAGTGGAGGGAAAGTGGGGCCGGGCGGGGGGTGCCTGGGAAGCCAGGCTGCGCTGACGTCACTGGGCGCGCAATTCGGGCTGGAGCGCTTTAAAAAACGAGCGTGCAAGCAGAGATGCTGCTCCACACCGCTCAGGCCGCGAGCAGCAGCAAGGCGCACCGCCACTGTCGCCGCTGCAGCCAGGGCTGCTCCGAAGGCCGGCGTGGCGGCAACCGGCACCTCTGTCCCCGCCGCGCTTCTCCTCGCCGCCCACGCCGTGGGGTCAGGAACGCGGCGTCTGGCGCTGCAGACGCCCGCTGAGTTGCAGAAGCCCACGGAGCGGCGCCCGGCGCGCCACGGCCCGTAGCAGTCCGGTGCTGCTCTCCGCCCGCGTCCGGCTCGTGGCCCCCTACTTCGGGCACCGACCGGT
在某些实施方案中,启动子是SEQ ID NO:56中所列的内源性人SYN1增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:56表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:56内的内源性人SYN1增强子-启动子序列。
示例性人SYN1增强子-启动子(SEQ ID NO:56)
TGCGTATGAGTGCAAGTGGGTTTTAGGACCAGGATGAGGCGGGGTGGGGGTGCCTACCTGACGACCGACCCCGACCCACTGGACAAGCACCCAACCCCCATTCCCCAAATTGCGCATCCCCTATCAGAGAGGGGGAGGGGAAACAGGATGCGGCGAGGCGCGTGCGCACTGCCAGCTTCAGCACCGCGGACAGTGCCTTCGCCCCCGCCTGGCGGCGCGCGCCACCGCCGCCTCAGCACTGAAGGCGCGCTGACGTCACTCGCCGGTCCCCCGCAAACTCCCCTTCCCGGCCACCTTGGTCGCGTCCGCGCCGCCGCCGGCCCAGCCGGACCGCACCACGCGAGGCGCGAGATAGGGGGGCACGGGCGCGACCATCTGCGCTGCGGCGCCGGCGACTCAGCGCTGCCTCAGTCTGCGGTGGGCAGCGGAGGAGTCGTGTCGTGCCTGAGAGCGCAGTCGAGAA
在某些实施方案中,启动子是SEQ ID NO:57或SEQ ID NO:62中所列的内源性人GFAP增强子-启动子。在一些实施方案中,增强子-启动子序列与由SEQ ID NO:57或SEQ IDNO:62表示的增强子-启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,启动子是包含在SEQ ID NO:57或SEQ IDNO:62内的内源性人GFAP增强子-启动子序列。
示例性人GFAP增强子-启动子(SEQ ID NO:57)
CCCACCTCCCTCTCTGTGCTGGGACTCACAGAGGGAGACCTCAGGAGGCAGTCTGTCCATCACATGTCCAAATGCAGAGCATACCCTGGGCTGGGCGCAGTGGCGCACAACTGTAATTCCAGCACTTTGGGAGGCTGATGTGGAAGGATCACTTGAGCCCAGAAGTTCTAGACCAGCCTGGGCAACATGGCAAGACCCTATCTCTACAAAAAAAGTTAAAAAATCAGCCACGTGTGGTGACACACACCTGTAGTCCCAGCTATTCAGGAGGCTGAGGTGAGGGGATCACTTAAGGCTGGGAGGTTGAGGCTGCAGTGAGTCGTGGTTGCGCCACTGCACTCCAGCCTGGGCAACAGTGAGACCCTGTCTCAAAAGACAAAAAAAAAAAAAAAAAAAAAAAGAACATATCCTGGTGTGGAGTAGGGGACGCTGCTCTGACAGAGGCTCGGGGGCCTGAGCTGGCTCTGTGAGCTGGGGAGGAGGCAGACAGCCAGGCCTTGTCTGCAAGCAGACCTGGCAGCATTGGGCTGGCCGCCCCCCAGGGCCTCCTCTTCATGCCCAGTGAATGACTCACCTTGGCACAGACACAATGTTCGGGGTGGGCACAGTGCCTGCTTCCCGCCGCACCCCAGCCCCCCTCAAATGCCTTCCGAGAAGCCCATTGAGCAGGGGGCTTGCATTGCACCCCAGCCTGACAGCCTGGCATCTTGGGATAAAAGCAGCACAGCCCCCTAGGGGCTGCCCTTGCTGTGTGGCGCCACCGGCGGTGGAGAACAAGGCTCTATTCAGCCTGTGCCCAGGAAAGGGGATCAGGGGATGCCCAGGCATGGACAGTGGGTGGCAGGGGGGGAGAGGAGGGCTGTCTGCTTCCCAGAAGTCCAAGGACACAAATGGGTGAGGGGACTGGGCAGGGTTCTGACCCTGTGGGACCAGAGTGGAGGGCGTAGATGGACCTGAAGTCTCCAGGGACAACAGGGCCCAGGTCTCAGGCTCCTAGTTGGGCCCAGTGGCTCCAGCGTTTCCAAACCCATCCATCCCCAGAGGTTCTTCCCATCTCTCCAGGCTGATGTGTGGGAACTCGAGGAAATAAATCTCCAGTGGGAGACGGAGGGGTGGCCAGGGAAACGGGGCGCTGCAGGAATAAAGACGAGCCAGCACAGCCAGCTCATGTGTAACGGCTTTGTGGAGCTGTCAAGGCCTGGTCTCTGGGAGAGAGGCACAGGGAGGCCAGACAAGGAAGGGGTGACCTGGAGGGACAGATCCAGGGGCTAAAGTCCTGATAAGGCAAGAGAGTGCCGGCCCCCTCTTGCCCTATCAGGACCTCCACTGCCACATAGAGGCCATGATTGACCCTTAGACAAAGGGCTGGTGTCCAATCCCAGCCCCCAGCCCCAGAACTCCAGGGAATGAATGGGCAGAGAGCAGGAATGTGGGACATCTGTGTTCAAGGGAAGGACTCCAGGAGTCTGCTGGGAATGAGGCCTAGTAGGAAATGAGGTGGCCCTTGAGGGTACAGAACAGGTTCATTCTTCGCCAAATTCCCAGCACCTTGCAGGCACTTACAGCTGAGTGAGATAATGCCTGGGTTATGAAATCAAAAAGTTGGAAAGCAGGTCAGAGGTCATCTGGTACAGCCCTTCCTTCCCTTTTTTTTTTTTTTTTTTGTGAGACAAGGTCTCTCTCTGTTGCCCAGGCTGGAGTGGCGCAAACACAGCTCACTGCAGCCTCAACCTACTGGGCTCAAGCAATCCTCCAGCCTCAGCCTCCCAAAGTGCTGGGATTACAAGCATGAGCCACCCCACTCAGCCCTTTCCTTCCTTTTTAATTGATGCATAATAATTGTAAGTATTCATCATGGTCCAACCAACCCTTTCTTGACCCACCTTCCTAGAGAGAGGGTCCTCTTGCTTCAGCGGTCAGGGCCCCAGACCCATGGTCTGGCTCCAGGTACCACCTGCCTCATGCAGGAGTTGGCGTGCCCAGGAAGCTCTGCCTCTGGGCACAGTGACCTCAGTGGGGTGAGGGGAGCTCTCCCCATAGCTGGGCTGCGGCCCAACCCCACCCCCTCAGGCTATGCCAGGGGGTGTTGCCAGGGGCACCCGGGCATCGCCAGTCTAGCCCACTCCTTCATAAAGCCCTCGCATCCCAGGAGCGAGCAGAGCCAGAGCAGGTTGGAGAGGAGACGCATCACCTCCGCTGCTCGC
示例性人GFAP增强子-启动子(SEQ ID NO:62)
GAACATATCCTGGTGTGGAGTAGGGGACGCTGCTCTGACAGAGGCTCGGGGGCCTGAGCTGGCTCTGTGAGCTGGGGAGGAGGCAGACAGCCAGGCCTTGTCTGCAAGCAGACCTGGCAGCATTGGGCTGGCCGCCCCCCAGGGCCTCCTCTTCATGCCCAGTGAATGACTCACCTTGGCACAGACACAATGTTCGGGGTGGGCACAGTGCCTGCTTCCCGCCGCACCCCAGCCCCCCTCAAATGCCTTCCGAGAAGCCCATTGAGCAGGGGGCTTGCATTGCACCCCAGCCTGACAGCCTGGCATCTTGGGATAAAAGCAGCACAGCCCCCTAGGGGCTGCCCTTGCTGTGTGGCGCCACCGGCGGTGGAGAACAAGGCTCTATTCAGCCTGTGCCCAGGAAAGGGGATCAGGGGATGCCCAGGCATGGACAGTGGGTGGCAGGGGGGGAGAGGAGGGCTGTCTGCTTCCCAGAAGTCCAAGGACACAAATGGGTGAGGGGAGCTCTCCCCATAGCTGGGCTGCGGCCCAACCCCACCCCCTCAGGCTATGCCAGGGGGTGTTGCCAGGGGCACCCGGGCATCGCCAGTCTAGCCCACTCCTTCATAAAGCCCTCGCATCCCAGGAGCGAGCAGAGCCAGAGCAGGTTGGAGAGGAGACGCATCACCTCCGCTGCTCGC
在某些方面,启动子是SEQ ID NO:90中所列的内源性人GDF6启动子。在一些方面,启动子序列与由SEQ ID NO:90表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子是包含在SEQ IDNO:90内的内源性人GDF6启动子序列。
示例性人GDF6启动子(SEQ ID NO:90)
CCACAGGTAACTCCGTCGGCGTCCACAGGGGGGCAGGAGATACCATACTGCACAGTTGTACGTCTTCCATCTGTTTGGTGTAGAAAAATCTAACCACTACAAGAATGCCACGGGCACTGTGGCAGACAGAAGCAGCGCTACGCCGCATCGCCTTTCAGCGTGCAGGCCCAGGAATGAGCGAGGCAGTGGGCGGGGAAGACAGGCACGGGGAATCTGGGGACAGATAAAGGAAACTCGTGATGGGGCGAGGCTGGGCTGAAGAGAAACAGATTGGGGTAGAGCTGCAAAGGGAGGGGTCCACTGGAAGGCGAGGGGGGAGGCCGGGAAGAGAGAGGGTGGGAAGGCAGTGTGAGATGGGAGGGCAGTGTGAGAAGAAAAGCAGGCTGGGGAAGAGGGATTGGAATGCAGAAGGAACTTGGGGAAGGAGGAAGTCCTGCAGGCGGGAGGGAAAGAAGAGAGGGGGAGCAGCTAAAGTCTGCGTCAGAAGAGGTTGGGGACTGCGAGAGGAGAGGCTGGGGCCTGCAGGGGAGCGCAGCAGCTTTTAGCATCGATCCAAACTCTAAAGACTCGTGGCCTTTGCCTGACCTCGAGGGTCGGGAATAGACGCCTGTCTTTGTGGAGAGCGATACCCAACCGAGAAAATGGGGCTGTTCCGAGCTGGGCCCTGCGCCTGGCCCAGGGCGAGGCTTCTCTGGCTCCGGGCTGGCCCCTGAGGGGCAGCACGCAGCCTGCAGCAGAGGCGCCTGCTCCAAGCTGTCTCTTGGGGGCGCCGCCGCCGCTTCCCTCCTCCGGGGCCGCTCGCTCCCAGGAAAGTGGAGGCGGCTGGCGAGGACCGAGAGCCGGGGCCGCGCTGCGGAGGGACCACACCTCCGGGAGTTCGAGGGGGACCCTGGCGCGGCGGGCCAGCCTTTCGGGCCGGCAGCGCCCGCCTTCCCCCGGTCAGCGCTTGCGGCCCGCGCCGCGCGCACCGCCCGGCAACCCCGCGCGCGTCCCGCGGGGGCGCTGCGTCTTCCTGCCACACCGGCGCACCGCGGCCCCTCTCCCCCACACCTCCGGCCCGCACCACCCGGCTCTCCTCCCACCCTCCCCACCCCTCCTCTGCCCTCCCTCCCCATTCCTCCCCTCCCGGCGAGGGGCGGGAGGGGGCGTGGCGGGGCCGGGGTTTGTGTGGCTGGGACCCGGCTCCTC
在某些方面,启动子是SEQ ID NO:95中所列的内源性人IGFBP2启动子。在一些方面,启动子序列与由SEQ ID NO:95表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%相同。在一些方面,启动子是包含在SEQ IDNO:95内的内源性人IGFBP2增强子-启动子序列。
示例性人IGFBP2启动子(SEQ ID NO:95)
AAGAAACTTGCCCGAGTTTACACAGCTAGTAAATGGTTGCATTAGTCAGGACAGCTAGCCTATATTACAATAACAACCCTCTCAAATCCTAATGGCTTAAAACAACAGAGGTTTAATTTATACTCATTAGCTGTTCAAGGCAGGAGGCTCTATTCTCTAATCCATACAGTCACTCAGGATCCAGGCTGGTGGAGACCCTGCCATATTGTAGCCTCACCATTTAAAACATGAAGAAGATAGAAAGTGAGGAGTCATGTAGGTTTTGTTCCGTTGCCTCAGGCTAGGAGTGACAGGTCACTTCATCTCACTCACAGCTCACTGCCCACAACTAGTCACTTGTGACTGTGCGAGTTAAGCTTCTGTGTGTGAAGGAAGGAAAAGAGAATGGGATAAAGGTGAACATCAGCAGGCTCTACCACAGTAGTTTGAACCAAGACTTGAGCCTAGGTCATGTGGCTTCAGAATCTTTGCTCTTAATCACACTAAACAGCCTCTGTAAGTCATCTTTCCTTCATCCAGTGCCTAAGAACATGCAGTCCAATGCCCTCATCCTTCAGAAGAACTTGAGTGAACTCAGAGAAATTGAGTAGAGTGCCACAGCATGCCCAAGGCCACACACCCTGAGGTTGGCAGTAGGTCCTGAGTTAGAGTTGTCATTTCTTGGCTCCCCTGGTAGTAGTGGAAAGGTAAGGTTTTGACATACTAGTTGGATGACCACGGGCAGGTCACTTAAATTGTCTAAGCATCGTTTGACCCTTGTAAGAATTAAATGAAATAGCACCTGTAAAAGTGTCTGCACGGACTTACTGCTGTTAGTTTTGTTCCTTTCTTCCTGTTGTCACTGCACTTCCCTGCCTGTTACCCAGGCCATGCAGACCAGCCAGGCCTTCGACTTACAGTGCGGATAAGATTCCAAATCTCCACGGCTGGTTTCCATGCTTTCTTCCAGGCTTCTGAGGACCCTGTGCTCTGGTTTCTTCTATTTCTTTTCTATTACTTTTCTGTTACTCTTGAGCACACTTGCTGGAAGCAATATGCATCCAGTTCTCCCTCTCTTGCCTCATTACACTTTGCAGAACAACTCCAATCCCTTCCAACCAAGTAGTCCCTTTGAATTTCTTGTCACCCAAGGAATCTCTCTGACAGGGGTCTTTGTTAGGGTCACACCCCAGGAGATGGTTGATTATGGCTGAGTCCAGCCTGGAATGATGGGGGTTGGGGGCAGCTTGGGTAGATGACTCAGTAAATCAAACAGAACAATGAAAGGAGGTCATGCTTGTCCATCTGCATTATTGAAGACAGCCATAAATGGCCTTACCCCAGAGCGGGTCTGTCACACCTGGAGAGCTGATCTGACCTCTCCAAGACCCCTGCAACTGAGTGTTCTGGGATCTGTCCTGCAACAAGTGCCTCGAGATTTGTAGGTGGGGGCCCAGAGGGAGGGGGTCTGCAGACGAAGGGGGCAGGTTTTGCGGGGCACTTAGGGTTCTCATAGGTTGTAGTCACGAGCTCC
在某些方面,启动子是SEQ ID NO:98中所列的内源性人RBP7启动子。在一些方面,启动子序列与由SEQ ID NO:98表示的启动子序列至少85%,至少90%,至少95%,至少96%,至少97%,至少98%至少99%,或100%相同。在一些方面,启动子是包含在SEQ IDNO:98内的内源性人RBP7增强子-启动子序列。
示例性人RBP7启动子(SEQ ID NO:98)
CCCATGGCTCTGTTAAAATCAAAGAAACATCTTTTCCAACAGCCCTTTCAAACTCCTCATCGCATCTCACTGGCTGATTCAGTCATTTAAACCTGCTTCTCCCTAAAGCTGATCACTGGCTAAGCTAATAGGGTTTCCGGGATTGGTTTAGCCTGATACTAATCCAGGTCTACCTTCAGGAGCCAGACCAAACTGCCTATTGGCATTGCATTCTTGCAGTAGGGAGGGGAGGTATGGATGGTGTGGAGTCCACCACAAGGTCCATGCCAGTCTTTGCTGAACCAGCATCAGACTCCATCAAGCAACAGATGAGAGGTTCCATGATAAAGTGGCCCTCAGCAATCCCCATCCATTGCTGTCTAGGAAGAACAGTGCTTGTACACAGGTTTAGGACCTCAGTCTTGGCTGTAATCTTCTGGTTTACTTTGCCAGCACCAAACAGAAGGAAAGAAAGGGCTCAAATTTGACCAAATAAATTATGCTTCTCCTTCCAGAGATAACCTTGAGTCCTGTCTAGGAAGATATTAGAATTGTAAAGAAAAAAAAAATTACTCCTTATCCTATGGCAAGTGGAGTCTATGTCTACTTCAGCTGAAATTAAATCCTGTCCATAATAGATGACCCTTGCTCAAGCTGGCCAGAAGCCATACCAACCAGCACGAAGGTTAAAACTATTATTAGTTTTTTCTGTGATTTTCATTTTCAGGCCAAGTTTTAGAACAATAAGATTTTAAGAATAGGAAGTAAGTAAGATTTCTGCATATCCTGTTCTCTTAGTCAGCTGAATTTTTTTTTTTTTTTTTTTAGTCCTAACTCAGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCGCACCAAGCCTGGAATCTATGTCTTACAGTTATGAGAATCAACAGCTAGCTCATTATGGGCAAGGTGATGTCACTCTGGCTTCTCAATGAAAATGGCATTTCTCCCTTGGAAAAGGTCATAGCCAGTCAGTCAGTCAGTCACGGGAGCGCAGCGGCTTCTAGGGGTGAGTGGGACCCACGCGGCCCCACCTGCTCCTCCCGCGCGCGGCCCCACCCCCCTGCCCCGCCCCGCCTGGTTTATAG
在某些方面,启动子是SEQ ID NO:101中所列的内源性人GJB6启动子。在一些方面,启动子序列与由SEQ ID NO:101表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些方面,启动子是包含在SEQ IDNO:101内的内源性人GJB6启动子序列。
示例性人GJB6启动子(SEQ ID NO:101)
AAATAGCTTCCAACGTTTCCACCCCACCAGCCCTTGCACCACTCCCTGTACTGGCCCTGAGCTTTCTAGTCTTGACTGAAAAGCGGGGAGGCAATGTGGTCTCTCCTGGTGCACTGTCCCGAGGAAGGCCTGCTCCGCTTCCCCGGAGGAGTCTTCAAAGGATGGAGGTAATTAATAAAAACAACCCCTGTACCTCCTCTAAGTGGTCATTAATTAATAAAGAACCTCCAGGCTCCTATAGGAGAGGTCTGTGCACCCCGCGGGCTATGAGAAGGCTGGATCACCCAGAAAGACTGAGGATGTGTCCTGGCAAAAACACAGCCTGCCCCTCACACTGCTCCCCACGGGTGCACTAGGGAGGAAGAGTTCCCTCGAGGGCCTGAGCAGGCGCCCCACACCTGCACCCGTGCAGAGGGGGCTGGGCCCGCCCTCTGCGCTCCCGAGGGAGAGCCCTACCCCCTGCATCCCCGGTACCCCGTTCCCTCCAAGGGCCGGAAAGAGGGCCCCGCGCACTGTGCACTTCTTAGGGGTCCCCCACCCTGCGCCCCCGCCACGGGAAAAAGGTCCCCGCTCTGCGCATCCGGCCCCGGAGGGACAGCCCCGGTCCTGCACTCCTTGCTCCTCAGGGGGACGGTCCGCGCCCAGCGGCTAGTGCGCCCCGGGTAGGTGGGGGCGGGGGGCTCGTCGAGTGACAGCGCTCGCCTCCCGCAGCCCGCCCGAGCCGCGTCAGGGCAG
在某些方面,启动子是SEQ ID NO:104中所列的内源性人PARM1启动子。在一些方面,启动子序列与由SEQ ID NO:104表示的启动子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%相同。在一些方面,启动子是包含在SEQ IDNO:104内的内源性人PARM1启动子序列。
示例性人PARM1启动子(SEQ ID NO:104)
TGTACAGGAGATAGTCAGGGAATTAGTAATTTTCAAAGAGGTGACTTTGAATTCAAACTTAAATATCATCTTCAGCTGAAACAAAGAAGGGGTGCAGTTATGAGGAAGTGACCAGGTAAAGCATGGCAAACAAAGGTAAAGTTTGTTATGCGTATTTAAGTCAGAGCCCTCTCCATTGATAAGAGTTTCCAGTAATTTAGTGCCATCCTTTTCTTGCTATAGAGTTCTCGTCTCTATCTGAGCACGCAAAAATAACATGCTTTCTTGCTTTCTTGAAGTTGGGCATGGCCATTGACTTGCCTTAGCCCATATTTTTCTGTGAAGTGGTCTTCAAAAACCTATATTTCTGCCATAGAGTCACTTACTTAACCTGCCCTATTTAAAGGGGCTAATGCCTGATAGAATGTCGCTGCATAACTCCATCTGTGTGTGGTCCCTGCATCCATGACAACCAAAACCCAGATGCAGAAATTGTTCCTAATCACATAGATTACCCTAGAAACCGGAAGGGCCTTGAAGTCAAAAGCATTCAGAGAACATGCTGAACAAATTGAATTTGCAGTTTATCTGGCCAGGGAGGATGGAGAGGGGATGGGCACTTGGTCTGAGTATTTTTTGTTTCTCATTCCAACAGAAATTACTAGATTTACCAAAAAATCTACAAGTGGTAGTGTGATAGAGTCAGGCAGAGGAATTGACCATAGATAAGGTGCTCAGGACTCCTAGAGTCAGCTTCTGGTATGTGAGAAAGAAGTGAGAACAGAGCCCATGGCATATGAAGAAGATATTACAGAAAAAAGAAAGCTGCCTTCCACGCAAATCATTTCTTTACAAAGGCTTGTTAACTCCTGCAGTGCCAAGAAGCTGAATGCAGCGGCAGACATCCTGGTTCGGGCCCCAGGAAGCTCAGCCGGGTTTAATGTGGATGAGGGTTTAATGATGTACACGCAGAAGTGTTTTGACAAATGAAGAAGGTCCTCATTCTTGGAACATGTGCCGGTTCTCCGAGGGAACTCCTAAAAGGCTGTAAGCTCATGTAGGAAAAGCTGAGCTAGATTCCTAAGGGCAGAGATGTGCTCACATTTCTTTGCATCCCTAGTTCCCAGCACAGTGCAAGGCGCTGCAAACATTTGCTGAACCCAGGGTCTCGTGTCTTGACTGTCCAGCAGAGGCCGCTCTGGGCCGGGGCTCTCGGGACCTGAGGGCTGAGAGAAGGAAGGCCAGGGGGTGGCCCAGTCATCGCCGCGGGGCCCGGGTGGGAGGGGTTTGGCAGCGGCAGGCGCGGCGGCGGCGGCGGAGGCGGAGGCGGCCCCGGG
增强子
在一些情况下,构建体可以包括增强子序列。术语“增强子”是指可以提高编码感兴趣的蛋白质(例如,connexin 26蛋白)的核酸的转录水平的核苷酸序列。增强子序列(长度一般为50-1500bp)通常通过为转录相关蛋白(例如,转录因子)提供额外的结合位点来提高转录水平。在一些实施方案中,增强子序列在内含子序列内发现。与启动子序列不同,增强子序列可以在距转录起始位点远得多(例如,与启动子相比)的距离处发挥作用。增强子的非限制性实例包括RSV增强子、CMV增强子和/或SV40增强子。在一些实施方案中,构建体包含由SEQ ID NO:18例举的CMV增强子。在一些实施方案中,构建体包含由SEQ ID NO:63例举的CMV增强子。在一些实施方案中,构建体包含由SEQ ID NO:64例举的嵌合内含子增强子。在一些实施方案中,构建体包含由SEQ ID NO:65例举的GJB2增强子。在一些实施方案中,增强子序列与由SEQ ID NO:18表示的增强子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,增强子序列与由SEQID NO:63表示的增强子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,增强子序列与由SEQ ID NO:64表示的增强子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,增强子序列与由SEQ ID NO:65表示的增强子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。在一些实施方案中,SV-40衍生增强子是由SEQ ID NO:19例举的SV-40T内含子序列。在一些实施方案中,增强子序列与由SEQ ID NO:19表示的增强子序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
示例性CMV增强子(SEQ ID NO:18)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGG
示例性CMV增强子(SEQ ID NO:63)
GACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGT
示例性SV-40合成内含子(SEQ ID NO:19)
GGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG
示例性嵌合内含子(SEQ ID NO:64)
GGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG
示例性GJB2增强子(SEQ ID NO:65)
CTTCTTCTGGAGTCTTTTCTGGAATAATTCTGGGAGTGGGCTCAGCCTGCGGGAGAGTAACATTTTTATAACTTGATAGATGTAGCTGAGATGCCTCCCAGAGGGGAGACCCGCCTCTCCTCCGGCAGCTGTGCACGTAGGCTTGTTCCCAGCAGCCTGGCCAGGGTGGTCCACCTGGTGTTTCTCATCTTCTTTCCCCGGAGCGCTGACTCCTGCGCGTCCTCTTGGAAGACTCTTGACAGGACGGGTGTTTTATGGGTGTGATTCAGTGTCCTCTTGCATCAGTTCAATGTGGTGGTGTTCAATCAACCCTTGTAGCGTTAGCAAAATTTGCTCAAGTCATTCCGCAGGAATGTCTGTGTCTTGCTTCCAAGAAAGCTTGTAAGTGCCGGCAACAGGCCAAGCAGCTCACAAACCTGACCACAAGCCTGTGAGTAATTGTGGGGCAGCACTTAGCAGTCTTTTATTTTCGACTTATTAAAGTCTCATCTTGGCCTCACCTTCTCCCTGGAAGGTGGCGTGGGTGGGAACCACTGGGTCAGATCTTTTTCACCCTTGCCGTGGAGCCAGTTTCCTGTTGCATGTGGGGGAAGCAACATGTGGTGAAGAGTATAGAAAACGAAAACATGTGGGTACAGTATGTATAAGTGGAGGGAACAAACTCATAATTCCAACTAGTTTCTCATGAGAGACTCATGAATCATTGTGGTAGTTCTCAATATAAACTTAATCTAGGCCGGATGTGGTGGCTCACACCTGTAATCTCAGCACTCTGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGTCTGACCAACATGGAGAAACCCCATCGCTACTAAAAATACAAAATTATCCAGATGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGAGAAACTGTGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGACGCATGCCTGTAATCCCAGCTATTTGGAGGCCGAAGCAGG
侧翼非翻译区、5’UTR和3’UTR
在一些实施方案中,本文所述的构建体中的任一者可以包括非翻译区(UTR),诸如5’UTR或3’UTR。基因的UTR转录但不翻译。5’UTR始于转录起始位点并且延续至起始密码子,但不包括起始密码子。3’UTR紧接在终止密码子之后起始并且延续直至转录终止信号。UTR的调控和/或控制特征可以并入如本文所描述的构建体、组合物、试剂盒或方法中的任一者中以增强或以其它方式调节connexin 26蛋白的表达。
天然5’UTR包括在翻译起始中起作用的序列。在一些实施方案中,5’UTR可以包含通常已知涉及于核糖体起始许多基因的翻译的过程中的序列,如Kozak序列。Kozak序列具有共有序列CCR(A/G)CCAUGG,其中R是起始密码子(AUG)上游的嘌呤(A或G)三碱基,并且起始密码子之后是另一个“G”。还已知5’UTR形成参与延伸因子结合的二级结构。
在一些实施方案中,5’UTR包括于本文所述的构建体中的任一者中。5’UTR的非限制性实例,包括来自以下基因的5’UTR:白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、甲胎蛋白、红细胞生成素和因子VIII,可以用于增强核酸分子,诸如mRNA的表达。
在一些实施方案中,来自由耳蜗中的细胞转录的mRNA的5’UTR可以包括在本文所述的构建体、组合物、试剂盒和方法中的任一者中。在一些实施方案中,5’UTR衍生自内源性GJB2基因座,并且可以包括由SEQ ID NO:20、SEQ ID NO:21或SEQ ID NO:66例举的内源性序列的全部或部分。在一些实施方案中,5’UTR序列与由SEQ ID NO:20、SEQ ID NO:21或SEQID NO:66表示的5’UTR序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
3’UTR在紧邻感兴趣的基因的终止密码子的3’发现。在一些实施方案中,来自由耳蜗中的细胞转录的mRNA的3’UTR可以包括在本文所述的构建体、组合物、试剂盒和方法中的任一者中。在一些实施方案中,3’UTR衍生自内源性GJB2基因座,并且可以包括由SEQ IDNO:22例举的内源性序列的全部或部分。在一些实施方案中,3’UTR序列与由SEQ ID NO:22表示的3’UTR序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%,或100%相同。在一些实施方案中,3’UTR衍生自内源性GJB2基因座,并且可以包括由SEQ ID NO:67或SEQ ID NO:68例举的内源性序列的全部或部分。在一些实施方案中,3’UTR序列与由SEQ ID NO:67,或SEQ ID NO:68表示的3’UTR序列至少85%,至少90%,至少95%,至少96%,至少97%,至少98%、至少99%或100%相同。
在一些实施方案中,UTR可以包含非内源性调控区。在一些实施方案中,包含非内源性调控区的UTR是3’UTR。在一些实施方案中,包含非内源性调控区的UTR是5’UTR。在一些实施方案中,非内源性调控区可以是至少一种抑制性核酸的靶标。在一些实施方案中,抑制性核酸抑制靶基因的表达和/或活性。在一些实施方案中,抑制性核酸是短干扰RNA(siRNA)、短发夹RNA(shRNA)、microRNA(miRNA)、反义寡核苷酸、向导RNA(gRNA)或核酸酶。在一些实施方案中,抑制性核酸是内源性分子。在一些实施方案中,抑制性核酸是非内源性分子。在一些实施方案中,抑制性核酸展示组织特异性表达模式。在一些实施方案中,抑制性核酸展示细胞特异性表达模式。在一些实施方案中,抑制性核酸在内耳毛细胞(例如,IHC和/或OHC)中表达。在一些方面,抑制性核酸在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中表达。在一些方面,抑制性核酸减少、压制、抑制或消除Connexin 26的表达。在一些方面,抑制性核酸减少、压制、抑制或消除Connexin 26在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中的表达。
在一些方面,抑制性核酸减少、压制、抑制或消除与Connexin 26的表达相关联的毒性。在一些方面,抑制性核酸减少、压制、抑制或消除与Connexin 26在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中的表达相关联的毒性。
在一些实施方案中,构建体可以包含超过一个的非内源性调控区,例如两个、三个、四个、五个、六个、七个、八个、九个或十个调控区。在一些实施方案中,构建体可以包含四个非内源性调控区。在一些实施方案中,构建体可以包含超过一个的非内源性调控区,其中该超过一个的非内源性调控区中的至少一个与其他非内源性调控区中的至少一个不相同。
在一些方面,本公开涉及包含microRNA调控靶位点(miRTS)的构建体,该miRTS可以用于调节(例如,减少)细胞(例如,内耳细胞,例如,毛细胞)中connexin 26的表达。在一些方面,构建体提供了可能与connexin 26在一些细胞(例如内耳细胞,例如毛细胞)中的表达相关联的减少的毒性。
在一些实施方案中,包含在UTR中的非内源性调控区可以包含miRNA调控靶位点(miRTS)。在一些实施方案中,miRTS可以是人miRNA-182靶序列。在一些实施方案中,UTR可以包含miRNA-182靶序列的全部或部分。在一些实施方案中,UTR可以含有超过一个miRNA-182靶序列。在一些实施方案中,超过一个miRNA-182靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-182靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-182靶序列。在一些方面,超过一个miRNA-182靶序列可以分散在3’UTR的多个位置。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。
在一些实施方案中,miRTS可以是人miRNA-183靶序列。在一些实施方案中,UTR可以包含miRNA-183靶序列的全部或部分。在一些实施方案中,UTR可以含有超过一个miRNA-183靶序列。在一些实施方案中,超过一个miRNA-183靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-183靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-183靶序列。在一些方面,超过一个miRNA-183靶序列可以分散在3’UTR的多个位置。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些方面,miRTS可以是人miRNA-194的靶序列。在一些方面,UTR可以包含miRNA-194靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-194靶序列。在一些方面,超过一个miRNA-194靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-194靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-194靶序列。在一些方面,超过一个miRNA-194靶序列可以分散在3’UTR的多个位置。在一些方面,miRNA-194靶序列包含与SEQ ID NO:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-194靶序列包含SEQ ID NO:107的核酸序列。
在一些方面,miRTS可以是人miRNA-140靶序列。在一些方面,UTR可以包含miRNA-140靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-140靶序列。在一些方面,超过一个miRNA-140靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-140靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-140靶序列。在一些方面,超过一个miRNA-140靶序列可以分散在UTR中的多个位置。在一些方面,3’UTR可以包含miRNA-140靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-140靶序列。在一些方面,超过一个miRNA-140靶标序列可以分散在3’UTR的多个位置。在一些方面,miRNA-140靶序列包含与SEQ ID NO:108具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-140靶标序列包含SEQ ID NO:108的核酸序列。
在一些方面,miRTS可以是人miRNA-18a的靶序列。在一些方面,UTR可以包含miRNA-18a靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-18a靶序列。在一些方面,超过一个miRNA-18a靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-18a靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-18a靶序列。在一些方面,超过一个miRNA-18a靶序列可以分散在3’UTR的多个位置。在一些方面,miRNA-18a靶序列包含与SEQ ID NO:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-18a靶序列包含SEQ ID NO:109的核酸序列。
在一些方面,miRTS可以是人miRNA-99a靶序列。在一些方面,UTR可以包含miRNA-99a靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-99a靶序列。在一些方面,超过一个miRNA-99a靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-99a靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-99a靶序列。在一些方面,超过一个miRNA-99a靶序列可以分散在3'UTR的多个位置。在一些方面,miRNA-99a靶序列包含与SEQ ID NO:110具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-99a靶序列包含SEQ IDNO:110的核酸序列。
在一些方面,miRTS可以是人miRNA-30b靶序列。在一些方面,UTR可以包含miRNA-30b靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-30b靶序列。在一些方面,超过一个miRNA-30b靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-30b靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-30b靶序列。在一些方面,超过一个miRNA-30b靶序列可以分散在3'UTR的多个位置。在一些方面,miRNA-30b靶序列包含与SEQ ID NO:111具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-30b靶序列包含SEQ IDNO:111的核酸序列。
在一些方面,miRTS可以是人miRNA-15a靶序列。在一些方面,UTR可以包含miRNA-15a靶序列的全部或部分。在一些方面,UTR可以含有超过一个miRNA-15a靶序列。在一些方面,超过一个miRNA-15a靶序列可以分散在UTR的多个位置。在一些方面,3’UTR可以包含miRNA-15a靶序列的全部或部分。在一些方面,3’UTR可以含有超过一个miRNA-15a靶序列。在一些方面,超过一个miRNA-15a靶序列可以分散在3’UTR的多个位置。在一些方面,miRNA-15a靶序列包含与SEQ ID NO:112具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-15a靶序列包含SEQ IDNO:112的核酸序列。
在一些方面,miRTS可以是在内耳的特定细胞中表达的miRNA的靶序列。在一些方面,miRTS可以是在耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中表达的miRNA的靶序列。
在一些方面,miRTS可以是在耳毛细胞中表达的miRNA的靶序列。在一些方面,在耳毛细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在耳毛细胞中表达的miRNA是miR-194、miR-140、miR-18a、miR-99a、miR-30b、miR-15a、miR182或miR-183。在一些方面,在耳毛细胞中表达的miRNA是miR-194。在一些方面,miRNA-194靶序列包含与SEQ ID NO:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-194靶序列包含SEQ ID NO:107的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-140。在一些方面,miRNA-140靶序列包含与SEQ ID NO:108具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-140的靶序列包含SEQID NO:108的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-18a。在一些方面,miRNA-18a靶序列包含与SEQ ID NO:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-18a靶序列包含SEQ ID NO:109的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-99a。在一些方面,miRNA-99a靶序列包含与SEQ ID NO:110具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-99a靶序列包含SEQ ID NO:110的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-30b。在一些方面,miRNA-30b靶序列包含与SEQ ID NO:111具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-30b靶序列包含SEQ ID NO:111的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-15a。在一些方面,miRNA-15a靶序列包含与SEQ ID NO:112具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-15a靶序列包含SEQ ID NO:112的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-182。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-183。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些方面,miRTS可以是在螺旋神经节细胞中表达的miRNA的靶序列。在一些方面,在螺旋神经节细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在螺旋神经节细胞中表达的miRNA是miR-194、miR-18a、miR-99a、miR-30b、miR-15a、miR182或miR-183。在一些方面,在耳毛细胞中表达的miRNA是miR-194。在一些方面,miRNA-194靶序列包含与SEQ ID NO:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-194靶序列包含SEQ ID NO:107的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-18a。在一些方面,miRNA-18a靶序列包含与SEQ ID NO:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-18a靶序列包含SEQ ID NO:109的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-99a。在一些方面,miRNA-99a靶序列包含与SEQ ID NO:110具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-99a靶序列包含SEQ ID NO:110的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-30b。在一些方面,miRNA-30b靶序列包含与SEQ ID NO:111具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-30b靶序列包含SEQ ID NO:111的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-15a。在一些方面,miRNA-15a靶序列包含与SEQ ID NO:112具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-15a靶序列包含SEQ ID NO:112的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-182。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-183。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些方面,miRTS可以是在基底膜细胞中表达的miRNA的靶序列。在一些方面,在基底膜细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在基底膜细胞中表达的miRNA是miR-99a、miR-30b和miR-15a。在一些方面,在耳毛细胞中表达的miRNA是miR-99a。在一些方面,miRNA-99a靶序列包含与SEQ ID NO:110具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-99a靶序列包含SEQ ID NO:110的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-30b。在一些方面,miRNA-30b靶序列包含与SEQ ID NO:111具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-30b靶序列包含SEQ ID NO:111的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-15a。在一些方面,miRNA-15a靶序列包含与SEQ ID NO:112具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-15a靶序列包含SEQ ID NO:112的核酸序列。
在一些方面,miRTS可以是在外侧支持细胞中表达的miRNA的靶序列。在一些方面,在外侧支持细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在外侧支持细胞中表达的miRNA是miR-99a、miR-30b和miR-15a。在一些方面,在耳毛细胞中表达的miRNA是miR-99a。在一些方面,miRNA-99a靶序列包含与SEQ ID NO:110具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-99a靶序列包含SEQ ID NO:110的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-30b。在一些方面,miRNA-30b靶序列包含与SEQ ID NO:111具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-30b靶序列包含SEQ ID NO:111的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-15a。在一些方面,miRNA-15a靶序列包含与SEQ IDNO:112具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-15a靶序列包含SEQ ID NO:112的核酸序列。
在一些方面,miRTS可以是在内侧支持细胞中表达的miRNA的靶序列。在一些方面,在内侧支持细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在内侧支持细胞中表达的miRNA是miR182和miR-183。在一些方面,在耳毛细胞中表达的miRNA是miR-182。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-183。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些方面,miRTS可以是在螺旋缘细胞中表达的miRNA的靶序列。在一些方面,在螺旋缘细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在螺旋缘细胞中表达的miRNA是miR182和miR-183。在一些方面,在耳毛细胞中表达的miRNA是miR-182。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-183。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些方面,miRTS可以是在内沟细胞中表达的miRNA的靶序列。在一些方面,在内沟细胞中表达的miRNA减少、降低或抑制GJB2蛋白(Connexin 26)的表达。在一些方面,在内沟细胞中表达的miRNA是miR182和miR-183。在一些方面,在耳毛细胞中表达的miRNA是miR-182。在一些方面,miRNA-182靶序列包含与SEQ ID NO:78具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-182靶序列包含SEQ ID NO:78的核酸序列。在一些方面,在耳毛细胞中表达的miRNA是miR-183。在一些方面,miRNA-183靶序列包含与SEQ ID NO:79具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,miRNA-183靶序列包含SEQ ID NO:79的核酸序列。
在一些实施方案中,包括在UTR中的非内源性调控区可以包含多个miRNA调控靶点(miRTS)。在一些实施方案中,UTR可以包含至少一个miRNA-182靶位点和至少一个miRNA-183靶位点。在一些实施方案中,包括在UTR中的非内源性调控区是去稳定化域并由SEQ IDNO:80例举。在一些实施方案中,UTR可以包含与由SEQ ID NO:80例举的非内源性调控区至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列。
已知3’UTR具有嵌入其中的腺苷和尿苷(以RNA形式)或胸苷(以DNA形式)的段。这些富含AU的签名在具有高周转率的基因中特别普遍。基于它们的序列特征和功能特性,富含AU的元件(ARE)可以分成三类(Chen et al.,Mol.Cell.Biol.15:5777-5788,1995;Chenet al.,Mol.Cell Biol.15:2010-2018,1995,其每一篇通过引用以其整体并入本文):I类ARE在富含U的区域内含有AUUUA基序的若干分散拷贝。例如,c-Myc和MyoD mRNAs含有I类ARE。II类ARE具有两个或多个重叠UUAUUUA(U/A)(U/A)九聚物。GM-CSF和TNF-αmRNA是含有II类ARE的实例。III类ARE定义不太明确。这些富含U的区域不含AUUUA基序,这一类的两个充分研究的实例是c-Jun和肌细胞生成素mRNA。
已知大多数与ARE结合的蛋白破坏信使的稳定性,而ELAV家族的成员,最显著的是HuR,已证明增加mRNA的稳定性。HuR与所有三类ARE结合。将HuR特异性结合位点工程化到核酸分子的3’UTR中将导致HuR结合并因此使在体内信息稳定。
在一些实施方案中,3’UTR ARE的引入、去除或修饰可以用于调控编码connexin26蛋白的mRNA的稳定性。在其他实施方案中,可以去除或突变ARE以增加细胞内稳定性并因此增加connexin 26蛋白的翻译和产生。
在其他实施方案中,可以将非ARE序列掺入5’或3’UTR中。在一些实施方案中,可以将内含子或内含子序列的一部分掺入本文提供的构建体、组合物、试剂盒和方法中的任一者中的多核苷酸的侧翼区中。内含子序列的掺入可以增加蛋白质产生以及mRNA水平。
示例性5’UTR序列(SEQ ID NO:20)
GTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGAGCAAACCGCCCAGAGTAGAAG
示例性5’UTR序列(SEQ ID NO:21)
TTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAG
示例性5’UTR序列(SEQ ID NO:66)
GTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAG
示例性3’UTR序列(SEQ ID NO:22)
CGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAA
示例性3’UTR序列(SEQ ID NO:67)
GAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAA
示例性3’ UTR序列(SEQ ID NO: 68)
CGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGAC
示例性3’UTR序列(SEQ ID NO:69)
GAGCTCAGTGTGAGTTCTACCATTGCCAAACTCGAGCAGTGAATTCTACCAGTGCCATAGGATCCAGTGTGAGTTCTACCATTGCCAAAGGTACCCAGTGAATTCTACCAGTGCCATAGTTAACCGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGAC
miRNA-182靶序列(SEQ ID NO:78)
AGTGTGAGTTCTACCATTGCCAAA
miRNA-183靶序列(SEQ ID NO:79)
AGTGAATTCTACCAGTGCCATAmiRNA-194靶序列(SEQ ID NO:107)
TCCACATGGAGTTGCTGTTACAmiRNA-140靶序列(SEQ ID NO:108)
CCGTGGTTCTACCCTGTGGTA
miRNA-18a靶序列(SEQ ID NO:109)
CTATCTGCACTAGATGCACCTTA
miRNA-99a靶序列(SEQ ID NO:110)
CACAAGATCGGATCTACGGGTT
miRNA-30b靶序列(SEQ ID NO:111)
CTGAGTGTAGGATGTTTACA
miRNA-15a靶序列(SEQ ID NO:112)
CACAAACCATTATGTGCTGCTA
内部核糖体进入位点(IRES)
在一些实施方案中,编码connexin 26蛋白的构建体可以包含内部核糖体进入位点(IRES)。IRES形成允许从紧邻IRES所在的下游的mRNA的任何位置发生翻译起始的复杂二级结构(参见,例如,Pelletier and Sonenberg,Mol.Cell.Biol.8(3):1103-1112,1988)。
有若干本领域技术人员已知的IRES序列,包括来自例如***病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)的那些。参见,例如,Alberts,MolecularBiology of the Cell,Garland Science,2002;and Hellen et al.,Genes Dev.15(13):1593-612,2001,其每一篇通过引用以其整体并入本文。
在一些实施方案中,掺入编码connexin 26蛋白或connexin 26蛋白的C端部分的构建体的IRES序列是***病毒(FMDV)2A序列。***病毒2A序列是已显示介导多蛋白质的裂解的小肽(长度为约18个氨基酸)(Ryan,MD et al.,EMBO 4:928-933,1994;Mattionet al.,J Virology 70:8124-8127,1996;Furler et al.,Gene Therapy 8:864-873,2001;和Halpin et al.,Plant Journal 4:453-459,1999,其每一篇通过引用以其整体并入本文)。2A序列的裂解活性先前已在包括质粒和基因疗法构建体(AAV和逆转录病毒)的人工***中得到证实(Ryan et al.,EMBO 4:928-933,1994;Mattion et al.,J Virology70:8124-8127,1996;Furler et al.,Gene Therapy 8:864-873,2001;and Halpin etal.,Plant Journal 4:453-459,1999;de Felipe et al.,Gene Therapy 6:198-208,1999;de Felipe et al.,Human Gene Therapy I I:1921-1931,2000;和Klump et al.,Gene Therapy 8:811-817,2001,其每一篇通过引用以其整体并入本文)。
IRES可以用于AAV构建体中。在一些实施方案中,编码connexin 26蛋白的C端部分的构建体可以包括多核苷酸内部核糖体进入位点(IRES)。在一些实施方案中,IRES可以是包含超过一个构建体的组合物的部分。在一些实施方案中,IRES用于从单个基因转录物产生超过一个多肽。
剪接位点
在一些实施方案中,本文提供的构建体中的任一者可以包括在转录期间发生的RNA加工过程中有功能的剪接供体和/或剪接接受体序列。在一些实施方案中,剪接位点参与反式剪接。
示例性剪接供体内含子(SEQ ID NO:SEQ ID NO:23)
GTAAGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAATAGAAACTGGGCTTGTCGAGACAGAGAAGACTCTTGCGTTTCT
示例性剪接接受体内含子(SEQ ID NO:SEQ ID NO:24)
GATAGGCACCTATTGGTCTTACTGACATCCACTTTGCCTTTCTCTCCACAG
多腺苷酸化序列
在一些实施方案中,本文提供的构建体可以包括多腺苷酸化(poly(A))信号序列。大多数新生真核生物mRNA在其3’末端具有在复杂过程中添加的poly(A)尾,该过程包括初级转录物的裂解和由poly(A)信号序列驱动的偶联多腺苷酸化反应(参见,例如,Proudfootet al.,Cell 108:501-512,2002,其通过引用以其整体并入本文)。poly(A)尾赋予mRNA稳定性和可转移性(Molecular Biology of the Cell,Third Edition by B.Alberts etal.,Garland Publishing,1994,其通过引用以其整体并入本文)。在一些实施方案中,poly(A)信号序列定位在编码序列的3’处。
如本文所用,“多腺苷酸化”是指将多腺苷酸部分或其修饰的变体与信使RNA分子共价连接。在真核生物体中,大多数信使RNA(mRNA)分子在3’末端进行多腺苷酸化。3’poly(A)尾是通过酶(多腺苷酸聚合酶)的作用添加到前mRNA上的腺嘌呤核苷酸的长序列(例如,50、60、70、100、200、500、1000、2000、3000、4000或5000)。在一些实施方案中,将poly(A)尾添加到含有特异性序列,例如,多腺苷酸化(或poly(A))信号的转录物上。poly(A)尾和相关蛋白有助于保护mRNA免受外切核酸酶降解。多腺苷酸化也在转录终止、mRNA从细胞核输出和翻译中起作用。多腺苷酸化通常在DNA转录成RNA后立即在细胞核中发生,但也可能随后在细胞质中发生。转录已经终止后,通过与RNA聚合酶相关的内切核酸酶复合物的作用使mRNA链裂解。裂解位点的特征通常在于裂解位点附近的碱基序列AAUAAA的存在。在mRNA已经裂解后,将腺苷残基添加到裂解位点的游离3’末端。
如本文所用,“poly(A)信号序列”或“多腺苷酸化信号序列”是触发mRNA的核酸内切酶裂解和一系列腺苷添加至裂解的mRNA的3’末端的序列。
有若干poly(A)信号序列可以使用,包括衍生自以下的那些:牛生长激素(bGH)的信号序列(Woychik et al.,Proc.Natl.Acad Sci.US.A.81(13):3944-3948,1984;美国专利号5,122,458,其每一篇通过引用以其整体并入本文)、小鼠-β-球蛋白、小鼠-α-球蛋白(Orkin et al.,EMBO J 4(2):453-456,1985;Thein et al.,Blood71(2):313-319,1988,其每一篇通过引用以其整体并入本文)、人胶原蛋白、多瘤病毒(Batt et al.,Mol.CellBiol.15(9):4783-4790,1995,通过引用以其整体并入本文)、单纯疱疹病毒胸苷激酶基因(HSV TK)、IgG重链基因多腺苷酸化信号(US 2006/0040354,通过引用以其整体并入本文)、人生长激素(hGH)(Szymanski et al.,Mol.Therapy 15(7):1340-1347,2007,通过引用以其整体并入本文),包含SV40 poly(A)位点,诸如SV40晚期和早期poly(A)位点的组(Scheket al.,Mol.Cell Biol.12(12):5386-5393,1992,通过引用以其整体并入本文)。
poly(A)信号序列可以是AATAAA。AATAAA序列可以用与AATAAA同源且能够传导多腺苷酸化信号的其他六核苷酸序列取代,包括ATTAAA、AGTAAA、CATAAA、TATAAA、GATAAA、ACTAAA、AATATA、AAGAAA、AATAAT、AAAAAA、AATGAA、AATCAA、AACAAA、AATCAA、AATAAC、AATAGA、AATTAA或AATAAG(参见,例如,WO 06/12414,其通过引用以其整体并入本文)。
在一些实施方案中,poly(A)信号序列可以是合成多腺苷酸化位点(参见,例如,Promega的pCl-neo表达构建体,其基于Levitt el al.,Genes Dev.3(7):1019-1025,1989,其通过引用以其整体并入本文)。在一些实施方案中,poly(A)信号序列是可溶性神经纤毛蛋白-1(sNRP)的多腺苷酸化信号(AAATAAAATACGAAATG)(参见,例如,WO 05/073384,其通过引用以其整体并入本文)。在一些实施方案中,poly(A)信号序列包含或由SV40 poly(A)位点组成。在一些实施方案中,poly(A)信号包含或由SEQ ID NO:25组成。在一些实施方案中,poly(A)信号序列包含或由bGHpA组成。在一些实施方案中,poly(A)信号包含或由SEQ IDNO:26组成。poly(A)信号序列的额外实例在本领域中是已知的。在一些实施方案中,poly(A)序列与由SEQ ID NO:25表示的poly(A)序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
示例性bGH poly(A)信号序列(SEQ ID NO:25)
CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG
示例性SV40 poly(A)信号序列(SEQ ID NO:26)
AACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTA
另外的序列
在一些实施方案中,本公开的构建体可以包含一个或多个填充物序列。在一些实施方案中,填充物序列可以起调控元件的作用,改变构建体表达。在一些此类实施方案中,在制造用于向受试者施用之前可能不完全去除填充物序列。在一些实施方案中,填充物序列可以具有功能性作用,包括作为接头序列、作为调控区或作为稳定区。正如本领域技术人员将理解的,填充物序列在一级序列上可以显著变化,同时保留它们的期望功能。在一些实施方案中,构建体可以含有填充物序列的任何组合,可以起作为调控序列作用的示例性填充物序列由SEQ ID NO:27或28表示。
在一些实施方案中,本公开的构建体可以包含T2A元素或序列。在一些实施方案中,本公开的构建体可以包括一个或多个克隆位点。在一些此类实施方案中,在制造用于向受试者施用之前可能不完全去除克隆位点。在一些实施方案中,克隆位点可以具有功能性作用,包括作为接头序列、Kozak位点的部分,或作为编码终止密码子的位点。正如本领域技术人员将理解的,克隆位点在一级序列上可以显著变化,同时保留它们的期望功能。在一些实施方案中,构建体可以含有克隆位点的任何组合,示例性克隆位点由SEQ ID NO:29、30、31、32、33、34、35、36、37或92表示。在一些实施方案中,构建体可以包含长度小于5个核苷酸的附加克隆位点。
示例性调控序列C3(SEQ ID NO:27)
CTTCTTCTGGAGTCTTTTCTGGAATAATTCTGGGAGTGGGCTCAGCCTGCGGGAGAGTAACATTTTTATAACTTGATAGATGTAGCTGAGATGCCTCCCAGAGGGGAGACCCGCCTCTCCTCCGGCAGCTGTGCACGTAGGCTTGTTCCCAGCAGCCTGGCCAGGGTGGTCCACCTGGTGTTTCTCATCTTCTTTCCCCGGAGCGCTGACTCCTGCGCGTCCTCTTGGAAGACTCTTGACAGGACGGGTGTTTTATGGGTGTGATTCAGTGTCCTCTTGCATCAGTTCAATGTGGTGGTGTTCAATCAACCCTTGTAGCGTTAGCAAAATTTGCTCAAGTCATTCCGCAGGAATGTCTGTGTCTTGCTTCCAAGAAAGCTTGTAAGTGCCGGCAACAGGCCAAGCAGCTCACAAACCTGACCACAAGCCTGTGAGTAATTGTGGGGCAGCACTTAGCAGTCTTTTATTTTCGACTTATTAAAGTCTCATCTTGGCCTCACCTTCTCCCTGGAAGGTGGCGTGGGTGGGAACCACTGGGTCAGATCTTTTTCACCCTTGCCGTGGAGCCAGTTTCCTGTTGCATGTGGGGGAAGCAACATGTGGTGAAGAGTATAGAAAACGAAAACATGTGGGTACAGTATGTATAAGTGGAGGGAACAAACTCATAATTCCAACTAGTTTCTCATGAGAGACTCATGAATCATTGTGGTAGTTCTCAATATAAACTTAATCTAGGCCGGATGTGGTGGCTCACACCTGTAATCTCAGCACTCTGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGTCTGACCAACATGGAGAAACCCCATCGCTACTAAAAATACAAAATTATCCAGATGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGAGAAACTGTGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGACGCATGCCTGTAATCCCAGCTATTTGGAGGCCGAAGCAGG
示例性调控序列D7(SEQ ID NO:28)
CTTCTTCTGGAGTCTTTTCTGGAATAATTCTGGGAGTGGGCTCAGCCTGCGGGAGAGTAACATTTTTATAACTTGATAGATGTAGCTGAGATGCCTCCCAGAGGGGAGACCCGCCTCTCCTCCGGCAGCTGTGCACGTAGGCTTGTTCCCAGCAGCCTGGCCAGGGTGGTCCACCTGGTGTTTCTCATCTTCTTTCCCCGGAGCGCTGACTCCTGCGCGTCCTCTTGGAAGACTCTTGACAGGACGGGTGTTTTATGGGTGTGATTCAGTGTCCTCTTGCATCAGTTCAATGTGGTGGTGTTCAATCAACCCTTGTAGCGTTAGCAAAATTTGCTCAAGTCATTCCGCAGGAATGTCTGTGTCTTGCTTCCAAGAAAGCTTGTAAGTGCCGGCAACAGGCCAAGCAGCTCACAAACCTGACCACAAGCCTGTGAGTAATTGTGGGGCAGCACTTAGCAGTCTTTTATTTTCGACTTATTAAAGTCTCATCTTGGCCTCACCTTCTCCCTGGAAGGTGGCGTGGGTGGGAACCACTGGGTCAGATCTTTTTCACCCTTGCCGTGGAGCCAGTTTCCTGTTGCATGTGGGGGAAGCAACATGTGGTGAAGAGTATAGAAAACGAAAACATGTGGGTACAGTATGTATAAGTGGAGGGAACAAACTCATAATTCCAACTAGTTTCTCATGAGAGACTCATGAATCATTGTGGTAGTTCTCAATATAAACTTAATCTAGGCCGGATGTGGTGGCTCACACCTGTAATCTCAGCACTCTGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGTCTGACCAACATGGAGAAACCCCATCGCTACTAAAAATACAAAATTATCCAGATGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGAGAAACTGTGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGACGCATGCCTGTAATCCCAGCTATTTGGAGGCCGAAGCAGG
示例性克隆位点A(SEQ ID NO:29)
TTGTCGACGCGGCCGCACGCGT
示例性克隆位点B(SEQ ID NO:30)
CTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGCCACC
示例性克隆位点C(SEQ ID NO:31)
TAAGAGCTCGCTGATCAGCCTCGA
示例性克隆位点D(SEQ ID NO:32)
AAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGG
示例性克隆位点E(SEQ ID NO:33)
TAAGAGCTC
示例性克隆位点F(SEQ ID NO:34)
GCTGATCAGCCTCGA
示例性克隆位点G(SEQ ID NO:35)
GGCATTCCGGTACTGTTGGTAAAGCCACCAGCAAACCGCCCAGAGTAGAAGACCGGTGGCCACC
示例性克隆位点H(SEQ ID NO:36)
AAGCTTGAATTC
示例性克隆位点I(SEQ ID NO:37)
AGCTGACGTGCCTCGGACCGCCTAGG
示例性克隆位点J(SEQ ID NO:70)
GCGGCCGCACGCGT
示例性克隆位点K(SEQ ID NO:71)
GCGGCCGCACGCGTGGT
示例性克隆位点L(SEQ ID NO:72)
CTCCTGGGCAACGTGCTGGTTATTGTGACCGGT
示例性克隆位点M(SEQ ID NO:73)
CGCTAGCCACC
示例性克隆位点N(SEQ ID NO:74)
ACCGGTCGCTAGCCACC
示例性克隆位点O(SEQ ID NO:75)
GAGCTCGCTGATCAGCCTCGA
示例性克隆位点P(SEQ ID NO:76)
AAGCTTGAATTCAGCTGACGTGCCTCGGACCGCT
示例性克隆位点Q(SEQ ID NO:92)
CTCACCGGT
示例性接头序列(SEQ ID NO:77)
GGATCCCGGGCT
去稳定化域
在一些实施方案中,本文提供的构建体中的任一者可以任选地包括编码用于蛋白质表达的时间控制的去稳定域(“去稳定序列”)的序列。去稳定序列的非限制性实例包括编码FK506序列、二氢叶酸还原酶(DHFR)序列或其它示例性去稳定序列的序列。
在不存在稳定配体的情况下,通过泛素化使操作性地连接至去稳定序列的蛋白质序列降解。相比之下,在存在稳定配体的情况下,蛋白质降解受抑制,从而允许操作性地连接至去稳定序列的蛋白质序列活跃地表达。作为稳定蛋白质表达的阳性对照,蛋白质表达可以通过常规方式来检测,包括酶促、放射照相、比色、荧光或其它光谱测定;荧光活化细胞分选(FACS)测定;免疫测定(例如,酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。
去稳定序列的额外实例在本领域中是已知的。在一些实施方案中,去稳定序列是FK506和雷帕霉素结合蛋白(FKBP12)序列,并且稳定配体是Shield-1(Shld1)(Banaszynskiet al.,(2012)Cell 126(5):995-1004,通过引用以其整体并入本文)。在一些实施方案中,去稳定序列是DHFR序列,并且稳定配体是甲氧苄啶(trimethoprim,TMP)(Iwamoto et al.,(2010)Chem Biol 17:981-988,通过引用以其整体并入本文)。
在一些实施方案中,去稳定序列是FKBP12序列,并且通过western印迹法(westernblotting)检测受试者细胞(例如,支持耳蜗外毛细胞)中携带FKBP12基因的AAV构建体的存在。在一些实施方案中,去稳定序列可以用于验证本文所述的AAV构建体中的任一者的时间特异性活性。
在一些实施方案中,去稳定域可以是抑制性核酸的靶位点。在一些实施方案中,去稳定域是已掺入RNA分子的调控区中的非内源性序列。在一些实施方案中,去稳定域可以允许对mRNA分子进行时间和/或空间控制。在一些实施方案中,去稳定域可以是内源性表达的抑制性核酸分子的靶标。在一些实施方案中,去稳定域可以是本文所述的miRNA调控靶位点和/或位点(miRTS)。在一些实施方案中,去稳定域由SEQ ID NO:78表示。在一些实施方案中,去稳定域由SEQ ID NO:79表示。在一些实施方案中,去稳定域由SEQ ID NO:80表示。
示例性mRNA去稳定域序列(SEQ ID NO:78)
AGTGTGAGTTCTACCATTGCCAAA
示例性mRNA去稳定域序列(SEQ ID NO:79)
AGTGAATTCTACCAGTGCCATA
示例性mRNA去稳定域序列(SEQ ID NO:80)
GAGCTCAGTGTGAGTTCTACCATTGCCAAACTCGAGCAGTGAATTCTACCAGTGCCATAGGATCCAGTGTGAGTTCTACCATTGCCAAAGGTACCCAGTGAATTCTACCAGTGCCATAGTTAAC
示例性DHFR去稳定氨基酸序列(SEQ ID NO:38)
MISLIAALAVDYVIGMENAMPWNLPADLAWFKRNTLNKPVIMGRHTWESIGRPLPGRKNIILSSQPSTDDRVTWVKSVDEAIAACGDVPEIMVIGGGRVIEQFLPKAQKLYLTHIDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFEILERR
示例性DHFR去稳定核苷酸序列(SEQ ID NO:39)
GGTACCATCAGTCTGATTGCGGCGTTAGCGGTAGATTACGTTATCGGCATGGAAAACGCCATGCCGTGGAACCTGCCTGCCGATCTCGCCTGGTTTAAACGCAACACCTTAAATAAACCCGTGATTATGGGCCGCCATACCTGGGAATCAATCGGTCGTCCGTTGCCAGGACGCAAAAATATTATCCTCAGCAGTCAACCGAGTACGGACGATCGCGTAACGTGGGTGAAGTCGGTGGATGAAGCCATCGCGGCGTGTGGTGACGTACCAGAAATCATGGTGATTGGCGGCGGTCGCGTTATTGAACAGTTCTTGCCAAAAGCGCAAAAACTGTATCTGACGCATATCGACGCAGAAGTGGAAGGCGACACCCATTTCCCGGATTACGAGCCGGATGACTGGGAATCGGTATTCAGCGAATTCCACGATGCTGATGCGCAGAACTCTCACAGCTATTGCTTTGAGATTCTGGAGCGGCGATAA
示例性去稳定域(SEQ ID NO:40)
ATCAGTCTGATTGCGGCGTTAGCGGTAGATTACGTTATCGGCATGGAAAACGCCATGCCGTGGAACCTGCCTGCCGATCTCGCCTGGTTTAAACGCAACACCTTAAATAAACCCGTGATTATGGGCCGCCATACCTGGGAATCAATCGGTCGTCCGTTGCCAGGACGCAAAAATATTATCCTCAGCAGTCAACCGAGTACGGACGATCGCGTAACGTGGGTGAAGTCGGTGGATGAAGCCATCGCGGCGTGTGGTGACGTACCAGAAATCATGGTGATTGGCGGCGGTCGCGTTATTGAACAGTTCTTGCCAAAAGCGCAAAAACTGTATCTGACGCATATCGACGCAGAAGTGGAAGGCGACACCCATTTCCCGGATTACGAGCCGGATGACTGGGAATCGGTATTCAGCGAATTCCACGATGCTGATGCGCAGAACTCTCACAGCTATTGCTTTGAGATTCTGGAGCGGCGA
示例性FKBP12去稳定肽氨基酸序列(SEQ ID NO:41)
MGVEKQVIRPGNGPKPAPGQTVTVHCTGFGKDGDLSQKFWSTKDEGQKPFSFQIGKGAVIKGWDEGVIGMQIGEVARLRCSSDYAYGAGGFPAWGIQPNSVLDFEIEVLSVQ
报告序列或元件
在一些实施方案中,本文所提供的构建体可以任选地包括编码报告多肽和/或蛋白质的序列(“报告序列”)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和萤光素酶。报告序列的额外实例在本领域中是已知的。当与驱动其表达的控制元件相关时,报告序列可以提供通过常规方式可检测的信号,包括酶促、放射照相、比色、荧光或其它光谱测定;荧光活化细胞分选(FACS)测定;免疫测定(例如,酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。
在一些实施方案中,报告序列是LacZ基因,并且通过β-半乳糖苷酶活性的测定来检测哺乳动物细胞(例如,耳蜗毛细胞)中携带LacZ基因的构建体的存在。当报告体是荧光蛋白(例如,绿色荧光蛋白)或萤光素酶时,可以通过荧光技术(例如,荧光显微术或FACS)或光度计(例如,分光光度计或IVIS成像仪器)中的光产生来测量哺乳动物细胞(例如,耳蜗毛细胞)中携带荧光蛋白或萤光素酶的构建体的存在。在一些实施方案中,报告序列可以用于验证本文所描述的构建体中的任一者的组织特异性靶向能力和组织特异性启动子调控和/或控制活性。
在一些实施方案中,报告序列是FLAG标签(例如,3xFLAG标签),并且通过蛋白质结合或检测测定(例如,Western印迹、免疫组织化学、放射免疫测定(RIA)、质谱法)来检测哺乳动物细胞(例如内耳细胞,例如耳蜗毛细胞或支持细胞)中携带FLAG标签的构建体的存在。示例性3xFLAG标签序列以SEQ ID NO:42提供。
示例性3xFLAG标签序列(SEQ ID NO:42)
GGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAG
具有终止密码子的示例性3xFLAG标签序列(SEQ ID NO:81)
GACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAA
示例性条形码标签(SEQ ID NO:93)
GTGTCACC
示例性条形码标签(SEQ ID NO:96)
CACAACCT
示例性条形码标签(SEQ ID NO:99)
CGTGTGTT
示例性条形码标签(SEQ ID NO:102)
TCGTGGGT
示例性条形码标签(SEQ ID NO:105)
GCAAACTG
AAV衣壳
本公开提供了包装到AAV衣壳中的一个或多个多核苷酸构建体。在一些实施方案中,AAV衣壳来自或衍生自AAV2、3、4、5、6、7、8、9、10、rh8、rh10、rh39、rh43或Anc80血清型的AAV衣壳,或其一个或多个杂交体。在一些实施方案中,AAV衣壳来自AAV祖先血清型。在一些实施方案中,AAV衣壳是祖先(Anc)AAV衣壳。Anc衣壳是从使用演化概率和演化建模构建的构建体序列创造创建的,以确定可能的祖先序列。因此,自然界中是否存在Anc衣壳/构建体序列是未知的。例如,在一些实施方案中,AAV衣壳是Anc80衣壳(例如,Anc80L65衣壳)。在一些实施方案中,AAV衣壳是使用包含SEQ ID NO:43的模板核苷酸编码序列创建的。在一些实施方案中,衣壳包含由SEQ ID NO:44表示的多肽。在一些实施方案中,衣壳包含与由SEQ IDNO:44表示的多肽具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的多肽。
如本文提供的,AAV衣壳和AAV构建体(例如,包括AAV ITR)的任何组合可以用于本公开的重组AAV(rAAV)颗粒中。例如,野生型或变体AAV2 ITR和Anc80衣壳、野生型或变体AAV2 ITR和AAV6衣壳等。在本公开的一些实施方案中,AAV颗粒完全由AAV2组分(例如,衣壳和ITR是AAV2血清型)组成。在一些实施方案中,AAV颗粒是AAV2/6、AAV2/8或AAV2/9颗粒(例如,AAV6、AAV8或AAV9衣壳与具有AAV2 ITR的AAV构建体)。在一些方面,AAV衣壳是Anc80衣壳(例如,Anc80L65衣壳)。在本公开的一些实施方案中,AAV颗粒是包含Anc80衣壳(例如,包含SEQ ID NO:44的多肽)的AAV2/Anc80颗粒,该衣壳衣壳化具有侧翼为编码序列的一部分,例如GJB2基因或其特征部分(例如,SEQ ID NO:1、2、3、4、5或6)的AAV2 ITR(例如,SEQ IDNO:8和9)的AAV构建体。其他AAV颗粒在本领域中是已知的,例如,Sharma et al.,BrainRes Bull.2010Feb 15;81(2-3):273,通过引用以其整体并入本文。在一些实施方案中,衣壳序列与分别由SEQ ID NO:43或44表示的衣壳核苷酸或氨基酸序列至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同。
示例性AAV Anc80衣壳DNA序列(SEQ ID NO:43)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACTTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACGACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGCCTACGACCAGCAGCTCAAAGCGGGTGACAATCCGTACCTGCGGTATAACCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCTTTTGGGGGCAACCTCGGGCGAGCAGTCTTCCAGGCCAAGAAGCGGGTTCTCGAACCTCTCGGTCTGGTTGAGGAAGGCGCTAAGACGGCTCCTGGAAAGAAGAGACCGGTAGAGCAATCACCCCAGGAACCAGACTCCTCTTCGGGCATCGGCAAGAAAGGCCAGCAGCCCGCGAAGAAGAGACTCAACTTTGGGCAGACAGGCGACTCAGAGTCAGTGCCCGACCCTCAACCACTCGGAGAACCCCCCGCAGCCCCCTCTGGTGTGGGATCTAATACAATGGCAGCAGGCGGTGGCGCTCCAATGGCAGACAATAACGAAGGCGCCGACGGAGTGGGTAACGCCTCAGGAAATTGGCATTGCGATTCCACATGGCTGGGCGACAGAGTCATCACCACCAGCACCCGAACCTGGGCCCTCCCCACCTACAACAACCACCTCTACAAGCAAATCTCCAGCCAATCGGGAGCAAGCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTGGGGGTATTTTGACTTTAACAGATTCCACTGCCACTTCTCACCACGTGACTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGACTCAACTTCAAGCTCTTCAACATCCAGGTCAAGGAGGTCACGACGAATGATGGCACCACGACCATCGCCAATAACCTTACCAGCACGGTTCAGGTCTTTACGGACTCGGAATACCAGCTCCCGTACGTCCTCGGCTCTGCGCACCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTCTTCATGATTCCTCAGTACGGGTACCTGACTCTGAACAATGGCAGTCAGGCCGTGGGCCGTTCCTCCTTCTACTGCCTGGAGTACTTTCCTTCTCAAATGCTGAGAACGGGCAACAACTTTGAGTTCAGCTACACGTTTGAGGACGTGCCTTTTCACAGCAGCTACGCGCACAGCCAAAGCCTGGACCGGCTGATGAACCCCCTCATCGACCAGTACCTGTACTACCTGTCTCGGACTCAGACCACGAGTGGTACCGCAGGAAATCGGACGTTGCAATTTTCTCAGGCCGGGCCTAGTAGCATGGCGAATCAGGCCAAAAACTGGCTACCCGGGCCCTGCTACCGGCAGCAACGCGTCTCCAAGACAGCGAATCAAAATAACAACAGCAACTTTGCCTGGACCGGTGCCACCAAGTATCATCTGAATGGCAGAGACTCTCTGGTAAATCCCGGTCCCGCTATGGCAACCCACAAGGACGACGAAGACAAATTTTTTCCGATGAGCGGAGTCTTAATATTTGGGAAACAGGGAGCTGGAAATAGCAACGTGGACCTTGACAACGTTATGATAACCAGTGAGGAAGAAATTAAAACCACCAACCCAGTGGCCACAGAACAGTACGGCACGGTGGCCACTAACCTGCAATCGTCAAACACCGCTCCTGCTACAGGGACCGTCAACAGTCAAGGAGCCTTACCTGGCATGGTCTGGCAGAACCGGGACGTGTACCTGCAGGGTCCTATCTGGGCCAAGATTCCTCACACGGACGGACACTTTCATCCCTCGCCGCTGATGGGAGGCTTTGGACTGAAACACCCGCCTCCTCAGATCCTGATTAAGAATACACCTGTTCCCGCGAATCCTCCAACTACCTTCAGTCCAGCTAAGTTTGCGTCGTTCATCACGCAGTACAGCACCGGACAGGTCAGCGTGGAAATTGAATGGGAGCTGCAGAAAGAAAACAGCAAACGCTGGAACCCAGAGATTCAATACACTTCCAACTACAACAAATCTACAAATGTGGACTTTGCTGTTGACACAAATGGCGTTTATTCTGAGCCTCGCCCCATCGGCACCCGTTACCTCACCCGTAATCTG
示例性AAV Anc80衣壳氨基酸序列(SEQ ID NO:44)
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKKGQQPAKKRLNFGQTGDSESVPDPQPLGEPPAAPSGVGSNTMAAGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSQSGASTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQTTSGTAGNRTLQFSQAGPSSMANQAKNWLPGPCYRQQRVSKTANQNNNSNFAWTGATKYHLNGRDSLVNPGPAMATHKDDEDKFFPMSGVLIFGKQGAGNSNVDLDNVMITSEEEIKTTNPVATEQYGTVATNLQSSNTAPATGTVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPTTFSPAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSTNVDFAVDTNGVYSEPRPIGTRYLTRNL
组合物
除其他事项外,本公开提供了组合物。在一些实施方案中,组合物包含如本文所述的构建体。在一些实施方案中,组合物包含一个或多个如本文所述的构建体。在一些实施方案中,组合物包含多个如本文所述的构建体。在一些实施方案中,当组合物中包括超过一个构建体时,构建体各自不同。
在一些实施方案中,组合物包含如本文所述的AAV颗粒。在一些实施方案中,组合物包含一个或多个如本文所述的AAV颗粒。在一些实施方案中,组合物包含多个AAV颗粒。在一些实施方案中,当组合物中包括超过一个AAV颗粒时,AAV颗粒各自不同。
在一些实施方案中,组合物包含connexin 26蛋白。在一些实施方案中,组合物包含细胞。
在一些实施方案中,组合物是或包含药物组合物。
给药和施用体积
在一些实施方案中,本文公开的组合物,例如,本文公开的一个或多个AAV载体,以单个剂量或多个剂量施用。
在一些实施方案中,本文公开的组合物以单个剂量施用。在一些实施方案中,本文公开的组合物以多个剂量,例如,2、3、4、5、6、7、8、9或10个剂量施用。
在一些实施方案中,本文公开的组合物(例如,包含本文公开的一个或多个rAAV构建体的组合物)以约0.01mL、约0.02mL、约0.03mL、约0.04mL、约0.05mL、约0.06mL、约0.07mL、约0.08mL、约0.09mL、约1.00mL、约1.10mL、约1.20mL、约1.30mL、约1.40mL、约1.50mL、约1.60mL、约1.70mL、约1.80mL、约1.90mL或约2.00mL的体积施用。在一些实施方案中,本文公开的组合物以约0.01mL的体积施用。在一些实施方案中,本文公开的组合物以约0.02mL的体积施用。在一些实施方案中,本文公开的组合物以约0.03mL的体积施用。在一些实施方案中,本文公开的组合物以约0.01mL的体积施用。在一些实施方案中,本文公开的组合物以约0.02mL的体积施用。在一些实施方案中,本文公开的组合物以约0.03mL的体积施用。在一些实施方案中,本文公开的组合物以约0.04mL的体积施用。在一些实施方案中,本文公开的组合物以约0.05mL的体积施用。在一些实施方案中,本文公开的组合物以约0.06mL的体积施用。在一些实施方案中,本文公开的组合物以约0.07mL的体积施用。在一些实施方案中,本文公开的组合物以约0.08mL的体积施用。在一些实施方案中,本文公开的组合物以约0.09mL的体积施用。在一些实施方案中,本文公开的组合物以约1.00mL的体积施用。在一些实施方案中,本文公开的组合物以约1.10mL的体积施用。在一些实施方案中,本文公开的组合物以约1.20mL的体积施用。在一些实施方案中,本文公开的组合物以约1.30mL的体积施用。在一些实施方案中,本文公开的组合物以约1.40mL的体积施用。在一些实施方案中,本文公开的组合物以约1.50mL的体积施用。在一些实施方案中,本文公开的组合物以约1.60mL的体积施用。在一些实施方案中,本文公开的组合物以约1.70mL的体积施用。在一些实施方案中,本文公开的组合物以约1.80mL的体积施用。在一些实施方案中,本文公开的组合物以约1.90mL的体积施用。在一些实施方案中,本文公开的组合物以约2.00mL的体积施用。
在一些实施方案中,本文公开的组合物(例如,包含本文公开的一个或多个rAAV构建体的组合物)以约0.01至2.00mL、约0.02至1.90mL、约0.03至1.8mL、约0.04至1.70mL、约0.05至1.60mL、约0.06至1.50mL、约0.06至1.40mL、约0.07至1.30mL、约0.08至1.20mL,或约0.09至1.10mL的体积施用。在一些实施方案中,本文公开的组合物(例如,包含本文公开的一个或多个rAAV构建体的组合物)以约0.01至2.00mL、约0.02至2.00mL、约0.03至2.00mL、约0.04至2.00mL、约0.05至2.00mL、约0.06至2.00mL、约0.07至2.00mL、约0.08至2.00mL、约0.09至2.00mL、约0.01至1.90mL、约0.01至1.80mL、约0.01至1.70mL、约0.01至1.60mL、约0.01至1.50mL、约0.01至1.40mL、约0.01至1.30mL、约0.01至1.20mL、约0.01至1.10mL、约0.01至1.00mL、约0.01至0.09mL的体积施用。
在一些实施方案中,给药方案包括以每个耳蜗至少0.01mL、至少0.02mL、至少0.03mL、至少0.04mL、至少0.05mL、至少0.06mL、至少0.07mL、至少0.08mL、至少0.09mL、至少0.10mL、至少0.11mL、至少0.12mL、至少0.13mL、至少0.14mL、至少0.15mL、至少0.16mL、至少0.17mL、至少0.18mL、至少0.19mL或至少0.20mL的体积递送。在一些实施方案中,给药方案包括以每个耳蜗至多0.30mL、至多0.25mL、至多0.20mL、至多0.15mL、至多0.14mL、至多0.13mL、至多0.12mL、至多0.11mL、至多0.10mL、至多0.09mL、至多0.08mL、至多0.07mL、至多0.06mL或至多0.05mL的体积递送。在一些实施方案中,视群体而定,给药方案包括以每个耳蜗约0.05mL、约0.06mL、约0.07mL、约0.08mL、约0.09mL、约0.10mL、约0.11mL、约0.12mL、约0.13mL、约0.14mL或约0.15mL的体积递送。
单个AAV构建体组合物
在一些实施方案中,本公开提供了包含由单个构建体组成的AAV颗粒的组合物或***。在一些此类实施方案中,单个构建体可以递送编码GJB2基因的功能性(例如,野生型或其他功能性,例如,密码子优化)拷贝的多核苷酸。在一些实施方案中,构建体是或包含rAAV构建体。在本文所述的一些实施方案中,单个rAAV构建体能够在靶细胞(例如,内耳细胞)中表达全长GJB2信使RNA或其特征蛋白。在一些实施方案中,单个构建体(例如,本文所述的构建体中的任一者)可以包括编码功能性connexin 26蛋白的序列(例如,产生功能性connexin 26蛋白的任何构建体)。在一些实施方案中,单个构建体(例如,本文所述的构建体中的任一者)可以包括编码功能性connexin 26蛋白的序列(例如,产生功能性connexin26蛋白的任何构建体)和任选地附加多肽序列(例如,调控序列和/或报告序列)。
在一些实施方案中,单个构建体组合物或***可以包括本文所述的任何或所有示例性构建体组分。在一些方面,构建体包含与SEQ ID NO:45具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:45表示。在一些方面,该构建体包含与SEQ ID NO:46具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:46表示。在一些方面,该构建体包含与SEQ ID NO:47具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQID NO:47表示。在一些方面,该构建体包含与SEQ ID NO:48具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:48表示。在一些方面,该构建体包含与SEQ ID NO:49具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:49表示。在一些方面,该构建体包含与SEQ ID NO:50具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQID NO:50表示。在一些方面,该构建体包含与SEQ ID NO:51具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:51表示。在一些方面,该构建体包含与SEQ ID NO:82具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:82表示。在一些方面,该构建体包含与SEQ ID NO:83具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQID NO:83表示。在一些方面,该构建体包含与SEQ ID NO:84具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:84表示。在一些方面,该构建体包含与SEQ ID NO:85具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:85表示。在一些方面,该构建体包含与SEQ ID NO:86具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQID NO:86表示。在一些方面,该构建体包含与SEQ ID NO:87具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:87表示。在一些方面,该构建体包含与SEQ ID NO:88具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,示例性单个构建体由SEQ ID NO:88表示。在一些方面,构建体包含SEQ ID NO:94的核酸序列。
在一些方面,构建体包含SEQ ID NO:97的核酸序列。在一些方面,该构建体包含与SEQ ID NO:97具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,该构建体包含SEQ ID NO:100的核酸序列。在一些方面,该构建体包含与SEQ ID NO:100具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%至少99%或100%同一性的核酸序列。在一些方面,该构建体包含SEQID NO:103的核酸序列。在一些方面,该构建体包含与SEQ ID NO:103具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。在一些方面,该构建体包含SEQ ID NO:106的核酸序列。在一些方面,该构建体包含与SEQ IDNO:106具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。本领域的技术人员将认识到,构建体可以经历额外的修饰,包括密码子优化、引入新的但功能等同的(例如,沉默突变)、添加报告序列和/或其他常规修饰。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:45表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:18例举的CMV增强子、由SEQ ID NO:11例举的CBA启动子、由SEQ ID NO:19例举的嵌合内含子、任选地由SEQ ID NO:30例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:31例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:32例举的克隆位点,和由SEQ ID NO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:46表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:18例举的CMV增强子、由SEQ ID NO:11例举的CBA启动子、由SEQ ID NO:19例举的嵌合内含子、任选地由SEQ ID NO:30例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:33例举的克隆序列、由SEQ ID NO:22例举的3’UTR、任选地由SEQ ID NO:34例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:32例举的克隆位点,和由SEQ ID NO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:47表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:17例举的启动子/增强子区域、任选地由SEQID NO:35例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:31例举的克隆位点、由SEQ ID NO:27例举的填充物序列、任选地由SEQ ID NO:36例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:37例举的克隆位点,和由SEQ IDNO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:48表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:17例举的启动子/增强子区域,任选地由SEQID NO:35例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:31例举的克隆位点、由SEQ ID NO:28例举的填充物序列、任选地由SEQ ID NO:36例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:37例举的克隆位点,和由SEQ IDNO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:49表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:17例举的启动子/增强子区、任选地由SEQ IDNO:35例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:31例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:32例举的克隆位点,和由SEQ ID NO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:50表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:18例举的CMV增强子、由SEQ ID NO:10例举的CBA启动子、由SEQ ID NO:19例举的嵌合内含子、任选地由SEQ ID NO:30例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:31例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:32例举的克隆位点,和由SEQ ID NO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:51表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:8例举的5’ITR、任选地由SEQ ID NO:29例举的克隆位点、由SEQ ID NO:18例举的CMV增强子、由SEQ ID NO:10例举的CBA启动子、由SEQ ID NO:19例举的嵌合内含子、任选地由SEQ ID NO:30例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、任选地由SEQ ID NO:33例举的克隆位点、由SEQ ID NO:22例举的3’UTR、任选地由SEQ ID NO:34例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:32例举的克隆位点,和由SEQ ID NO:9例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:82表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:14例举的CAG增强子/启动子、任选地由SEQID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB2 5’UTR序列、任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQ ID NO:67例举的3’UTR、任选地由SEQ ID NO:75例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ IDNO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:83表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:12例举的CMV/CBA增强子/启动子、由SEQ IDNO:64例举的嵌合内含子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB2 5’UTR序列、任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQ ID NO:67例举的3’UTR、任选地由SEQ ID NO:75例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:84表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:63例举的CMV增强子、由SEQ ID NO:61例举的人GJB2启动子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB2 5’UTR序列,任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQID NO:67例举的3’UTR、任选地由SEQ ID NO:75例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:85表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:63例举的CMV增强子、由SEQ ID NO:62例举的GFAP增强子-启动子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB25’UTR、任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQ IDNO:67例举的3’UTR、任选地由SEQ ID NO:75例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:86表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:71例举的克隆位点、由SEQ ID NO:62例举的人GFAP增强子-启动子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB2 5’UTR、任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQ ID NO:67例举的3’UTR、任选地由SEQ ID NO:75例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ IDNO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:87表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:62例举的人GFAP增强子-启动子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:66例举的GJB2 5’UTR、任选地由SEQ ID NO:73例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQ ID NO:80例举的去稳定化域、由SEQ ID NO:68例举的3’UTR、任选地由SEQ ID NO:34例举的克隆位点、由SEQ ID NO:25例举的poly(A)位点、任选地由SEQ ID NO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些实施方案中,示例性rAAVAnc80颗粒包含由SEQ ID NO:88表示的构建体。
在一个实施方案中,示例性构建体包含:由SEQ ID NO:52例举的5’ITR、任选地由SEQ ID NO:70例举的克隆位点、由SEQ ID NO:65例举的GJB2增强子区、由SEQ ID NO:61例举的GJB2增强子、任选地由SEQ ID NO:72例举的克隆位点、由SEQ ID NO:20例举的GJB2 5’UTR序列、任选地由SEQ ID NO:74例举的克隆位点、由SEQ ID NO:1例举的GJB2编码区、由SEQ ID NO:77例举的接头序列、由SEQ ID NO:81例举的具有终止密码子的FLAG序列、由SEQID NO:67例举的3’UTR、任选地由SEQ ID NO:76例举的克隆位点,和由SEQ ID NO:53例举的3’ITR。
在一些方面中,rAAVAnc80颗粒包括包含SEQ ID NO:94的核酸序列的构建体。
在一些方面中,构建体包括:包含SEQ ID NO:52的核酸序列的5’ITR、任选地包含SEQ ID NO:71的核酸序列的克隆位点、包含SEQ ID NO:90的核酸序列的GDF6启动子序列;包含SEQ ID NO:91的核酸序列的hGJB2最小启动子、任选地包含SEQ ID NO:92的核酸序列的克隆位点;包含SEQ ID NO:93的核酸序列的合成条形码;包含SEQ ID NO:66的核酸序列的5’UTR序列、包含SEQ ID NO:1的核酸序列的GJB2编码区、由SEQ ID NO:77例举的接头序列、包含SEQ ID NO:81的核酸序列的具有终止密码子的FLAG序列、包含SEQ ID NO:67的核酸序列的3’UTR、包含SEQ ID NO:25的核酸序列的poly(A)、任选地包含SEQ ID NO:76的核酸序列的克隆位点,和包含SEQ ID NO:53的核酸序列的3’ITR。
在一些方面中,rAAVAnc80颗粒包括包含SEQ ID NO:97的核酸序列的构建体。
在一些方面中,构建体包括:包含SEQ ID NO:52的核酸序列的5’ITR、任选地包含SEQ ID NO:71的核酸序列的克隆位点、包含SEQ ID NO:95的核酸序列的IGFBP2启动子序列;包含SEQ ID NO:91的核酸序列的hGJB2最小启动子、任选地包含SEQ ID NO:92的核酸序列的克隆位点;包含SEQ ID NO:96的核酸序列的合成条形码;包含SEQ ID NO:66的核酸序列的5’UTR序列、包含SEQ ID NO:1的核酸序列的GJB2编码区、由SEQ ID NO:77例举的接头序列、包含SEQ ID NO:81的核酸序列的具有终止密码子的FLAG序列、包含SEQ ID NO:67的核酸序列的3’UTR、包含SEQ ID NO:25的核酸序列的poly(A)、任选地包含SEQ ID NO:76的核酸序列的克隆位点,和包含SEQ ID NO:53的核酸序列的3’ITR。
在一些方面中,rAAVAnc80颗粒包括包含SEQ ID NO:100的核酸序列的构建体。
在一些方面中,构建体包括:包含SEQ ID NO:52的核酸序列的5’ITR、任选地包含SEQ ID NO:71的核酸序列的克隆位点、包含SEQ ID NO:98的核酸序列的RBP7启动子序列;包含SEQ ID NO:91的核酸序列的hGJB2最小启动子、任选地包含SEQ ID NO:92的核酸序列的克隆位点;包含SEQ ID NO:99的核酸序列的合成条形码;包含SEQ ID NO:66的核酸序列的5’UTR序列、包含SEQ ID NO:1的核酸序列的GJB2编码区、由SEQ ID NO:77例举的接头序列、包含SEQ ID NO:81的核酸序列的具有终止密码子的FLAG序列、包含SEQ ID NO:67的核酸序列的3’UTR、包含SEQ ID NO:25的核酸序列的poly(A)、任选地包含SEQ ID NO:76的核酸序列的克隆位点,和包含SEQ ID NO:53的核酸序列的3’ITR。
在一些方面中,rAAVAnc80颗粒包括包含SEQ ID NO:103的核酸序列的构建体。
在一些方面中,构建体包括:包含SEQ ID NO:52的核酸序列的5’ITR、任选地包含SEQ ID NO:71的核酸序列的克隆位点、包含SEQ ID NO:101的核酸序列的GJB6启动子序列;包含SEQ ID NO:91的核酸序列的hGJB2最小启动子、任选地包含SEQ ID NO:92的核酸序列的克隆位点;包含SEQ ID NO:102的核酸序列的合成条形码;包含SEQ ID NO:66的核酸序列的5’UTR序列、包含SEQ ID NO:1的核酸序列的GJB2编码区、由SEQ ID NO:77例举的接头序列、包含SEQ ID NO:81的核酸序列的具有终止密码子的FLAG序列、包含SEQ ID NO:67的核酸序列的3’UTR、包含SEQ ID NO:25的核酸序列的poly(A)、任选地包含SEQ ID NO:76的核酸序列的克隆位点,和包含SEQ ID NO:53的核酸序列的3’ITR。
在一些方面中,rAAVAnc80颗粒包括包含SEQ ID NO:106的核酸序列的构建体。
在一些方面中,构建体包括:包含SEQ ID NO:52的核酸序列的5’ITR、任选地包含SEQ ID NO:71的核酸序列的克隆位点、包含SEQ ID NO:104的核酸序列的PARM1启动子序列;包含SEQ ID NO:91的核酸序列的hGJB2最小启动子、任选地包含SEQ ID NO:92的核酸序列的克隆位点;包含SEQ ID NO:105的核酸序列的合成条形码;包含SEQ ID NO:66的核酸序列的5’UTR序列、包含SEQ ID NO:1的核酸序列的GJB2编码区、由SEQ ID NO:77例举的接头序列、包含SEQ ID NO:81的核酸序列的具有终止密码子的FLAG序列、包含SEQ ID NO:67的核酸序列的3’UTR、包含SEQ ID NO:25的核酸序列的poly(A)、任选地包含SEQ ID NO:76的核酸序列的克隆位点,和包含SEQ ID NO:53的核酸序列的3’ITR。
示例性构建体序列(SEQ ID NO:45)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO:46)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCCGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO:47)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTAAGCTTCGGTGAATTTAAAACGTTTGGTGGCAGTGGGTCAAGTAGCCAGGCGGCTGCGCTAGAGTACCCCGAAGGGACATCGGCGACACCACAAACCTCGCGCTGGCGGCTCGCCCGCGCCTTTTTCCCCTCCCGCGCGCGCCCGGCCCCACTCGCACCCCGGGCGGTGCCATCGCGTCCACTTCCCCGGCCGCCCCATTCCAGCTCCGGAGCTCGGCCGCAGAAACGCCCGCTCCAGAAGGCGGCCCCCGCCCCCCGGCCCAAGGACGTGTGTTGGTCCAGCCCCCCGGTTCCCCGAGACCCACGCGGCCGGGCAACCGCTCTGGGTCTCGCGGTCCCTCCCCGCGCCAGGTTCCTGGCCGGGCAGTCCGGGGCCGGCGGGCTCACCTGCGTCGGGAGGAAGCGCGGCGGGGCCGGGGCGGGGGTCTCGGCGTTGGGGTCTCTGCGCTGGGGCTCCTGCGCTCCTAGGCGGGTCCTGGGCCGGGCGCCGCCGAGGGGCTCCGAGTCGGGGAGAGGAGCGCGCGGGCGCTGCGGGGCCGCAACACCTGTCTCCCGCCGTGGCGCCTTTTAACCGCACCCCACACCCCGCCTCTTCCCTCGGAGACTGGGAAAGTTACGGAGGGGGCGGCGCCGCGGGCGGAGCGCGCCCGGCCTCTGGGTCCTCAGAGCTTCCCGGGTCCGCGAACCCCCGACCGCCCCCGAAAGCCCCGAACCCCCCAAGTCCCCTTCGAGGTCCCGATCTCCTAGTTCCTTTGAGCCCCCATGAGTTCCCCAAGTGCCCCCAGCGCCCTGAGTCTCCCCCGGTTACCCCGAGCGCCGCCTCCCCCAGCCCCTTGGCGGCCCGGGTGAAGCGGGGGCGGCTGAGAGTCGGGACCCCCCAGGAAGCGGCGCCCCAGACCCCGGCTCCGGCGCTGTGCCGTGGGCGGGGTTCAGGGATGGCTGTGGTCGTTGTCCTCTGTACTCCGCATAGTGCGAGAGGACTTGGCATTTATGAGCGCTTCTTTAATTTTTTATTGTTAGAGAAACAGGCATTCCTCCAAGGACTGAAGATCTGTTCGAGTCGCGGAGGCTGCGCGGGCCCGCGAGGCTCTCGCAGGGGGACCTAGGCTGGGTGGCGGGGCAGTGCCCTCTGGAATGGGGGTTAACGGTGGCCGAGGAGGGGGCGCCGCTGGTGCCGGCGAAGTCCCCGCTTCTTTCTCCCCTCAAAATCTCACCAATCCGAACGAACGCCTTCTCGAATTTCCGATTTTATTCAATTACTTTCAACAATGTGCCAAGGACTAAGGTTGGGGGCGGTGGGAGAGACAAGCCTCGTTTTTGCCATGGCCGGCAGGGGGGTCCCGCCATCTGCGGAGGGTGCCCCCCGCGGCCCCCGGCCCAGCCAACTTCCTCCTCTTTTCGCAACTGGGGAACTGCAAGGAGGTGACTCCTTTCGGGGTGAGGAGGCCCAGACTTTTCAGAAAGGAAAGAGGGCAGGTAAAACCTGCCAAGCCCCTTCCTGCTCGATGCACACAGCACGAAAGGGGGAAACTGATAGGATTCTGCGGAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCACCAGCAAACCGCCCAGAGTAGAAGACCGGTGGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCCTTCTTCTGGAGTCTTTTCTGGAATAATTCTGGGAGTGGGCTCAGCCTGCGGGAGAGTAACATTTTTATAACTTGATAGATGTAGCTGAGATGCCTCCCAGAGGGGAGACCCGCCTCTCCTCCGGCAGCTGTGCACGTAGGCTTGTTCCCAGCAGCCTGGCCAGGGTGGTCCACCTGGTGTTTCTCATCTTCTTTCCCCGGAGCGCTGACTCCTGCGCGTCCTCTTGGAAGACTCTTGACAGGACGGGTGTTTTATGGGTGTGATTCAGTGTCCTCTTGCATCAGTTCAATGTGGTGGTGTTCAATCAACCCTTGTAGCGTTAGCAAAATTTGCTCAAGTCATTCCGCAGGAATGTCTGTGTCTTGCTTCCAAGAAAGCTTGTAAGTGCCGGCAACAGGCCAAGCAGCTCACAAACCTGACCACAAGCCTGTGAGTAATTGTGGGGCAGCACTTAGCAGTCTTTTATTTTCGACTTATTAAAGTCTCATCTTGGCCTCACCTTCTCCCTGGAAGGTGGCGTGGGTGGGAACCACTGGGTCAGATCTTTTTCACCCTTGCCGTGGAGCCAGTTTCCTGTTGCATGTGGGGGAAGCAACATGTGGTGAAGAGTATAGAAAACGAAAACATGTGGGTACAGTATGTATAAGTGGAGGGAACAAACTCATAATTCCAACTAGTTTCTCATGAGAGACTCATGAATCATTGTGGTAGTTCTCAATATAAACTTAATCTAGGCCGGATGTGGTGGCTCACACCTGTAATCTCAGCACTCTGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGTCTGACCAACATGGAGAAACCCCATCGCTACTAAAAATACAAAATTATCCAGATGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGAGAAACTGTGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGACGCATGCCTGTAATCCCAGCTATTTGGAGGCCGAAGCAGGAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO:48)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTAAGCTTCGGTGAATTTAAAACGTTTGGTGGCAGTGGGTCAAGTAGCCAGGCGGCTGCGCTAGAGTACCCCGAAGGGACATCGGCGACACCACAAACCTCGCGCTGGCGGCTCGCCCGCGCCTTTTTCCCCTCCCGCGCGCGCCCGGCCCCACTCGCACCCCGGGCGGTGCCATCGCGTCCACTTCCCCGGCCGCCCCATTCCAGCTCCGGAGCTCGGCCGCAGAAACGCCCGCTCCAGAAGGCGGCCCCCGCCCCCCGGCCCAAGGACGTGTGTTGGTCCAGCCCCCCGGTTCCCCGAGACCCACGCGGCCGGGCAACCGCTCTGGGTCTCGCGGTCCCTCCCCGCGCCAGGTTCCTGGCCGGGCAGTCCGGGGCCGGCGGGCTCACCTGCGTCGGGAGGAAGCGCGGCGGGGCCGGGGCGGGGGTCTCGGCGTTGGGGTCTCTGCGCTGGGGCTCCTGCGCTCCTAGGCGGGTCCTGGGCCGGGCGCCGCCGAGGGGCTCCGAGTCGGGGAGAGGAGCGCGCGGGCGCTGCGGGGCCGCAACACCTGTCTCCCGCCGTGGCGCCTTTTAACCGCACCCCACACCCCGCCTCTTCCCTCGGAGACTGGGAAAGTTACGGAGGGGGCGGCGCCGCGGGCGGAGCGCGCCCGGCCTCTGGGTCCTCAGAGCTTCCCGGGTCCGCGAACCCCCGACCGCCCCCGAAAGCCCCGAACCCCCCAAGTCCCCTTCGAGGTCCCGATCTCCTAGTTCCTTTGAGCCCCCATGAGTTCCCCAAGTGCCCCCAGCGCCCTGAGTCTCCCCCGGTTACCCCGAGCGCCGCCTCCCCCAGCCCCTTGGCGGCCCGGGTGAAGCGGGGGCGGCTGAGAGTCGGGACCCCCCAGGAAGCGGCGCCCCAGACCCCGGCTCCGGCGCTGTGCCGTGGGCGGGGTTCAGGGATGGCTGTGGTCGTTGTCCTCTGTACTCCGCATAGTGCGAGAGGACTTGGCATTTATGAGCGCTTCTTTAATTTTTTATTGTTAGAGAAACAGGCATTCCTCCAAGGACTGAAGATCTGTTCGAGTCGCGGAGGCTGCGCGGGCCCGCGAGGCTCTCGCAGGGGGACCTAGGCTGGGTGGCGGGGCAGTGCCCTCTGGAATGGGGGTTAACGGTGGCCGAGGAGGGGGCGCCGCTGGTGCCGGCGAAGTCCCCGCTTCTTTCTCCCCTCAAAATCTCACCAATCCGAACGAACGCCTTCTCGAATTTCCGATTTTATTCAATTACTTTCAACAATGTGCCAAGGACTAAGGTTGGGGGCGGTGGGAGAGACAAGCCTCGTTTTTGCCATGGCCGGCAGGGGGGTCCCGCCATCTGCGGAGGGTGCCCCCCGCGGCCCCCGGCCCAGCCAACTTCCTCCTCTTTTCGCAACTGGGGAACTGCAAGGAGGTGACTCCTTTCGGGGTGAGGAGGCCCAGACTTTTCAGAAAGGAAAGAGGGCAGGTAAAACCTGCCAAGCCCCTTCCTGCTCGATGCACACAGCACGAAAGGGGGAAACTGATAGGATTCTGCGGAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCACCAGCAAACCGCCCAGAGTAGAAGACCGGTGGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCCCTGTAAAGCCAATTCCAACCCACTTGTAATTAAGAGAAAATCCCACGGTTCCTAATTGAAAGTCCTTTGTTCTATTTCTTGGGTATTTGTGTTTTAGGCCTTATTTTTAGATGCATCATTAAAGATTTTTAAAGTCCTTTCAGGCATCAGGACTGATGATGCTGAATGATGGAGGGTTGTGGATAAGTTTTTTTGTTTTTTTTTTAACCAGGTTAAAGGCTTTCCTGTTATCCTACTATGCTTAATTAAGAGCTGTATTTCTTAATATCATTGGTGCCTGATTAGATTTAACTTTTAGATACAGTCTGTAAGATTTTTGAACCAGAAAAACCTAAATAACTTATGACTGTTAGCAGTCATATTCTAGAAGAAGCAAATGTACTGAATTCTTATGTACCTAGGATTTTAAGGGAGTACATACAAATCTTTCCTCAGTAGCAGGTACTTTATTTTTATAACACACACATTTAAGCTGAGTTAAATATGCAGAACTGGTTGTACTTCTTTGGCAGGAAAAGGGAAGCTTAGGATATCTTGTGACCAACTACCTCTTCCTTCTCAAATAACTGGCAAATAACTTCAGGAAAATCCAGTTATGTTGTGTCATATTGCACCCCCTAGGAAGTACTGGATTCTTAGTCTTGAGTGACTTTTAAATAAAGCTACCTTTTTCTCTTTCTTACATCGCAAGATCTTCAAATGTACCATTCCCGCACAGAGAGTCCAAGGTAAAAGGACTGAAACCAAACTTTGTTTTTGTAAGTATTTTGGTCAGTGCAATGAGTTCAGAGACCAGGAGGTTAATGATTGTGAAGTCTTGTCAACAGCAACACCGTGTATGACCTGTGGTGCTTAGATGTTCAGAAACCCCAAGGTTAAAATGTCCCTGACCACATATCAGGCAAAAGGAATGTAAGGAAAACCAACTTAATCCTTTTGTCAAGAAGTATAAATGATGTATCTTTCCAATCGGGTTGCATTGACTTTTGGGTCCAAATAGCTTGTGTCCACAGGCATCTTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO: 49)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTAAGCTTCGGTGAATTTAAAACGTTTGGTGGCAGTGGGTCAAGTAGCCAGGCGGCTGCGCTAGAGTACCCCGAAGGGACATCGGCGACACCACAAACCTCGCGCTGGCGGCTCGCCCGCGCCTTTTTCCCCTCCCGCGCGCGCCCGGCCCCACTCGCACCCCGGGCGGTGCCATCGCGTCCACTTCCCCGGCCGCCCCATTCCAGCTCCGGAGCTCGGCCGCAGAAACGCCCGCTCCAGAAGGCGGCCCCCGCCCCCCGGCCCAAGGACGTGTGTTGGTCCAGCCCCCCGGTTCCCCGAGACCCACGCGGCCGGGCAACCGCTCTGGGTCTCGCGGTCCCTCCCCGCGCCAGGTTCCTGGCCGGGCAGTCCGGGGCCGGCGGGCTCACCTGCGTCGGGAGGAAGCGCGGCGGGGCCGGGGCGGGGGTCTCGGCGTTGGGGTCTCTGCGCTGGGGCTCCTGCGCTCCTAGGCGGGTCCTGGGCCGGGCGCCGCCGAGGGGCTCCGAGTCGGGGAGAGGAGCGCGCGGGCGCTGCGGGGCCGCAACACCTGTCTCCCGCCGTGGCGCCTTTTAACCGCACCCCACACCCCGCCTCTTCCCTCGGAGACTGGGAAAGTTACGGAGGGGGCGGCGCCGCGGGCGGAGCGCGCCCGGCCTCTGGGTCCTCAGAGCTTCCCGGGTCCGCGAACCCCCGACCGCCCCCGAAAGCCCCGAACCCCCCAAGTCCCCTTCGAGGTCCCGATCTCCTAGTTCCTTTGAGCCCCCATGAGTTCCCCAAGTGCCCCCAGCGCCCTGAGTCTCCCCCGGTTACCCCGAGCGCCGCCTCCCCCAGCCCCTTGGCGGCCCGGGTGAAGCGGGGGCGGCTGAGAGTCGGGACCCCCCAGGAAGCGGCGCCCCAGACCCCGGCTCCGGCGCTGTGCCGTGGGCGGGGTTCAGGGATGGCTGTGGTCGTTGTCCTCTGTACTCCGCATAGTGCGAGAGGACTTGGCATTTATGAGCGCTTCTTTAATTTTTTATTGTTAGAGAAACAGGCATTCCTCCAAGGACTGAAGATCTGTTCGAGTCGCGGAGGCTGCGCGGGCCCGCGAGGCTCTCGCAGGGGGACCTAGGCTGGGTGGCGGGGCAGTGCCCTCTGGAATGGGGGTTAACGGTGGCCGAGGAGGGGGCGCCGCTGGTGCCGGCGAAGTCCCCGCTTCTTTCTCCCCTCAAAATCTCACCAATCCGAACGAACGCCTTCTCGAATTTCCGATTTTATTCAATTACTTTCAACAATGTGCCAAGGACTAAGGTTGGGGGCGGTGGGAGAGACAAGCCTCGTTTTTGCCATGGCCGGCAGGGGGGTCCCGCCATCTGCGGAGGGTGCCCCCCGCGGCCCCCGGCCCAGCCAACTTCCTCCTCTTTTCGCAACTGGGGAACTGCAAGGAGGTGACTCCTTTCGGGGTGAGGAGGCCCAGACTTTTCAGAAAGGAAAGAGGGCAGGTAAAACCTGCCAAGCCCCTTCCTGCTCGATGCACACAGCACGAAAGGGGGAAACTGATAGGATTCTGCGGAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCACCAGCAAACCGCCCAGAGTAGAAGACCGGTGGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO: 50)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO: 51)
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTTGTCGACGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTTAAGAGCTCCGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCCTAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA
示例性构建体序列(SEQ ID NO: 82)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 83)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 84)CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTAAGCTTCCGCAGAATCCTATCAGTTTCCCCCTTTCGTGCTGTGTGCATCGAGCAGGAAGGGGCTTGGCAGGTTTTACCTGCCCTCTTTCCTTTCTGAAAAGTCTGGGCCTCCTCACCCCGAAAGGAGTCACCTCCTTGCAGTTCCCCAGTTGCGAAAAGAGGAGGAAGTTGGCTGGGCCGGGGGCCGCGGGGGGCACCCTCCGCAGATGGCGGGACCCCCCTGCCGGCCATGGCAAAAACGAGGCTTGTCTCTCCCACCGCCCCCAACCTTAGTCCTTGGCACATTGTTGAAAGTAATTGAATAAAATCGGAAATTCGAGAAGGCGTTCGTTCGGATTGGTGAGATTTTGAGGGGAGAAAGAAGCGGGGACTTCGCCGGCACCAGCGGCGCCCCCTCCTCGGCCACCGTTAACCCCCATTCCAGAGGGCACTGCCCCGCCACCCAGCCTAGGTCCCCCTGCGAGAGCCTCGCGGGCCCGCGCAGCCTCCGCGACTCGAACAGATCTTCAGTCCTTGGAGGAATGCCTGTTTCTCTAACAATAAAAAATTAAAGAAGCGCTCATAAATGCCAAGTCCTCTCGCACTATGCGGAGTACAGAGGACAACGACCACAGCCATCCCTGAACCCCGCCCACGGCACAGCGCCGGAGCCGGGGTCTGGGGCGCCGCTTCCTGGGGGGTCCCGACTCTCAGCCGCCCCCGCTTCACCCGGGCCGCCAAGGGGCTGGGGGAGGCGGCGCTCGGGGTAACCGGGGGAGACTCAGGGCGCTGGGGGCACTTGGGGAACTCATGGGGGCTCAAAGGAACTAGGAGATCGGGACCTCGAAGGGGACTTGGGGGGTTCGGGGCTTTCGGGGGCGGTCGGGGGTTCGCGGACCCGGGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO:85)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTGAACATATCCTGGTGTGGAGTAGGGGACGCTGCTCTGACAGAGGCTCGGGGGCCTGAGCTGGCTCTGTGAGCTGGGGAGGAGGCAGACAGCCAGGCCTTGTCTGCAAGCAGACCTGGCAGCATTGGGCTGGCCGCCCCCCAGGGCCTCCTCTTCATGCCCAGTGAATGACTCACCTTGGCACAGACACAATGTTCGGGGTGGGCACAGTGCCTGCTTCCCGCCGCACCCCAGCCCCCCTCAAATGCCTTCCGAGAAGCCCATTGAGCAGGGGGCTTGCATTGCACCCCAGCCTGACAGCCTGGCATCTTGGGATAAAAGCAGCACAGCCCCCTAGGGGCTGCCCTTGCTGTGTGGCGCCACCGGCGGTGGAGAACAAGGCTCTATTCAGCCTGTGCCCAGGAAAGGGGATCAGGGGATGCCCAGGCATGGACAGTGGGTGGCAGGGGGGGAGAGGAGGGCTGTCTGCTTCCCAGAAGTCCAAGGACACAAATGGGTGAGGGGAGCTCTCCCCATAGCTGGGCTGCGGCCCAACCCCACCCCCTCAGGCTATGCCAGGGGGTGTTGCCAGGGGCACCCGGGCATCGCCAGTCTAGCCCACTCCTTCATAAAGCCCTCGCATCCCAGGAGCGAGCAGAGCCAGAGCAGGTTGGAGAGGAGACGCATCACCTCCGCTGCTCGCCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 86)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTGAACATATCCTGGTGTGGAGTAGGGGACGCTGCTCTGACAGAGGCTCGGGGGCCTGAGCTGGCTCTGTGAGCTGGGGAGGAGGCAGACAGCCAGGCCTTGTCTGCAAGCAGACCTGGCAGCATTGGGCTGGCCGCCCCCCAGGGCCTCCTCTTCATGCCCAGTGAATGACTCACCTTGGCACAGACACAATGTTCGGGGTGGGCACAGTGCCTGCTTCCCGCCGCACCCCAGCCCCCCTCAAATGCCTTCCGAGAAGCCCATTGAGCAGGGGGCTTGCATTGCACCCCAGCCTGACAGCCTGGCATCTTGGGATAAAAGCAGCACAGCCCCCTAGGGGCTGCCCTTGCTGTGTGGCGCCACCGGCGGTGGAGAACAAGGCTCTATTCAGCCTGTGCCCAGGAAAGGGGATCAGGGGATGCCCAGGCATGGACAGTGGGTGGCAGGGGGGGAGAGGAGGGCTGTCTGCTTCCCAGAAGTCCAAGGACACAAATGGGTGAGGGGAGCTCTCCCCATAGCTGGGCTGCGGCCCAACCCCACCCCCTCAGGCTATGCCAGGGGGTGTTGCCAGGGGCACCCGGGCATCGCCAGTCTAGCCCACTCCTTCATAAAGCCCTCGCATCCCAGGAGCGAGCAGAGCCAGAGCAGGTTGGAGAGGAGACGCATCACCTCCGCTGCTCGCCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 87)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGACTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGACCGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAGCTCAGTGTGAGTTCTACCATTGCCAAACTCGAGCAGTGAATTCTACCAGTGCCATAGGATCCAGTGTGAGTTCTACCATTGCCAAAGGTACCCAGTGAATTCTACCAGTGCCATAGTTAACCGCATTGCCCAGTTGTTAGATTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 88)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTCTTCTTCTGGAGTCTTTTCTGGAATAATTCTGGGAGTGGGCTCAGCCTGCGGGAGAGTAACATTTTTATAACTTGATAGATGTAGCTGAGATGCCTCCCAGAGGGGAGACCCGCCTCTCCTCCGGCAGCTGTGCACGTAGGCTTGTTCCCAGCAGCCTGGCCAGGGTGGTCCACCTGGTGTTTCTCATCTTCTTTCCCCGGAGCGCTGACTCCTGCGCGTCCTCTTGGAAGACTCTTGACAGGACGGGTGTTTTATGGGTGTGATTCAGTGTCCTCTTGCATCAGTTCAATGTGGTGGTGTTCAATCAACCCTTGTAGCGTTAGCAAAATTTGCTCAAGTCATTCCGCAGGAATGTCTGTGTCTTGCTTCCAAGAAAGCTTGTAAGTGCCGGCAACAGGCCAAGCAGCTCACAAACCTGACCACAAGCCTGTGAGTAATTGTGGGGCAGCACTTAGCAGTCTTTTATTTTCGACTTATTAAAGTCTCATCTTGGCCTCACCTTCTCCCTGGAAGGTGGCGTGGGTGGGAACCACTGGGTCAGATCTTTTTCACCCTTGCCGTGGAGCCAGTTTCCTGTTGCATGTGGGGGAAGCAACATGTGGTGAAGAGTATAGAAAACGAAAACATGTGGGTACAGTATGTATAAGTGGAGGGAACAAACTCATAATTCCAACTAGTTTCTCATGAGAGACTCATGAATCATTGTGGTAGTTCTCAATATAAACTTAATCTAGGCCGGATGTGGTGGCTCACACCTGTAATCTCAGCACTCTGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGTCTGACCAACATGGAGAAACCCCATCGCTACTAAAAATACAAAATTATCCAGATGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGAGAAACTGTGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGACGCATGCCTGTAATCCCAGCTATTTGGAGGCCGAAGCAGGAAGCTTCCGCAGAATCCTATCAGTTTCCCCCTTTCGTGCTGTGTGCATCGAGCAGGAAGGGGCTTGGCAGGTTTTACCTGCCCTCTTTCCTTTCTGAAAAGTCTGGGCCTCCTCACCCCGAAAGGAGTCACCTCCTTGCAGTTCCCCAGTTGCGAAAAGAGGAGGAAGTTGGCTGGGCCGGGGGCCGCGGGGGGCACCCTCCGCAGATGGCGGGACCCCCCTGCCGGCCATGGCAAAAACGAGGCTTGTCTCTCCCACCGCCCCCAACCTTAGTCCTTGGCACATTGTTGAAAGTAATTGAATAAAATCGGAAATTCGAGAAGGCGTTCGTTCGGATTGGTGAGATTTTGAGGGGAGAAAGAAGCGGGGACTTCGCCGGCACCAGCGGCGCCCCCTCCTCGGCCACCGTTAACCCCCATTCCAGAGGGCACTGCCCCGCCACCCAGCCTAGGTCCCCCTGCGAGAGCCTCGCGGGCCCGCGCAGCCTCCGCGACTCGAACAGATCTTCAGTCCTTGGAGGAATGCCTGTTTCTCTAACAATAAAAAATTAAAGAAGCGCTCATAAATGCCAAGTCCTCTCGCACTATGCGGAGTACAGAGGACAACGACCACAGCCATCCCTGAACCCCGCCCACGGCACAGCGCCGGAGCCGGGGTCTGGGGCGCCGCTTCCTGGGGGGTCCCGACTCTCAGCCGCCCCCGCTTCACCCGGGCCGCCAAGGGGCTGGGGGAGGCGGCGCTCGGGGTAACCGGGGGAGACTCAGGGCGCTGGGGGCACTTGGGGAACTCATGGGGGCTCAAAGGAACTAGGAGATCGGGACCTCGAAGGGGACTTGGGGGGTTCGGGGCTTTCGGGGGCGGTCGGGGGTTCGCGGACCCGGGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGAGCAAACCGCCCAGAGTAGAAGACCGGTCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAG
示例性构建体序列(SEQ ID NO: 94)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTCCACAGGTAACTCCGTCGGCGTCCACAGGGGGGCAGGAGATACCATACTGCACAGTTGTACGTCTTCCATCTGTTTGGTGTAGAAAAATCTAACCACTACAAGAATGCCACGGGCACTGTGGCAGACAGAAGCAGCGCTACGCCGCATCGCCTTTCAGCGTGCAGGCCCAGGAATGAGCGAGGCAGTGGGCGGGGAAGACAGGCACGGGGAATCTGGGGACAGATAAAGGAAACTCGTGATGGGGCGAGGCTGGGCTGAAGAGAAACAGATTGGGGTAGAGCTGCAAAGGGAGGGGTCCACTGGAAGGCGAGGGGGGAGGCCGGGAAGAGAGAGGGTGGGAAGGCAGTGTGAGATGGGAGGGCAGTGTGAGAAGAAAAGCAGGCTGGGGAAGAGGGATTGGAATGCAGAAGGAACTTGGGGAAGGAGGAAGTCCTGCAGGCGGGAGGGAAAGAAGAGAGGGGGAGCAGCTAAAGTCTGCGTCAGAAGAGGTTGGGGACTGCGAGAGGAGAGGCTGGGGCCTGCAGGGGAGCGCAGCAGCTTTTAGCATCGATCCAAACTCTAAAGACTCGTGGCCTTTGCCTGACCTCGAGGGTCGGGAATAGACGCCTGTCTTTGTGGAGAGCGATACCCAACCGAGAAAATGGGGCTGTTCCGAGCTGGGCCCTGCGCCTGGCCCAGGGCGAGGCTTCTCTGGCTCCGGGCTGGCCCCTGAGGGGCAGCACGCAGCCTGCAGCAGAGGCGCCTGCTCCAAGCTGTCTCTTGGGGGCGCCGCCGCCGCTTCCCTCCTCCGGGGCCGCTCGCTCCCAGGAAAGTGGAGGCGGCTGGCGAGGACCGAGAGCCGGGGCCGCGCTGCGGAGGGACCACACCTCCGGGAGTTCGAGGGGGACCCTGGCGCGGCGGGCCAGCCTTTCGGGCCGGCAGCGCCCGCCTTCCCCCGGTCAGCGCTTGCGGCCCGCGCCGCGCGCACCGCCCGGCAACCCCGCGCGCGTCCCGCGGGGGCGCTGCGTCTTCCTGCCACACCGGCGCACCGCGGCCCCTCTCCCCCACACCTCCGGCCCGCACCACCCGGCTCTCCTCCCACCCTCCCCACCCCTCCTCTGCCCTCCCTCCCCATTCCTCCCCTCCCGGCGAGGGGCGGGAGGGGGCGTGGCGGGGCCGGGGTTTGTGTGGCTGGGACCCGGCTCCTCAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCACCGGTGTGTCACCGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTATGAGCCATATTCAACGGGAAACGTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGCTTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGAAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
表3:构建体序列的组分(SEQ ID NO:94)
组分 构建体中的位置
5’ITR 12-130
克隆位点 131-147
GDF6启动子 148-1335
hGJB2最小启动子 1336-1463
克隆位点 1464-1472
合成条形码 1473-1480
5’UTR 1481-1842
GJB2(外显子2) 1854-2531
3xFLAG 2544-2609
3’UTR(外显子2) 2613-4019
bGHpA 4041-4265
克隆位点 4266-4299
3’ITR 4300-4429
示例性构建体序列(SEQ ID NO:97)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTAAGAAACTTGCCCGAGTTTACACAGCTAGTAAATGGTTGCATTAGTCAGGACAGCTAGCCTATATTACAATAACAACCCTCTCAAATCCTAATGGCTTAAAACAACAGAGGTTTAATTTATACTCATTAGCTGTTCAAGGCAGGAGGCTCTATTCTCTAATCCATACAGTCACTCAGGATCCAGGCTGGTGGAGACCCTGCCATATTGTAGCCTCACCATTTAAAACATGAAGAAGATAGAAAGTGAGGAGTCATGTAGGTTTTGTTCCGTTGCCTCAGGCTAGGAGTGACAGGTCACTTCATCTCACTCACAGCTCACTGCCCACAACTAGTCACTTGTGACTGTGCGAGTTAAGCTTCTGTGTGTGAAGGAAGGAAAAGAGAATGGGATAAAGGTGAACATCAGCAGGCTCTACCACAGTAGTTTGAACCAAGACTTGAGCCTAGGTCATGTGGCTTCAGAATCTTTGCTCTTAATCACACTAAACAGCCTCTGTAAGTCATCTTTCCTTCATCCAGTGCCTAAGAACATGCAGTCCAATGCCCTCATCCTTCAGAAGAACTTGAGTGAACTCAGAGAAATTGAGTAGAGTGCCACAGCATGCCCAAGGCCACACACCCTGAGGTTGGCAGTAGGTCCTGAGTTAGAGTTGTCATTTCTTGGCTCCCCTGGTAGTAGTGGAAAGGTAAGGTTTTGACATACTAGTTGGATGACCACGGGCAGGTCACTTAAATTGTCTAAGCATCGTTTGACCCTTGTAAGAATTAAATGAAATAGCACCTGTAAAAGTGTCTGCACGGACTTACTGCTGTTAGTTTTGTTCCTTTCTTCCTGTTGTCACTGCACTTCCCTGCCTGTTACCCAGGCCATGCAGACCAGCCAGGCCTTCGACTTACAGTGCGGATAAGATTCCAAATCTCCACGGCTGGTTTCCATGCTTTCTTCCAGGCTTCTGAGGACCCTGTGCTCTGGTTTCTTCTATTTCTTTTCTATTACTTTTCTGTTACTCTTGAGCACACTTGCTGGAAGCAATATGCATCCAGTTCTCCCTCTCTTGCCTCATTACACTTTGCAGAACAACTCCAATCCCTTCCAACCAAGTAGTCCCTTTGAATTTCTTGTCACCCAAGGAATCTCTCTGACAGGGGTCTTTGTTAGGGTCACACCCCAGGAGATGGTTGATTATGGCTGAGTCCAGCCTGGAATGATGGGGGTTGGGGGCAGCTTGGGTAGATGACTCAGTAAATCAAACAGAACAATGAAAGGAGGTCATGCTTGTCCATCTGCATTATTGAAGACAGCCATAAATGGCCTTACCCCAGAGCGGGTCTGTCACACCTGGAGAGCTGATCTGACCTCTCCAAGACCCCTGCAACTGAGTGTTCTGGGATCTGTCCTGCAACAAGTGCCTCGAGATTTGTAGGTGGGGGCCCAGAGGGAGGGGGTCTGCAGACGAAGGGGGCAGGTTTTGCGGGGCACTTAGGGTTCTCATAGGTTGTAGTCACGAGCTCCAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCACCGGTCACAACCTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTATGAGCCATATTCAACGGGAAACGTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGCTTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGAAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
表4:构建体序列的组分(SEQ ID NO:97)
组分 构建体中的位置
5’ITR 12-130
克隆位点 131-147
IGFBP2启动子 148-1660
hGJB2最小启动子 1661-1788
克隆位点 1789-1797
合成条形码 1798-1805
5’UTR 1806-2167
GJB2(外显子2) 2179-2856
3xFLAG 2869-2934
3’UTR(外显子2) 2938-4344
bGHpA 4366-4590
克隆位点 4591-4624
3’ITR 4625-4754
示例性构建体序列(SEQ ID NO:100)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTCCCATGGCTCTGTTAAAATCAAAGAAACATCTTTTCCAACAGCCCTTTCAAACTCCTCATCGCATCTCACTGGCTGATTCAGTCATTTAAACCTGCTTCTCCCTAAAGCTGATCACTGGCTAAGCTAATAGGGTTTCCGGGATTGGTTTAGCCTGATACTAATCCAGGTCTACCTTCAGGAGCCAGACCAAACTGCCTATTGGCATTGCATTCTTGCAGTAGGGAGGGGAGGTATGGATGGTGTGGAGTCCACCACAAGGTCCATGCCAGTCTTTGCTGAACCAGCATCAGACTCCATCAAGCAACAGATGAGAGGTTCCATGATAAAGTGGCCCTCAGCAATCCCCATCCATTGCTGTCTAGGAAGAACAGTGCTTGTACACAGGTTTAGGACCTCAGTCTTGGCTGTAATCTTCTGGTTTACTTTGCCAGCACCAAACAGAAGGAAAGAAAGGGCTCAAATTTGACCAAATAAATTATGCTTCTCCTTCCAGAGATAACCTTGAGTCCTGTCTAGGAAGATATTAGAATTGTAAAGAAAAAAAAAATTACTCCTTATCCTATGGCAAGTGGAGTCTATGTCTACTTCAGCTGAAATTAAATCCTGTCCATAATAGATGACCCTTGCTCAAGCTGGCCAGAAGCCATACCAACCAGCACGAAGGTTAAAACTATTATTAGTTTTTTCTGTGATTTTCATTTTCAGGCCAAGTTTTAGAACAATAAGATTTTAAGAATAGGAAGTAAGTAAGATTTCTGCATATCCTGTTCTCTTAGTCAGCTGAATTTTTTTTTTTTTTTTTTTAGTCCTAACTCAGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCGCACCAAGCCTGGAATCTATGTCTTACAGTTATGAGAATCAACAGCTAGCTCATTATGGGCAAGGTGATGTCACTCTGGCTTCTCAATGAAAATGGCATTTCTCCCTTGGAAAAGGTCATAGCCAGTCAGTCAGTCAGTCACGGGAGCGCAGCGGCTTCTAGGGGTGAGTGGGACCCACGCGGCCCCACCTGCTCCTCCCGCGCGCGGCCCCACCCCCCTGCCCCGCCCCGCCTGGTTTATAGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCACCGGTCGTGTGTTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTATGAGCCATATTCAACGGGAAACGTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGCTTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGAAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
表5:构建体序列的组分(SEQ ID NO:100)
Figure BDA0004046106460001521
Figure BDA0004046106460001531
示例性构建体序列(SEQ ID NO:103)
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTAAATAGCTTCCAACGTTTCCACCCCACCAGCCCTTGCACCACTCCCTGTACTGGCCCTGAGCTTTCTAGTCTTGACTGAAAAGCGGGGAGGCAATGTGGTCTCTCCTGGTGCACTGTCCCGAGGAAGGCCTGCTCCGCTTCCCCGGAGGAGTCTTCAAAGGATGGAGGTAATTAATAAAAACAACCCCTGTACCTCCTCTAAGTGGTCATTAATTAATAAAGAACCTCCAGGCTCCTATAGGAGAGGTCTGTGCACCCCGCGGGCTATGAGAAGGCTGGATCACCCAGAAAGACTGAGGATGTGTCCTGGCAAAAACACAGCCTGCCCCTCACACTGCTCCCCACGGGTGCACTAGGGAGGAAGAGTTCCCTCGAGGGCCTGAGCAGGCGCCCCACACCTGCACCCGTGCAGAGGGGGCTGGGCCCGCCCTCTGCGCTCCCGAGGGAGAGCCCTACCCCCTGCATCCCCGGTACCCCGTTCCCTCCAAGGGCCGGAAAGAGGGCCCCGCGCACTGTGCACTTCTTAGGGGTCCCCCACCCTGCGCCCCCGCCACGGGAAAAAGGTCCCCGCTCTGCGCATCCGGCCCCGGAGGGACAGCCCCGGTCCTGCACTCCTTGCTCCTCAGGGGGACGGTCCGCGCCCAGCGGCTAGTGCGCCCCGGGTAGGTGGGGGCGGGGGGCTCGTCGAGTGACAGCGCTCGCCTCCCGCAGCCCGCCCGAGCCGCGTCAGGGCAGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCACCGGTTCGTGGGTGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTATGAGCCATATTCAACGGGAAACGTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGCTTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGAAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
表6:构建体序列的组分(SEQ ID NO:103)
组分 构建体中的位置
5’ITR 12-130
克隆位点 131-147
GJB66启动子 148-882
hGJB2最小启动子 883-1010
克隆位点 1011-1019
合成条形码 1020-1027
5’UTR 1028-1389
GJB2(外显子2) 1401-2078
3xFLAG 2091-2156
3’UTR(外显子2) 2160-3566
bGHpA 3588-3812
克隆位点 3813-3846
3’ITR 3847-3976
示例性构建体序列(SEQ ID NO:106)CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGTTGTACAGGAGATAGTCAGGGAATTAGTAATTTTCAAAGAGGTGACTTTGAATTCAAACTTAAATATCATCTTCAGCTGAAACAAAGAAGGGGTGCAGTTATGAGGAAGTGACCAGGTAAAGCATGGCAAACAAAGGTAAAGTTTGTTATGCGTATTTAAGTCAGAGCCCTCTCCATTGATAAGAGTTTCCAGTAATTTAGTGCCATCCTTTTCTTGCTATAGAGTTCTCGTCTCTATCTGAGCACGCAAAAATAACATGCTTTCTTGCTTTCTTGAAGTTGGGCATGGCCATTGACTTGCCTTAGCCCATATTTTTCTGTGAAGTGGTCTTCAAAAACCTATATTTCTGCCATAGAGTCACTTACTTAACCTGCCCTATTTAAAGGGGCTAATGCCTGATAGAATGTCGCTGCATAACTCCATCTGTGTGTGGTCCCTGCATCCATGACAACCAAAACCCAGATGCAGAAATTGTTCCTAATCACATAGATTACCCTAGAAACCGGAAGGGCCTTGAAGTCAAAAGCATTCAGAGAACATGCTGAACAAATTGAATTTGCAGTTTATCTGGCCAGGGAGGATGGAGAGGGGATGGGCACTTGGTCTGAGTATTTTTTGTTTCTCATTCCAACAGAAATTACTAGATTTACCAAAAAATCTACAAGTGGTAGTGTGATAGAGTCAGGCAGAGGAATTGACCATAGATAAGGTGCTCAGGACTCCTAGAGTCAGCTTCTGGTATGTGAGAAAGAAGTGAGAACAGAGCCCATGGCATATGAAGAAGATATTACAGAAAAAAGAAAGCTGCCTTCCACGCAAATCATTTCTTTACAAAGGCTTGTTAACTCCTGCAGTGCCAAGAAGCTGAATGCAGCGGCAGACATCCTGGTTCGGGCCCCAGGAAGCTCAGCCGGGTTTAATGTGGATGAGGGTTTAATGATGTACACGCAGAAGTGTTTTGACAAATGAAGAAGGTCCTCATTCTTGGAACATGTGCCGGTTCTCCGAGGGAACTCCTAAAAGGCTGTAAGCTCATGTAGGAAAAGCTGAGCTAGATTCCTAAGGGCAGAGATGTGCTCACATTTCTTTGCATCCCTAGTTCCCAGCACAGTGCAAGGCGCTGCAAACATTTGCTGAACCCAGGGTCTCGTGTCTTGACTGTCCAGCAGAGGCCGCTCTGGGCCGGGGCTCTCGGGACCTGAGGGCTGAGAGAAGGAAGGCCAGGGGGTGGCCCAGTCATCGCCGCGGGGCCCGGGTGGGAGGGGTTTGGCAGCGGCAGGCGCGGCGGCGGCGGCGGAGGCGGAGGCGGCCCCGGGAAGCTCTGAGGACCCAGAGGCCGGGCGCGCTCCGCCCGCGGCGCCGCCCCCTCCGTAACTTTCCCAGTCTCCGAGGGAAGAGGCGGGGTGTGGGGTGCGGTTAAAAGGCGCCACGGCGGGAGACAGGTCTCACCGGTGCAAACTGGTTGCGGCCCCGCAGCGCCCGCGCGCTCCTCTCCCCGACTCGGAGCCCCTCGGCGGCGCCCGGCCCAGGACCCGCCTAGGAGCGCAGGAGCCCCAGCGCAGAGACCCCAACGCCGAGACCCCCGCCCCGGCCCCGCCGCGCTTCCTCCCGACGCAGTTTAGGACCCTTGTTCGCGAAGAGGTGGTGTGCGGCTGAGACCCGCGTCCTCAGGACGGTTCCATCAGTGCCTCGATCCTGCCCCACTGGAGGAGGAAGGCAGCCCGAACAGCGCTCACCTAACTAACAGCTGCTGAGAGCTGGGTTCCGTGGCCATGCACCTGGGACTGCCTTGAGAAGCGTGAGCAAACCGCCCAGAGTAGAAGCGCTAGCCACCATGGATTGGGGCACGCTGCAGACGATCCTGGGGGGTGTGAACAAACACTCCACCAGCATTGGAAAGATCTGGCTCACCGTCCTCTTCATTTTTCGCATTATGATCCTCGTTGTGGCTGCAAAGGAGGTGTGGGGAGATGAGCAGGCCGACTTTGTCTGCAACACCCTGCAGCCAGGCTGCAAGAACGTGTGCTACGATCACTACTTCCCCATCTCCCACATCCGGCTATGGGCCCTGCAGCTGATCTTCGTGTCCACGCCAGCGCTCCTAGTGGCCATGCACGTGGCCTACCGGAGACATGAGAAGAAGAGGAAGTTCATCAAGGGGGAGATAAAGAGTGAATTTAAGGACATCGAGGAGATCAAAACCCAGAAGGTCCGCATCGAAGGCTCCCTGTGGTGGACCTACACAAGCAGCATCTTCTTCCGGGTCATCTTCGAAGCCGCCTTCATGTACGTCTTCTATGTCATGTACGACGGCTTCTCCATGCAGCGGCTGGTGAAGTGCAACGCCTGGCCTTGTCCCAACACTGTGGACTGCTTTGTGTCCCGGCCCACGGAGAAGACTGTCTTCACAGTGTTCATGATTGCAGTGTCTGGAATTTGCATCCTGCTGAATGTCACTGAATTGTGTTATTTGCTAATTAGATATTGTTCTGGGAAGTCAAAAAAGCCAGTTGGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGTAAGAAATAGACAGCATGAGAGGGATGAGGCAACCCGTGCTCAGCTGTCAAGGCTCAGTCGCTAGCATTTCCCAACACAAAGATTCTGACCTTAAATGCAACCATTTGAAACCCCTGTAGGCCTCAGGTGAAACTCCAGATGCCACAATGGAGCTCTGCTCCCCTAAAGCCTCAAAACAAAGGCCTAATTCTATGCCTGTCTTAATTTTCTTTCACTTAAGTTAGTTCCACTGAGACCCCAGGCTGTTAGGGGTTATTGGTGTAAGGTACTTTCATATTTTAAACAGAGGATATCGGCATTTGTTTCTTTCTCTGAGGACAAGAGAAAAAAGCCAGGTTCCACAGAGGACACAGAGAAGGTTTGGGTGTCCTCCTGGGGTTCTTTTTGCCAACTTTCCCCACGTTAAAGGTGAACATTGGTTCTTTCATTTGCTTTGGAAGTTTTAATCTCTAACAGTGGACAAAGTTACCAGTGCCTTAAACTCTGTTACACTTTTTGGAAGTGAAAACTTTGTAGTATGATAGGTTATTTTGATGTAAAGATGTTCTGGATACCATTATATGTTCCCCCTGTTTCAGAGGCTCAGATTGTAATATGTAAATGGTATGTCATTCGCTACTATGATTTAATTTGAAATATGGTCTTTTGGTTATGAATACTTTGCAGCACAGCTGAGAGGCTGTCTGTTGTATTCATTGTGGTCATAGCACCTAACAACATTGTAGCCTCAATCGAGTGAGACAGACTAGAAGTTCCTAGTGATGGCTTATGATAGCAAATGGCCTCATGTCAAATATTTAGATGTAATTTTGTGTAAGAAATACAGACTGGATGTACCACCAACTACTACCTGTAATGACAGGCCTGTCCAACACATCTCCCTTTTCCATGACTGTGGTAGCCAGCATCGGAAAGAACGCTGATTTAAAGAGGTCGCTTGGGAATTTTATTGACACAGTACCATTTAATGGGGAGGACAAAATGGGGCAGGGGAGGGAGAAGTTTCTGTCGTTAAAAACAGATTTGGAAAGACTGGACTCTAAAGTCTGTTGATTAAAGATGAGCTTTGTCTACTTCAAAAGTTTGTTTGCTTACCCCTTCAGCCTCCAATTTTTTAAGTGAAAATATAGCTAATAACATGTGAAAAGAATAGAAGCTAAGGTTTAGATAAATATTGAGCAGATCTATAGGAAGATTGAACCTGAATATTGCCATTATGCTTGACATGGTTTCCAAAAAATGGTACTCCACATATTTCAGTGAGGGTAAGTATTTTCCTGTTGTCAAGAATAGCATTGTAAAAGCATTTTGTAATAATAAAGAATAGCTTTAATGATATGCTTGTAACTAAAATAATTTTGTAATGTATCAAATACATTTAAAACATTAAAATATAATCTCTATAATAAGAGCTCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGAAGCTTGAATTCAGCTGACGTGCCTCGGACCGCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTATGAGCCATATTCAACGGGAAACGTCGAGGCCGCGATTAAATTCCAACATGGATGCTGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTATCGCTTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGTTGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCTTCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATCCCCGGAAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTTGATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT
表7:构建体序列的组分(SEQ ID NO:106)
组分 构建体中的位置
5’ITR 12-130
克隆位点 131-147
PARM1启动子 148-1463
hGJB2最小启动子 1464-1591
克隆位点 1592-1600
合成条形码 1601-1608
5’UTR 1609-1970
GJB2(外显子2) 1982-2659
3xFLAG 2672-2737
3’UTR(外显子2) 2741-4147
bGHpA 4169-4393
克隆位点 4394-4427
3’ITR 4428-4557
多个AAV构建体组合物
本发明认识到编码蛋白质(例如,connexin 26蛋白)的一些编码序列可以通过将编码序列分成多个部分来递送,这些部分各自包含在不同的构建体中。在一些实施方案中,本文提供了包含至少两个不同的构建体,(例如,两个、三个、四个、五个或六个)的组合物或***。在一些实施方案中,至少两个不同的构建体中的每一个包括编码编码区的不同部分的编码序列(例如,编码靶蛋白(例如,内耳靶蛋白,例如,connexin 26蛋白)),所编码部分中的每一个是至少10个氨基酸(例如,至少约10个氨基酸、至少约20个氨基酸、至少约30个氨基酸、至少约60个氨基酸、至少约70个氨基酸、至少约80个氨基酸、至少约90个氨基酸、至少约100个氨基酸、至少约110个氨基酸、至少约120个氨基酸、至少约130个氨基酸、至少约140个氨基酸、至少约150个氨基酸、至少约160个氨基酸、至少约170个氨基酸、至少约180个氨基酸、至少约190个氨基酸、至少约200个氨基酸、至少约210个氨基酸、至少约220个氨基酸、至少约230个氨基酸、至少约240个氨基酸、至少约250个氨基酸,或至少约260个氨基酸),其中所编码部分中的每一个的氨基酸序列任选地与所编码部分中的不同一个的氨基酸序列部分重合。至少两个不同的构建体中没有单个构建体编码活性靶蛋白;并且当引入到受试者细胞(例如,动物细胞,例如灵长类动物细胞,例如人细胞)时,至少两个不同的构建体彼此经历同源重组,其中重组的核酸编码活性靶蛋白(例如,由GJB2基因或其特征部分编码的基因产物)。在一些实施方案中,核酸构建体之一可以包括编码靶蛋白(例如,内耳靶蛋白,例如,connexin 26蛋白)的一部分的编码序列,其中所编码部分是至多约260个氨基酸(例如,至多约10个氨基酸、至多约20个氨基酸、至多约30个氨基酸、至多约60个氨基酸、至多约70个氨基酸、至多约80个氨基酸、至多约90个氨基酸、至多约100个氨基酸、至多约110个氨基酸、至多约120个氨基酸、至多约130个氨基酸、至多约140个氨基酸、至多约150个氨基酸、至多约160个氨基酸、至多约170个氨基酸、至多约180个氨基酸、至多约190个氨基酸、至多约200个氨基酸、至多约210个氨基酸、至多约220个氨基酸、至多约230个氨基酸、至多约240个氨基酸、至多约250个氨基酸,或至多约260个氨基酸)。
在一些实施方案中,构建体中的至少一个包括跨越靶基因组DNA(例如,内耳靶基因组DNA,例如,GJB2基因组DNA)的两个相邻外显子的核苷酸序列,并且缺乏天然存在于两个相邻外显子之间的内含子序列。
在一些实施方案中,构建体中的每一个的所编码部分的氨基酸序列不与所编码部分中的不同一个的氨基酸序列重叠,甚至部分重叠。在一些实施方案中,构建体的所编码部分的氨基酸序列与不同构建体的所编码部分的氨基酸序列部分重叠。在一些实施方案中,每个构建体的所编码部分的氨基酸序列与至少一个不同构建体的所编码部分的氨基酸序列部分重叠。在一些实施方案中,重叠氨基酸序列的长度在约10个氨基酸残基至约260个氨基酸之间,或这个范围的任何子范围(例如,约10个氨基酸、约20个氨基酸、约30个氨基酸、约60个氨基酸、约70个氨基酸、约80个氨基酸、约90个氨基酸、约100个氨基酸、约110个氨基酸、约120个氨基酸、约130个氨基酸、约140个氨基酸、约150个氨基酸、约160个氨基酸、约170个氨基酸、约180个氨基酸、约190个氨基酸、约200个氨基酸、约210个氨基酸、约220个氨基酸、约230个氨基酸、约240个氨基酸、约250个氨基酸、或约260个氨基酸)。
在一些实例中,期望基因产物(例如,治疗性基因产物)由至少两个不同的构建体编码。在一些实施方案中,至少两个不同的构建体中的每一个包括内含子的不同区段,其中内含子包括存在于靶基因组DNA(例如,内耳细胞靶基因组DNA(例如,GJB2基因组DNA))的核苷酸序列(例如,本文所述的SEQ ID NO:5中的示例性内含子中的任一者)。在一些实施方案中,不同的内含子区段重叠。在一些实施方案中,不同的内含子区段在序列上重叠的长度为至多约3,000个核苷酸(例如,至多约100个核苷酸、至多约200个核苷酸、至多约300个核苷酸、至多约600个核苷酸、至多约700个核苷酸、至多约800个核苷酸、至多约900个核苷酸、至多约1,000个核苷酸、至多约1,100个核苷酸、至多约1,200个核苷酸、至多约1,300个核苷酸、至多约1,400个核苷酸、至多约1,500个核苷酸、至多约1,600个核苷酸、至多约1,700个核苷酸、至多约1,800个核苷酸、至多约1,900个核苷酸、至多约2,000个核苷酸、至多约2,100个核苷酸、至多约2,200个核苷酸、至多约2,300个核苷酸、至多约2,400个核苷酸、至多约2,500个核苷酸、至多约2,600个核苷酸、至多约2,700个核苷酸、至多约2,800个核苷酸、至多约2,900个核苷酸,或至多约3000个核苷酸)。在一些实施方案中,不同构建体中的任何两个的重叠核苷酸序列可以包括靶基因(例如,内耳细胞靶基因(例如,GJB2基因))的一个或多个外显子的部分或全部(例如,本文所述SEQ ID NO:5中的示例性外显子中的任何一个或多个)。
在一些实施方案中,组合物或***是或包含两个、三个、四个或五个不同的构建体。在组合物中不同构建体的数目为两个的组合物中,两个不同构建体中的第一者可以包括编码蛋白质(例如,connexin 26蛋白)的N端部分的编码序列,其可以称为前导部分、第一构建体或5’部分(例如内耳细胞蛋白的N端部分,例如connexin 26蛋白的N端部分)。在一些实例中,靶基因的N端部分的长度为至少约10个氨基酸(例如,至少约10个核苷酸、至少约20个核苷酸、至少约30个核苷酸、至少约60个核苷酸、至少约70个核苷酸、至少约80个核苷酸、至少约90个核苷酸、至少约100个核苷酸、至少约110个核苷酸、至少约120个核苷酸、至少约130个核苷酸、至少约140个核苷酸、至少约150个核苷酸、至少约160个核苷酸、至少约170个核苷酸、至少约180个核苷酸、至少约190个核苷酸、至少约200个核苷酸、至少约210个核苷酸、至少约220个核苷酸、至少约230个核苷酸、至少约240个核苷酸、至少约250个氨基酸,或至少约260个氨基酸)。在一些实例中,第一构建体包括启动子(例如,本文所述或本领域已知的启动子中的任一者)和Kozak序列(例如,本文所述或本领域已知的示例性Kozak序列中的任一者)中的一个或两个。在一些实例中,第一构建体包括启动子,该启动子是诱导型启动子、组成型启动子或组织特异性启动子。在一些实例中,两个不同的构建体中的第二者构建体包括编码蛋白质的C端部分的编码序列,其可以称为末端部分、第二构建体或3’部分(例如,内耳细胞靶蛋白的C端部分,例如,Connexin26蛋白的C端部分)。在一些实例中,靶蛋白的C端部分的长度为至少约10个氨基酸(例如,至少约10个核苷酸、至少约20个核苷酸、至少约30个核苷酸、至少约60个核苷酸、至少约70个核苷酸、至少约80个核苷酸、至少约90个核苷酸、至少约100个核苷酸、至少约110个核苷酸、至少约120个核苷酸、至少约130个核苷酸、至少约140个核苷酸、至少约150个核苷酸、至少约160个核苷酸、至少约170个核苷酸、至少约180个核苷酸、至少约190个核苷酸、至少约200个核苷酸、至少约210个核苷酸、至少约220个核苷酸、至少约230个核苷酸、至少约240个核苷酸、至少约250个氨基酸,或至少约260个氨基酸)。在一些实例中,第二构建体进一步包括poly(A)序列。
在组合物中不同构建体的数目为两个的一些实例中,由两个构建体中的一个编码的N端部分可以包括包含内耳细胞靶蛋白(例如,SEQ ID NO:7)的氨基酸位置1到约氨基酸位置260,或该范围的任何子范围的部分,(例如,氨基酸1至至少约氨基酸10、氨基酸1至至少约氨基酸20、氨基酸1至至少约氨基酸30、氨基酸1至至少约氨基酸60、氨基酸1至至少约氨基酸70、氨基酸1至至少约氨基酸80、氨基酸1至至少约氨基酸90、氨基酸1至至少约氨基酸100、氨基酸1至至少约氨基酸110、氨基酸1至至少约氨基酸120、氨基酸1至至少约氨基酸130、氨基酸1至至少约氨基酸140、氨基酸1至至少约氨基酸150、氨基酸1至至少约氨基酸160、氨基酸1至至少约氨基酸170、氨基酸1至至少约氨基酸180、氨基酸1至至少约氨基酸190、氨基酸1至至少约氨基酸200、氨基酸1至至少约氨基酸210、氨基酸1至至少约氨基酸220、氨基酸1至至少约氨基酸230、氨基酸1至至少约氨基酸240、氨基酸1至至少约氨基酸250,或氨基酸1至至少约氨基酸260)。在组合物中不同构建体的数目为两个的一些实例中,前体内耳细胞靶蛋白的N端部分可以包括包含内耳细胞靶蛋白(例如,SEQ ID NO:7)的氨基酸位置1至氨基酸位置260或该范围的任何子范围的部分(例如,氨基酸1至至多约氨基酸10、氨基酸1至至多约氨基酸20、氨基酸1至至多约氨基酸30、氨基酸1至至多约氨基酸60、氨基酸1至至多约氨基酸70、氨基酸1至至多约氨基酸80、氨基酸1至至多约氨基酸90、氨基酸1至至多约氨基酸100、氨基酸1至至多约氨基酸110、氨基酸1至至多约氨基酸120、氨基酸1至至多约氨基酸130、氨基酸1至至多约氨基酸140、氨基酸1至至多约氨基酸150、氨基酸1至至多约氨基酸160、氨基酸1至至多约氨基酸170、氨基酸1至至多约氨基酸180、氨基酸1至至多约氨基酸190、氨基酸1至至多约氨基酸200、氨基酸1至至多约氨基酸210、氨基酸1至至多约氨基酸220、氨基酸1至至多约氨基酸230、氨基酸1至至多约氨基酸240、氨基酸1至至多约氨基酸250,或氨基酸1至至多约氨基酸260)。
在组合物中不同构建体的数目为两个的一些实例中,由两个构建体中的一个编码的C端部分可以包括包含内耳细胞靶蛋白(例如,SEQ ID NO:7)的最末氨基酸(例如,约氨基酸位置260)至约氨基酸位置1,或这个范围的任何子范围,(例如,氨基酸260至至少约氨基酸10、氨基酸260至至少约氨基酸20、氨基酸260至至少约氨基酸30、氨基酸260至至少约氨基酸60、氨基酸260至至少约氨基酸70、氨基酸260至至少约氨基酸80、氨基酸260至至少约氨基酸90、氨基酸260至至少约氨基酸100、氨基酸260至至少约氨基酸110、氨基酸260至至少约氨基酸120、氨基酸260至至少约氨基酸130、氨基酸260至至少约氨基酸140、氨基酸260至至少约氨基酸150、氨基酸260至至少约氨基酸160、氨基酸260至至少约氨基酸170、氨基酸260至至少约氨基酸180、氨基酸260至至少约氨基酸190、氨基酸260至至少约氨基酸200、氨基酸260至至少约氨基酸210、氨基酸260至至少约氨基酸220、氨基酸260至至少约氨基酸230、氨基酸260至至少约氨基酸240、氨基酸260至至少约氨基酸250、氨基酸260至至少约氨基酸260)。在组合物中不同构建体的数目为两个的一些实例中,前体内耳细胞靶蛋白的C端部分可以包括包括包含内耳细胞靶蛋白(例如,SEQ ID NO:7)的最末氨基酸(例如,约氨基酸位置2600)至至多约氨基酸位置1的部分,或该范围的任何子范围(例如,氨基酸260至至多约氨基酸10、氨基酸260至至多约氨基酸20、氨基酸260至至多约氨基酸30、氨基酸260至至多约氨基酸60、氨基酸260至至多约氨基酸70、氨基酸260至至多约氨基酸80、氨基酸260至至多约氨基酸90、氨基酸260至至多约氨基酸100、氨基酸260至至多约氨基酸110、氨基酸260至至多约氨基酸120、氨基酸260至至多约氨基酸130、氨基酸260至至多约氨基酸140、氨基酸260至至多约氨基酸150、氨基酸260至至多约氨基酸160、氨基酸260至至多约氨基酸170、氨基酸260至至多约氨基酸180、氨基酸260至至多约氨基酸190、氨基酸260至至多约氨基酸200、氨基酸260至至多约氨基酸210、氨基酸260至至多约氨基酸220、氨基酸260至至多约氨基酸230、氨基酸260至至多约氨基酸240、氨基酸260至至多约氨基酸250、氨基酸260至至多约氨基酸260),或其间的任何长度。
在一些实施方案中,剪接位点参与反式剪接。在一些实施方案中,剪接供***点(Trapani et al.,EMBO Mol.Med.6(2):194-211,2014,通过引用以其整体并入本文)跟在N端构建体中的编码序列之后。在C端构建体中,可以在紧邻GJB2的编码序列之前亚克隆剪接接受***点。在一些实施方案中,在编码序列内可以引入沉默突变,生成用于限制性消化的额外位点。
在一些实施方案中,本文提供的构建体中的任一者可以包括在适合向动物施用以改善与综合征性和/或非综合征性听力损失相关联的症状的组合物中。
药物组合物
除其他事项外,本公开提供了药物组合物。在一些实施方案中,本文提供的组合物适合向动物施用,以改善与综合征性和/或非综合征性听力损失相关联的症状。
在一些实施方案中,如本文所述,本公开的药物组合物可以包含,例如多核苷酸,例如一个或多个构建体。在一些实施方案中,如本文所述,药物组合物可以包含一个或多个AAV颗粒,例如,由一个或多个AAV血清型衣壳衣壳化的一个或多个rAAV构建体。
在一些实施方案中,药物组合物包含一种或多种药学或生理学上可接受的载体、稀释剂或赋形剂。如本文所用,术语“药学上可接受的载体”包括与药物施用相容的溶剂、分散介质、包衣、抗细菌剂、抗真菌剂等。补充性活性化合物也可以掺入本文所述的组合物中的任一者中。此类组合物可以包含一种或多种缓冲剂,诸如中性缓冲盐水、磷酸盐缓冲盐水等;一种或多种碳水化合物,诸如葡萄糖、甘露糖、蔗糖和葡聚糖;甘露糖醇;一种或多种蛋白质、多肽或氨基酸,诸如甘氨酸;一种或多种抗氧化剂;一种或多种螯合剂,诸如EDTA或谷胱甘肽;和/或一种或多种防腐剂。在一些实施方案中,配制剂呈剂型,诸如可注射溶液、可注射凝胶、药物释放胶囊等。
在一些实施方案中,本公开的组合物配制成用于静脉内施用。在一些实施方案中,本公开的组合物配制成用于耳蜗内施用。在一些实施方案中,治疗性组合物配制成包含脂质纳米颗粒、聚合物纳米颗粒、微环DNA和/或CELiD DNA。
在一些实施方案中,本文公开的组合物配制成用于耳蜗内施用的无菌悬浮液。在一些实施方案中,组合物包含构建体,其量为至少1E11、至少5E11、至少1E12、至少5E12、至少1E13、至少2E13、至少3E13、至少4E13、至少5E13、至少6E13、至少7E13、至少8E13、至少9E13或至少1E14载体基因组(vg)/毫升(mL)。在一些实施方案中,组合物包含构建体,其量为至多1E15、至多5E14、至多1E14、至多5E13、至多1E13、至多9E12、至多8E12、至多7E12、至多6E12、至多5E12、至多4E12、至多3E12、至多2E12或至多1E12载体基因组(vg)/毫升(mL)的构建体。在一些实施方案中,组合物包含构建体,其量为1E12至1E13、5E12至5E13,或1E13至2E13载体基因组(vg)/毫升(mL)。
在一些实施方案中,治疗性组合物配制成包含合成外淋巴溶液。例如,在一些实施方案中,合成外淋巴溶液包含20-200mM NaCl;1-5mM KCl;0.1-10mM CaCl2;1-10mM葡萄糖;和2-50mM HEPES,pH在约6和约9之间。在一些实施方案中,治疗组合物配制成包含生理学上合适的溶液。例如,在一些实施方案中,生理上适合的溶液包括市售的具有普朗尼克酸(pluronic acid)F68的1xPBS,制备至最终浓度为:8.10mM磷酸氢二钠、1.5mM磷酸二氢钾、2.7mM氯化钾、172mM氯化钠和0.001%普朗尼克酸F68)。在一些实施方案中,利用替代性普朗尼克酸。在一些实施方案中,利用替代性离子浓度。
在一些实施方案中,本文所述的药物组合物中的任一者可以进一步包含促进核酸或本文所述的构建体中的任一者进入哺乳动物细胞中的一种或多种药剂(例如,脂质体或阳离子脂质)。在一些实施方案中,本文所述的构建体中的任一者可以使用天然和/或合成聚合物进行配制。可以包括在本文所述的组合物中的任一者中的聚合物的非限制性实例可以包括但不限于DYNAMIC
Figure BDA0004046106460001671
(Arrowhead Research Corp.,Pasadena,Calif.)、来自Mirus Bio(Madison,Wis.)和Roche Madison(Madison,Wis.)的配制剂、PhaseRX聚合物配制剂,诸如但不限于SMARTT POLYMER
Figure BDA0004046106460001672
(PhaseRX,Seattle,Wash.)、DMRI/DOPE、泊洛沙姆(poloxamer)、来自Vical(San Diego,Calif.)的
Figure BDA0004046106460001673
佐剂、壳聚糖、来自Calando Pharmaceuticals(Pasadena,Calif.)的环糊精、树枝状聚合物和聚(乳酸-共-乙醇酸)(PLGA)聚合物、RONDELTM(RNAi/寡核苷酸纳米颗粒递送)聚合物(Arrowhead Research Corporation,Pasadena,Calif.)以及pH反应性共嵌段聚合物,诸如但不限于PhaseRX(Seattle,Wash.)生产的那些。这些聚合物中的许多已经证明在体内将寡核苷酸递送到哺乳动物细胞中的功效(参见,例如,deFougerolles,Human Gene Ther.19:125-132,2008;Rozema et al.,Proc.Natl.Acad.Sci.U.S.A.104:12982-12887,2007;Rozema et al.,Proc.Natl.Acad.Sci.U.S.A.104:12982-12887,2007;Hu-Lieskovan et al.,CancerRes.65:8984-8982,2005;Heidel et al.,Proc.Natl.Acad.Sci.U.S.A.104:5715-5721,2007,其每一篇通过引用以其整体并入本文)。
在一些实施方案中,组合物包含药学上可接受的载体(例如,磷酸盐缓冲盐水、盐水或抑菌水)。在配制后,溶液将以与剂量配制剂相容的方式和治疗有效的量进行施用。配制剂易于以各种剂型施用,诸如可注射溶液、可注射凝胶、药物释放胶囊等。
在一些实施方案中,本文提供的组合物可以例如配制成与它们的预定施用途径相容。预期施用途径的非限制性实例是局部施用(例如,耳蜗内施用)。在一些实施方案中,所提供的组合物包含一个核酸构建体。在一些实施方案中,所提供的组合物包含两个或更多个不同的构建体。在一些实施方案中,组合物包括包含编码connexin 26蛋白和/或其功能特征部分的编码序列的单个核酸构建体。在一些实施方案中,组合物包括包含编码connexin 26蛋白和/或其功能特征部分的编码序列的单个核酸构建体,当引入哺乳动物细胞时,该编码序列整合到哺乳动物细胞的基因组中。在一些实施方案中,包含至少两个不同的构建体的组合物,例如,构建体包含编码connexin 26蛋白的不同部分的编码序列,可以组合该构建体以在哺乳动物细胞中产生编码活性connexin 26蛋白(例如,全长connexin26蛋白)的序列,并且从而治疗有此需要的受试者的相关综合征性或非综合征性感觉神经性听力损失。
还提供了包含本文所述的组合物中的任一者的试剂盒。在一些实施方案中,试剂盒可以包含固体组合物(例如,包括本文所述的至少两种不同构建物的冻干组合物)和用于溶解冻干组合物的液体。在一些实施方案中,试剂盒可以包括包含本文所述的组合物中的任一者的预装载注射器。
在一些实施方案中,试剂盒包括包含本文所述的组合物中的任一者(例如,配制成水性组合物,例如,水性药物组合物)的小瓶。
在一些实施方案中,试剂盒可以包括用于执行本文所述的方法中的任一者的说明书。
遗传修饰的细胞
本公开还提供了包含本文所述的核酸、构建体或组合物中的任一者的细胞(例如,动物细胞,例如,哺乳动物细胞,例如,灵长类动物细胞,例如,人细胞)。在一些实施方案中,动物细胞是人细胞(例如,人支持细胞或人毛细胞)。在其他实施方案中,动物细胞是非人哺乳动物(例如,猿猴细胞、猫科细胞、犬科细胞等)。本领域技术人员将理解,可以将本文所述的核酸和构建体引入任何动物细胞(例如,适合兽医干预的任何动物的支持细胞或毛细胞)中。本文描述了构建体和用于将构建体引入动物细胞中的方法的非限制性实例。
在一些实施方案中,动物细胞可以是内耳的任何细胞,包括毛细胞和/或支持细胞。此类细胞的非限制性实例包括:Hensen细胞、Deiters细胞、内淋巴囊和管的细胞、球囊、椭圆囊和壶腹中的过渡细胞、内毛和外毛细胞、螺旋韧带细胞、螺旋神经节细胞、螺旋隆凸细胞、外球囊细胞、边缘细胞、中间细胞、基底细胞、内柱细胞、外柱细胞、Claudius细胞、内边界细胞、内指状细胞或血管纹细胞。
在一些实施方案中,动物细胞是耳蜗的特化细胞。在一些实施方案中,动物细胞是毛细胞。在一些实施方案中,动物细胞是耳蜗内毛细胞或耳蜗外毛细胞。在一些实施方案中,动物细胞是耳蜗内毛细胞。在一些实施方案中,动物细胞是耳蜗外毛细胞。
在一些实施方案中,动物细胞是体外的。在一些实施方案中,动物细胞是内源性存在于动物中,例如,在灵长类动物和/或人中的细胞类型。在一些实施方案中,动物细胞是获得自动物并离体培养的自体细胞。
方法
除其他事项外,本公开提供了方法。在一些实施方案中,方法包括将本文所述的组合物引入受试者的内耳(例如,耳蜗)。例如,本文提供的方法在一些实施方案中包括向受试者(例如,动物,例如,哺乳动物,例如,灵长类动物,例如,人)的内耳(例如,耳蜗)施用治疗有效量的本文所述的任何组合物。在这些方法中的任一者的一些实施方案中,受试者先前已被鉴定为具有缺陷性内耳细胞靶基因(例如,支持性和/或听觉细胞靶基因,其具有导致由该基因编码的支持性和/或听觉细胞靶蛋白的表达和/或活性降低的突变)。这些方法中的任一者的一些实施方案进一步包括,在引入或施用步骤之前,确定受试者具有缺陷性内耳细胞靶基因。这些方法中的任一者的一些实施方案可以进一步包括检测受试者的内耳细胞靶基因中的突变。这些方法中的任一者的一些实施方案可以进一步包括将受试者鉴定或诊断为具有非综合征性或综合征性感觉神经性听力损失。
在一些实施方案中,本文提供了校正受试者,例如,动物,例如,哺乳动物,例如,灵长类动物,例如,人的内耳中的内耳细胞靶基因缺陷(例如,GJB2的缺陷)的方法。在一些实施方案中,方法包括向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者,其中施用修复和/或改善受试者内耳的任何细胞亚群中的内耳细胞靶基因缺陷。在一些实施方案中,内耳靶细胞可以是感觉细胞,例如毛细胞,和/或非感觉细胞,例如支持细胞,和/或内耳细胞的所有或任何亚群。
本文还提供了提高受试者(例如,动物,例如,哺乳动物,例如,灵长类动物,例如,人)内耳细胞的任何亚群中的内耳细胞靶蛋白的表达水平的方法,其包括:向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者,其中施用导致受试者内耳的任何细胞亚群中的内耳细胞靶蛋白(例如connexin26蛋白)的表达水平增加。在一些实施方案中,内耳靶细胞可以是感觉细胞,例如毛细胞,和/或非感觉细胞,例如支持细胞,和/或内耳细胞的所有或任何亚群。
本文还提供了治疗被鉴定为具有缺陷性内耳细胞靶基因的受试者(例如,动物,例如,哺乳动物,例如,灵长类动物,例如,人)的听力损失,例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失的方法,其包括:向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者。
本文还提供了在鉴定或诊断为患有内耳病症的受试者中恢复突触和/或保存螺旋神经节神经的方法,其包括:向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者。
本文还提供了将前庭导水管的尺寸减小和/或恢复到适当尺寸的方法。本文还提供了将被鉴定或诊断为患有内耳病症的受试者的内淋巴pH恢复到适当和/或可接受水平的方法,其包括:向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者。
本文还提供了方法,其包括向受试者的内耳施用治疗有效量的本文所述的组合物中的任一者。
本文还提供了治疗听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)的手术方法。在一些实施方案中,这些方法包括以下步骤:在第一切口点处将第一切口引入受试者的耳蜗中;和在耳蜗内施用治疗有效量的本文提供的组合物中的任一者。在一些实施方案中,组合物在第一切口点处施用于受试者。在一些实施方案中,组合物进入或通过第一切口施用于受试者。
在本文所述的方法中的任一者的一些实施方案中,本文所述的任何组合物进入或通过耳蜗卵圆窗膜施用于受试者。在本文所述的方法中的任一者的一些实施方案中,本文所述的组合物中的任一者进入或通过耳蜗圆窗膜施用于受试者。在本文所述的方法中的任一者的一些实施方案中,使用能够在圆窗膜中创建多个切口的医疗装置来施用组合物。在一些实施方案中,医疗装置包括多个微针。在一些实施方案中,医疗装置包括多个微针,该多个微针包括大致圆形的第一方面,其中每个微针具有至少约10微米的直径。在一些实施方案中,医疗装置包括基部和/或能够容纳组合物的储存器。在一些实施方案中,医疗装置包括多个中空微针,该多个中空微针分别包括能够转移组合物的内腔。在一些实施方案中,医疗装置包括用于生成至少部分真空的手段。
在一些实施方案中,本公开的技术用于治疗患有听力损失或有听力损失风险的受试者。例如,在一些实施方案中,受试者具有常染色体隐性听力损失,其归因于GJB2的至少一个致病变体。本领域人员将理解,GJB2的许多不同突变可以导致致病变体。在一些此类实施方案中,致病变体导致听力损失或有导致听力损失的风险。
在一些实施方案中,将对经历听力损失的受试者进行评价,以确定是否以及在何处可能存在可能导致听力损失的一个或多个突变。在一些此类实施方案中,将评价GJB2基因产物或功能的状态(例如,经由蛋白质或测序分析)。在本文所述的方法中的任一者的一些实施方案中,受试者或动物是哺乳动物,在一些实施方案中,哺乳动物是家养动物、农场动物、动物园动物、非人灵长类动物或人。在本文所述的方法中的任一者的一些实施方案中,动物、受试者或哺乳动物是成年人、青少年、幼年、儿童、幼儿、婴儿或新生儿。在本文所述的方法中的任一者的一些实施方案中,动物、受试者或哺乳动物为1-5、1-10、1-20、1-30、1-40、1-50、1-60、1-70、1-80、1-90、1-100、1-110、2-5、2-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、10-110、20-40、20-50、20-60、20-70、20-80、20-90、20-100、20-110、30-50、30-60、30-70、30-80、30-90、30-100、40-60、40-70、40-80、40-90、40-100、50-70、50-80、50-90、50-100、60-80、60-90、60-100、70-90、70-100、70-110、80-100、80-110或90-110岁龄。在本文所述的方法中的任一者的一些实施方案中,受试者或哺乳动物为1、2、3、4、5、6、7、8、9、10或11月龄。
在本文所述的方法中的任一者的一些实施方案中,该方法导致有此需要的受试者的听力的改善(例如,本文所述的用于确定听力改善的指标中的任一者)至少10天、至少15天、至少20天、至少25天、至少30天、至少35天、至少40天、至少45天、至少50天、至少55天、至少60天、至少65天、至少70天、至少75天、至少80天、至少85天、至少100天、至少105天、至少110天、至少115天、至少120天、至少5个月、至少6个月、至少7个月、至少8个月、至少9个月、至少10个月、至少11个月,或至少12个月。
在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)患有或有发生综合征性或非综合征性感觉神经性听力损失的风险。在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)先前已被鉴定为具有GJB2基因的突变。在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)具有本文所述的或本领域已知的与综合征性或非综合征性感觉神经性听力损失相关联的GJB2基因的突变中的任一者。
在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)已被鉴定为GJB2基因突变的携带者(例如,通过基因测试)。在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)已被鉴定为具有GJB2基因的突变,并已被诊断患有综合征性或非综合征性感觉神经性听力损失。在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)已被鉴定为患有综合征性或非综合征性感觉神经性听力损失。
在一些实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)已被鉴定为有听力损失的风险(例如,有成为基因突变,例如,GJB2突变的携带者的风险)。在一些此类实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)可能具有听力损失的某些风险因素或听力损失的风险(例如,已知的亲代携带者、受影响的兄弟姐妹,或听力损失的症状)。在一些此类实施方案中,受试者(例如,动物,例如,哺乳动物,例如,人)已被鉴定为GJB2基因突变的携带者(例如,通过基因测试),该突变以前未被鉴定(即,不是已发表的或其他已知的GJB2变体)。在一些此类实施方案中,鉴定的突变可能是新的(即以前没有在文献中描述过),并且治疗患有或易患听力损失的受试者的方法将根据特定患者的突变进行个性化。
在一些实施方案中,可以使用本领域已知的常规功能性听力测试中的任一者来确定受试者的综合征性或非综合征性感觉神经性听力损失的成功治疗。功能性听力测试的非限制性实例是各种类型的听觉测定(例如,纯音测试、言语测试、中耳测试、听觉脑干反应和耳声发射)。
在本文提供的任何方法的一些实施方案中,将两个或更多个剂量的本文所述的任何组合物引入或施用到受试者的耳蜗中。这些方法中的任一者的一些实施方案可以包括将第一剂的组合物引入或施用到受试者的耳蜗中,在引入或施用第一剂后评估受试者的听力功能,并将额外剂量的组合物施用到发现不具有正常范围内的听力功能的受试者的耳蜗中(例如,如使用本领域已知的任何听力测试确定)。
在本文提供的任何方法的一些实施方案中,组合物可以配制用于耳蜗内施用。在本文所述的方法中的任一者的一些实施方案中,本文所述的组合物可以经由耳蜗内施用或局部施用来施用。在本文所述的方法中的任一者的一些实施方案中,通过使用医疗装置(例如,本文所述的示例性医疗装置中的任一者)来施用组合物。
在一些实施方案中,可以使用本文所述或本领域已知的方法中的任一者进行耳蜗内施用。例如,在一些实施方案中,可以使用以下手术技术将组合物施用或引入到耳蜗中:首先使用0度、2.5mm刚性内窥镜进行可视化,清理外耳道并使用圆刀锐利地描绘出约5mm鼓膜耳道皮瓣(tympanomeatal flap)。然后将鼓膜耳道皮瓣抬高,并从后方进入中耳。鉴定并分离鼓索神经,并使用刮匙去除盾骨,暴露圆窗膜。为了增强所施用或引入的组合物的顶端分布,可以使用外科激光器在卵形窗中作小的2mm开窗,以在组合物的跨圆窗膜输注期间允许外淋巴移位。然后预充微量输注装置并带入术野(surgical field)。该装置***纵到圆窗,并且使尖端就座在骨圆窗悬垂物内,以允许微针穿透膜。接合脚蹬以允许对组合物进行测量的、稳定的输注。然后撤出该装置,并用明胶海绵贴片密封圆窗和镫骨足板
在本文提供的任何方法的一些实施方案中,受试者患有或有发生综合征性或非综合征性感觉神经性听力损失的风险。在本文提供的任何方法的一些实施方案中,受试者先前已被鉴定为具有内耳细胞靶基因的突变,该基因可以在支持细胞和/或毛细胞中表达。
在本文提供的任何方法的一些实施方案中,受试者已被鉴定为内耳细胞靶基因突变的携带者(例如,通过基因测试)。在本文提供的任何方法的一些实施方案中,受试者已被鉴定为具有内耳细胞靶基因的突变,并已被诊断患有听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失,例如,DFNB1、DFNA3)。分别为Bart-Pumphrey综合征、豪猪样鱼鳞病伴耳聋(HID)、掌跖角化病伴耳聋、角膜炎-鱼鳞病-耳聋(KID)综合征,或Vohwinkel综合征)。在本文所述的方法中的任一者的一些实施方案中,受试者已被鉴定为患有听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)。在一些实施方案中,可以使用本领域已知的常规功能性听力测试中的任一者来确定受试者的听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)的成功治疗。功能性听力测试的非限制性实例包括各种类型的测听测定(例如,纯音测试、言语测试、中耳测试、听觉脑干反应和耳声发射)。
在一些实施方案中,受试者细胞是在体外的。在一些实施方案中,受试者细胞最初获得自受试者并离体培养。在一些实施方案中,受试者细胞先前已被鉴定为具有缺陷性内耳细胞靶基因。在一些实施方案中,受试者细胞先前已被鉴定为有缺陷性毛细胞靶基因。在一些实施方案中,受试者细胞先前已被鉴定为具有缺陷性支持细胞靶基因。
在这些方法的一些实施方案中,在治疗后,例如,一次或两次或更多次施用本文所述的组合物后,活性内耳细胞靶蛋白(例如,connexin 26蛋白)的表达增加。在一些实施方案中,本文所述的活性内耳靶蛋白(例如,connexin 26蛋白)的表达增加是相对于对照水平,例如,与引入包含本文所述的任何构建体的组合物之前的内耳细胞靶蛋白的表达水平相比。
检测靶蛋白(例如,connexin 26蛋白)的表达和/或活性的方法是本领域中已知的。在一些实施方案中,可以直接检测内耳细胞靶蛋白的表达水平(例如,检测内耳细胞靶蛋白或靶mRNA。可以用于直接检测靶RNA或蛋白(例如,GJB2基因产物和/或connexin 26蛋白或其功能特征部分)的表达和/或活性的技术的非限制性实例包括:实时PCR、Western印迹、免疫沉淀、免疫组织化学、质谱法或免疫荧光。在一些实施方案中,可以间接检测内耳细胞靶蛋白的表达(例如,通过功能性听力测试)。
装置、施用和手术方法
本文提供了用于治疗听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)的治疗性递送***。在一个方面,治疗性递送***包括:i)能够在有此需要的受试者内耳的圆窗膜中创建一个或多个切口的医疗装置,以及ii)有效剂量的组合物(例如,本文所述的组合物中的任一者)。在一些实施方案中,医疗装置包括多个微针。
本文还提供了治疗听力损失(例如,非综合征性感觉神经性听力损失或综合征性感觉神经性听力损失)的手术方法。在一些实施方案中,方法的步骤是:在第一切口点处将第一切口引入受试者的耳蜗中;和在耳蜗内施用治疗有效量的本文提供的组合物中的任一者。在一些实施方案中,组合物在第一切口点处施用于受试者。在一些实施方案中,组合物进入或通过第一切口施用于受试者。
在本文提供的任何方法的一些实施方案中,本文所述的组合物中的任一者进入或通过耳蜗卵圆窗膜施用于受试者。在本文提供的任何方法的一些实施方案中,本文所述的组合物中的任一者进入或通过耳蜗圆窗膜施用于受试者。在本文提供的任何方法的一些实施方案中,使用能够在圆窗膜中创建多个切口的医疗装置来施用组合物。在一些实施方案中,医疗装置包括多个微针。在一些实施方案中,医疗装置包括多个微针,该多个微针包括大致圆形的第一方面,其中每个微针具有至少约10微米的直径。在一些实施方案中,医疗装置包括基部和/或能够容纳组合物的储存器。在一些实施方案中,医疗装置包括多个中空微针,该多个中空微针分别包括能够转移组合物的内腔。在一些实施方案中,医疗装置包括用于生成至少部分真空的手段。
在一些实施方案中,本公开描述了利用微创、广为接受的手术技术来通过外耳道进入中耳和/或内耳的递送方法。该规程包括在卵形窗处打开中耳和内耳之间的物理屏障之一,并随后使用本文公开的装置,例如,如图8-11中所示的装置(或微导管)以经由圆窗膜,以受控流速和固定体积递送本文公开的组合物。
在一些实施方案中,用于哺乳动物(例如,啮齿动物(例如,小鼠、大鼠、仓鼠或兔)、灵长类(例如,NHP(例如,猕猴、黑猩猩、猴或猿)或人)的手术规程可以包括通气以增加沿耳蜗长度方向的AAV载体转导率。在一些实施方案中,与进行通气的手术后的AAV载体耳蜗细胞转导率相比,手术期间缺乏通气可能导致较低的AAV载体耳蜗细胞转导率。在一些实施方案中,通气促进整个耳蜗中约75-100%的IHC的转导率。在一些实施方案中,通气允许在耳蜗底部的约50-70%、约60-80%、约70-90%或约80-100%的IHC转导率。在一些实施方案中,通气允许在耳蜗顶端处的约50-70%、约60-80%、约70-90%或约80-100%的IHC转导率。
本文所述的递送装置可以放置在手术室的无菌区中,并且可以将管的末端从无菌区移除并连接到已经装载有本文公开的组合物(例如,一种或多种AAV载体)的注射器并安装在泵中。在对***进行适当预充以去除任何空气之后,然后可以在可视化(手术显微镜、内窥镜和/或远端尖端照相机)下将针穿过中耳。可以使用针(或微针)以刺穿RWM。可以***针直到止动器接触到RWM。然后可以将装置保持在该位置,同时将本文公开的组合物以受控的流速递送至内耳,持续选定的持续时间。在一些实施方案中,流速(或输注速率)可以包括约30μL/min,或约25μL/min至约35μL/min,或约20μL/min至约40μL/min的速率,或约20μL/min至约70μL/min,或约20μL/min至约90μL/min,或约20μL/min至约100μL/min。在一些实施方案中,流速为约20μL/min、约30μL/min、约40μL/min、约50μL/min、约60μL/min、约70μL/min、约80μL/min、约90μL/min或约100μL/min。在一些实施方案中,选定的持续时间(即,本文公开的组合物流动期间的时间)可以是约3分钟,或约2.5分钟至约3.5分钟,或约2分钟至约4分钟,或约1.5分钟至约4.5分钟,或约1分钟至约5分钟。在一些实施方案中,流至内耳的本文公开的组合物的总体积可以为约0.09mL,或约0.08mL至约0.10mL,或约0.07mL至约0.11mL。在一些实施方案中,本文公开的组合物的总体积等于内耳体积的约40%至约50%。
一旦递送完成,可以移除装置。在一些实施方案中,本文所述的装置可以配置为一次性使用的产品。在其他实施方案中,本文所述的装置可以配置为多用途、可灭菌产品,例如,具有可更换和/或可灭菌的针子组件。一次性使用的装置可以在施用完成后适当地丢弃(例如,在生物危害锐器容器中)。
在一些实施方案中,本文公开的组合物包含一种或多种AAV构建体。在一些实施方案中,当组合物中包含多于一种AAV构建体时,AAV构建体各自不同。在一些实施方案中,AAV构建体包含抗VEGF编码区,例如,如本文所述。在一些实施方案中,组合物包含rAAV颗粒,其包含本文所述的AAV构建体。在一些实施方案中,rAAV颗粒由Anc80衣壳衣壳化。在一些实施方案中,Anc80衣壳包含SEQ ID NO:44的多肽。
在一些实施方案中,本文公开的组合物可以通过手术规程施用于受试者。在一些实施方案中,施用,例如经由手术规程包括经由本文所述的递送装置将本文公开的组合物注射到内耳中。在一些实施方案中,本文公开的手术规程包括进行经管鼓室切开术(transcanal tympanotomy);进行激光辅助显微镫骨足板造孔术(laser-assisted micro-stapedotomy);以及经由如本文所述的递送装置将本文公开的组合物注射到内耳中。
在一些实施方案中,手术规程包括进行经管鼓室切开术;进行激光辅助显微镫骨足板造孔术;经由如本文所述的递送装置将本文公开的组合物注射到内耳中;在受试者的圆窗和/或卵圆窗周围应用密封剂;并将受试者的鼓膜耳道皮瓣降低到解剖位置。
在一些实施方案中,手术规程包括进行经管鼓室切开术;准备受试者的圆窗;进行激光辅助显微镫骨足板造孔术;准备如本文所述的递送装置和本文所公开的组合物以递送至内耳;经由递送装置将本文公开的组合物注射到内耳中;在受试者的圆窗和/或卵圆窗周围应用密封剂;并将受试者的鼓室皮瓣降低到解剖位置。
在一些实施方案中,进行激光辅助显微镫骨足板造孔术包括使用KTP耳科激光和/或CO2耳科激光。
作为另一个实例,本文公开的组合物使用专门设计用于耳蜗内施用途径的装置和/或***施用。在一些实施方案中,本文所述的装置的设计元素可以包括:保持所注射流体的无菌性;最小化引入内耳的气泡;能够以受控的速度精确地递送小体积;由外科医师通过外耳道递送;最小化对圆窗膜(RWM)或内耳,例如RWM之外的耳蜗结构的损伤;和/或最小化通过RWM回漏的所注射流体。
本文提供的装置、***和方法还描述了将组合物安全且高效地递送至内耳的潜力,以便治疗将受益于将本文公开的组合物递送至内耳的病况和病症,包括但不限于不限于听力障碍,例如,如本文所述。作为另一个实例,通过在镫骨足板中放置通气孔并通过RWM注射,本文公开的组合物分散在整个耳蜗中,在作用部位具有最小的稀释度。所描述的装置的开发允许通过人的外耳道进行手术施用规程。在将一定量的流体输注到耳蜗的外淋巴中后,可以从耳中移除所描述的装置。在受试者中,该装置可以在外科显微镜控制下或与内窥镜一起通过外耳道推进。
用于本文所公开的方法中的任一者的示例性装置在图8-11中描述。图8例示了用于将流体递送到内耳的示例性装置10。装置10包括滚花手柄12和与可伸缩海波管针支撑物24耦合的远端手柄粘合剂14(例如,环氧树脂,诸如Loctite 4014)。滚花手柄12(或手柄部分)可以包括滚花特征和/或凹槽以增强握把。滚花手柄12(或手柄部分)可以是从约5mm至约15mm厚,或从约5mm至约12mm厚,或从约6mm至约10mm厚,或从约6mm至约9mm厚,或从约7mm至约8mm厚。滚花手柄12(或手柄部分)可以是中空的,使得流体可以在使用期间通过装置10。装置10还可以包括在滚花手柄12的近端18处的近端手柄粘合剂16、在装置10的远端20处具有止动器28(显示于图34)的针子组件26(显示于图9)和应变消除特征22。应变消除特征22可以由Santoprene材料、Pebax材料、聚氨酯材料、硅树脂材料、尼龙材料和/或热塑性弹性体构成。可伸缩海波管针支撑物24围绕并支撑设置在其中的弯针38(显示于图9)。
仍然参考图8,止动器28可以由热塑性材料或塑料聚合物(诸如UV固化聚合物)以及其他合适的材料构成,并且可以用于防止弯针38被***到耳道中太远(例如,为了防止弯针38***侧壁或其他内耳结构)。装置10还可以包括锥形部分23,该锥形部分23设置在滚花手柄12和与可伸缩海波管针支撑物24耦合和远端手柄粘合剂14之间。滚花手柄12(或手柄部分)可以包括在手柄部分12的远端的锥形部分23。装置10还可以包括与装置10的近端16流体连接并充当将装置连接到上游部件(例如,泵、注射器和/或在一些实施方案中可以与控制***和/或电源耦合的上游部件(未显示))的流体入口管线的管道36。在一些实施方案中,弯针38(显示于图9)从远端20延伸,通过可伸缩海波管针支撑物24,通过锥形部分23,通过滚花手柄12,并通过应力消除特征22,并且直接流体连接到管道36。在其他实施方案中,弯针38与滚花手柄的中空内部流体连接(例如,通过可伸缩海波管针支撑物24),后者转而在近端16与管道36流体连接。在弯针38不一直延伸通过装置10的内部的实施方案中,接触面积(例如,在重叠的嵌套海波管42之间)、公差和/或接口部件之间的密封剂必须足够以防止治疗性流体泄漏出装置10(其在相对低的压力下(例如,从约1帕斯卡(Pascal)到约50Pa,或从约2Pa到约20Pa,或从约3Pa至约10Pa)操作)。
图9例示了根据本公开实施方案的方面的弯针子组件26的侧视图。弯针子组件26包括具有弯曲部分32的针38。弯针子组件26还可以包括与弯曲部分32耦合的止动器28。弯曲部分32包括在装置10的远端20处的用于刺穿耳膜(例如,RWM)的成角度尖端34。针38、弯曲部分32和成角度尖端34是中空的,使得流体可以从中流过。弯曲部分32的角度46(显示于图11)可以变化。止动器28的几何形状可以是圆柱形、盘形、环形、圆顶形和/或其他合适的形状。止动器28可以模制在弯曲部分32上的适当位置。例如,止动器28可以使用粘合剂或压合接头(compression fitting)围绕弯曲部分32同中心地定位。粘合剂的实例包括UV固化粘合剂(诸如Dymax 203A-CTH-F-T)、弹性体粘合剂、热固性粘合剂(诸如环氧树脂或聚氨酯)或乳液粘合剂(诸如聚醋酸乙烯酯)。止动器28同中心地安装在弯曲部分32周围,使得有成角度尖端34以期望的***深度***耳中。弯针38可以使用渐进成形以及其他合适的技术由直针形成。
图10示出了用于将流体输送到内耳的示例性装置10的透视图。管道36的长度可以从约1300mm(图10中的尺寸11)到约1600mm,或者从约1400mm到约1500mm,或者从约1430mm到约1450mm。应变释放特征22可以为从约25mm到约30mm长度(图10中的尺寸15),或者从约20mm到约35mm长度。手柄12的长度可以是约155.4mm(图10中的尺寸13),或者从约150mm到约160mm,或者从约140mm到约170mm。可伸缩海波管针支撑物24可以具有两个或更多个嵌套海波管,例如三个嵌套海波管42A、42B和42C,或四个嵌套海波管42A、42B、42C和42D。海波管42A、42B、42C和尖端组件26的总长度(图10中的尺寸17)可以为约25mm至约45mm,或约30mm至约40mm,或约35mm。此外,可伸缩海波管针支撑物24可以具有约36mm、或约25mm至约45mm、或约30mm至约40mm的长度。三个嵌套海波管42A、42B和42C各自可以分别具有3.5mm、8.0mm和19.8mm的长度,正负约20%。可伸缩海波管针支撑物24的最深处的嵌套海波管(或最窄部分)可以同中心地设置在针38周围。
图11例示了根据本公开实施方案的方面的与装置10的远端20耦合的弯针子组件26的透视图。如图11所示,弯针子组件26可以包括与弯曲部分32耦合的针38。在其他实施方案中,弯针38可以是单根针(例如,然后被弯曲使得其包括期望的角度46的直针)。针38可以是33量规的针,或者可以包括从约32到约34,或从约31到35的量规。在更细的量规下,必须注意确保管道36没有扭结或损坏。针头38可以附接到手柄12上,以便将针头38安全且精确地放置到内耳中。如图11所示,弯针子组件26还可以包括设置在弯曲部分32周围的止动器28。图11还显示弯曲部分32可以包括用于刺穿耳膜(例如,RWM)的成角度尖端34。止动器28可以具有约0.5mm,或从约0.4mm到约0.6mm,或约0.3mm到约0.7mm的高度48。弯曲部分32可以具有约1.45mm,或约1.35mm到约1.55mm,或者约1.2mm到约1.7mm的长度52。在其他实施方案中,弯曲部分32可以具有大于2.0mm的长度,使得止动器28的远端和成角度尖端34的远端之间的距离为约0.5mm到约1.7mm,或约0.6mm到约1.5mm,或约0.7mm到约1.3mm,或约0.8mm到1.2mm。图11显示止动器28可以具有圆柱形、盘形和/或圆顶形的几何形状。普通技术人员将理解可以使用其他几何形状。
评价听力损失和恢复
在一些实施方案中,听力功能通过听觉脑干反应测量(ABR)来确定。在一些实施方案中,听力通过测量畸变产物耳声发射(DPOAE)来测试。在一些此类实施方案中,从受试者的一只耳朵或两只耳朵进行测量。在一些此类实施方案中,将记录与同一受试者的先前记录和/或用于定义例如听力损失的此类反应测量的已知阈值与定义为正常听力的可接受的听力范围进行比较。在一些实施方案中,受试者在接受任何治疗之前具有ABR和/或DPOAE测量记录。在一些实施方案中,用本文所述的一种或多种技术治疗的受试者,与治疗前相比,治疗后的ABR和/或DPOAE测量将具有改善。在一些实施方案中,ABR和/或DPOAE测量是在治疗后和治疗后定期随访时进行的。
在一些实施方案中,听力功能是使用言语模式识别确定,或由言语治疗师确定。在一些实施方案中,听力功能是通过纯音测试确定的。在一些实施方案中,听力功能是通过骨传导测试确定的。在一些实施方案中,听力功能是通过声反射测试确定的。在一些实施方案中,听力功能是通过鼓室导抗测试(tympanometry)确定的。在一些实施方案中,听力功能是通过本领域已知的听力分析的任何组合来确定的。在一些此类实施方案中,测量是整体性进行,和/或从受试者的一只或两只耳朵进行的。在一些此类实施方案中,将记录和/或专业分析与同一受试者的先前记录和/或分析,和/或用于定义例如听力损失的此类反应测量的已知阈值与定义为正常听力的可接受的听力范围进行比较。在一些实施方案中,受试者在接受任何治疗之前,已进行言语模式识别、纯音测试、骨传导测试、声反射测试和/或鼓室导抗测试和/或分析。在一些实施方案中,用本文所述的一种或多种技术治疗的受试者,与治疗前相比,治疗后的言语模式识别、纯音测试、骨传导测试、声反射测试和/或鼓室导抗测试将具有改善。在一些实施方案中,言语模式识别、纯音测试、骨传导测试、声反射测试和/或鼓室导抗测试在治疗后和治疗后定期随访时进行。
表征的方法
术语“GJB2基因的突变”是指在已知的共识功能性GJB2基因中的修饰,导致产生具有以下的一项或多项的connexin 26蛋白:一个或多个氨基酸的缺失、一个或多个氨基酸的取代,和一个或多个氨基酸的***,和/或导致哺乳动物细胞中编码的connexin 26蛋白的表达水平与没有突变的哺乳动物细胞中编码的connexin 26蛋白的表达水平相比下降。在一些实施方案中,突变可以导致产生具有一个或多个氨基酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15 16、17、18、19、20或更多氨基酸)缺失的connexin 26蛋白。在一些实施方案中,突变可以导致GJB2基因的移码。术语“移码”在本领域是已知涵盖编码序列中导致编码序列的阅读框发生变化的任何突变。在一些实施方案中,移码可以导致无功能的蛋白质。在一些实施方案中,点突变可以是无义突变(即在基因的外显子中导致提前终止密码子)。无义突变可以导致产生截短的蛋白质(与相应的共识功能性蛋白相比),该蛋白可能是也可能不是功能性的。在一些实施方案中,突变可以导致GJB2 mRNA或connexin 26蛋白或mRNA和蛋白的表达丧失(或水平降低)。在一些实施方案中,突变可以导致产生改变的connexin26蛋白,与共识功能性connexin 26蛋白相比,它的一种或多种生物活性(功能)丧失或降低。
在一些实施方案中,突变是将一个或多个核苷酸***GJB2基因中。在一些实施方案中,突变是在connexin 26基因的调控和/或控制序列中,即不是编码序列的基因的一部分。在一些实施方案中,调控和/或控制序列的突变可能是在启动子或增强子区,并阻止或减少GJB2基因的适当转录。在一些实施方案中,突变是在已知的与connexin 26蛋白相互作用的异源基因,或GJB2基因(例如,GJB6,或其他间隙连接基因)中。
基因分型和/或检测GJB2 mRNA和/或connexin 26蛋白的表达或活性的方法在本领域是已知的(参见,例如,Ito et al.,World J Otorhinolaryngol.2013May 28;3(2):26–34,and Roesch et al.,Int J Mol Sci.2018Jan;19(1):209.,其每一篇通过引用以其整体并入本文)。在一些实施方案中,可以直接检测GJB2 mRNA或connexin 26蛋白的表达水平(例如,检测connexin 26蛋白,检测GJB2 mRNA等)。可以用于直接检测GJB2的表达和/或活性的技术的非限制性实例包括,例如,实时PCR、定量实时PCR、Western印迹、免疫沉淀、免疫组织化学、质谱法或免疫荧光。在一些实施方案中,可以间接检测GJB2和/或connexin 26蛋白的表达(例如,通过功能性听力测试、ABR、DPOAE等)。
在一些实施方案中,组织样品(例如,包含一个或多个内耳细胞,例如,包含一个或多个毛细胞和/或一个或多个支持细胞)可以经由形态学分析评价,以确定毛细胞和/或支持细胞在施用本文所述的任何药剂(例如,组合物,例如,包含构建体和/或颗粒等的组合物)之前和之后的形态。在一些此类实施方案中,可以进行标准的免疫组织化学或组织学分析。在一些实施方案中,如果在体外或离体使用细胞,可以进行额外的免疫细胞化学或免疫组织化学分析。在一些实施方案中,可以对来自受试者或体外细胞群的一个或多个样品进行一个或多个蛋白质或转录物的一个或多个测定(例如,western印迹、ELISA、聚合酶链反应)。
生产方法
AAV***在本领域一般是众所周知的(参见,例如,Kelleher and Vos,Biotechniques,17(6):1110-17(1994);Cotten et al.,P.N.A.S.U.S.A.,89(13):6094-98(1992);Curiel,Nat Immun,13(2-3):141-64(1994);Muzyczka,Curr Top MicrobiolImmunol,158:97-129(1992);and Asokan A,et al.,Mol.Ther.,20(4):699-708(2012),其每一篇通过引用以其整体并入本文)。生成和使用AAV构建体的方法描述于,例如,美国专利号5,139,941、4,797,368和PCT申请US2019/060328中,其每一篇通过引用以其整体并入本文。
用于获得病毒构建体的方法在本领域是已知的。例如,为了生产AAV构建体,该方法通常涉及培养宿主细胞,其含有编码AAV衣壳蛋白或其片段的核酸序列;功能性代表基因;由AAV反向末端重复(ITR)和编码序列构成的重组AAV构建体;和/或足够的辅助功能以允许将重组AAV构建体包装到AAV衣壳蛋白中。
在一些实施方案中,待在宿主细胞中培养以将AAV构建体包装到AAV衣壳中的组分可以反式提供给宿主细胞。替代地,任何一个或多个组分(例如,重组AAV构建体、rep序列、cap序列和/或辅助功能)可以由稳定的宿主细胞提供,该宿主细胞已使用本领域技术人员已知的方法工程化改造为含有一个或多个此类组分。在一些实施方案中,此类稳定的宿主细胞含有在诱导型启动子的控制下的此类组分。在一些实施方案中,此类组分可以在组成型启动子的控制下。在一些实施方案中,选定的稳定宿主细胞可以含有在组成型启动子控制下的选定组分和在一个或多个诱导型启动子控制下的其他选定组分。例如,可以生成稳定的宿主细胞,该细胞衍生自HEK293细胞(其含有在组成型启动子的控制下的E1辅助功能),但该细胞含有在诱导型启动子的控制下的rep和/或cap蛋白。其他稳定的宿主细胞可以由本领域技术人员使用常规方法生成。
生产本公开的AAV所需的重组AAV构建体、rep序列、cap序列和辅助功能可以使用任何适当的遗传元件(例如,构建体)递送到包装宿主细胞。选定的遗传元件可以通过本领域,例如,对于核酸操作技术人员来说,已知的任何合适的方法来递送并且包括基因工程、重组工程和合成技术(参见,例如,Sambrook et al.,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,which is incorporatedin its entirety herein by reference)。类似地,生成AAV颗粒的方法是众所周知的,并且任何合适的方法可以用于本公开(参见,例如,K.Fisher et al.,J.Virol.,70:520-532(1993)和美国专利号5,478,745,其通过引用以其整体并入本文)。
在一些实施方案中,重组AAV可使用三重转染方法生产(例如,如美国专利号6,001,650中所述,其通过引用以其整体并入本文)。在一些实施方案中,重组AAV是通过用待包装成AAV颗粒的重组AAV构建体(包含编码序列)、AAV辅助功能构建体和附属功能构建体转染宿主细胞来产生。AAV辅助功能构建体编码“AAV辅助功能”序列(即rep和cap),其反式功能用于生产性AAV复制和衣壳化。在一些实施方案中,AAV辅助功能构建体支持高效AAV构建体生产,而不生成任何可检测的野生型AAV颗粒(即含有功能性rep和cap基因的AAV颗粒)。适合与本公开使用的构建体的非限制性实例包括pHLP19(参见,例如,美国专利号6,001,650,其通过引用以其整体并入本文)和pRep6cap6构建体(参见,例如,美国专利号6,156,303,其通过引用以其整体并入本文)。附属功能构建体编码AAV复制所依赖的非AAV衍生病毒和/或细胞功能(即“附属功能”)的核苷酸序列。附属功能可以包括AAV复制所需的那些功能,包括但不限于参与AAV基因转录的激活、阶段特异性AAV mRNA剪接、AAV DNA复制、cap表达产物的合成和AAV衣壳组装的那些部分。基于病毒的附属功能可以来自任何已知的辅助病毒,诸如腺病毒、疱疹病毒(除单纯疱疹病毒1型外)和牛痘病毒。
用于生成和分离适合于递送给受试者的AAV病毒构建体的其他方法描述于,例如美国专利号7,790,449;美国专利号7,282,199;WO 2003/042397;WO 2005/033321,WO2006/110689;和美国专利号7,588,772中,其每一篇通过引用以其整体并入本文。在一个***中,生产细胞系用编码侧翼为ITR的编码序列的构建体和编码rep和cap的构建体瞬时转染。在另一个***中,稳定供应rep和cap的包装细胞系用编码侧翼为ITR的编码序列的构建体瞬时转染。在这些***的每一个中,AAV颗粒响应于辅助腺病毒或疱疹病毒的感染而产生,并且AAV与污染病毒分离。其他***不需要用辅助病毒感染来恢复AAV——辅助功能(即腺病毒E1、E2a、VA和E4或疱疹病毒UL5、UL8、UL52和UL29以及疱疹病毒聚合酶)也由***反式供应。在此类***中,辅助功能可以通过用编码辅助功能的构建体瞬时转染细胞来供应,或者细胞可以工程化改造以稳定地含有编码辅助功能的基因,其表达可以在转录或转录后水平上控制。
在一些实施方案中,确定纯化后的病毒构建体滴度。在一些实施方案中,使用定量PCR确定滴度。在某些实施方案中,利用对构建体特异的TaqMan探针来确定构建体水平。在某些实施方案中,TaqMan探针由SEQ ID NO:58表示,而正向和反向扩增引物分别由SEQ IDNO:59和60示例。
用于量化构建体的示例性Taqman探针(SEQ ID NO:58)
/56-FAM/TCTGGCTCA/ZEN/CCGTCCTCTTCATTT/3IABkFQ/
用于量化构建体的示例性正向qPCR引物(SEQ ID NO:59)
CAAACACTCCACCAGCATTG
用于量化构建体的示例性反向qPCR引物(SEQ ID NO:60)
CAGCCACAACGAGGATCATA
如本文所述,在一些实施方案中,本公开的病毒构建体是腺相关病毒(AAV)构建体。已经表征若干AAV血清型,包括AAV1、AAV2、AAV3(例如AAV3B)、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV Anc80,以及其变体。在一些实施方案中,AAV颗粒是AAV2/6、AAV2/8、AAV2/9或AAV2/Anc80颗粒(例如,具有AAV6、AAV8、AAV9或Anc80衣壳和具有AAV2ITR的构建体)。其他AAV颗粒和构建体描述于,例如Sharma et al.,Brain ResBull.2010Feb 15;81(2-3):273,其通过引用以其整体并入本文。通常,任何AAV血清型可以用于递送本文所述的编码序列。然而,血清型具有不同的趋向性,例如,它们优先感染不同的组织。在一些实施方案中,AAV构建体是自互补的AAV构建体。
除其他外,本公开提供了制备基于AAV的构建体的方法。在一些实施方案中,此类方法包括使用宿主细胞。在一些实施方案中,宿主细胞是哺乳动物的细胞。宿主细胞可以用作AAV辅助构建体、AAV小基因质粒、附属功能构建体和/或与重组AAV生产相关的其他转移DNA的接受者。该术语包括已转染的原始细胞的后代。因此,如本文所用,“宿主细胞”可以指已用外源性DNA序列转染的细胞。可以理解的是,由于自然的、偶然的或故意的突变,单个亲代细胞的后代在形态上或在基因组或总DNA补足物上不一定与原始亲代完全相同。
用于生成和分离适合于传递给受试者的AAV颗粒的其他方法描述于,例如美国专利号7,790,449;美国专利号7,282,199;WO 2003/042397;WO 2005/033321,WO 2006/110689;和美国专利号7,588,772中,其每一篇通过引用以其整体并入本文。在一个***中,生产细胞系用编码侧翼为ITR的编码序列的构建体和编码rep和cap的构建体瞬时转染。在另一个***中,稳定供应Rep和Cap的包装细胞系用编码侧翼为ITR的编码序列的构建体瞬时转染。在这些***的每一个中,AAV颗粒响应于辅助腺病毒或疱疹病毒的感染而产生,并且AAV颗粒与污染病毒分离。其他***不需要用辅助病毒感染来恢复AAV颗粒——辅助功能(即腺病毒E1、E2a、VA和E4或疱疹病毒UL5、UL8、UL52和UL29,以及疱疹病毒聚合酶)也由***反式供应。在此类***中,辅助功能可以通过用编码辅助功能的构建体瞬时转染细胞来供应,或者细胞可以工程化改造以稳定地含有编码辅助功能的基因,其表达可以在转录或转录后水平上控制。
在又一个***中,侧翼ITR的编码序列和rep/cap基因通过用基于杆状病毒的构建体感染而引入昆虫宿主细胞。此类生产***在本领域是已知的(通常参见,例如,Zhang etal.,2009,Human Gene Therapy 20:922-929,其通过引用以其整体并入本文)。制备和使用这些和其他AAV生产***的方法也描述于美国专利号5,139,941;5,741,683;6,057,152;6,204,059;6,268,213;6,491,907;6,660,514;6,951,753;7,094,604;7,172,893;7,201,898;7,229,823;和7,439,065中,其每一篇通过引用以其整体并入本文。
实施例
参考以下实验性实施例对本公开进行进一步详细说明。提供这些实施例仅用于说明目的,并且不旨在限制,除非另有说明。因此,本公开绝不应被解释为限于以下实施例,而是应被解释为涵盖由于本文提供的教导而变得明显的任何和所有变化。
据信,本领域技术人员或普通技术人员可以利用先前描述和以下实施例,以及本领域已知的内容,制备和利用本公开的技术。
实施例1:病毒构建体的构建
本实施例提供了生成本文所述病毒构建体的描述。重组AAV(rAAV)颗粒是通过用由Xiao et al.,J Virol.73(5):3994-4003,1999使用的无腺病毒方法进行转染而生成的,其通过引用以其整体并入本文。将具有AAV ITR的顺式质粒、具有AAV Rep和Cap基因的反式质粒以及具有来自腺病毒基因组的必需区的辅助质粒在HEK293细胞中共转染。rAAV构建体在单个构建体策略下使用所述构建体表达人connexin 26。制备AAV Anc80衣壳以包囊独特rAAV connexin 26蛋白编码构建体。
本领域的普通技术人员将很容易理解,根据本实施例可以制备类似的构建体。例如,可以在单一、双重或多重构建体策略下生成表达哺乳动物、灵长类动物或人connexin26的rAAV构建体。AAV血清型1、2、3、4、5、6、7、8、9、rh8、rhl0、rh39、rh43和Anc80可以各自制备成包囊四组connexin 26构建体,以测试(i)多联体化-反式剪接策略,(ii)杂合内含子同源重组-反式剪接策略,(iii)外显子同源重组策略,如Pryadkina et al.,Meth.Clin.Devel.2:15009,2015所汇总,其通过引用以其整体并入本文,以及(iv)单个构建体策略。在一些实施方案中,重组AAV(rAAV)颗粒是通过用由Xiao et al.,J Virol.73(5):3994-4003,1999使用的无腺病毒方法进行转染而生成的,其通过引用以其整体并入本文。
实施例2:生成和纯化病毒颗粒
本实施例提供了病毒构建体的纯化的描述。使用三重转染方案产生重组AAV(rAAV)并进行纯化。通过斑点印迹分析级分以确定含有rAAV基因组的级分。使用与AAV构建体基因组的ITR区相对应的引物和探针,通过基于定量实时PCR的滴定方法确定每个制备物的病毒基因组数(vg)(Bartoli et al.,Gene.Ther.13:20-28,2006,其通过引用以其整体并入本文)。
在本实施例的一些实施方案中,使用标准的三重转染方案产生重组AAV(rAAV),并通过两个连续的氯化铯(CsCl)密度梯度进行纯化,如Pryadkina et al.,Mol.Ther.2:15009所述,其通过引用以其整体并入本文。在第二次离心结束时,从CsCl密度梯度管中回收500μl的11个级分,并通过在1x PBS中透析进行纯化。通过斑点印迹分析级分以确定含有rAAV基因组的级分。使用与AAV构建体基因组的ITR区相对应的引物和探针,通过基于定量实时PCR的滴定方法确定每个制备物的病毒基因组数(vg)(Bartoli et al.,Gene.Ther.13:20-28,2006,其通过引用以其整体并入本文)。
本领域的普通技术人员将很容易理解,可以根据本实施例进行类似的生产和纯化过程。例如,rAAV颗粒可以使用本领域已知的各种柱色谱法进行纯化,和/或使用替代引物组对病毒基因组进行定量。
实施例3:病毒颗粒的配制剂
本实施例涉及包含rAAV颗粒和生理学上可接受的溶液的组合物的制备。生产rAAV颗粒并纯化至1.2x1013 vg/mL的滴度,然后在生理上可接受的溶液(例如,市售的具有普朗尼克酸F68的1xPBS,制备至最终浓度为:8.10mM磷酸氢二钠、1.5mM磷酸二氢钾、2.7mM氯化钾、172mM氯化钠和0.001%普朗尼克酸F68)以6x104、1.3x105、1.8x105、4.5x109和1.3x1010的稀释度制备。
在另一个实施方案中,生产rAAV并纯化至已知浓度(例如,大约1x1013vg/mL的滴度),然后在生理学上可接受的缓冲液(例如,市售的具有普朗尼克酸F68的1xPBS,制备至最终浓度为:8.10mM磷酸氢二钠、1.5mM磷酸二氢钾、2.7mM氯化钾、172mM氯化钠和0.001%普朗尼克酸F68;或例如,人工外淋巴,包含NaCl,120mM;KCl,3.5mM;CaCl2,1.5mM;葡萄糖,5.5mM;HEPES,20mM,其用NaOH滴定以将其pH调整到7.5(130mM的总Na+浓度),如Chen etal.,J Controlled Rel.110:1-19,2005中所述,其通过引用以其整体并入本文)以期望的浓度制备。本领域的普通技术人员很容易理解,可以根据本实施例制备其他配制剂。例如,rAAV颗粒可以纯化到替代滴度,以替代稀释度制备,并悬浮在替代的合适溶液中。
实施例4:装置描述
本实施例涉及适用于将rAAV颗粒递送至内耳的装置。使用为持续和安全地穿透圆窗膜(RWM)而设计的专用微导管将包含rAAV颗粒的组合物递送到受试者的耳蜗中。使微导管成形使得执行递送规程的外科医师可以经由外耳道进入中耳腔,并使微导管的端部与RWM接触。微导管的远端可以包括至少一个直径为10微米至1000微米的微针,这些微针在RWM中产生的穿孔足以允许所述的构建体(如rAAV构建体)以不损伤内耳的速率(如生理上可接受的速率,如约30μl/min至约90μl/min的速率)进入鼓阶的耳蜗外淋巴,但足够小而无需手术修复即可愈合。微导管的剩余部分,微针的近端,以定义的滴度(例如,约1x1012至5x1013 vg/mL)装载有rAAV/人工淋巴配制剂。微导管的近端连接到允许约30μL至约100μL的精确、低容量输注的显微操作器。
实施例5:GJB2 mRNA和Connexin 26蛋白产生的体外证明(抗Connexin 26抗体)。
本实施例涉及在体外或离体生长的哺乳动物细胞中表达hGJB2基因的rAAV构建体的引入、调控和表达分析。制备模拟品rAAV颗粒、rAAV构建体或包含由Anc80衣壳衣壳化的rAAV构建体(如图2小图(A)-(L)表示)的rAAV颗粒,并使用已知的细胞浓度和已知的感染复数(MOI)(例如,HEK293FT细胞以每孔1.5x105个细胞的密度,以每孔8.0x104、1.5x105、2.4x105或3x105 vg/细胞的MOI接种在24孔格式中)或已知的DNA浓度转导或转染到细胞培养物中(注,数据显示选择滴度下的选择构建体)。使用每孔100μL RIPA缓冲液(ThermoScientific)或350μL RLT Plus RNA裂解缓冲液(Qiagen)在转染后48小时或转导后72小时收获细胞。为了进行蛋白质表达分析,将30微升样品加载至4-12% Bis-Tris蛋白凝胶的各个孔中,并进行本领域已知的标准western印迹规程。使用荧光读取器确定带型,用测试抗connexin 26(Thermo Scientific)和Vinculin或GAPDH作为对照。确定转基因connexin 26蛋白的带型(图3小图(A),图3小图(B),和图3小图(C))。图3小图(C)描绘了从HEK293FT细胞中分离出的蛋白质的带型,以每孔3x105 vg/细胞的MOI用模拟品rAAV颗粒、AAVAnc80-CAG.5UTR.hGJB2.3F.3UTR(图2小图(F),SEQ ID NO:82)、AAVAnc80-smCBA.5UTR.hGJB2.3F.3UTR(图2小图(G),SEQ ID NO:83)、AAVAnc80-CMVeGJB2p.5UTR.hGJB2.3F.3UTR(图2小图(H),SEQ ID NO:84)或AAVAnc80-CAG.hGJB2.FLAG(图2小图(A),SEQ ID NO:45)作为阳性对照转导这些细胞。如图3小图(C)所示,使用CAG启动子以及小CBA启动子检测到稳健的hGJB2信号。在定制的CMV-增强子/GJB2-启动子组合下游表达hGJB2后,也检测到较弱但明显的条带。
对于RNA表达分析。使用RNeasy Mini Kit(Qiagen)提取RNA。使用用hGJB2特异性引物和TaqMan探针(SEQ ID NO:58-60)和人GAPDH TaqMan探针作为对照(LifeTechnologies)进行的定量实时PCR测定相对mRNA表达水平。观察到稳健和剂量依赖性的GJB2 mRNA产生(图4)。
此外,还进行实验以确定来自转导到野生型外植体(离体)的rAAV构建体的mRNA表达水平。制备模拟品rAAV颗粒或由Anc80衣壳衣壳化的包含rAAV构建体的rAAV颗粒(如图2小图(A)-(E)表示;数据显示在选择滴度下的选择构建体),并以1.2x1010或3.6x1010 vg/耳蜗的MOI转导至外植体。使用350μL RLT Plus RNA裂解缓冲液(Qiagen)在转导后72小时收获细胞,并使用RNeasy Micro Kit(Qiagen)制备RNA样品。使用用hGJB2特异性引物和TaqMan探针(SEQ ID NO:58-60)和人GAPDH TaqMan探针作为对照(Life Technologies)进行的定量实时PCR测定相对mRNA表达水平。观察到稳健和剂量依赖性的GJB2 mRNA产生(图4)。
进一步,进行实验以证明转染到HEK293FT细胞的rAAV构建体的mRNA表达调控。包含hGJB2.FLAG(CAG.5UTR.hGJB2.FLAG.3UTR;SEQ ID NO:82)和位于3’UTR的任选miRNA调控靶位点(miRTS)(CAG.5UTR.hGJB2.FLAG.miRTS.3UTR;图2M;SEQ ID NO:87)的rAAV构建体以300ng转染到HEK293FT细胞中,其中有(+)或没有(-)以400ng转染的包含miRNA编码区(例如,miR-182和miR-183)的附加质粒。在转染后72小时,收获细胞使用western印迹分析(参见图7小图(A))和实时qPCR(参见图7小图(B))进行GJB2蛋白和RNA分析。与表达单独的靶质粒的样品相比,在共同表达靶质粒和miR-182和miR-183的样品中检测到GJB2 RNA和蛋白表达的减少。包含不包括miR-182和miR-183靶位点的质粒的类似hGJB2.FLAG用作对照,并且在有和没有miR-182和miR-183共表达的情况下呈现类似的hGJB2蛋白水平(参见图7小图(A)和图7小图(B))。
本领域的普通技术人员将很容易理解,存在进行与当前实施例相关的实验的替代方法,例如,替代的病毒滴度、MOI、细胞浓度、细胞收获的时间、用于细胞收获或mRNA或蛋白质分析的试剂、AAV血清型和/或对包含SLC26A4基因的构建体的标准修饰是当前实施例的实际和预期的改变。
实施例6:对新生儿耳蜗外植体中转基因GJB2 mRNA表达和connexin 26蛋白产生的初步毛细胞耐受性评估。
本实施例涉及在新生儿耳蜗外植体中过量表达GJB2基因的rAAV构建体的引入和表达分析。制备模拟品rAAV颗粒或由Anc80衣壳衣壳化的包含rAAV构建体的rAAV颗粒(图2小图(A)-(L)),并以已知的MOI(例如,约4.5x109或1.3x1010 vg/每耳蜗)转导至新生儿耳蜗外植体。外植体生长到适合收获的水平(例如,转导后72小时),然后通过使用4%PFA固定准备免疫荧光染色/成像或RNA提取。制备RNA样品,并使用构建体特异性引物,使用用适当的试剂按已发表方法中描述的方式(例如,根据RNeasy Micro Kit和定量实时PCR的适当方法)进行的定量PCR确认GJB2基因过表达并相对于对照。当与模拟品转导事件相比,在用测试rAAV转导的外植体中观察到稳健的GJB2 mRNA生产。使用免疫荧光染色/成像来确定毛细胞毒性的耐受性和缺乏,利用靶向Myo7a(Proteus Biosciences)的抗体来描绘内耳毛细胞,同时使用DAPI染色来定义核定位。在GJB2过表达后,观察到无或较低的毛细胞(Myo7)毒性。
制备由CAG、CMV-GJB2p或smCBA启动子/增强子组合驱动的rAAV Anc80颗粒,并以已知的MOI(分别约5.8x109、1.4x1010或1.8x1010 vg/每耳蜗)转导至小鼠新生儿(P2)耳蜗外植体。外植体生长到适合收获的水平(例如,转导后72小时),然后通过使用4%PFA固定准备免疫荧光染色/成像。然后外植体用DAPI进行染色(呈现为蓝色)并使用抗FLAG抗体(呈现为绿色)和毛细胞特异性抗Myo7a抗体(呈现为红色)进行免疫染色,随后对外植体进行成像(示例性数据呈现于图6)。在用包含AAVAnc80-CAG.5UTR.hGJB2.3F.3UTR(如图2小图(F)中所描绘,SEQ ID NO:82)的rAAV颗粒以5.8E9 vg/外植体转导的外植体中,观察到稳健的支持细胞特异性FLAG信号(参见图6小图(A))。在用包含AAVAnc80-smCBA.5UTR.hGJB2.3F.3UTR(如图2小图(G)中所描绘,SEQ ID NO:83)的rAAV颗粒以1.4E10vg/外植体转导的外植体中,观察到稳健的支持细胞特异性FLAG信号。在用包含AAVAnc80-CMVeGJB2p.5UTR.hGJB2.3F.3UTR(如图2小图(H)中所描绘,SEQ ID NO:84)的rAAV颗粒以1.8E10 vg/外植体转导的外植体中观察到稳健的支持细胞特异性FLAG信号。在样品间检测到FLAG表达的变化,这可能是载体滴度变异性的结果。
实施例7:老年小鼠的手术方法
当前实施例涉及将本文所述的构建体引入老年小鼠的内耳。在配制剂缓冲液(例如,人工外淋巴或具有普朗尼克酸F68的1xPBS)中制备包含AAV衣壳和编码connexin 26蛋白或其特征功能部分的构建体的rAAV颗粒,然后如Shu et al.,Human Gene Therapy,27(9):687-699,2016所述,其通过引用以其整体并入本文)施用于小鼠的鼓阶。使用甲苯噻嗪(例如,约5-10mg/kg)和***(例如,约90-120mg/kg)的腹腔注射对年长于P15的雄性和雌性小鼠进行麻醉。使用电热垫将体温维持在37℃。从右耳后区进行切口并暴露鼓泡和后半规管。将大泡用手术针穿孔,并将小孔扩大以提供进入耳蜗的通道。用牙钻将鼓阶的耳蜗侧壁的骨头变薄,从而使膜性侧壁保持完整。然后在后半规管(PSCC)上钻小孔。通过可视化外淋巴的缓慢渗出,确认小管造口术的开放性。Nanoliter Microinjection System与玻璃微量移液器结合使用,以约2nL/秒的速率向鼓阶递送总共约1μL的含有构建体的缓冲液(例如,以人工外淋巴或具有普朗尼克酸F68的1xPBS中约4.5x109至5x1010 vg/每耳蜗的本文所述的rAAV构建体)。注射后将玻璃微量移液器留置5分钟。耳蜗造口术和注射后,用小块脂肪密封鼓泡和PSCC的开口,并缝合肌肉和皮肤。让小鼠从麻醉中醒,并用0.15mg/kg盐酸丁丙诺啡控制其疼痛,持续3天。
实施例8:野生型小鼠中connexin 26蛋白的转基因表达和成像。
本实施例涉及野生型小鼠中转基因connexin 26蛋白的转基因表达和分析。野生型小鼠通过实施例7中描述的方法将包含CAG.hGJB2.F.GFP(图2O中提供的示意图)的AAVAnc80颗粒(1.2x1010 vg/耳蜗)施用于耳蜗。施用后10天,在感觉上皮的支持细胞的膜上检测到清晰和稳健的外源性Connexin 26(FLAG;紫色)(图12,中间和右小图)。在内毛细胞中也检测到外源性Connexin 26的表达。在所有支持细胞中均检测到内源性Connexin 26(红色)(图12,左和右小图)。
实施例9:老年GJB2突变体小鼠中Connexin 26蛋白的转基因表达和成像。
本实施例涉及成年小鼠中转基因connexin 26蛋白的转基因表达和分析。在时间控制的他莫西芬诱导的Sox10-CreER x Cx26flox系或CAG-CreER x Cx26flox系中的敲除后,可以生成合适的突变体GJB2小鼠。年老的对照和突变体GJB2小鼠按照动物福利准则饲养,并由机构动物护理和使用委员会(Institutional Animal Care and Use Committee,IACUC)批准,并进行根据实施例7的手术方法。用Anc80L65-GFP病毒或媒介物作为阴性对照,如上所述进行并行假手术。在规定的时间点(例如,手术后1个月、2个月、6个月和12个月),收获小鼠进行免疫荧光染色/成像。所有收获的对照和GJB2突变体小鼠耳蜗切片或整装制片使用用于核表达的DAPI、抗Connexin 26抗体和抗Myo7或抗鬼笔环肽抗体进行成像。
实施例10:GJB2突变体小鼠中Connexin 26蛋白的转基因表达和成像。
本实施例涉及到新生小鼠中转基因connexin 26蛋白的转基因表达和分析。在时间控制的他莫西芬诱导的Sox10-CreER x Cx26flox系或CAG-CreER x Cx26flox系中的敲除后,可以生成合适的突变体GJB2小鼠。将P0至P4龄的新生儿野生型或GJB2突变型小鼠麻醉(例如,通过冰上热疗),以准备引入本文所述的组合物。制备模拟品rAAV颗粒或由Anc80衣壳衣壳化的rAAV构建体(如图2小图(A)-(L)表示),并通过圆窗膜(RWM)或后半规管(PSCC)引入小鼠内耳。rAAV颗粒的引入通过以下步骤进行:A)耳前切口暴露耳蜗泡,B)用微量移液器拉针器(cat#P87-Sutter instruments)拉至约10μm的最终OD的玻璃微量移液器(cat#4878-WPI)用于手动将含有rAAV颗粒的组合物(由Nanoliter 2000显微操纵器-WPI固定的微量移液器)递送至鼓阶,其允许进入内耳细胞,C)将约1μL本文所述的组合物(例如,约4.5x109至5x1010vg/每耳蜗的rAAV构建体)以约0.3μl/min的释放速率注射到每个测试的耳蜗(由MICRO4显微注射控制器-WPI控制)。用Anc80L65-GFP病毒或媒介物如上所述进行假手术作为阴性对照。允许小鼠从手术中恢复,无需额外干预。在P21天评价小鼠生理学。随后或在额外的生理评估后的较晚时间点,收获小鼠进行免疫荧光成像。对照或GJB2突变体小鼠耳蜗切片或整装制片使用用于核表达的DAPI、抗Connexin 26抗体和抗Myo7或抗鬼笔环肽抗体进行成像。
实施例11:GJB2突变体小鼠中GJB2 mRNA和connexin 26蛋白的转基因表达的表型分析。
本实施例涉及在内耳中转基因表达GJB2 mRNA和connexin 26蛋白的小鼠的听力的表型分析。在时间控制的他莫西芬诱导的Sox10-CreER x Cx26flox系或CAG-CreER xCx26flox系中的敲除后,可以生成合适的突变体GJB2小鼠。P0至P4龄的新生儿对照和突变体GJB2小鼠通过冰上热疗麻醉,以准备引入本文所述的组合物。制备媒介物对照、模拟品rAAV颗粒或由Anc80衣壳衣壳化的rAAV构建体(如图2小图(A)-(L)表示),并通过圆窗膜(RWM)或后半规管(PSCC)引入小鼠内耳。rAAV颗粒的引入通过以下步骤进行:A)耳前切口暴露耳蜗泡,B)用微量移液器拉针器(cat#P87-Sutter instruments)拉至约10μm的最终OD的玻璃微量移液器(cat#4878-WPI)用于手动将含有rAAV颗粒的组合物(由Nanoliter 2000显微操纵器-WPI固定的微量移液器)递送至鼓阶,其允许进入内耳细胞,C)将1μL本文所述的组合物(例如,约4.5x109至5x1010 vg/每耳蜗的rAAV构建物)以约0.3μl/min的释放速率注射到每个测试的耳蜗(由MICRO4显微注射控制器-WPI控制)。用Anc80L65-GFP病毒或媒介物如上所述进行假手术作为阴性对照。允许小鼠从手术中恢复,无需额外干预。
在规定的测试时间点(例如,手术后1个月、2个月、6个月和12个月),用腹膜内递送戊巴比妥钠(例如,约35mg/kg)对已经历单侧组合物注射的对照和突变体GJB2小鼠进行麻醉。然后将小鼠置于并维持在接地的、声学和电学绝缘的测试室内的头部固定器上。使用诱发电位检测***(例如Smart EP 3.90,Intelligent Hearing Systems,Miami,FL,USA)来测量小鼠的听觉脑干反应(ABR)的阈值。使用短声以及不同强度(从10到130dB SPL)的8、16和32kHz猝发音来唤起测试小鼠的ABR。用腹外侧***小鼠耳中的皮下针状电极来记录反应信号。假注射的小鼠充当阴性对照,而模拟品注射的耳朵可以充当ABR测试的内部对照,与对照的耳朵和/或动物相比,在测试的耳朵中观察到ABR表现的改善。
实施例12:老年GJB2突变体小鼠中GJB2 mRNA和connexin 26蛋白的转基因表达的表型分析。
本实施例涉及到转基因表达connexin 26蛋白的成年小鼠的听力的表型分析。在时间控制的他莫西芬诱导的Sox10-CreER x Cx26flox系或CAG-CreER x Cx26flox系中的敲除后,可以生成合适的突变体GJB2小鼠。对照和突变体GJB2小鼠按照机构动物护理和使用委员会(IACUC)批准的动物福利准则饲养,并且一旦达到适当的年龄,则进行根据实施例7的手术方法。使用媒介物配方缓冲液或Anc80L65-GFP如上所述进行并行假手术作为阴性对照,。在规定的时间点(例如,手术后1个月、2个月、6个月和12个月),腹膜内递送(例如,用约35mg/kg的戊巴比妥钠或用约5-10mg/kg的甲苯噻嗪和用约90-120mg/kg的***)对小鼠进行麻醉。然后将小鼠置于并维持在接地的、声学和电学绝缘的测试室内的头部固定器上。使用诱发电位检测***(Smart EP 3.90,Intelligent Hearing Systems,Miami,FL,USA)来测量小鼠的听觉脑干反应(ABR)的阈值。使用短声以及不同强度(从10到130dB SPL)的8、16和32kHz猝发音来唤起测试小鼠的ABR。用腹外侧***小鼠耳中的皮下针状电极来记录反应信号。在用本文所述的组合物单侧注射的老年GJB2突变体小鼠的示例性结果中,观察到听力功能的改善。假注射的小鼠充当阴性对照,而模拟品注射的耳朵可以充当ABR测试的对照,与对照的耳朵和/或动物相比,在测试的耳朵中观察到ABR表现的改善。
实施例13:对母体血液进行非侵入性产前测试以检测GJB2突变
本实施例涉及测试母体血液,以在出生前确定后代的GJB2基因型,以促进迅速和有效的治疗干预。母体血液样品(20-40mL)被收集到无细胞DNA(cfDNA)管中。经由2,000g离心20分钟,然后3,220g离心30分钟,在第一次旋转后转移上清液的双重离心方案,从每个样品中分离出至少7mL的血浆。使用QIAGEN QIAmp Circulating Nuclei Acid试剂盒从7-20mL的血浆中分离出cfDNA,并在45μl TE缓冲液中洗脱。从第一次离心后获得的血沉棕黄层中分离出纯的母体基因组DNA。
通过将选择具有探针-探针相互作用的最小化可能性的探针的测定的热力学模型与先前描述的扩增方法(Stiller et al.,2009Genome Res 19(10):1843-1848,其通过引用以其整体并入本文)组合,可以实现11000次测定的复用。母体cfDNA和母体基因组DNA样品使用11,000个靶标特异性测定预扩增15个循环,并将等分试样转移到使用巢式引物的的15个循环第二PCR反应。通过在第三轮12个循环的PCR反应中添加条形码标签,制备用于测序的样品。靶标包括与已知导致DFNB1、DFNA3、Bart-Pumphrey综合征、豪猪样鱼鳞病伴耳聋(HID)、掌跖角化病伴耳聋、角膜炎-鱼鳞病-耳聋(KID)综合征或Vohwinkel综合征的GJB2中的200多个突变相对应的SNP,和/或覆盖GJB2的所有外显子的序列,以便检测任何目前未知但潜在致病的变体。任选地,扩增与其他connexin基因相对应的序列,以鉴定DFNB1、DFNA3、Bart-Pumphrey综合征、豪猪样鱼鳞病伴耳聋(HID)、掌跖角化病伴耳聋、角膜炎-鱼鳞病-耳聋(KID)综合征或Vohwinkel综合征的可能的异源性双基因病例。然后用Illumina HiSeq测序仪对扩增子进行测序。使用市售软件进行基因组序列比对。

Claims (109)

1.构建体,其包含与启动子可操作地连接的编码序列,其中所述编码序列编码connexin 26蛋白。
2.权利要求1的构建体,其中所述编码序列是GJB2基因。
3.权利要求2的构建体,其中所述GJB2基因是灵长类GJB2基因。
4.权利要求2或3的构建体,其中所述GJB2基因是人GJB2基因。
5.权利要求4的构建体,其中所述人GJB2基因包含根据SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3或SEQ ID NO:4的核酸序列。
6.权利要求4或5的构建体,其中所述人GJB2基因包含根据SEQ ID NO:1的核酸序列。
7.权利要求1的构建体,其中所述connexin 26蛋白是灵长类connexin26蛋白。
8.权利要求1或7的构建体,其中所述connexin 26蛋白是人connexin26蛋白。
9.权利要求8的构建体,其中所述connexin 26蛋白包含根据SEQ ID NO:7的氨基酸序列。
10.权利要求1-9中任一项的构建体,其中所述启动子是诱导型启动子、组成型启动子、组织特异性启动子或用于支持的细胞选择性启动子。
11.权利要求1-10中任一项的构建体,其中所述启动子是内耳细胞特异性启动子。
12.权利要求11的构建体,其中所述启动子是内源性GJB2基因启动子。
13.权利要求12的构建体,其中所述启动子包含根据SEQ ID NO:17的核酸序列。
14.权利要求11的构建体,其中所述内耳细胞特异性启动子是GJB6启动子、SLC26A4启动子、TECTA启动子、DFNA5启动子、COCH启动子、NDP启动子、SYN1启动子、GFAP启动子、PLP启动子、TAK1启动子、SOX21启动子、SOX2启动子、FGFR3启动子、PROX1启动子、GLAST1启动子、LGR5启动子、HES1启动子、HES5启动子、NOTCH1启动子、JAG1启动子、CDKN1A启动子、CDKN1B启动子、SOX10启动子、P75启动子、CD44启动子、HEY2启动子、LFNG启动子、GDF6启动子、IGFBP2启动子、RBP7启动子、PARM1启动子、GJB2最小启动子、或S100b启动子。
15.权利要求11的构建体,其中所述启动子能够在内耳支持细胞中表达所述多核苷酸,所述内耳支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure FDA0004046106450000021
器官细胞(KO)、成纤维细胞和侧壁的其他细胞、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)中的一种或多种。
16.权利要求14的构建体,其中所述内耳细胞特异性启动子包含与SEQ ID NO:16、17、61、91、54、55、56、57、62、90、95、98、101和104中的任一个具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。
17.前述权利要求中任一项的构建体,其中所述组成型启动子是CAG启动子、CBA启动子、CMV启动子或CB7启动子。
18.权利要求17的构建体,其中所述启动子包含与SEQ ID NO:10、11、12、13、14和15具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。
19.前述权利要求中任一项的构建体,其进一步包含核酸序列,所述核酸序列包含用于在内耳细胞中表达的microRNA的microRNA调控靶位点(miRTS)。
20.权利要求19的构建体,其中所述microRNA是miR-194、miR-140、miR-18a、miR-99a、miR-30b、miR-15a、miR182或miR-183中的一种或多种。
21.权利要求19的构建体,其中所述microRNA在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞或螺旋缘细胞中的一种或多种中表达。
22.权利要求21的构建体,其中所述microRNA在内耳毛细胞中表达。
23.权利要求22的构建体,其中所述microRNA是miR-194、miR-140、miR-18a、miR-99a、miR-30b、miR-15a、miR182或miR-183中的一种或多种。
24.权利要求21的构建体,其中所述microRNA在螺旋神经节细胞中表达。
25.权利要求24的构建体,其中所述microRNA选自miR-194、miR-18a、miR-99a、miR-30b、miR-15a、miR182或miR-183中的一种或多种。
26.权利要求21的构建体,其中所述microRNA在外侧支持细胞中表达。
27.权利要求26的构建体,其中所述microRNA选自miR-99a、miR-30b或miR-15a中的一种或多种。
28.权利要求21的构建体,其中所述microRNA在基底膜细胞中表达。
29.权利要求28的构建体,所述microRNA选自miR-99a、miR-30b或miR-15a中的一种或多种。
30.权利要求21的构建体,其中所述microRNA在内侧支持细胞中表达。
31.权利要求30的构建体,其中所述microRNA选自miR182和miR-183中的一种或多种。
32.权利要求21的构建体,其中所述microRNA在螺旋缘细胞中表达。
33.权利要求32的构建体,其中所述microRNA选自miR182和miR-183中的一种或多种。
34.权利要求19-33中任一项的构建体,所述microRNA调控靶位点包含与SEQ ID NO:78、79、107、108、109、110、111或112中任一个具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸序列。
35.前述权利要求中任一项的构建体,其中所述构建体进一步包含5’UTR。
36.权利要求35的构建体,其中所述5’UTR包含SEQ ID NO:20、21或66中任一个的核酸序列。
37.前述权利要求中任一项的构建体,其中所述构建体进一步包含3’UTR。
38.权利要求37的构建体,其中所述3’UTR包含SEQ ID NO:22、67、68或69中任一个的核酸序列。
39.权利要求35-38中任一项的构建体,其中所述3’UTR和/或5’UTR包含所述miRTS。
40.前述权利要求中任一项的构建体,其进一步包含polyA尾。
41.权利要求40的构建体,其中所述polyA尾是牛生长激素、小鼠-β-球蛋白、小鼠-α-球蛋白、人胶原蛋白、多瘤病毒、单纯疱疹病毒胸苷激酶基因(HSV TK)、IgG重链基因、人生长激素或SV40晚期和早期poly(A)位点。
42.权利要求41的构建体,其中所述polyA尾是牛生长激素polyA。
43.前述权利要求中任一项的构建体,其进一步包含5’和3’反向末端重复(ITR),其中所述5’ITR和所述3’ITR位于所述启动子和所述多核苷酸的侧翼。
44.权利要求43的构建体,其中所述5’ITR和所述3’ITR是衍生自选自AAV1、AAV2、AAV3(例如AAV3B)、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV Anc80 ITR的血清型的AAV ITR。
45.权利要求43-44的构建体,其中所述AAV ITR衍生自血清型AAV2。
46.权利要求43-45的构建体,其中所述5’AAV ITR包含SEQ ID NO:8或52的核酸序列。
47.权利要求43-46的构建体,其中所述3’AAV ITR包含SEQ ID NO:9或53的核酸序列。
48.权利要求46-47的构建体,其中:
(i)5’ITR包含根据SEQ ID NO:8的核酸序列且3’ITR包含根据SEQ ID NO:9的核酸序列;或
(ii)5’ITR包含根据SEQ ID NO:52的核酸序列且3’ITR包含根据SEQ ID NO:52的核酸序列。
49.权利要求43-48中任一项的构建体,其中(i)所述5’ITR包含SEQ ID NO:8或52的核酸序列,(ii)所述5’UTR包含SEQ ID NO:20、21或66中任一个的核酸,(iii)所述启动子包含SEQ ID NO:10-17、54、55、56、57、61、62、90、91、95、98、101或104中任一个的核酸序列,(iv)所述3’UTR包含SEQ ID NO:22、67、68或69的核酸序列,以及(v)所述3’ITR包含SEQ ID NO:9或53的核酸序列。
50.权利要求49的构建体,其中所述3’UTR和/或所述5’UTR包含所述miRTS。
51.前述权利要求中任一项的构建体,其中所述构建体包含根据SEQ ID NO:45-51、50-51、82-88、94、97、100、103和106中任一个的核酸序列。
52.前述权利要求中任一项的构建体,其中所述构建体是表达盒。
53.载体,其包含前述权利要求中任一项的构建体。
54.权利要求53的载体,其中所述载体是哺乳动物载体或病毒载体。
55.权利要求54的载体,其中所述载体是病毒载体。
56.权利要求55的载体,其中所述病毒载体选自由腺相关病毒(AAV)、腺病毒或慢病毒载体组成的组。
57.权利要求56的载体,其中所述病毒载体是AAV载体。
58.AAV颗粒,其包含前述权利要求中任一项的构建体。
59.权利要求58的AAV颗粒,其进一步包含AAV衣壳,其中所述AAV衣壳是或衍生自AAV1、AAV2、AAV3(例如AAV3B)、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11和AAV Anc80衣壳。
60.权利要求59的AAV颗粒,其中所述AAV衣壳是AAV Anc80衣壳。
61.组合物,其包含权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体或权利要求58-60中任一项的AAV颗粒。
62.权利要求61的组合物,其中所述组合物是药物组合物,任选地其中所述组合物进一步包含药学上可接受的载体。
63.权利要求61或62的组合物,其中所述药物组合物是合成外淋巴溶液。
64.离体细胞,其包含权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体或权利要求58-60的AAV颗粒。
65.权利要求64的离体细胞,其中所述离体细胞是内耳细胞。
66.权利要求65的离体细胞,其中所述离体细胞是内耳支持细胞。
67.权利要求66的离体细胞,其中所述内耳支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure FDA0004046106450000051
器官细胞(KO)、成纤维细胞和侧壁的其他细胞、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)中的一种或多种。
68.方法,其包括用以下转导离体细胞:
(i)权利要求1-52中任一项的构建体或权利要求X中任一项的载体;和
(ii)一种或多种辅助质粒,其共同包含AAV Rep基因、AAV Cap基因、AAV VA基因、AAVE2a基因和AAV E4基因。
69.权利要求68的方法,其中所述离体细胞是内耳细胞。
70.权利要求69的方法,其中所述离体细胞是内耳支持细胞。
71.权利要求70的方法,其中所述内耳支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure FDA0004046106450000061
器官细胞(KO)、成纤维细胞和侧壁的其他细胞、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)中的一种或多种。
72.在有此需要的受试者的内耳支持细胞中表达Connexin 26的方法,其包括向所述受试者施用权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
73.在有此需要的受试者的内耳支持细胞中增加Connexin 26的表达的方法,其包括向所述受试者施用权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
74.权利要求72-73的方法,其中所述Connexin 26的表达在非内耳支持细胞中降低、抑制或消除。
75.在非内耳支持细胞中减少Connexin 26的表达的方法,其包括向所述受试者施用权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
76.权利要求72-75中任一项的方法,其中所述内耳支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure FDA0004046106450000062
器官细胞(KO)、成纤维细胞和侧壁的其他细胞、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)中的一种或多种。
77.在内耳细胞中降低与Connexin 26的表达相关联的毒性的方法,其包括向所述受试者施用权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
78.权利要求77的方法,其中所述内耳细胞选自内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞,或其任何组合。
79.治疗患有听力损失或处于听力损失风险的受试者的听力损失的方法,其包括向所述受试者施用权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
80.权利要求75-79的方法,其中Connexin 26的表达在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中降低、抑制或消除。
81.权利要求75-80中任一项的方法,其中由于Connexin 26的表达而导致的毒性在内耳毛细胞、螺旋神经节细胞、外侧支持细胞、基底膜细胞、内侧支持细胞、螺旋缘细胞、内沟细胞或其任何组合中降低。
82.权利要求72-81的方法,其中Connexin 26主要在内耳支持细胞中表达。
83.权利要求82的方法,其中所述内耳支持细胞选自内指状细胞/边缘细胞(IPhC)、内柱细胞(IPC)、外柱细胞(OPC)、Deiters细胞第1和2排(DC1/2)、Deiters细胞第3排(DC3)、Hensen细胞(Hec)、Claudius细胞/外沟细胞(CC/OSC)、齿间细胞(Idc)、内沟细胞(ISC)、
Figure FDA0004046106450000071
器官细胞(KO)、成纤维细胞和侧壁的其他细胞、大上皮嵴细胞(GER)(包括外侧大上皮嵴细胞(LGER))和OC90+细胞(OC90)中的一种或多种。
84.权利要求72-83中任一项的方法,其中施用是至所述受试者的内耳。
85.权利要求84的方法,其中所述施用是至所述受试者的耳蜗。
86.权利要求85的方法,其中所述施用是经由圆窗膜注射。
87.权利要求72-86中任一项的方法,其进一步包括测量所述受试者的听力水平。
88.权利要求87的方法,其中听力水平通过进行听觉脑干反应(ABR)测试来测量。
89.权利要求87或88的方法,其进一步包括将所述受试者的听力水平与参考听力水平比较。
90.权利要求89的方法,其中所述参考听力水平是已公布的或历史上的参考听力水平。
91.权利要求89的方法,其中所述受试者的听力水平是在引入权利要求61-63的组合物之后测量的,并且所述参考听力水平是在引入权利要求61-63的组合物之前测量的所述受试者的听力水平。
92.权利要求72-91中任一项的方法,其进一步包括测量所述受试者中connexin 26蛋白的水平。
93.权利要求92的方法,其中在所述受试者的内耳中测量所述connexin26蛋白的水平。
94.权利要求92或93的方法,其中在所述受试者的耳蜗中测量所述connexin 26蛋白的水平。
95.权利要求92-94中任一项的方法,其进一步包括将所述受试者中的connexin 26蛋白的水平与参考connexin 26蛋白水平比较。
96.权利要求95的方法,其中所述参考听力水平是已公布的或历史上的参考connexin26蛋白水平。
97.权利要求95的方法,其中在引入权利要求61-63的组合物之后测量所述受试者中的connexin 26蛋白的水平,并且所述参考connexin 26蛋白水平是在引入权利要求61-63的组合物之前测量的所述受试者的connexin 26蛋白水平。
98.权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、或权利要求61-63中任一项的组合物、或权利要求64-67中任一项的离体细胞用于治疗患有听力损失或处于听力损失风险的受试者的听力损失的用途。
99.权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、或权利要求61-63中任一项的组合物、或权利要求64-67中任一项的离体细胞在制造用于治疗听力损失的药物中的用途。
100.权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、或权利要求61-63中任一项的组合物、或权利要求64-67中任一项的离体细胞,其用作药物。
101.权利要求1-52中任一项的构建体、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒、或权利要求61-63中任一项的组合物、或权利要求64-67中任一项的离体细胞,其用于治疗听力损失。
102.试剂盒,其包含1-52、权利要求53-57中任一项的载体、权利要求58-60中任一项的AAV颗粒,或权利要求61-63中任一项的组合物,或权利要求64-67中任一项的离体细胞。
103.权利要求102的试剂盒,其中所述构建体、载体、AAV颗粒、组合物或离体细胞预装载在装置中。
104.权利要求103的试剂盒,其中所述装置是微导管。
105.权利要求104的试剂盒,其中使所述微导管成形,使得其可以经由外耳道进入中耳腔并且使所述微导管的端部与RWM接触。
106.权利要求104或105的试剂盒,其中所述微导管的远端由至少一个直径在10至1000微米之间的微针组成。
107.权利要求102的试剂盒,其进一步包含装置。
108.权利要求107的试剂盒,其中所述装置是图8-11中任一项所描述的装置。
109.权利要求108的试剂盒,其中所述装置包含针,所述针包含弯曲部分和成角度的尖端。
CN202180049197.6A 2020-05-13 2021-05-13 用于治疗gjb2相关听力损失的组合物和方法 Pending CN116096900A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063024468P 2020-05-13 2020-05-13
US63/024,468 2020-05-13
US202163152835P 2021-02-23 2021-02-23
US63/152,835 2021-02-23
PCT/US2021/032354 WO2021231808A2 (en) 2020-05-13 2021-05-13 Compositions and methods for treating gjb2-associated hearing loss

Publications (1)

Publication Number Publication Date
CN116096900A true CN116096900A (zh) 2023-05-09

Family

ID=78525016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180049197.6A Pending CN116096900A (zh) 2020-05-13 2021-05-13 用于治疗gjb2相关听力损失的组合物和方法

Country Status (11)

Country Link
US (1) US20230183743A1 (zh)
EP (1) EP4164695A4 (zh)
JP (1) JP2023526053A (zh)
KR (1) KR20230023641A (zh)
CN (1) CN116096900A (zh)
AU (1) AU2021270308A1 (zh)
CA (1) CA3178197A1 (zh)
CL (1) CL2022003147A1 (zh)
IL (1) IL298091A (zh)
MX (1) MX2022014085A (zh)
WO (1) WO2021231808A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023150689A2 (en) * 2022-02-04 2023-08-10 Decible Therapeutics, Inc. Gjb2 regulatory elements and uses thereof
CN116836975A (zh) * 2022-03-25 2023-10-03 上海玮美基因科技有限责任公司 一种耳蜗和/或前庭细胞特异性启动子及其应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7387614B2 (en) * 2003-08-26 2008-06-17 University Of Maryland, Baltimore Drug delivery to the inner ear and methods of using same
RU2018122564A (ru) * 2013-07-24 2019-03-06 Комиссариат А Л'Энержи Атомик Это Энержи Альтернатив Применение флекаинида в качестве антиконнексинового средства и способ потенцирования эффектов психотропных лекарственных средств
EP3984550A1 (en) * 2015-12-11 2022-04-20 Massachusetts Eye & Ear Infirmary Materials and methods for delivering nucleic acids to cochlear and vestibular cells
US20210079406A1 (en) * 2018-04-10 2021-03-18 President And Fellows Of Harvard College Aav vectors encoding clarin-1 or gjb2 and uses thereof
US20210355504A1 (en) * 2018-10-11 2021-11-18 Decibel Therapeutics, Inc. Aav1 vectors and uses thereof for treatment of otic indications
WO2020097372A1 (en) * 2018-11-07 2020-05-14 Akouos, Inc. Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear

Also Published As

Publication number Publication date
EP4164695A4 (en) 2024-06-05
US20230183743A1 (en) 2023-06-15
KR20230023641A (ko) 2023-02-17
WO2021231808A3 (en) 2021-12-23
IL298091A (en) 2023-01-01
CA3178197A1 (en) 2021-11-18
AU2021270308A1 (en) 2022-12-15
MX2022014085A (es) 2022-12-07
CL2022003147A1 (es) 2023-07-21
WO2021231808A2 (en) 2021-11-18
EP4164695A2 (en) 2023-04-19
JP2023526053A (ja) 2023-06-20

Similar Documents

Publication Publication Date Title
AU2021204620A1 (en) Central nervous system targeting polynucleotides
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20180097631A (ko) 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법
CN110678208B (zh) 膜融合脂质纳米颗粒和制造方法以及用于产生治疗性蛋白质和用于治疗的用途
CN113453702A (zh) 细胞重编程以逆转衰老并促进组织和组织再生
CN113227385A (zh) 核酸分子及其用于非病毒基因疗法的用途
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
KR20210102882A (ko) 핵산 구조체 및 사용 방법
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
KR20210068068A (ko) 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법
CN116096900A (zh) 用于治疗gjb2相关听力损失的组合物和方法
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
CN115666722A (zh) 包封的rna复制子和使用方法
KR20240022575A (ko) 아머링된 키메라 수용체 및 이의 사용 방법
KR20230117179A (ko) 청신경초종 연관 증상을 치료하기 위한 항-vegf 항체작제물 및 관련된 방법
KR20230069157A (ko) GJB2를 코딩하는 재조합 아데노 연관 바이러스 (rAAV) 및 그의 용도
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
JP2023153320A (ja) Clrn1に関連する聴力喪失及び/または視力喪失を治療する方法
KR20210132109A (ko) Dna-결합 도메인 전사활성화제 및 이의 용도
KR20240021799A (ko) 청력 손실을 치료하기 위한 유전자 치료 전달 조성물 및 방법
CN117813101A (zh) 用于治疗听力损失的基因疗法递送组合物和方法
KR20230041965A (ko) Slc26a4-연관 청력손실을 치료하기 위한 조성물 및 방법
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)
NL2027815B1 (en) Genomic integration
CN116568283A (zh) 用于治疗前庭神经鞘瘤相关症状的抗vegf抗体构建体和相关方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination