WO2024123005A1 - 다중 단백질의 발현을 위한 신규 핵산 구조체 - Google Patents

다중 단백질의 발현을 위한 신규 핵산 구조체 Download PDF

Info

Publication number
WO2024123005A1
WO2024123005A1 PCT/KR2023/019767 KR2023019767W WO2024123005A1 WO 2024123005 A1 WO2024123005 A1 WO 2024123005A1 KR 2023019767 W KR2023019767 W KR 2023019767W WO 2024123005 A1 WO2024123005 A1 WO 2024123005A1
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
mrna
expression
sequence
present
Prior art date
Application number
PCT/KR2023/019767
Other languages
English (en)
French (fr)
Inventor
이규리
박현호
Original Assignee
경상국립대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경상국립대학교산학협력단 filed Critical 경상국립대학교산학협력단
Publication of WO2024123005A1 publication Critical patent/WO2024123005A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease

Definitions

  • the present invention relates to a novel nucleic acid construct in which multiple expression constructs are structured into a single structure through hybridization of terminal sequences for efficient simultaneous and equal expression of multiple proteins.
  • Efficient mass expression of proteins is an important process that is fundamental to the industrial use of various functional proteins, including medicine.
  • genetic recombination technology develops, research on recombinant mass production of target proteins is being actively conducted using prokaryotic cells such as E. coli or various eukaryotic cells such as animal, plant, and insect cells as host cells.
  • the present inventors have made extensive research efforts to develop an efficient multiplex expression system that can homogenize the expression time and expression amount of multiple proteins in the same host cell.
  • multiple target proteins can be produced at the same level in the host cell by a simple operation of binding an additional sequence that can be used for structuralization through hybridization to the 3' end of the multiple expression constructs.
  • the present invention was completed.
  • the purpose of the present invention is to provide nucleic acid molecules for expressing multiple proteins.
  • the present invention provides a nucleic acid molecule for expressing multiple proteins comprising:
  • a first nucleic acid structure comprising a nucleotide sequence encoding a first target protein and an optional first additional sequence (ADS) at the 3' end;
  • a second nucleic acid construct comprising a nucleotide sequence encoding a second target protein and a second additional sequence at the 3' end capable of complementary hybridization with the first additional sequence.
  • each target protein i) directly hybridizes with each other; or ii) when combining additional sequences that can simultaneously hybridize to the same linker molecule, each expression construct forms one nucleic acid structure through the hybridization reaction of the additional sequences, thereby producing multiple proteins at the same level in the host cell. It was discovered that they could be expressed simultaneously.
  • nucleic acid molecule is meant to comprehensively include DNA (gDNA and cDNA) and RNA molecules, and nucleotides, the basic structural unit of nucleic acid molecules, are deoxyribonucleotides or ribonucleotides that exist in single-stranded or double-stranded form. It includes not only natural nucleotides, but also analogues with modified sugar or base sites (Scheit, Nucleotide Analogs , John Wiley, New York (1980); Uhlman and Peyman, Chemical Reviews , 90:543-584 (1990) )).
  • additional sequence used while describing this embodiment refers to any sequence attached to the 3' end of the expression construct of a target protein, and includes the additional sequence of the expression construct of another target protein. It refers to a sequence that can induce structuralization into a single nucleic acid molecule for expression of multiple proteins through hybridization by having a complementary sequence.
  • the term “complementary” means that a first additional sequence of the present invention is sufficiently complementary to selectively hybridize to a second additional sequence under predetermined annealing or hybridization conditions, and is completely complementary thereto. It is meant to encompass not only cases but also cases that are substantially complementary.
  • substantially complementary sequence means not only a completely identical sequence but also a sequence that partially mismatches the target sequence to the extent that sequence-specific hybridization can occur by annealing to the target sequence.
  • the nucleotide sequence encoding the first target protein and the nucleotide sequence encoding the second target protein have 5'-UTR and 3'-UTR linked to both ends, respectively.
  • the 5'-UTR has 5'-cap attached to it.
  • the term “UTR (untranslated region) refers to the untranslated region bound to both ends of the coding sequence encoding the target protein within the mRNA, including the 5'-UTR present upstream and downstream of the coding sequence. There is a 3'-UTR that does.
  • the term “5'-cap” is linked to the 5'-UTR and binds to eukaryote translation initiation factor 4E (elF4E), thereby binding the 40S ribosomal subunit to the mRNA, which serves to initiate protein synthesis from the 5' start site of the mRNA.
  • elF4E eukaryote translation initiation factor 4E
  • it refers to a component of mRNA that plays a role in protecting mRNA from nucleic acid degrading enzymes.
  • the nucleic acid construct additionally includes a poly(A) sequence containing 20 to 400 bases between the 3'-UTR and the additional sequence.
  • poly(A) sequence refers to a protein located at the 3' end of an RNA molecule to protect the RNA molecule from degradation by enzymes.
  • Adenine - refers to a repeating nucleotide sequence.
  • the “poly(A) sequence” can be expressed as “poly (dA:dT)”.
  • the poly(A) sequence of the present invention contains 20 to 300 bases, more specifically 25 to 200 bases, and even more specifically 25 to 150 bases. It includes, and most specifically includes 30 to 120 bases.
  • the first nucleic acid construct and the second nucleic acid construct are IVT ( in vitro transcribed) mRNA.
  • the IVT mRNA may include one or more modified nucleosides.
  • Variant nucleosides include, for example, N1-methylpseudouridine, pseudouridine, 2-thiouridine, 5-methyluridine, 5-methyluridine, - Any modified nucleoside known in the art that can reduce the immunogenicity of the mRNA molecule can be applied, including but not limited to 5-methylcytidine and 5-methoxyuridine. You can.
  • uracil (U) in the IVT mRNA is replaced with modified U represented by the following formula (1):
  • R 1 and R 2 are each independently hydrogen, C 1 -C 3 alkyl or C 1 -C 3 alkoxy, X and A are carbon or nitrogen and are different from each other, represents a single bond or double bond.
  • alkyl refers to a straight-chain or branched saturated hydrocarbon group and includes, for example, methyl, ethyl, propyl, isopropyl, etc.
  • C 1 -C 3 alkyl refers to an alkyl group having an alkyl unit having 1 to 3 carbon atoms, and when C 1 -C 3 alkyl is substituted, the carbon number of the substituent is not included.
  • alkoxy refers to a radical formed by removing hydrogen from alcohol, and when C 1 -C 3 alkoxy is substituted, the carbon number of the substituent is not included.
  • X is nitrogen, A is carbon, and R 1 and R 2 are hydrogen.
  • the compound of Formula 1 where X is nitrogen, A is carbon, and R 1 and R 2 are hydrogen is pseudouridine.
  • X is nitrogen
  • A is carbon
  • R 1 is C 1 alkyl (methyl)
  • R 2 is hydrogen
  • the compound of Formula 1 where X is nitrogen, A is carbon, and R 1 and R 2 are hydrogen is N1-methyl-pseudouridine.
  • X is carbon, A is nitrogen, R 1 is C 1 alkoxy (methoxy), and R 2 is hydrogen.
  • the compound of Formula 1 in which X is carbon, A is nitrogen, R 1 is methoxy, and R 2 is hydrogen is 5-methoxyuridine.
  • the present invention provides a nucleic acid molecule for expressing multiple proteins comprising:
  • a first nucleic acid structure comprising a nucleotide sequence encoding a first target protein and an optional first additional sequence (ADS) at the 3' end;
  • a second nucleic acid construct comprising a nucleotide sequence encoding a second protein of interest and an optional second additional sequence at the 3′ end;
  • a linker comprising a first region capable of complementary hybridization with the first additional sequence and a second region capable of complementary hybridization with the second additional sequence.
  • additional sequence used while describing this embodiment refers to any sequence linked to the 3' end of the expression construct of the target protein, including a portion of the linker sequence (e.g., the first region) and Structuring a second expression construct into a single nucleic acid molecule and incorporating a second additional sequence that has a complementary sequence and can hybridize with another portion of the linker sequence (e.g., a second region). This refers to a sequence that can induce structuralization.
  • linker refers to a linear connection of a first region capable of hybridizing with a first additional sequence and a second region capable of hybridizing with a second additional sequence, thereby forming a first nucleic acid structure and a second nucleic acid structure. refers to a nucleic acid molecule that acts as a bridge to structure a single molecule through indirect annealing.
  • one of the first region and the second region consists of an inverted base.
  • inverted base refers to a 5′-5′ or 3′-3′ inverted bond (reversed bond) rather than a 5′-3′ bond with an adjacent base in an oligonucleotide that has a normal base structure and symmetrical structure. refers to a mutant base that forms a linkage.
  • first region and the second region are joined by a 5'-5' reversed linkage.
  • an oligonucleotide starting in the 3' ⁇ 5' direction is linked to a sequence composed of normal bases by a 5'-5' inversion bond, and then ends in the general 5' ⁇ 3' direction. You can.
  • the first nucleic acid construct and the second nucleic acid construct are IVT ( in vitro transcribed) mRNA.
  • uracil (U) in the IVT mRNA is replaced with modified U represented by the following formula (1):
  • modified uracil base that can be used in the present invention has already been described in detail, its description is omitted to avoid excessive duplication.
  • the present invention provides a nucleic acid construct for expressing multiple proteins comprising:
  • ADS an additional sequence located at the 3' end of the nucleic acid structure and capable of hybridizing with another nucleic acid structure or linker sequence.
  • additional sequence used in describing this embodiment refers to the above-described sequence that hybridizes directly with an additional sequence attached to the 3' end of another protein expression construct or with a linker sequence that acts as a bridge. It is meant to encompass both types of additional sequences.
  • the present invention provides a nucleic acid molecule for expressing multiple proteins in which a plurality of protein expression constructs are structured into a single structure through a hybridization reaction of an additional sequence linked to each end.
  • multiple target proteins can be delivered to a single host through a simple design in which any additional sequence designed to perform direct hybridization with each other or simultaneous hybridization with the same linker molecule is linked to the 3' end of each expression construct. It can be efficiently expressed simultaneously and in equal amounts within cells.
  • the present invention can be particularly useful as an efficient multiplex expression system that overcomes the shortcomings of the conventional self-cleaving peptide expression system, which shows uneven expression patterns between each protein.
  • Figure 1 is a diagram schematically showing the structure of the in vitro transcribed (IVT) mRNA structure of the present invention, which is amplified from a plasmid vector containing a T7 promoter and then bound to the 3' end with an additional sequence for hybridization.
  • IVT in vitro transcribed
  • Figure 2 is a diagram showing the linker structure used in the present invention.
  • the inverted base structure included in the linker ( Figure 2a), the inverted base sequence and the regular base sequence are 5'- Linker structure joined by 5' reversed linkage (FIG. 2b), structure of mRNA-ADS-1/LNK/mRNA-ADS-2 formed by hybridization through the linker (linker-dependent structuralization) ( Figure 2c) and a gel image confirming the hybridization result through electrophoresis (Figure 2d), respectively.
  • Figure 3 shows the structure of mRNA-ADS/mRNA-ADS-C formed by direct hybridization between additional sequences of two molecules of IVT mRNA without a linker (linker-independent conformation) ( Figure 3a) and the hybridization result through electrophoresis. This is a picture showing the gel image (FIG. 3b) confirmed.
  • Figure 4 shows the results of measuring the synthesis yield of the IVT mRNA of the present invention according to the salt concentration in the buffer solution.
  • Figure 5 shows the results of measuring the synthesis yield of IVT mRNA of the present invention according to mRNA concentration.
  • Figure 6 shows the results of measuring the synthesis yield of the IVT mRNA of the present invention according to the length of the poly(A) tail.
  • Figure 7 shows the results of measuring the synthesis yield of the IVT mRNA of the present invention according to the length of the additional sequence (ADS).
  • Figure 8 is a diagram showing the results of comparing the yields of linker-dependent and linker-independent structures.
  • Figure 9 shows the results of an in vitro luciferase assay to investigate the intracellular protein expression efficiency of the IVT mRNA of the present invention.
  • Figure 10 shows the results of FACS analysis measuring RFP (Red Fluorescent protein) expression to investigate the intracellular protein expression efficiency of the IVT mRNA of the present invention.
  • IVT mRNA generally consists of 5'cap, 5'UTR, ORF, 3'UTR, and poly(A) tail in that order from the 5' end to the 3' end.
  • the structure proposed in the present invention is a form in which an additional sequence is introduced at the 3' end of the general IVT mRNA structure, and this additional sequence is an arbitrary sequence, complementary to another additional sequence, or linked with a linker. It is a sequence that can hybridize.
  • the DNA template required for the production of the IVT mRNA construct of the present invention was obtained by performing PCR amplification using appropriate forward and reverse primers on a plasmid vector containing the T7 promoter and cloned with the 5'UTR, ORF, and 3'UTR ( Figure 1).
  • Various types of reverse primers were designed to introduce a poly(A) tail of the desired length and additional sequences.
  • the mRNA construct of the present invention can be combined with a second mRNA construct via a 'linker' oligonucleotide having a sequence that can hybridize complementary to the additional sequence bound to the 3' end of the IVT mRNA described above.
  • Linker oligonucleotides include a regular base and an inverted base that has a symmetrical structure ( Figure 2a). When an oligonucleotide is made using this inverted base, the 3' carbon is the starting point and the 5' carbon is A nucleic acid molecule structure ending in can be obtained, and a 5'-5' reversed linkage can be formed at the part connected to the normal base ( Figure 2b).
  • the linker of the present invention is sequentially linked from the 5' end to the 3' end: reversed base ⁇ 5'-5' reversed linkage ⁇ normal base.
  • the reversed bases arranged from the 5' start point to the 5'-5' reversed linkage are composed of a sequence that can hybridize complementary to an additional sequence bound to the 3' end of the first mRNA structure
  • the 5'- The normal bases located after the 5' reversed linkage to the 3' end are composed of a sequence that can hybridize complementary to the additional sequence of the second mRNA structure, so that the entire linker molecule is the first mRNA structure with additional sequences that are not complementary to each other. And it acts as a bridge to bind the second mRNA structure ( Figure 2c).
  • mRNA-ADS-1 and mRNA-ADS-2 Two mRNA constructs (mRNA-ADS-1 and mRNA-ADS-2) with additional sequences that are not complementary to each other and sequences that can hybridize complementary to both ADS-1 and ADS-2 were created.
  • linker After manufacturing the linker, mRNA-ADS-1, mRNA-ADS-2, and linker were mixed at the same molar concentration.
  • the temperature of the mixture was heated to 65°C and maintained for 5 minutes, then heated at 1°C/20 seconds. The temperature was reduced and cooled to 30° C. over 700 seconds.
  • the sample was loaded onto a 1% agarose gel pre-stained with GelRed and gel electrophoresis was performed for 30 minutes in 1X TAE buffer at 100V. After electrophoresis was completed, gel images were obtained using the BIO-RAD Chemidoc Imaging System ( Figure 2d).
  • first and second mRNA constructs (mRNA-ADS and mRNA-ADS-C) with additional sequences complementary to each other and mix mRNA-ADS and mRNA-ADS-C at equimolar concentrations to induce annealing. was heated to 65°C and maintained for 5 minutes, then the temperature was decreased by 1°C/20 seconds and cooled to 30°C over 700 seconds. To confirm the results, the sample was loaded onto a 1% agarose gel pre-stained with GelRed and gel electrophoresis was performed for 30 minutes in 1 x TAE buffer at 100V. After electrophoresis was completed, gel images were obtained using the BIO-RAD Chemidoc Imaging System ( Figure 3b).
  • the band or smear distributed above the band position of the longest mRNA is expected to be a structured result, so the intensity of the upper region of the band of the longest mRNA was quantified;
  • the basic reaction was conducted under the conditions of 1X PBS buffer, NaCl 400mM, and mRNA 300nM, and the mRNA concentration was adjusted to optimize reaction conditions.
  • a yield of 48% was observed at the initial concentration of 300 nM mRNA, and as the mRNA concentration increased to 600 nM, 1200 nM, 1800 nM, and 2400 nM, the yield changed to 55%, 68%, 71%, and 76%, respectively. It was found that increasing concentration had a positive effect on structural yield (Figure 5). However, since the structural yield tended to be saturated at concentrations exceeding 1200nM, the conditions of 1X PBS buffer, NaCl 400mM, and mRNA 1200nM were used for further experiments.
  • Luciferase assay was performed to evaluate the intracellular protein expression ability of the new construct.
  • ARCA anti-reverse cap analogue
  • pUTP pseudouridine triphosphate
  • poly (A) A tail was introduced.
  • HEK293T 3.0 A total of 105ng of mRNA (mRFP, mRFP-ADS46-1: 35ng/mLuc, mLuc-ADS46-2: 70ng) was transduced for each sample.
  • Lipofectamine 2000 was used for transduction, and after transduction, the cells were incubated at 37°C in a 5% CO 2 environment for 24 hours and then luciferase assay was performed.
  • 2A peptide is a protein located upstream of the region in which the ribosome skips the peptide bond formation between glycine and proline located at the C-terminus (ribosome skipping) during the process of translating the mRNA containing the corresponding sequence.
  • Multiple protein expression is achieved by placing base sequences encoding the desired proteins upstream and downstream of the 2A peptide, respectively, by taking advantage of the self-cleaving property of proteins located downstream.
  • the 2A peptide has a problem in that the downstream protein is expressed less than the upstream protein.
  • plasmid vectors with the RFP-P2A-Luc sequence and the Luc-P2A-RFP sequence inserted into the ORF were cloned, respectively.
  • PCR amplification was performed using appropriate primers on these plasmid vectors to produce an IVT template, and transcription was performed using this IVT template to produce the desired mRNA (mRFP-P2A-Luc, mLuc-P2A-RFP).
  • the luciferase expression level of the construct (mRFP-ADS46-1/LNK46/mLuc-ADS46-2) of the present invention, in which mRFP-ADS46-1 and mLuc-ADS46-2 are structured using a linker (LNK46), is higher than mRFP-ADS46. It was confirmed that it was higher than when -1 and mLuc-ADS46-2 were transduced together (mRFP-ADS46-1 + mLuc-ADS46-2) and when mLuc-ADS46-2 was transduced (FIG. 9).
  • the mRNA construct for expressing multiple proteins of the present invention not only exhibits multiple protein expression efficiency that is equivalent to or higher than that of the conventional P2A system, but also efficiently overcomes the disadvantage of P2A, which is the uneven expression amount of the target protein depending on the upstream and downstream locations. It was confirmed that this was the case.
  • RFP red fluorescent protein

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 복수의 단백질 발현 컨스트럭트가 각 말단에 결합된 추가 서열(additional sequence)의 혼성화 반응을 통해 단일 구조화되는 다중 단백질 발현용 핵산 분자에 관한 것이다. 본 발명은 상호간의 직접 혼성화 또는 동일한 링커 분자에 대한 동시 혼성화 반응을 하도록 설계된 임의의 추가 서열을 각 발현 컨스트럭트의 3'말단에 결합시키는 간단한 설계를 통해 복수의 목적 단백질을 단일 숙주세포 내에서 효율적으로 동시, 동량 발현시킬 수 있다. 본 발명은 특히 각 단백질 간 불균일한 발현 양상을 보이는 종래의 자가절단 펩타이드 발현 시스템의 단점을 극복하는 효율적인 다중 발현 시스템으로 유용하게 이용될 수 있다.

Description

다중 단백질의 발현을 위한 신규 핵산 구조체
본 발명은 다중 단백질의 효율적인 동시, 동량 발현을 위하여 복수의 발현 컨스트럭트가 말단 서열의 혼성화를 통해 단일 구조화된 신규한 핵산 구조체에 관한 것이다.
단백질의 효율적인 대량 발현은 의약을 비롯한 다양한 기능적 단백질의 산업적 이용에 가장 기초가 되는 중요한 과정이다. 유전자 재조합 기술이 발전하면서 대장균 등의 원핵세포나 동물, 식물, 곤충 세포 등의 다양한 진핵세포를 숙주세포로 이용하여 목적 단백질의 재조합적 대량 생산에 관한 연구가 활발하게 이루어지고 있다.
복수의 목적 단백질을 숙주 세포 내에서 공발현시키는 기술은 세포의 효율적인 표현형 변경, 복수의 기능성 단백질의 동시 대량생산, 치료용 단백질을 유전자 형태로 전달하는 유전자 치료 기술 등에 필수적이며, 이러한 목적을 위해 지금까지 복수의 플라스미드를 순차적으로 공-형질도입하거나, IRES-기반 폴리시스트로닉 컨스트럭트(polycistronic construct)를 이용하거나, 각 목적 단백질 도메인이 자가절단 펩타이드를 사이에 두고 결합된 융합 단백질 형태로 발현시키거나, 또는 유전자 전달체로서 복수개의 바이러스(예를 들어 렌티바이러스 등)를 공-감염(co-infection) 시키는 방법 등이 사용되어 왔다. 그러나 이러한 종래 기술은 각각의 유전자의 발현이 균일하지 못하고 각 목적 단백질 생산 효율을 조절하기 어려우며 자가 절단 과정에서 N-또는 C-말단이 변형됨으로서 단백질 고유의 생물학적 기능을 유지하지 못할 뿐 아니라 복수의 목적 단백질이 동시에 균일하게 생산되지 못하는 등의 문제점이 있어왔다. 이에, 복수의 단백질을 재조합적으로 동시, 동량 발현시키는 새로운 발현 시스템에 대한 개발 요구가 커지고 있다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 동일한 숙주 세포 내에서 복수의 단백질의 발현 시간과 발현량을 균질화할 수 있는 효율적인 다중 발현 시스템을 개발하기 위하여 예의 연구 노력하였다. 그 결과, 복수의 발현 컨스트럭트의 3’말단에 혼성화를 통한 구조체화(structuralization)에 이용될 수 있는 추가 서열(additional sequence)을 결합시키는 간단한 조작만으로도 복수의 목적 단백질을 숙주 세포 내에서 동등한 수준으로 동시에 발현시킬 수 있음을 발견함으로써, 본 발명을 완성하게 되었다.
따라서 본 발명의 목적은 다중 단백질 발현용 핵산 분자를 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 다음을 포함하는 다중 단백질 발현용 핵산 분자를 제공한다:
(a) 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제1 추가 서열(additional sequence, ADS)을 포함하는 제1 핵산 구조체; 및
(b) 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 상기 제1 추가 서열과 상보적으로 혼성화될 수 있는 제2 추가 서열을 포함하는 제2 핵산 구조체.
본 발명자들은 복수의 단백질을 재조합적으로 동시, 동량을 발현시키는 효율적인 다중 발현 시스템을 개발하기 위하여 예의 연구 노력하였다. 그 결과, 각 목적 단백질에 대한 발현 컨스트럭트의 3’말단에 i) 서로 직접 혼성화되거나; 또는 ⅱ) 동일한 링커 분자에 동시에 혼성화될 수 있는 추가 서열을 결합시킬 경우, 각 발현 컨스트럭트가 추가 서열의 혼성화 반응을 통해 하나의 핵산 구조체를 형성함으로써 숙주세포 내에서 복수의 단백질을 동등한 수준으로 동시에 발현시킬 수 있음을 발견하였다.
본 명세서에서 용어“핵산 분자”는 DNA(gDNA 및 cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 가지며, 핵산 분자의 기본 구성단위인 뉴클레오타이드는 단일가닥 또는 이중가닥 형태로 존재하는 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드로서 자연의 뉴클레오타이드뿐만 아니라, 당 또는 염기 부위가 변형된 유사체 (analogue)도 포함한다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
본 구현예를 설명하면서 사용되는 용어“추가 서열(additional sequence)”은 목적 단백질의 발현 컨스트럭트의 3’말단에 결합된 임의의 서열로서, 또 다른 목적 단백질의 발현 컨스트럭트의 추가 서열과 상보적인 서열을 가짐으로써 혼성화를 통해 다중 단백질 발현을 위한 단일 핵산분자로의 구조체화(structuralization)를 유도할 수 있는 서열을 의미한다.
본 명세서에서 용어“상보적”은 소정의 어닐링 또는 혼성화 조건 하에서 본 발명의 제1 추가 서열이 제2 추가 서열에 선택적으로 혼성화할 정도로 충분히 상보적인 것을 의미하며, 이에 완전히 상보적(perfectly complementary)인 경우 뿐 아니라 실질적으로 상보적(substantially complementary)인 경우를 포괄하는 의미이다. 본 명세서에서“실질적으로 상보적인 서열”이라 함은 완전히 일치되는 서열뿐 아니라 타겟 서열에 어닐링하여 서열 특이적 혼성화가 일어날 수 있는 범위 내에서 타겟 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다.
본 발명의 구체적인 구현예에 따르면, 상기 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열은 각각 양 말단에 5'-UTR 및 3'-UTR이 결합되어 있다.
보다 구체적으로는, 상기 5'-UTR은 5'-cap이 결합되어 있다.
본 명세서에서 용어“UTR(untranslated region)는 mRNA 내에서 목적 단백질을 암호화하는 코딩 서열의 양 말단에 결합된 비번역 부위를 의미하며, 코딩 서열의 업스트림에 존재하는 5'-UTR 및 다운스트림에 존재하는 3'-UTR이 있다. 용어“5’-cap”은 5'-UTR에 연결되어 elF4E(eukaryote translation initiation factor 4E)와 결합함으로써 40S 리보솜 서브유닛을 mRNA에 결합시켜 mRNA의 5' 시작 부위로부터 단백질 합성을 개시하는 역할을 할 뿐 아니라 핵산 분해효소로부터 mRNA를 보호하는 역할을 하는 mRNA의 구성요소를 의미한다.
본 발명의 보다 구체적인 구현예에 따르면, 상기 핵산 구조체는 상기 3'-UTR과 상기 추가 서열 사이에 20개 내지 400개의 염기를 포함하는 폴리(A) 서열을 추가적으로 포함한다.
본 명세서에서 용어“폴리(A) 서열”,“폴리아데닌 서열”또는“폴리 A 테일(poly(A) tail)”은 RNA 분자의 3' 말단에 위치하여 효소에 의한 분해로부터 RNA 분자를 보호하는 아데닌-반복 뉴클레오타이드 서열을 의미한다. 본 발명의 핵산 분자가 이중 가닥 형태의 디옥시리보뉴클레오타이드인 경우“폴리(A) 서열”은“폴리 (dA:dT)”로 표현될 수 있다.
보다 구체적으로는, 본 발명의 폴리(A) 서열은 20개 내지 300개의 염기를 포함하고, 보다 더 구체적으로는 25개 내지 200개의 염기를 포함하며, 보다 더 구체적으로는 25개 내지 150개의 염기를 포함하고, 가장 구체적으로는 30개 내지 120개의 염기를 포함한다.
본 발명의 구체적인 구현예에 따르면, 상기 제1 핵산 구조체 및 제2 핵산 구조체는 IVT(in vitro transcribed) mRNA이다.
본 발명의 보다 구체적인 구현예에 따르면, 상기 IVT mRNA는 변형 뉴클레오사이드(modified nucleoside)를 하나 이상 포함할 수 있다. 변이 뉴클레오사이드는 예를 들어 N1-메틸슈도우리딘(N1-methylpseudouridine), 슈도우리딘(pseudouridine), 2-티오우리딘(2-thiouridine), 5-메틸우리딘(5-methyluridine), 5-메틸시티딘(5-methylcytidine) 및 5-메톡시우리딘(5-methoxyuridine)을 포함하나, 이에 제한되지 않고 mRNA 분자의 면역원성을 감소시킬 수 있다고 당업계에 알려진 어떠한 변형 뉴클레오사이드라도 적용될 수 있다.
보다 구체적으로는, 상기 IVT mRNA 중 우라실(U)의 전부 또는 일부가 하기 화학식 1로 표시되는 변형된 U(modified U)로 치환된다:
화학식 1
Figure PCTKR2023019767-appb-img-000001
상기 화학식에서 R1 및 R2는 각각 독립적으로 수소, C1-C3 알킬 또는 C1-C3 알콕시이고, X 및 A는 탄소 또는 질소이며 서로 상이하고,
Figure PCTKR2023019767-appb-img-000002
는 단일결합 또는 이중결합을 나타낸다.
본 명세서에서 용어“알킬”은 직쇄 또는 분쇄의 포화 탄화수소기를 의미하며, 예를 들어, 메틸, 에틸, 프로필, 이소프로필 등을 포함한다. C1-C3 알킬은 탄소수 1 내지 3의 알킬 유니트를 가지는 알킬기를 의미하며, C1-C3 알킬이 치환된 경우 치환체의 탄소수는 포함되지 않은 것이다.
본 명세서에서 용어“알콕시”는 알코올에서 수소가 제거되어 형성된 라디칼을 의미하며, C1-C3 알콕시가 치환된 경우 치환체의 탄소수는 포함되지 않은 것이다.
옥텟 규칙(octet rule)에 의할 때, X 또는 A가 질소인 경우, X 또는 A가 각각 참여하는 결합인
Figure PCTKR2023019767-appb-img-000003
가 단일결합임은 자명하다.
본 발명의 구체적인 일 구현예에 따르면, 상기 화학식에서 X는 질소이고 A는 탄소이며 R1 및 R2는 수소이다. X는 질소이고 A는 탄소이며 R1 및 R2가 수소인 화학식 1 화합물은 슈도우리딘(pseudouridine)이다.
본 발명의 일 구현예에 따르면, 상기 화학식에서 X는 질소이고 A는 탄소이며 R1은 C1 알킬(메틸)이고 R2는 수소이다. X는 질소이고 A는 탄소이며 R1 및 R2는 수소인 화학식 1 화합물은 N1-메틸-슈도우리딘(N1-methyl-pseudouridine)이다.
본 발명의 일 구현예에 따르면, 상기 화학식에서 X는 탄소이고, A는 질소이며, R1은 C1 알콕시(메톡시)이고, R2는 수소이다. X는 탄소, A는 질소, R1은 메톡시, R2는 수소인 화학식 1 화합물은 5-메톡시우리딘(5-methoxyuridine)이다.
본 발명의 다른 양태에 따르면, 본 발명은 다음을 포함하는 다중 단백질 발현용 핵산 분자를 제공한다:
(a) 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제1 추가 서열(additional sequence, ADS)을 포함하는 제1 핵산 구조체;
(b) 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제2 추가 서열을 포함하는 제2 핵산 구조체; 및
(c) 상기 제1 추가 서열과 상보적으로 혼성화될 수 있는 제1 영역 및 상기 제2 추가 서열과 상보적으로 혼성화될 수 있는 제2 영역을 포함하는 링커(linker).
본 구현예를 설명하면서 사용되는 용어“추가 서열(additional sequence)”은 목적 단백질의 발현 컨스트럭트의 3’말단에 결합된 임의의 서열로서, 링커 서열의 일부(예를 들어 제1 영역)와 상보적인 서열을 가져 이와 혼성화됨으로써 해당 링커 서열의 다른 일부(예를 들어 제2 영역)와 혼성화될 수 있는 제2의 추가 서열이 결합된 제2의 발현 컨스트럭트와 단일 핵산분자로의 구조체화(structuralization)를 유도할 수 있는 서열을 의미한다.
본 명세서에서 용어“링커(linker)”는 제1 추가 서열과 혼성화될 수 있는 제1 영역 및 제2 추가 서열과 혼성화될 수 있는 제2 영역이 선형으로 연결됨으로서 제1 핵산 구조체와 제2 핵산 구조체가 간접적인 어닐링을 통해 단일 분자로 구조체화되도록 가교 역할을 하는 핵산 분자를 의미한다.
본 발명의 구체적인 구현예에 따르면, 상기 제1 영역 및 제2 영역 중 어느 하나는 역위 염기(inverted base)로 구성된다.
본 명세서에서 용어“역위 염기(inverted base)”는 정상적인 염기 구조와 대칭구조를 가져 올리고뉴클레오타이드 내의 인접한 염기와 5′-3’결합이 아닌 5′-5’또는 3′-3’역위 결합(reversed linkage)을 형성하는 변이 염기를 의미한다.
보다 구체적으로는, 상기 제1 영역 및 제2 영역은 5'-5' 역위결합(reversed linkage)에 의해 결합된다.
본 발명의 역위 염기를 이용할 경우 예를 들어 3′→ 5’방향으로 시작된 올리고뉴클레오타이드가 5'-5' 역위결합에 의해 정상 염기로 구성된 서열과 연결된 후, 일반적인 5′→ 3’방향으로 종료될 수 있다.
본 발명의 구체적인 구현예에 따르면, 제 8 항에 있어서, 상기 제1 핵산 구조체 및 제2 핵산 구조체는 IVT(in vitro transcribed) mRNA이다.
본 발명의 보다 구체적인 구현예에 따르면, 상기 IVT mRNA 중 우라실(U)의 전부 또는 일부가 하기 화학식 1로 표시되는 변형된 U(modified U)로 치환된다:
화학식 1
Figure PCTKR2023019767-appb-img-000004
본 발명에서 이용될 수 있는 변형 우라실 염기에 대해서는 이미 상술하였으므로, 과도한 중복을 피하기 위해 그 기재를 생략한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 다음을 포함하는 다중 단백질 발현용 핵산 구조체를 제공한다:
(a) 목적 단백질을 인코딩하는 뉴클레오타이드 서열; 및
(b) 상기 핵산 구조체의 3’말단에 위치하여 다른 핵산 구조체 또는 링커 서열과 혼성화될 수 있는 추가 서열(additional sequence, ADS).
본 발명에서 이용되는 추가 서열 및 링커 서열에 대해서는 이미 상술하였으므로, 과도한 중복을 피하기 위해 그 기재를 생략한다.
본 구현예를 설명하면서 사용되는 용어“추가 서열(additional sequence)”은 또 다른 단백질 발현 컨스트럭트의 3’말단에 결합된 추가 서열과 직접 혼성화되거나 가교 역할을 하는 링커 서열과 혼성화되는, 전술한 2가지 양태의 추가 서열을 모두 포괄하는 의미이다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 복수의 단백질 발현 컨스트럭트가 각 말단에 결합된 추가 서열(additional sequence)의 혼성화 반응을 통해 단일 구조화되는 다중 단백질 발현용 핵산 분자를 제공한다.
(b) 본 발명은 상호간의 직접 혼성화 또는 동일한 링커 분자에 대한 동시 혼성화 반응을 하도록 설계된 임의의 추가 서열을 각 발현 컨스트럭트의 3’말단에 결합시키는 간단한 설계를 통해 복수의 목적 단백질을 단일 숙주세포 내에서 효율적으로 동시, 동량 발현시킬 수 있다.
(c) 본 발명은 특히 각 단백질 간 불균일한 발현 양상을 보이는 종래의 자가절단 펩타이드 발현 시스템의 단점을 극복하는 효율적인 다중 발현 시스템으로 유용하게 이용될 수 있다.
도 1은 T7 프로모터를 포함하는 플라스미드 벡터로부터 증폭된 후 3’말단에 혼성화를 위한 추가 서열(additional sequence)이 결합된 본 발명의 IVT(in vitro transcribed) mRNA 구조의 구조를 도식화한 그림이다.
도 2는 본 발명에 사용된 링커(링커) 구조를 보여주는 그림으로, 상기 링커에 포함된 역위 염기(Inverted base) 구조(도 2a), 역위 염기 서열과 정상 염기(regular base) 서열이 5'-5' 역위결합(reversed linkage)에 의해 결합된 링커 구조(도 2b), 상기 링커를 매개로 하여 혼성화됨으로써 형성된(링커-의존성구조체화) mRNA-ADS-1/ LNK/ mRNA-ADS-2의 구조(도 2c) 및 전기영동을 통해 혼성화 결과물을 확인한 젤 이미지(도 2d)를 각각 보여주는 그림이다.
도 3은 링커 없이 2 분자의 IVT mRNA의 추가 서열 간 직접 혼성화가 일어남으로서 형성된(링커-비의존성 구조체화) mRNA-ADS/mRNA-ADS-C의 구조(도 3a) 및 전기영동을 통해 혼성화 결과물을 확인한 젤 이미지(도 3b)를 각각 보여주는 그림이다.
도 4는 완충액 내 염(salt) 농도에 따른 본 발명의 IVT mRNA의 합성 수율을 측정한 결과를 보여준다.
도 5는 mRNA 농도에 따른 본 발명의 IVT mRNA의 합성 수율을 측정한 결과를 보여준다.
도 6은 Poly(A) 테일의 길이에 따른 본 발명의 IVT mRNA의 합성 수율을 측정한 결과를 보여준다.
도 7은 추가 서열(additional sequence, ADS)의 길이에 따른 본 발명의 IVT mRNA의 합성 수율을 측정한 결과를 보여준다.
도 8은 링커-의존성 구조체 및 링커-비의존성 구조체의 각 수율을 비교한 결과를 보여주는 그림이다.
도 9는 본 발명의 IVT mRNA의 세포 내 단백질 발현 효율을 조사하기 위해 인 비트로 루시퍼라제 어세이를 수행한 결과를 나타낸다.
도 10은 본 발명의 IVT mRNA의 세포 내 단백질 발현 효율을 조사하기 위해 RFP(Red Fluorescent protein) 발현을 측정한 FACS 분석 결과를 나타낸다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
다중 단백질 발현용 mRNA 구조체의 제작
IVT mRNA는 일반적으로 5’말단부터 3’말단까지 순서대로 5’cap, 5’UTR, ORF, 3’UTR, poly(A) 테일로 이루진다. 본 발명에서 제안하는 구조체는 상기 일반적인 IVT mRNA 구조체의 3' 말단에 추가 서열(additional sequence)이 도입된 형태로서, 이러한 추가 서열는 임의의 서열로, 또 다른 추가 서열과 상보적으로 혼성화하거나, 링커와 혼성화될 수 있는 서열이다. T7 프로모터를 포함하며 5' UTR, ORF, 3’UTR이 클로닝되어 있는 플라스미드 벡터에 적절한 정방향 및 역방향 프라이머를 이용하여 PCR 증폭을 수행함으로써 본 발명의 IVT mRNA 구조체의 제작에 필요한 DNA 주형을 수득하였다(도 1). 원하는 길이의 poly(A) 테일과 추가 서열 도입을 위해서 다양한 종류의 역방향 프라이머를 설계하였다.
프라이머 서열
FP TTGGACCCTCGTACAGAAGCTAATACG
RP 30A TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS21-1 30A AAGCAAGCTGACCCTGAAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS21-1C 30A AAAACTTCAGGGTCAGCTTGCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS21-2 30A AAGCGAGAAACTAGACAAAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS21-2C 30A AAACTTTGTCTAGTTTCTCGCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT CTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS46-1 30A TGTTTGTTGGTGTGGAGGATGGTGTGTGGGTACGCTGAGTCGTTTT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTCCTACTCAGGCTTTATTCAAAGACCA
RP-ADS46-2 30A CTTGGGAGTCGTGGGAGTGTGGGTTAGGGTGGGTTGTAGGAGTTTT TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTTCCTACTCAGGCTTTATTCAAAGACCA
링커 의존성 mRNA 구조체의 제작
본 발명의 mRNA 구조체는 상술한 IVT mRNA의 3' 말단에 결합된 추가 서열에 상보적으로 혼성화할 수 있는 서열을 가진 '링커(linker)' 올리고뉴클레오타이드를 경유하여 제2의 mRNA 구조체와 결합할 수 있다(도 2c). 링커 올리고뉴클레오타이드는 정상 염기(regular base)와 대칭적인 구조를 가지는 역위 염기(inverted base)를 포함하는데(도 2a), 이러한 역위 염기를 이용해서 올리고뉴클레오타이드를 만들면 3' 탄소를 시작점으로 하여 5' 탄소로 종료되는 핵산 분자 구조를 수득할 수 있으며, 정상 염기와 연결되는 부분에서는 5'-5' reversed linkage를 형성할 수 있다(도 2b). 본 발명의 링커는 5’말단에서 3’말단 방향으로 순서대로 역위 염기 → 5'-5' reversed linkage → 정상 염기가 순차적으로 결합되어 있다. 아울러, 5’시작점부터 5'-5' reversed linkage 전까지 배치된 역위 염기들은 제1 mRNA의 구조체의 3' 말단에 결합된 추가 서열과 상보적으로 혼성화할 수 있는 서열로 구성되어 있으며, 5'-5' reversed linkage 이후부터 3' 말단까지 배치된 정상 염기는 제2 mRNA 구조체의 추가 서열과 상보적으로 혼성화할 수 있는 서열로 구성됨으로서, 전체 링커 분자는 서로 상보적이지 않은 추가 서열을 가진 제1 및 제2 mRNA 구조체가 결합하는 데에 가교 역할을 하게 된다(도 2c).
이를 확인하기 위해 서로 상보적이지 않은 추가 서열을 가진 2개의 mRNA 구조체(mRNA-ADS-1 및 mRNA-ADS-2) 및 ADS-1, ADS-2 양쪽 모두와 상보적으로 혼성화 할 수 있는 서열을 가진 링커를 제작한 뒤 mRNA-ADS-1, mRNA-ADS-2 및 링커를 같은 몰 농도로 혼합하고 어닐링을 유도하기 위해 혼합물의 온도를 65℃로 가열 후 5분 유지한 뒤 1℃/20초씩 온도를 감소시켜 700초에 걸쳐 30℃로 냉각하였다. 결과 확인을 위해서 GelRed로 예비-염색한 1% 아가로스 겔에 시료를 로딩 후 1X TAE 완충액, 100V 조건에서 30분 동안 젤 전기영동을 수행하였다. 전기영동이 끝난 후 BIO-RAD Chemidoc Imaging System을 이용해서 젤 이미지를 수득하였다(도 2d).
링커-비의존성 mRNA 구조체의 제작
서로 상보적인 추가 서열을 가진 제1 및 제2 mRNA 구조체(mRNA-ADS 및 mRNA-ADS-C)를 제작하고 mRNA-ADS 및 mRNA-ADS-C를 같은 몰 농도로 혼합하고 어닐링을 유도하기 위해 혼합물을 65℃로 가열 후 5분간 유지한 뒤 1℃/20초씩 온도를 감소시켜 700초에 걸쳐 30℃로 냉각하였다. 결과 확인을 위해서 GelRed로 예비-염색한 1% 아가로스 젤에 시료를 로딩 후 1 x TAE 완충액, 100V 조건에서 30분 동안 젤 전기영동을 수행하였다. 전기영동이 끝난 후 BIO-RAD Chemidoc Imaging System을 이용해서 젤 이미지를 수득하였다(도 3b).
완충액 내 염 농도에 따른 수율의 비교
본 발명의 mRNA 구조체의 수율 분석을 위해서 BIO-RAD Image Lab 6.1 프로그램을 이용하여 겔 이미지를 분석하였다(도 4). 겔 이미지 상 각각의 레인을 지정하고, 어닐링을 진행하지 않은 대조군 레인에서 어닐링 이전의 mRNA들의 밴드 위치를 확인하였다(도 4의 2번 및 3번 레인). 어닐링을 진행한 레인에서:
1) 대조군 레인의 밴드 위치를 참고하여 구조체화 되지 않은 mRNA들의 밴드 위치를 확인한 뒤 밴드별 강도를 정량하고;
2) 구조체화를 위해 사용한 mRNA 중 가장 길이가 긴 mRNA의 밴드 위치보다 상단에 분포하는 밴드 또는 smear는 구조체화된 결과물로 예측되므로, 가장 길이가 긴 mRNA의 밴드 상단 영역의 강도를 정량하였으며;
3) 한 레인 안에서 전체 밴드 강도 값의 합계를 100%로 하고, 그 중 2)에서 계산한 강도 값의 비율을 구조체화(structuralization) 수율로 정의하였다.
기본 반응은 1 x PBS 완충액, NaCl 135mM 조건에서 진행하였고, 반응 조건의 최적화를 위해서 NaCl 농도를 조절하여 실험을 진행하였다. 최초 농도인 NaCl 135mM 조건에서 36%의 수율을 보였고, NaCl 농도가 400mM, 600mM로 증가함에 따라 수율은 각각 49%, 55%로 증가하였다(도 4). 이를 통해 NaCl 농도 증가가 구조체화 수율 향상에 긍정적인 영향을 미침을 알 수 있었다. 단, 400mM를 초과하는 NaCl 농도에서는 구조체화 수율이 포화되는 경향을 보였으므로, 이후 추가 실험들을 위해서 1X PBS 완충액, NaCl 400mM 조건을 사용하였다.
mRNA 농도에 따른 수율의 비교
기본 반응은 1X PBS 완충액, NaCl 400mM, mRNA 300nM 조건에서 진행하였으며, 반응 조건 최적화를 위해 mRNA 농도를 조절하였다. 최초 농도인 mRNA 300nM 조건에서 48%의 수율을 보였으며, mRNA 농도가 600nM, 1200nM, 1800nM, 2400nM으로 증가함에 따라 수율은 각각 55%, 68%, 71%, 76%로 변화함을 관찰함으로서 mRNA 농도 증가가 구조체화 수율에 긍정적인 영향을 미치는 것을 알 수 있었다(도 5). 단, 1200nM를 초과하는 농도에서는 구조체화 수율이 포화되는 경향을 보였으므로, 이후 추가 실험들을 위해서는 1X PBS 완충액, NaCl 400mM, mRNA 1200nM 조건을 사용하였다.
Poly(A) 테일의 길이에 따른 수율의 비교
1 x PBS 완충액, NaCl 400mM, mRNA 1200nM 조건을 적용하였으며, Poly(A) 테일 길이가 각각 30A 및 120A인 mRNA의 구조체화 수율을 비교한 결과, 30A인 경우 68%, 120A인 경우 65%의 수율을 각각 보였다(도 6). 이를 통해 Poly(A) 길이는 구조체화 수율에 유의미한 영향을 미치지 않음을 확인하였다.
추가 서열(additional sequence)의 길이에 따른 수율의 비교
1X PBS 완충액, NaCl 400mM, mRNA 1200nM 조건을 적용하였으며, 21nt의 추가 서열이 결합된 mRNA들을 연결하는 링커(LNK21)를 사용한 경우 및 46nt의 추가 서열이 결합된 mRNA들을 연결하는 링커(LNK46)를 사용한 경우의 구조체화 수율을 비교한 결과, LNK21을 사용한 경우 72%, LNK46을 사용한 경우 66%의 수율을 각각 보였다. 이를 통해 추가 서열 길이 변화는 구조체화 수율에 유의미한 영향을 미치지 않음을 확인하였다(도 7).
링커-의존성 및 비의존성 구조체의 수율
mRNA 2400nM, 1X PBS, 400mM NaCl 조건에서 링커-의존성 구조체화 결과 최대 76%의 구조체화 수율을 보였으며(도 8a), mRNA 2400nM, 1X PBS, 400mM NaCl 조건에서 링커-비의존성 구조체화 결과 최대 75%의 구조체화 수율을 보여(도 8b) 제1 및 제2 mRNA 구조체가 결합하는 과정에서 링커의 사용 여부에 따른 유의한 수율 차이는 없는 것으로 확인되었다.
인 비트로 루시퍼라제 발현 분석
새로운 구조체의 세포 내 단백질 발현 능력을 평가하기 위해 루시퍼라제 어세이를 수행하였다. IVT mRNA의 캐핑(capping)을 위해 ARCA(anti-reverse cap analogue)를 ARCA:GTP=4:1 비율로 적용하였으며, 일반적인 UTP를 대신하여 pUTP (pseudouridine triphosphate)를 사용하였고, 30개의 A로 이루어진 poly(A) 테일을 도입하였다. 96 웰-플레이트에 웰당 HEK293T 3.0 x 104 cells를 씨딩하고 24시간 동안 37℃, 5% CO2 환경에서 사전-인큐베이션을 하였다. 시료 별로 총 mRNA 105ng (mRFP, mRFP-ADS46-1: 35ng/ mLuc, mLuc-ADS46-2: 70ng)을 형질도입하였다. mLuc, mLuc-ADS46-2를 단독으로 형질도입한 시료는 총 mRNA 양을 105ng로 맞추기 위해 35ng의 scramble mRNA를 함께 형질도입하였다(mRFP-ADS46-1/LNK46/mLuc-ADS46-2, mRFP-P2A-Luc, mLuc-P2A-RFP: 105ng). 형질도입에 Lipofectamine 2000을 이용하였으며, 형질도입 후 24시간 동안 37℃, 5% CO2 환경에서 인큐베이션한 뒤 루시퍼라제 어세이를 수행하였다.
본 발명의 다중 단백질 발현용 mRNA 구조체와, 하나의 mRNA로 다중 단백질을 동시에 발현하기 위해 현재 널리 사용되는 2A 펩타이드의 단백질 발현 효율을 비교하고자 공지된 2A 펩타이드 중 porcine teschovirus-1 유래의 P2A를 사용하였다. 2A 펩타이드는 해당 서열이 포함된 mRNA가 번역되는 과정 중에, C-말단에 위치한 글리신(glycine)과 프롤린(proline) 사이에서 리보좀이 펩타이드 결합 형성을 건너뛰어(리보좀 스키핑) 해당 부위의 업스트림에 위치한 단백질과 다운스트림에 위치한 단백질이 분리(self-cleaving)되는 특성을 이용하여 2A 펩타이드의 업스트림과 다운스트림에 각각 원하는 단백질을 코딩하는 염기서열을 배치함으로서 다중 단백질 발현을 달성한다. 단, 2A 펩타이드는 다운스트림에 위치한 단백질이 업스트림에 위치한 단백질에 비해 적게 발현된다는 문제점이 보고된 바 있다.
본 발명의 다중 단백질 발현용 mRNA 구조체와의 효율 비교를 위해 ORF에 RFP-P2A-Luc 서열 및 Luc-P2A-RFP 서열이 삽입된 플라스미드 벡터들을 각각 클로닝하였다. 이 플라스미드 벡터들에 적절한 프라이머를 사용하여 PCR 증폭을 수행함으로서 IVT 주형을 생산하고, 이 IVT 주형을 이용하여 전사를 수행함으로서 원하는 mRNA를 생산하였다(mRFP-P2A-Luc, mLuc-P2A-RFP).
링커(LNK46)를 이용해서 mRFP-ADS46-1과 mLuc-ADS46-2을 구조체화 한 본 발명의 구조체(mRFP-ADS46-1/LNK46/mLuc-ADS46-2)의 루시퍼라제 발현 수준이 mRFP-ADS46-1과 mLuc-ADS46-2을 함께 형질도입한 경우(mRFP-ADS46-1 + mLuc-ADS46-2) 및 mLuc-ADS46-2 형질도입한 경우에 비해 높음을 확인하였다(도 9). 이러한 결과는 추가 서열과 DNA 올리고뉴클레오타이드 링커가 결합하여 형성된 DNA/RNA 하이브리드가 세포 내 RNase H에 의해 분해되어 mRNA 추가 서열이 제거됨으로서 추가 서열로 인해 저해되었던 mRNA의 단백질 발현이 회복된 결과로 추정된다.
링커(LNK46)를 이용해서 mRFP-ADS46-1과 mLuc-ADS46-2을 구조체화한 경우(mRFP-ADS46-1/LNK46/mLuc-ADS46-2), P2A를 이용해서 업스트림의 RFP와 다운스트림의 Luc을 동시 발현한 경우(mRFP-P2A-Luc)에 비해 높은 루시퍼라제 발현 수준을 보였으며, P2A를 이용해서 업스트림의 Luc와 다운스트림의 RFP를 동시에 발현한 경우(mLuc-P2A-RFP)와 비교하면 동등한 루시퍼라제 발현 수준을 보였다(도 9). 이러한 결과를 통해 본 발명의 다중 단백질 발현용 mRNA 구조체는 종래의 P2A 시스템 대비 동등 이상의 다중 단백질 발현 효율을 보일 뿐 아니라 업스트림과 다운스트림 위치에 따라 목적 단백질의 발현량이 불균등한 P2A의 단점을 효율적으로 극복함을 확인하였다.
인 비트로 RFP 발현 분석
본 발명의 다중 단백질 발현용 mRNA 구조체의 세포 내 단백질 발현 능력을 평가하기 FACS 분석을 통해 RFP(red fluorescent protein)의 발현을 측정하였다. IVT mRNA는 Capping을 위해 ARCA:GTP=4:1 비율로 ARCA cap을 사용하였으며, UTP를 대신하여 변이된 pUTP(pseudouridine triphosphate)를 적용하였고, 30개의 A로 이루어진 poly(A) 테일을 도입하였다. 12 웰-플레이트에 웰당 3.0 x 105 cells 밀도로 HEK293T를 씨딩하고 이후 24시간 동안 37℃, 5% CO2 환경에서 사전-인큐베이션을 하였다. 시료 별로 총 mRNA 1050ng (mLuc 700ng, mRFP 350ng)를 형질도입하였다. mRFP, mRFP-ADS46-1 단독 형질도입하는 시료는 총 mRNA 양을 1050ng로 맞추기 위해 700ng의 scramble mRNA를 함께 형질도입하였다(mLuc, mLuc-ADS46-2: 700ng/ mRFP-ADS46-1/LNK46/mLuc-ADS46-2, mRFP-P2A-Luc, mLuc-P2A-RFP: 1050ng). Lipofectamine 2000을 이용하여 형질도입하였으며, 이후 24시간 동안 37℃, 5% CO2 환경에서 인큐베이션한 후 루시퍼라제 어세이를 수행하였다.
FACS를 통해 적색 형광을 측정한 결과, 링커(LNK46)를 이용해서 mRFP-ADS46-1과 mLuc-ADS46-2을 구조체화한 경우(mRFP-ADS46-1/LNK46/mLuc-ADS46-2)가 mRFP-ADS46-1과 mLuc-ADS46-2을 함께 형질도입한 경우(mRFP-ADS46-1 + mLuc-ADS46-2) 및 mRFP-ADS46-1 단독 형질도입의 경우에 비하여 RFP 발현 수준이 높음을 확인하였다. 이 결과는 역시 mRNA-ADS에 포함된 추가 서열의 영향에 의해 저해되었던 단백질 발현이 상술한 과정을 통해 회복된 것으로 추정할 수 있다(도 10).
링커(LNK46)를 이용해서 mRFP-ADS46-1과 mLuc-ADS46-2을 구조체화한 경우(mRFP-ADS46-1/LNK46/mLuc-ADS46-2), P2A를 이용해서 업스트림의 RFP와 다운스트림의 Luc을 동시에 발현한 경우(mRFP-P2A-Luc) 및 P2A를 이용해서 업스트림의 Luc와 다운스트림의 RFP를 동시에 발현한 경우(mLuc-P2A-RFP) 모두에 비해 높은 RFP 발현 수준을 보임을 확인하였다(도 10). 이러한 결과는 루시퍼라제 어세이에서 도출한 결과와 일치하는 것으로, 본 발명의 다중 단백질 발현용 mRNA 구조체가 P2A 시스템 대비 동등 이상의 다중 단백질 발현 효율을 보임을 다시 한번 확인할 수 있었다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (12)

  1. 다음을 포함하는 다중 단백질 발현용 핵산 분자:
    (a) 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제1 추가 서열(Additional Sequence, ADS)을 포함하는 제1 핵산 구조체; 및
    (b) 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 상기 제1 추가 서열과 상보적으로 혼성화될 수 있는 제2 추가 서열을 포함하는 제2 핵산 구조체.
  2. 제 1 항에 있어서, 상기 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열은 각각 양 말단에 5'-UTR 및 3'-UTR이 결합되어 있는 것을 특징으로 하는 핵산 분자.
  3. 제 2 항에 있어서, 상기 5'-UTR은 5'-cap이 결합되어 있는 것을 특징으로 하는 핵산 분자.
  4. 제 2 항에 있어서, 상기 핵산 구조체는 상기 3'-UTR과 상기 추가 서열 사이에 20개 내지 400개의 염기를 포함하는 폴리(A) 서열을 추가적으로 포함하는 것을 특징으로 하는 핵산 분자.
  5. 제 1 항에 있어서, 상기 제1 핵산 구조체 및 제2 핵산 구조체는 IVT(in vitro transcribed) mRNA인 것을 특징으로 하는 핵산 분자.
  6. 제 5 항에 있어서, 상기 IVT mRNA 중 우라실(U)의 전부 또는 일부가 하기 화학식 1로 표시되는 변형된 U(modified U)로 치환된 것을 특징으로 하는 RNA 분자:
    화학식 1
    Figure PCTKR2023019767-appb-img-000005
    상기 화학식에서 R1 및 R2는 각각 독립적으로 수소, C1-C3 알킬 또는 C1-C3 알콕시이고, X 및 A는 탄소 또는 질소이며 서로 상이하고,
    Figure PCTKR2023019767-appb-img-000006
    는 단일결합 또는 이중결합을 나타낸다.
  7. 다음을 포함하는 다중 단백질 발현용 핵산 분자:
    (a) 제1 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제1 추가 서열(Additional Sequence, ADS)을 포함하는 제1 핵산 구조체;
    (b) 제2 목적 단백질을 인코딩하는 뉴클레오타이드 서열 및 3’말단에 임의의 제2 추가 서열을 포함하는 제2 핵산 구조체; 및
    (c) 상기 제1 추가 서열과 상보적으로 혼성화될 수 있는 제1 영역 및 상기 제2 추가 서열과 상보적으로 혼성화될 수 있는 제2 영역을 포함하는 링커(linker).
  8. 제 7 항에 있어서, 상기 제1 영역 및 제2 영역 중 어느 하나는 역위 염기(Inverted base)로 구성된 것을 특징으로 하는 핵산 분자.
  9. 제 8 항에 있어서, 상기 제1 영역 및 제2 영역은 5'-5' 역위결합(reversed linkage)에 의해 결합되는 것을 특징으로 하는 핵산 분자.
  10. 제 7 항에 있어서, 상기 제1 핵산 구조체 및 제2 핵산 구조체는 IVT(in vitro transcribed) mRNA인 것을 특징으로 하는 핵산 분자.
  11. 제 10 항에 있어서, 상기 IVT mRNA 중 우라실(U)의 전부 또는 일부가 하기 화학식 1로 표시되는 변형된 U(modified U)로 치환된 것을 특징으로 하는 RNA 분자:
    화학식 1
    Figure PCTKR2023019767-appb-img-000007
    상기 화학식에서 R1 및 R2는 각각 독립적으로 수소, C1-C3 알킬 또는 C1-C3 알콕시이고, X 및 A는 탄소 또는 질소이며 서로 상이하고,
    Figure PCTKR2023019767-appb-img-000008
    는 단일결합 또는 이중결합을 나타낸다.
  12. 다음을 포함하는 다중 단백질 발현용 핵산 구조체:
    (a) 목적 단백질을 인코딩하는 뉴클레오타이드 서열; 및
    (b) 상기 핵산 구조체의 3’말단에 위치하여 다른 핵산 구조체 또는 링커 서열과 혼성화될 수 있는 추가 서열(Additional Sequence, ADS).
PCT/KR2023/019767 2022-12-05 2023-12-04 다중 단백질의 발현을 위한 신규 핵산 구조체 WO2024123005A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2022-0167440 2022-12-05
KR1020220167440A KR20240086779A (ko) 2022-12-05 2022-12-05 다중 단백질의 발현을 위한 신규 핵산 구조체

Publications (1)

Publication Number Publication Date
WO2024123005A1 true WO2024123005A1 (ko) 2024-06-13

Family

ID=91379602

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/019767 WO2024123005A1 (ko) 2022-12-05 2023-12-04 다중 단백질의 발현을 위한 신규 핵산 구조체

Country Status (2)

Country Link
KR (1) KR20240086779A (ko)
WO (1) WO2024123005A1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101514473B1 (ko) * 2007-05-15 2015-04-22 트랜스진 에스.에이. 다중 유전자 발현용 벡터
WO2022051677A1 (en) * 2020-09-04 2022-03-10 Verve Therapeutics, Inc. Compositions and methods for capping rnas

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101514473B1 (ko) * 2007-05-15 2015-04-22 트랜스진 에스.에이. 다중 유전자 발현용 벡터
WO2022051677A1 (en) * 2020-09-04 2022-03-10 Verve Therapeutics, Inc. Compositions and methods for capping rnas

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ARYA SMRITI, LIN QIUBIN, ZHOU NAN, GAO XIANG, HUANG JIAN-DONG: "Strong Immune Responses Induced by Direct Local Injections of Modified mRNA-Lipid Nanocomplexes", MOLECULAR THERAPY-NUCLEIC ACIDS, CELL PRESS, US, vol. 19, 1 March 2020 (2020-03-01), US , pages 1098 - 1109, XP055874595, ISSN: 2162-2531, DOI: 10.1016/j.omtn.2019.12.044 *
LEE KYURI, KIM SOO YOUNG, SEO YUNMI, KWON HYOKYUNG, KWON YOUNG JIK, LEE HYUKJIN: "Multicistronic IVT mRNA for simultaneous expression of multiple fluorescent proteins", JOURNAL OF INDUSTRIAL AND ENGINEERING CHEMISTRY, THE KOREAN SOCIETY OF INDUSTRIAL AND ENGINEERING CHEMISTRY, KOREA, vol. 80, 1 December 2019 (2019-12-01), KOREA , pages 770 - 777, XP093178226, ISSN: 1226-086X, DOI: 10.1016/j.jiec.2019.06.042 *
LEE KYURI; KIM TAE-SHIN; SEO YUNMI; KIM SOO YOUNG; LEE HYUKJIN: "Combined hybrid structure of siRNA tailed IVT mRNA (ChriST mRNA) for enhancing DC maturation and subsequent anticancer T cell immunity", JOURNAL OF CONTROLLED RELEASE, ELSEVIER, AMSTERDAM, NL, vol. 327, 11 August 2020 (2020-08-11), AMSTERDAM, NL , pages 225 - 234, XP086328272, ISSN: 0168-3659, DOI: 10.1016/j.jconrel.2020.08.009 *

Also Published As

Publication number Publication date
KR20240086779A (ko) 2024-06-19

Similar Documents

Publication Publication Date Title
US20210299280A1 (en) Compositions and methods for transient gene therapy with enhanced stability
Wang et al. Detection of integration of plasmid DNA into host genomic DNA following intramuscular injection and electroporation
EP3610035B1 (en) Compositions and methods for transient gene therapy with enhanced stability
WO2012053741A2 (ko) Rna 간섭을 유도하는 핵산 분자 및 그 용도
TW201215408A (en) Antisense nucleic acid
JP2002320497A (ja) エキソヌクレアーゼ含有溶解物を用いる無細胞invitro転写/翻訳系、またはエキソヌクレアーゼを含む細胞系における、安定化された線状短鎖DNAからのタンパク質発現方法
WO2022191642A1 (ko) 자가 환형화 rna 구조체
US20230181620A1 (en) Compositions for translation and methods of use thereof
WO2024123005A1 (ko) 다중 단백질의 발현을 위한 신규 핵산 구조체
WO2024053933A1 (ko) Mrna의 세포내 안정성과 생합성을 향상시키는 utr 서열을 포함하는 구성물과 그 사용
WO2021107647A1 (ko) 단백질 발현용 mrna 구조체 및 이의 용도
Epplen et al. An attempt to approach the molecular mechanisms of primary sex determination: W‐and Y‐chromosomal conserved simple repetitive DNA sequences and their differential expression in mRNA
WO2022010241A1 (ko) 질환 세포-특이적인 mirna에 의해 세포 생리 활성 조절 물질의 활성을 조절하는 복합체 및 이를 crispr/cas 시스템에 적용한 질환 특이적 유전자 조작용 복합체
WO2022131398A1 (ko) 유전자 발현 및 억제가 동시에 가능한 핵산 구조체
WO2019048882A1 (en) OLIGONUCLEOTIDES AND THEIR ANALOGUES
WO2021157809A1 (ko) 신규한 핵산 분자 전달용 조성물 및 그 용도
JP2024523006A (ja) 新規なレプリカーゼサイクリング反応(rcr)
WO2023149775A1 (ko) 유전자 전달용 올리고뉴클레오티드 및 이를 포함하는 유전자 전달용 지질나노입자
WO2012033382A2 (ko) 신규한 rna 결합 단백질 및 이를 이용한 무표지 마이크로 rna 검출방법
WO2016122135A1 (ko) 상보적 염기서열 내지는 미스-매치된 염기를 포함하는 상보적인 염기서열과 연결된 pcr 프라이머 및 이를 이용한 핵산 증폭 방법
WO2021187883A1 (ko) 인비트로 트랜스크립트 mrna 및 이를 함유하는 약학조성물
WO2019231287A1 (ko) 회전환 증폭을 이용한 표적핵산 검출 방법 및 표적핵산 검출용 조성물
WO2023234661A1 (ko) 신규한 변형 폴리아데닌 서열 및 이의 용도
WO2021246565A1 (ko) 개선된 안정성을 갖는 핵산 분자 및 이의 용도
JP2002291491A (ja) Rna−dna結合体