KR20220093189A - 세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터 - Google Patents

세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터 Download PDF

Info

Publication number
KR20220093189A
KR20220093189A KR1020227018753A KR20227018753A KR20220093189A KR 20220093189 A KR20220093189 A KR 20220093189A KR 1020227018753 A KR1020227018753 A KR 1020227018753A KR 20227018753 A KR20227018753 A KR 20227018753A KR 20220093189 A KR20220093189 A KR 20220093189A
Authority
KR
South Korea
Prior art keywords
gene
cell
site
cloning
interest
Prior art date
Application number
KR1020227018753A
Other languages
English (en)
Inventor
마이클 씨 주잇
에쉬티 에스 카림
미카엘 쾨프케
다마위 주미나가
펑민 류
Original Assignee
노오쓰웨스턴유니버시티
란자테크, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노오쓰웨스턴유니버시티, 란자테크, 인크. filed Critical 노오쓰웨스턴유니버시티
Publication of KR20220093189A publication Critical patent/KR20220093189A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

무세포 단백질 합성(CFPS)을 수행하고 세포에서 단백질을 발현하기 위한 조성물, 방법 및 키트가 개시된다. 클로닝을 위한 골든 게이트 부위를 포함하는 벡터, 이러한 벡터를 제조하는 방법, 및 세포에서, 예컨대 클로스트리듐 아우토에토게눔을 포함하는 클로스트리디아의 자연 발생 또는 재조합된 종에서 CFPS를 수행하기 위한 및 단백질을 발현하기 위한 이의 용도가 특히 개시되어 있다.

Description

세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터
연방 지원된 조사 또는 개발에 대한 성명
본 발명은 미국 에너지국(Department of Energy)이 부여한 SC0018249 하에 정부 지원으로 이루어졌다. 정부는 본 발명에서 소정의 권한을 갖는다.
관련된 특허 출원의 상호 참조
본 출원은 35 U.S.C. 119(e) 하에 2019년 12월 3일에 출원된 미국 가출원 제62/943,036호의 우선권의 이익을 주장하고, 이의 내용은 그 전체가 본원에 참고로 포함된다.
본 발명은 일반적으로 무세포 단백질 합성(CFPS: cell-free protein synthesis)을 수행하고 세포에서 단백질을 발현하기 위한 조성물, 방법 및 키트에 관한 것이다. 보다 구체적으로는, 본 발명은 클로닝을 위한 골든 게이트 부위를 포함하는 벡터, 이러한 벡터를 제조하는 방법, 및 세포에서, 예컨대 클로스트리듐 아우토에토게눔(Clostridium autoethanogenum)을 포함하는 클로스트리디아의 자연 발생 또는 재조합된 종에서 CFPS를 수행하기 위한 그리고 단백질을 발현하기 위한 이의 용도에 관한 것이다.
효소의 무세포 발현은 대개 최소 조절로 DNA를 요하지만, 세포 발현은 섀시 유기체에 특이적일 수 있고, 오히려 복잡한 구성을 함유한다. 이는 후속하여 세포에서 경로를 구축하기 전에 무세포 환경에서 프로토타이핑 생합성 경로에 관여된 조사 및 개발에 부담을 줄 수 있다. 그러나, 무세포 발현 벡터의 변형은 대개 발현 능력의 급격한 감소로 이어질 수 있다. 본원에서, 본 발명자들은 무세포 발현을 억제하지 않으면서 클로스트리디아 발현 벡터로의 단순한 클로닝을 위해 변형된 무세포 벡터를 구축하였다. 이 무세포 벡터는 원래의 무세포 벡터의 5' 및 3' 말단에서의 변형을 함유하고, 너무 길고 비싼 재합성 및/또는 서브클로닝 없이 생체내 발현 작제물의 빠른 직접적인 어셈블리를 허용한다. 개시된 벡터는 비제한적인 예로서 (i) 대사의 시험관내 연구; (ii) 생물제조 및 소분자 생성; (iii) 이종성 경로를 균형화하기 위한 효소-발현 수준 프로토타이핑; (iv) 생합성 경로의 신속한 고쓰루풋 시험; (v) 효소 개발; (vi) 생합성 경로 오류수정; (vii) 가스 발효; 및 (viii) 화학물질 및 진전된 생물제품을 제조하기 위한 클로스트리디아의 조작을 포함하는 분야에 사용될 수 있다. 개시된 벡터는 CFPS 및 세포에서의 후속하는 단백질 발현에서 사용될 때 유리한데, 왜냐하면 이들이 더 적은 재조합 조작으로 CFPS 및 세포에서의 후속하는 단백질 발현 둘 모두를 수행하도록 사용될 수 있어서, 조작된 세포에서 생물학적 경로를 생물학적으로 설계하는 데 관여된 비용을 감소시키기 때문이다.
무세포 단백질 합성(CFPS)을 수행하고 세포에서 단백질을 발현하기 위한 조성물, 방법 및 키트가 개시된다. 벡터, 벡터를 제조하는 방법, 및 세포에서, 예컨대 클로스트리듐 아우토에토게눔을 포함하는 클로스트리디아의 자연 발생 또는 재조합된 종에서 CFPS를 수행하기 위한 그리고 단백질을 발현하기 위한 이의 용도가 특히 개시되어 있다.
도 1. 본원에 개시된 벡터 및 시스템의 예시적인 실시형태.
도 2. 제1 골든 게이트 부위(GG1), 제3 골든 게이트 부위(GG3) 및 제5 골든 게이트 부위(GG5)를 제공하기 위해 리보솜 결합 부위(RBS)의 BsaI 하류에 대한 인식 부위를 포함하는 무세포 발현 벡터를 설계하기 위한 다양한 옵션의 예시. A. 옵션 1: BsaI(RBS의 하류); B. 옵션 2: BsaI(RBS의 하류, 그러나 비변경된 RBS 서열); 및 C. 옵션 3: BbsI(RBS의 하류).
도 3. 대조군 벡터(pJL1)에 대한 변형된 벡터(p111, p212, p314, p431, p532, p634, p751, p852 및 p954)를 사용한 GFP의 무세포 발현.
도 4. 본원에 개시된 것과 같은 다유전자 발현 벡터를 사용한 발현 경로의 어셈블리. 공여자 플라스미드 pDN1-sfGFP, pDN2-Pwl, pDN3-sfGFP, pDN4-Ppfor 및 pDN5-buk로부터의 성분은 골든 게이트 프로토콜을 사용하여 절제되고 골격 세포 발현 플라스미드로 어셈블링되었다.
도 5. 5/15개의 형질전환된 세포에서 형광에 의해 예시된 성분의 세포 발현.
도 6. 클로스트리듐 벡터 시스템으로 무세포를 사용한 3개의 유전자의 어셈블리.
도 7. 클로스트리듐 벡터 시스템으로 무세포를 사용한 수혜자 벡터로의 2개의 유전자의 어셈블리.
도 8. 클로스트리듐 벡터 시스템으로 무세포를 사용한 수혜자 벡터로의 단일 유전자의 어셈블리.
도 9. 클로스트리듐 발현 벡터로의 무세포 벡터의 심리스 어셈블리가 가능하게 하는 모듈식 '무세포 대 클로스트리듐' 벡터 시스템에 대한 프레임워크. (a) 시험관내 수요 및 생체내 수요 사이의 정보가 DNA 서열을 설계하기 위해 어떻게 사용되는지의 체계적 표시, JGI 시설은 DNA 설계를 구축할 수 있고, DNA 재료는 시험관내 실험 및 생체내 실험 둘 모두에서 사용될 수 있다. 근사 시간은 무세포 시험, 생체내 작제물 어셈블리 및 DNA 합성에 주목된다(새로운 워크플로우 및 오래된 워크플로우에 대해). DNA 합성과 연관된 비용은 0.1 USD/bp 및 1 내지 3 kb 유전자의 추정에 의해 계산된다. (b) 모듈식 벡터 시스템의 구성이 도시되어 있다. BsaI 분해로부터 생성된 고유한 오버행(Ov) 부위를 첨가함으로써 어셈블리에 무세포 벡터가 적합하게 제조된다.
도 10. 골든 게이트 적합 벡터의 무세포 발현은 생합성 효소를 프로토타이핑하기에 충분하다. (a) 리포터 sfGFP를 사용하여 CFE에서 3개의 공여자 플라스미드의 각각의 3개의 변이체(BsaI 부위가 어디에 위치하는지의 변경)의 체계적 표시가 기재되어 있다. (b) sfGFP 농도는 무세포 반응이 시작한 후 20시간에 형광에 의해 측정되었다. 데이터는 평균 오류를 갖는 n=2 독립 실험에 대해 기재되어 있다. (c) 3개의 공여자 벡터의 각각으로부터 발현된 Ptb 및 Buk 효소에 대한 20시간에서의 단백질 농도는 C14-류신 혼입을 통해 측정되었다. 데이터는 평균 오류를 갖는 n=2 독립 실험에 대해 기재되어 있다. (d) 산 및 알코올 발효에 대한 관심 있는 16개의 효소는 C. 아우토에토게눔에 대해 코돈 최적화되고, pD1, pD2 및 pD3으로 클로닝되었다. n=3 독립 실험에 대해 20시간에서 단백질 발현을 측정하였다. 모든 오류 막대는 1의 표준 편차를 나타낸다.
도 11. 적합 무세포 벡터 시스템을 사용한 3-유전자 작제물의 골든 게이트 어셈블리. (a) 플라스미드의 컴퓨터 설계, 액체-취급 지시, 플라스미드 어셈블리, 및 플라스미드 확인으로 이루어진 자동화 어셈블리를 포함하는 본 발명자들의 골든 게이트 어셈블리 워크플로우의 체계적 표시. (b) 작제된 클로스트리듐 발현 벡터를 함유하는 6개 콜로니에서의 플라스미드 어셈블리의 PCR 확인.
도 12. 모듈식 '무세포 대 클로스트리듐' 벡터 시스템. (A) 단일 유전자 삽입을 위한 2개-부분 어셈블리. (B) 정의된 Ov 부위를 사용한 2개-유전자 삽입이 가능하게 하는 공여자 벡터의 구성. (C) 1개 초과의 유전자를 보유하기 위한 pD1(또는 pD2, pD3)의 변형은 '무세포 대 클로스트리듐' 벡터 시스템을 사용하여 3개 초과의 유전자의 완전한 어셈블리를 허용한다. (D) pCExpress는 상이한 어셈블리 유형에 대해 변할 수 있다. 핵심 매개변수는 표 3에서 변이체의 전체 표로 본원에 언급된다.
도 13. E. 콜라이 최적화된 DNA 서열의 무세포 발현은 클로스트리듐 최적화된 서열보다 더 많은 단백질을 생성한다. 17개의 유전자 서열은 E. 콜라이 및 C. 아우토에토게눔에 대해 코돈 최적화되고 pJL1에 배치된다. 각각은 n=2로 CFE에서 발현되었다. 평균 발현은 20시간 후 나타났고, 오류 막대는 평균 오류를 나타낸다.
도 14. C. 아우토에토게눔 최적화된 DNA 서열의 무세포 발현은 활성 단백질을 생성한다. 14C-류신 혼입(가용성 분획)을 사용한 도 13에서 발현된 C. 아우토에토게눔에 대해 코돈 최적화된 16개의 유전자 서열은 SDS PAGE에서 실행되었고(a), 자기방사법에 의해 노출되었다(b). PAGE 겔 및 생성된 자가방사기록사진이 본원에 제시되고, 분자량이 열거되어 있다. (c) 부탄산을 제조하기 위한 12개의 고유한 생합성 경로(아세틸-CoA로부터의 4개의 효소 단계)는 (a)(b)로부터 발현된 효소를 함유하는 용해물을 배합함으로써 구축되었다. 오류 막대는 n=3으로 1의 표준 편차를 나타낸다.
정의 및 전문용어
개시된 대상은 하기와 같은 정의 및 전문용어를 사용하여 추가로 기재될 수 있다. 본원에 사용된 정의 및 전문용어는 오직 특정 실시형태를 기술할 목적이고 제한인 것으로 의도되지 않는다.
본 명세서 및 청구항에 사용된 것과 같이, 단수 형태("a", "an" 및 "the")는 문맥이 명확히 달리 기술하지 않는 한 복수의 형태를 포함한다. 예를 들어, "성분"과 같은 용어는, 문맥이 명확히 달리 기술하지 않는 한, "하나 이상의 성분"을 의미하는 것으로 해석되어야 한다. 본원에 사용된 것과 같이 "복수"와 같은 용어는 "2개 이상"을 의미한다.
본원에 사용된 것과 같이 "약", "대략", "실질적으로" 및 "유의미하게"는 당업자에 의해 이해될 것이고, 이들이 사용된 맥락에 약간의 정도로 변할 것이다. 이것이 사용된 맥락을 고려하여 당업자에게 명확하지 않은 용어의 사용이 있으면, "약" 및 "대략"은 특정 용어의 플러스 또는 마이너스 10%까지를 의미할 것이고, "실질적으로" 및 "유의미하게"는 특정 용어의 플러스 또는 마이너스 10% 초과를 의미할 것이다.
본원에 사용된 것과 같이 "포함한다" 및 "포함하는"과 같은 용어는 "함유한다" 및 "함유하는"과 같은 용어와 동일한 의미를 갖는다. "포함한다" 및 "포함하는"과 같은 용어는 청구항에 열거된 성분에 추가로 추가 성분의 포함을 허용하는 "개방" 이행 용어인 것으로 해석되어야 한다. "이루어진" 및 "이루어지는"과 같은 용어는 청구항에 열거된 성분 이외의 추가 성분의 포함을 허용하지 않는 "폐쇄" 이행 용어인 것으로 해석되어야 한다. "본질적으로 이루어진"과 같은 용어는 부분적으로 폐쇄이고 청구된 대상의 성질을 기본적으로 변경하지 않는 오직 추가 성분의 포함을 허용하는 것으로 해석되어야 한다.
"예컨대"와 같은 구절은 "예를 들어, 포함하는"으로 해석되어야 한다. 더욱이 비제한적인 예로서 "예컨대"를 포함하는 임의의 및 모든 예시적인 언어의 사용은 단순히 본 발명을 더 잘 예시하도록 의도되고, 달리 청구되지 않는 한 본 발명의 범위에 대한 제한을 부여하지 않는다.
더욱이, "A, B 및 C 등 중 적어도 하나"와 유사한 관계가 사용되는 경우에, 일반적으로 이러한 구성은 당업자가 관례를 이해한다는 점에서 의도된다(예를 들어, "A, B 및 C 중 적어도 하나를 갖는 시스템"은 A 단독, B 단독, C 단독, 및 A와 B를 함께, 및 A와 C를 함께, B와 C를 함께, 및/또는 A, B와 C를 함께 갖는 시스템을 포함하지만, 이들로 제한되지는 않을 것이다). 2개 이상의 대안적인 용어를 제시하는 실제로 임의의 선언적 단어 및/또는 구절이 설명 또는 도면에서든 용어들 중 하나, 용어들 중 어느 것, 또는 용어들 둘 모두를 포함하는 것의 가능성을 고려하는 것으로 이해되어야 한다고 당업자에 의해 추가로 이해될 것이다. 예를 들어, "A 또는 B"라는 구절은 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
"이하", "적어도", "초과", "미만" 및 기타와 같은 모든 언어는 열거된 숫자를 포함하고, 후속하여 상기 기술된 것처럼 하위범위로 나눠질 수 있는 범위를 지칭한다.
범위는 각각의 개별 구성원을 포함한다. 이와 같이, 예를 들어, 1개 내지 3개의 구성원은 갖는 그룹은 1개, 2개 또는 3개의 구성원을 갖는 그룹을 지칭한다. 유사하게, 6개의 구성원은 갖는 그룹은 1개, 2개, 3개, 4개 또는 6개의 그룹 및 기타 등등을 갖는 그룹을 지칭한다.
법조 동사 "할 수 있다"는 몇몇 기재된 실시형태 또는 여기에 함유된 특징 중에서 하나 이상의 옵션 또는 선택의 바람직한 사용 또는 선택을 지칭한다. 옵션 또는 선택이 특정 실시형태 또는 이에 함유된 특징과 관련하여 개시되어 있지 않는 경우, 법조 동사 "할 수 있다"는 어떻게 제조하고 사용하는지에 관한 긍정적 작용 및 기재된 실시형태 또는 이에 함유된 특징의 양태, 또는 기재된 실시형태 또는 이에 함유된 특징과 관련하여 특정 기술을 사용하기 위한 한정적 결정을 지칭한다. 이 후자의 맥락에서, 법조 동사 "할 수 있다"는 조동사 "일 수 있다"와 동일한 의미 및 함축을 갖는다.
폴리뉴클레오타이드 및 합성 방법
개시된 방법, 장치, 키트 및 성분은 폴리뉴클레오타이드를 사용하고/하거나 포함할 수 있다. "폴리뉴클레오타이드", "폴리뉴클레오타이드 서열", "핵산" 및 "핵산 서열"과 같은 용어는 뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드(이 용어는 상호교환 가능하게 사용될 수 있음), 또는 임의의 이들의 단편을 지칭한다. 이들 구절은 또한 게놈, 천연, 또는 합성 기원(단일-가닥 또는 이중-가닥일 수 있고, 센스 또는 안티센스 가닥을 나타낼 수 있음)의 DNA 또는 RNA를 지칭한다.
본원에 사용된 것과 같이 "핵산" 및 "올리고뉴클레오타이드"와 같은 용어는 폴리데옥시리보뉴클레오타이드(2-데옥시-D-리보스를 함유), 폴리리보뉴클레오타이드(D-리보스를 함유), 및 푸린 또는 피리미딘 염기의 N 글리코사이드인 폴리뉴클레오타이드의 임의의 다른 유형을 지칭한다. "핵산", "올리고뉴클레오타이드"와 "폴리뉴클레오타이드" 사이에 길이의 의도된 구별이 없고, 이들 용어는 상호교환 가능하게 사용될 것이다. 이들 용어는 분자의 일차 구조를 오직 지칭한다. 이와 같이, 이들 용어는 이중-가닥 및 단일-가닥 DNA뿐만 아니라 이중-가닥 및 단일-가닥 RNA를 포함한다. 본 방법에서 사용하기 위해, 올리고뉴클레오타이드는 또한 염기, 당 또는 포스페이트 골격이 변형된 뉴클레오타이드 유사체뿐만 아니라 비-푸린 또는 비-피리미딘 뉴클레오타이드 유사체를 포함할 수 있다.
폴리뉴클레오타이드 서열과 관련하여, "퍼센트 동일성" 및 "% 동일성"과 같은 용어는 표준화된 알고리즘을 사용하여 정렬된 적어도 2개의 폴리뉴클레오타이드 서열 사이의 잔기 일치의 백분율을 지칭한다. 이러한 알고리즘은 2개의 서열 사이의 정렬을 최적화하기 위해 비교되는 서열에서 표준화되고 재현 가능한 방식으로 갭을 삽입할 수 있고, 따라서 2개의 서열의 더 의미 있는 비교를 달성한다. 핵산 서열에 대한 퍼센트 동일성은 당해 분야에 이해된 것처럼 결정될 수 있다. (예를 들어, 미국 특허 제7,396,664호를 참조하고, 이것은 본원에 그 전체가 참고로 포함된다). 흔히 사용되고 자유롭게 이용 가능한 서열 비교 알고리즘의 세트는 National Center for Biotechnology Information(NCBI) Basic Local Alignment Search Tool(BLAST)에 의해 제공되고, 이것은 이의 웹사이트에서 NCBI(메릴랜드주 베데스다)를 포함하는 몇몇 소스로부터 이용 가능하다. BLAST 소프트웨어 세트는 공지된 폴리뉴클레오타이드 서열을 다양한 데이터베이스로부터의 다른 폴리뉴클레오타이드 서열과 정렬하기 위해 사용된 "blastn"을 포함하는 다양한 서열 분석 프로그램을 포함한다. 2개의 뉴클레오타이드 서열의 직접적인 쌍별 비교를 위해 사용된 "BLAST 2 서열"이라 칭하는 도구가 또한 이용 가능하다. "BLAST 2 서열"은 NCBI 웹사이트에서 접근되고 쌍방향으로 사용될 수 있다. "BLAST 2 서열" 도구는 (상기 기재된) blastn 및 blastp 둘 모두에 대해 사용될 수 있다.
폴리뉴클레오타이드 서열과 관련하여, 퍼센트 동일성은 예를 들어 특정 서열 번호(예를 들어, 서열 번호 1 내지 서열 번호 32 중 어느 하나)에 의해 정의된 것과 같은 전체 정의된 폴리뉴클레오타이드 서열의 길이에 걸쳐 측정될 수 있거나, 더 짧은 길이에 걸쳐, 예를 들어 더 긴, 정의된 서열로부터 취한 단편, 예를 들어 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 70개, 적어도 100개 또는 적어도 200개의 인접한 뉴클레오타이드의 단편의 길이에 걸쳐 측정될 수 있다. 이러한 길이는 오직 예시적이고, 표, 도면 또는 서열 목록에서 본원에 기재된 서열에 의해 뒷받침된 임의의 단편 길이가 퍼센트 동일성이 측정될 수 있는 길이를 기재하기 위해 사용될 수 있다고 이해된다.
폴리뉴클레오타이드 서열과 관련하여 "변이체", "돌연변이체" 또는 "유도체"는 National Center for Biotechnology Information의 웹사이트에서 이용 가능한 "BLAST 2 서열" 도구로 blastn을 사용하여 핵산 서열 중 소정의 길이에 걸쳐 기준 서열(예를 들어, 서열 번호 1 내지 서열 번호 32 중 어느 하나이거나 이를 포함함)에 비해 적어도 50%의 서열 동일성을 갖는 핵산 서열로서 정의될 수 있다. (Tatiana A. Tatusova, Thomas L. Madden (1999), "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250을 참조한다). 예를 들어, 기준 서열의 변이체, 돌연변이체 또는 유도체는 기준 서열(예를 들어, 여기서 기준 서열은 서열 번호 1 내지 32 중 어느 것이거나 이를 포함함)의 소정의 정의된 길이에 걸쳐 예를 들어 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 또는 초과의 서열 동일성을 나타낼 수 있다.
높은 정도의 동일성을 나타내지 않는 핵산 서열은 그럼에도 불구하고 다수의 코돈이 단일 아미노산을 암호화할 수 있는 유전 코드의 축퇴성으로 인해 유사한 아미노산 서열을 암호화할 수 있다. 핵산 서열의 변경이 모두 동일한 단백질을 실질적으로 암호화하는 다수의 핵산 서열을 제조하기 위해 이 축퇴성을 사용하여 이루어질 수 있다고 이해된다. 예를 들어, 본원에 고려되는 것과 같은 폴리뉴클레오타이드 서열은 단백질을 암호화할 수 있고, 특정 숙주에서 발현에 대해 코돈-최적화되고/되거나 코돈-채택될 수 있다. 당해 분야에서, 코돈 용법 빈도 표는 인간, 마우스, 래트, 돼지, E. 콜라이, 식물 및 다른 숙주 세포를 포함하는 다수의 숙주 유기체에 대해 준비되었다. 일부 실시형태에서, 본원에 개시된 폴리뉴클레오타이드 서열은 단백질(예를 들어, 리포터 단백질, 예컨대 루시퍼라제)을 암호화할 수 있고, 클로스트리디아(예를 들어, 클로스트리듐 아세토부틸리쿰, 클로스트리듐 아우토에토게눔 및/또는 E. 콜라이)에서의 발현에 대해 코돈-최적화되고/되거나 코돈-채택될 수 있다.
올리고뉴클레오타이드는 Narang 등, 1979, Meth. Enzymol. 68:90-99의 포스포트리에스테르 방법; Brown 등, 1979, Meth. Enzymol. 68:109-151의 포스포디에스테르 방법; Beaucage 등, 1981, Tetrahedron Letters 22:1859-1862의 디에틸포스포르아미다이트 방법; 및 미국 특허 제4,458,066호의 고체 지지체 방법(이들의 각각은 본원에 참고로 포함됨)과 같은 방법에 의한 직접적인 화학 합성을 포함하는 임의의 적합한 방법에 의해 제조될 수 있다. 올리고뉴클레오타이드 및 변형된 뉴클레오타이드의 접합체의 합성 방법의 검토는 Goodchild, 1990, Bioconjugate Chemistry 1(3): 165-187에 제공되고, 이것은 본원에 참고로 포함된다.
"증폭 반응"과 같은 용어는 주형 핵산 서열의 카피를 증가시키거나 주형 핵산을 전사시키는 효소 반응을 포함하는 임의의 화학 반응을 지칭한다. 증폭 반응은 역전사, 실시간 PCR(미국 특허 제4,683,195호 및 미국 특허 제4,683,202호; PCR Protocols: A Guide to Methods and Applications (Innis 등, eds, 1990) 참조)을 포함하는 중합효소 연쇄 반응(PCR) 및 리가제 연쇄 반응(LCR)(Barany 등의 미국 특허 제5,494,810호 참조)을 포함한다. 예시적인 "증폭 반응 조건" 또는 "증폭 조건"은 통상적으로 2개 또는 3개의 단계 사이클을 포함한다. 2개-단계 사이클은 고온 변성 단계, 이어서 혼성화/연장(또는 결찰) 단계를 갖는다. 3개의 단계 사이클은 변성 단계, 이어서 혼성화 단계, 이어서 별개의 연장 단계를 포함한다.
본원에 사용된 것과 같이 "표적", "표적 서열", "표적 영역" 및 "표적 핵산"과 같은 용어는 동의어이고, 증폭되거나 시퀀싱되거나 검출되는 핵산의 영역 또는 서열을 지칭한다.
본원에 사용된 것과 같이 "혼성화"라는 용어는 상보성 염기 페어링으로 인해 2개의 단일-가닥 핵산에 의한 듀플렉스 구조의 형성을 지칭한다. 혼성화는 완전 상보성 핵산 가닥 사이에 또는 미스매치의 소수 영역을 함유하는 "실질적으로 상보성"인 핵산 가닥 사이에 발생할 수 있다. 완전 상보성 핵산 가닥의 혼성화가 강하게 바람직한 조건은 "엄격한 혼성화 조건" 또는 "서열-특이적 혼성화 조건"이라 칭해진다. 실질적으로 상보성인 서열의 안정한 듀플렉스는 덜 엄격한 혼성화 조건 하에 달성될 수 있다; 관용되는 미스매치의 정도는 혼성화 조건의 적합한 조정에 의해 제어될 수 있다. 핵산 기술의 당업자는 당해 분야에 의해 제공된 가이드라인에 따라 예를 들어 올리고뉴클레오타이드의 길이 및 염기 쌍 조성, 이온 강도 및 미스매칭된 염기 쌍의 발생을 포함하는 다수의 변수를 경험적으로 고려하여 듀플렉스 안정성을 결정할 수 있다(예를 들어, 본원에 참고로 포함된 Sambrook 등, 1989, Molecular Cloning-A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York; Wetmur, 1991, Critical Review in Biochem. and Mol. Biol. 26(3/4):227-259; 및 Owczarzy 등, 2008, Biochemistry, 47: 5336-5353 참조).
본원에 사용된 것과 같이 "프라이머"라는 용어는 적합한 조건 하에 DNA 합성의 개시의 점으로서 작용할 수 있는 올리고뉴클레오타이드를 지칭한다. 이러한 조건은 핵산 가닥에 상보성인 프라이머 연장 산물의 합성이 적절한 완충액 중에 및 적합한 온도에서 4개의 상이한 뉴클레오사이드 트리포스페이트 및 연장을 위한 물질(예를 들어, DNA 중합효소 또는 역전사효소)의 존재 하에 유도된 것을 포함한다.
프라이머는 바람직하게는 단일 가닥 DNA이다. 프라이머의 적절한 길이는 프라이머의 의도된 사용에 의존하지만, 중간 범위, 예컨대 15개 내지 35개의 뉴클레오타이드, 18개 내지 75개의 뉴클레오타이드 및 25개 내지 150개의 뉴클레오타이드를 포함하여 통상적으로 약 6개 내지 약 225개의 뉴클레오타이드 범위이다. 짧은 프라이머 분자는 일반적으로 주형과 충분히 안정한 하이브리드 복합체를 형성하기 위해 더 차가운 온도를 요한다. 프라이머는 주형 핵산의 정확한 서열을 반영할 필요는 없지만, 주형과 혼성화하기에 충분히 상보성이어야 한다. 소정의 표적 서열의 증폭을 위한 적합한 프라이머의 설계는 당해 분야에 잘 공지되어 있고, 본원에 인용된 문헌에 기재된다.
프라이머는 프라이머의 검출 또는 부동화를 허용하지만 DNA 합성의 개시의 점으로서 작용하는 것의 프라이머의 기본적인 특성을 변경하지 않는 추가 특징을 혼입할 수 있다. 예를 들어, 프라이머는 표적 핵산에 혼성화하지 않고, 증폭된 산물의 클로닝 또는 검출을 용이하게 하거나, RNA의 전사(예를 들어, 프로모터의 포함에 의해) 또는 단백질의 번역(예를 들어, 5'-UTR, 예컨대 내부 리보솜 진입 부위(IRES) 또는 3'-UTR 요소, 예컨대 poly(A)n 서열(여기서, n은 약 20 내지 약 200의 범위임)의 도입에 의해)이 가능하게 하는 5' 말단에서의 추가 핵산 서열을 함유할 수 있다. 혼성화하기 위해 주형에 충분히 상보성인 프라이머의 영역은 본원에서 혼성화 영역이라 칭해진다.
본원에 사용된 것과 같이, 충분히 엄격한 조건 하에 증폭 반응에서 사용될 때, 프라이머가 주로 표적 핵산에 혼성화하면 프라이머는 표적 서열에 "특이적"이다. 통상적으로, 프라이머-표적 듀플렉스 안정성이 프라이머와 샘플에서 발견된 임의의 다른 서열 사이에 형성된 듀플렉스의 안정보다 크면 프라이머는 표적 서열에 특이적이다. 당업자는 다양한 인자, 예컨대 프라이머의 염 조건뿐만 아니라 염기 조성 및 미스매치의 위치가 프라이머의 특이성에 영향을 미치고, 프라이머 특이성의 일상적 실험 확인이 많은 경우에 필요할 것이라는 것을 인식할 것이다. 프라이머가 오직 표적 서열과 안정한 듀플렉스를 형성할 수 있는 혼성화 조건이 선택될 수 있다. 이와 같이, 적합하게 엄격한 증폭 조건 하에 표적-특이적 프라이머의 사용은 표적 프라이머 결합 부위를 함유하는 이 표적 서열의 선택적 증폭이 가능하게 한다.
본원에 사용된 것과 같이 "중합효소"는 뉴클레오타이드의 중합을 촉매화하는 효소를 지칭한다. "DNA 중합효소"는 데옥시리보뉴클레오타이드의 중합을 촉매화한다. 공지된 DNA 중합효소는 예를 들어 무엇보다도 피로코커스 푸리오수스(Pyrococcus furiosus)(Pfu) DNA 중합효소, E. 콜라이 DNA 중합효소 I, T7 DNA 중합효소 및 써무스 아쿠아티쿠스(Thermus aquaticus)(Taq) DNA 중합효소를 포함한다. "RNA 중합효소"는 리보뉴클레오타이드의 중합을 촉매화한다. DNA 중합효소의 상기 예는 또한 DNA-의존적 DNA 중합효소로 공지되어 있다. RNA-의존적 DNA 중합효소는 또한 DNA 중합효소의 범위 내에 해당한다. 레트로바이러스에 의해 암호화된 바이러스 중합효소를 포함하는 역전사효소는 RNA-의존적 DNA 중합효소의 예이다. RNA 중합효소("RNAP")의 공지된 예는 무엇보다도 예를 들어 박테리오파지의 RNA 중합효소(예를 들어, T3 RNA 중합효소, T7 RNA 중합효소, SP6 RNA 중합효소) 및 E. 콜라이 RNA 중합효소를 포함한다. RNA 중합효소의 상기 예는 또한 DNA-의존적 RNA 중합효소로 공지되어 있다. 임의의 상기 효소의 중합효소 활성은 당해 분야에 잘 공지된 수단에 의해 결정될 수 있다.
"프로모터"라는 용어는 RNA 중합효소를 지시하기 위한 시스-작용 DNA 서열 및 시스-작용 DNA 서열을 포함하는 DNA 주형으로부터 RNA 전사를 개시하기 위한 다른 트랜스-작용 전사 인자를 지칭한다.
본원에 사용된 것과 같이 "서열 정의된 생물중합체"라는 용어는 특정 1차 서열을 갖는 생물중합체를 지칭한다. 서열 정의된 생물중합체는 유전자가 특정 1차 서열을 갖는 생물중합체를 암호화하는 경우에 유전적으로-암호화된 정의된 생물중합체와 동등할 수 있다. 본원에 사용된 것과 같이 "발현"은 폴리뉴클레오타이드가 DNA 주형으로부터(예컨대, mRNA 또는 다른 RNA 전사체로) 전사되는 과정 및/또는 전사된 mRNA가 후속하여 펩타이드, 폴리펩타이드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 암호화된 폴리펩타이드는 총체적으로 "유전자 산물"이라 칭해질 수 있다. 폴리뉴클레오타이드가 게놈 DNA로부터 유래되면, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
본원에 사용된 것과 같이 "발현 주형"은 서열 정의된 생물중합체(예를 들어, 폴리펩타이드 또는 단백질)로 번역될 수 있는 적어도 하나의 RNA를 전사하기 위한 기질로서 작용하는 핵산을 지칭한다. 발현 주형은 DNA 또는 RNA로 이루어진 핵산을 포함한다. 발현 주형에 대한 핵산으로서 사용하기 위한 DNA의 적합한 소스는 cDNA로 전환될 수 있는 게놈 DNA, cDNA 및 RNA를 포함한다. 게놈 DNA, cDNA 및 RNA는 임의의 생물학적 소스, 예컨대 무엇보다도 조직 샘플, 생검, 면봉, 가래, 혈액 샘플, 대변 샘플, 뇨 샘플, 스크래핑 유래일 수 있다. 게놈 DNA, cDNA 및 RNA는 숙주 세포 또는 바이러스 기원 유래일 수 있고, 현존 유기체 및 멸종 유기체를 포함하는 임의의 종 유래일 수 있다. 본원에 사용된 것과 같이 "발현 주형" 및 "전사 주형"은 동일한 의미를 갖고, 상호교환 가능하게 사용된다.
소정의 예시적인 실시형태에서, 본원에 기재된 하나 이상의 rRNA 또는 리포터 폴리펩타이드 및/또는 단백질을 암호화하는 핵산을 함유하는 예를 들어 발현 벡터와 같은 벡터가 제공된다. 본원에 사용된 것과 같이 "벡터"라는 용어는 이것이 연결된 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터의 하나의 유형은 추가 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프라 칭하는 "플라스미드"이다. 이러한 벡터는 본원에서 "발현 벡터"라 칭해진다. 일반적으로, 재조합 DNA 기법에서 유용한 발현 벡터는 대개 플라스미드의 형태이다. 본 명세서에서,"플라스미드" 및 "벡터"는 상호교환 가능하게 사용될 수 있다. 그러나, 개시된 방법 및 조성물은 동등한 기능을 하는 발현 벡터의 이러한 다른 형태, 예컨대 바이러스 벡터(예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노 연관 바이러스)를 포함하도록 의도된다.
소정의 예시적인 실시형태에서, 재조합 발현 벡터는 본원에 기재된 방법의 하나 이상에서 핵산 서열의 발현에 적합한 형태로 핵산 서열(예를 들어, 하나 이상의 본원에 기재된 rRNA 또는 리포터 폴리펩타이드 및/또는 단백질을 암호화하는 핵산 서열)을 포함하고, 이는 재조합 발현 벡터가 발현되는 핵산 서열에 작동 가능하게 연결된 하나 이상의 조절 서열을 포함한다는 것을 의미한다. 재조합 발현 벡터 내에, "작동가능하게 연결된"은 (예를 들어, 시험관내 리보솜 어셈블리, 전사 및/또는 번역 시스템에서) 뉴클레오타이드 서열의 발현을 허용하는 하는 방식으로 본원에 기재된 하나 이상의 rRNA 또는 리포터 폴리펩타이드 및/또는 단백질을 암호화하는 뉴클레오타이드 서열이 조절 서열(들)에 연결된다는 것을 의미하도록 의도된다. "조절 서열"이라는 용어는 프로모터, 인핸서 및 다른 발현 제어 요소(예를 들어, 폴리아데닐화 신호)를 포함하도록 의도된다. 이러한 조절 서열은 예를 들어 Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)에 기재되어 있다.
본원에 고려되는 폴리뉴클레오타이드 서열은 발현 벡터에 존재할 수 있다. 예를 들어, 벡터는 (a) 단백질의 ORF를 암호화하는 폴리뉴클레오타이드; (b) 표적 DNA 서열의 RNA-매개된 결합, 니킹, 및/또는 절단을 지시하는 RNA를 발현하는 폴리뉴클레오타이드; 및 (a) 및 (b) 둘 모두를 포함할 수 있다. 벡터에 존재하는 폴리뉴클레오타이드는 원핵 프로모터 또는 진핵 프로모터에 작동가능하게 연결될 수 있다. "작동가능하게 연결된"은 제1 핵산 서열이 제2 핵산 서열과 기능적 관계에 있는 상황을 지칭한다. 예를 들어, 프로모터가 코딩 서열의 전사 또는 발현에 영향을 미치면 프로모터는 코딩 서열에 작동가능하게 연결된다. 작동가능하게 연결된 DNA 서열은 근접하거나 인접할 수 있고, 2개의 단백질 코딩 영역을 연결하는 것이 필요한 경우 동일한 리딩 프레임에 있을 수 있다. 본원에 고려된 벡터는 단백질을 암호화하는 폴리뉴클레오타이드에 작동가능하게 연결된 이종성 프로모터(예를 들어, 진핵 프로모터 또는 원핵 프로모터)를 포함할 수 있다. "이종성 프로모터"는 발현되는 단백질 또는 RNA에 대한 자연적 또는 내인성 프로모터가 아닌 프로모터를 지칭한다. 본원에 개시된 것과 같은 벡터는 플라스미드 벡터를 포함할 수 있다.
올리고뉴클레오타이드 및 폴리뉴클레오타이드는 하나 이상의 비표준 뉴클레오타이드(들), 뉴클레오타이드 유사체(들) 및/또는 변형된 뉴클레오타이드를 선택적으로 포함할 수 있다. 변형된 뉴클레오타이드의 예는 디아미노푸린, S2T, 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-요오도우라실, 하이포잔틴, 잔틴, 4-아세틸사이토신, 5-(카복시하이드록실메틸)우라실, 5-카복시메틸아미노메틸-2-티오우리딘, 5-카복시메틸아미노메틸우라실, 디하이드로우라실, 베타-D-갈락토실쿠오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸사이토신, 5-메틸사이토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실쿠오신, 5'-메톡시카복시메틸우라실, 5-메톡시우라실, 2-메틸티오-D46-이소펜테닐아데닌, 우라실-5-옥시아세트산(v), 와이부톡소신와이부톡소신, 슈도우라실, 쿠오신, 2-티오사이토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카복시프로필) 우라실, (acp3)w, 2,6-디아미노푸린 및 기타를 포함하지만, 이들로 제한되지는 않는다. 핵산 분자는 또한 염기 모이어티(예를 들어, 통상적으로 상보성 뉴클레오타이드와 수소 결합을 형성하기 위해 이용 가능한 하나 이상의 원자에서 및/또는 통상적으로 상보성 뉴클레오타이드와 수소 결합을 형성할 수 없는 하나 이상의 원자에서), 당 모이어티 또는 포스페이트 골격에서 변형될 수 있다.
펩타이드, 폴리펩타이드, 단백질 및 합성 방법
개시된 방법, 장치, 키트 및 성분은 단백질, 폴리펩타이드, 및/또는 펩타이드를 합성하기 위해 사용될 수 있다. 본원에 사용된 것과 같이 "단백질" 또는 "폴리펩타이드" 또는 "펩타이드"라는 용어는 아미노산의 중합체를 지칭하도록 상호교환 가능하게 사용된다. 통상적으로, "폴리펩타이드" 또는 "단백질"은 통상적으로 50개, 60개, 70개, 80개, 90개 또는 100개 초과의 아미노산의 길이의 아미노산의 더 긴 중합체로서 정의된다. "펩타이드"는 통상적으로 50개, 40개, 30개, 20개 또는 이것 미만의 아미노산의 길이의 아미노산의 짧은 중합체로서 정의된다.
본원에 사용된 것과 같이 "펩타이드", "폴리펩타이드" 및 "단백질"이라는 용어는 아미드 연결에 의해 연결된 아미노산 잔기의 중합체의 사슬을 포함하는 분자를 지칭한다. "아미노산 잔기"라는 용어는 알라닌(Ala 또는 A), 시스테인(Cys 또는 C), 아스파르트산(Asp 또는 D), 글루탐산(Glu 또는 E), 페닐알라닌(Phe 또는 F), 글리신(Gly 또는 G), 히스티딘(His 또는 H), 이소류신(Ile 또는 I), 리신(Lys 또는 K), 류신(Leu 또는 L), 메티오닌(Met 또는 M), 아스파라긴(Asn 또는 N), 프롤린(Pro 또는 P), 글루타민(Gln 또는 Q), 아르기닌(Arg 또는 R), 세린(Ser 또는 S), 트레오닌(Thr 또는 T), 발린(Val 또는 V), 트립토판(Trp 또는 W) 및 티로신(Tyr 또는 Y) 잔기로 이루어진 군에 함유된 아미노산 잔기를 포함하지만, 이들로 제한되지는 않는다. "아미노산 잔기"라는 용어는 또한 하기의 아미노산 중 어느 것이 아닌 아미노산을 선택적으로 포함할 수 있는 비표준, 비정규 또는 비천연적 아미노산을 포함할 수 있다: 알라닌, 시스테인, 아스파르트산, 글루탐산, 페닐알라닌, 글리신, 히스티딘, 이소류신, 리신, 류신, 메티오닌, 아스파라긴, 프롤린, 글루타민, 아르기닌, 세린, 트레오닌, 발린, 트립토판 및 티로신 잔기. "아미노산 잔기"라는 용어는 알파-아미노산, 베타-아미노산, 감마-아미노산 및 델타-아미노산을 포함할 수 있다.
일부 실시형태에서, "아미노산 잔기"라는 용어는 호모시스테인, 2-아미노아디프산, N-에틸아스파라긴, 3-아미노아디프산, 하이드록시리신, β-알라닌, β-아미노-프로피온산, 알로-하이드록시리신 산, 2-아미노부티르산, 3-하이드록시프롤린, 4-아미노부티르산, 4-하이드록시프롤린, 피페리딘산, 6-아미노카프로산, 이소데스모신, 2-아미노헵탄산, 알로-이소류신, 2-아미노이소부티르산, N-메틸글리신, 사르코신, 3-아미노이소부티르산, N-메틸이소류신, 2-아미노피멜산, 6-N-메틸리신, 2,4-디아미노부티르산, N-메틸발린, 데스모신, 노르발린, 2,2'-디아미노피멜산, 노르류신, 2,3-디아미노프로피온산, 오르니틴 및 N-에틸글리신으로 이루어진 군에 함유된 비표준, 비정규 또는 비천연적 아미노산 잔기를 포함할 수 있다. "아미노산 잔기"라는 용어는 임의의 상기 언급된 아미노산의 L 이성질체 또는 D 이성질체를 포함할 수 있다.
비표준, 비정규 또는 비천연적 아미노산의 다른 예는 p-아세틸-L-페닐알라닌, p-요오도-L-페닐알라닌, O-메틸-L-티로신, p-프로파길옥시페닐알라닌, p-프로파길-페닐알라닌, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcpβ-세린, L-도파, 불화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비천연적 유사체; 글루타민 아미노산의 비천연적 유사체; 페닐알라닌 아미노산의 비천연적 유사체; 세린 아미노산의 비천연적 유사체; 트레오닌 아미노산의 비천연적 유사체; 메티오닌 아미노산의 비천연적 유사체; 류신 아미노산의 비천연적 유사체; 이소류신 아미노산의 비천연적 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 하이드라진, 하이드라지드, 하이드록실, 알케닐, 알키닐, 에테르, 티올, 설포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 17ufa 17hor, 포스포노, 포스핀, 헤테로사이클릭, 에논, 이민, 알데하이드, 하이드록실아민, 케토 또는 아미노 치환된 아미노산, 또는 이들의 조합; 광활성화 가능한 가교결합제를 갖는 아미노산; 스핀-라벨링된 아미노산; 형광 아미노산; 금속 결합 아미노산; 금속 함유 아미노산; 방사성 아미노산; 광케이징된 및/또는 광이성질화 가능한 아미노산; 비오틴 또는 비오틴-유사체 함유 아미노산; 케토 함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르를 포함하는 아미노산; 무거운 원자 치환된 아미노산; 화학 절단 가능한 또는 광절단 가능한 아미노산; 신장된 측쇄를 갖는 아미노산; 아미노산 함유 독성 기; 당 치환된 아미노산; 탄소-연결된 당 함유 아미노산; 레독스-활성 아미노산; α-하이드록시 함유 산; 아미노 티오 산; α,α 이치환된 아미노산; β-아미노산; γ-아미노산, 프롤린 또는 히스티딘 이외의 사이클릭 아미노산, 및 페닐알라닌, 티로신 또는 트립토판 이외의 방향족 아미노산을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 것과 같이 "펩타이드"는 통상적으로 20개 이하의 아미노산의 길이, 및 더 통상적으로 12개 이하의 아미노산의 길이의 아미노산의 짧은 중합체로 정의된다(Garrett & Grisham, Biochemistry, 2nd edition, 1999, Brooks/Cole, 110). 일부 실시형태에서, 본원에 고려된 것과 같은 펩타이드는 약 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이하의 아미노산을 포함할 수 있다. 단백질이라고도 칭하는 폴리펩타이드는 통상적으로 100개 이상의 아미노산의 길이이다(Garrett & Grisham, Biochemistry, 2nd edition, 1999, Brooks/Cole, 110). 본원에 고려되는 것과 같은 폴리펩타이드는 100개, 101개, 102개, 103개, 104개, 105개, 약 110개, 약 120개, 약 130개, 약 140개, 약 150개, 약 160개, 약 170개, 약 180개, 약 190개, 약 200개, 약 210개, 약 220개, 약 230개, 약 240개, 약 250개, 약 275개, 약 300개, 약 325개, 약 350개, 약 375개, 약 400개, 약 425개, 약 450개, 약 475개, 약 500개, 약 525개, 약 550개, 약 575개, 약 600개, 약 625개, 약 650개, 약 675개, 약 700개, 약 725개, 약 750개, 약 775개, 약 800개, 약 825개, 약 850개, 약 875개, 약 900개, 약 925개, 약 950개, 약 975개, 약 1000개, 약 1100개, 약 1200개, 약 1300개, 약 1400개, 약 1500개, 약 1750개, 약 2000개, 약 2250개, 약 2500 또는 이것 초과의 아미노산 잔기를 포함할 수 있지만, 이들로 제한되지는 않는다.
본원에 고려되는 것과 같은 폴리펩타이드는 비아미노산 모이어티를 포함하도록 추가로 변형될 수 있다. 변형은 아실화(예를 들어, O-아실화(에스테르), N-아실화(아미드), S-아실화(티오에스테르)), 아세틸화(예를 들어, 단백질의 N 말단 또는 리신 잔기 중 어느 하나에서의 아세틸 기의 첨가), 포밀화 리포일화(예를 들어, 리포에이트, C8 작용기의 부착), 미리스토일화(예를 들어, 미리스테이트, C14 포화 산의 부착), 팔미토일화(예를 들어, 팔미테이트, C16 포화 산의 부착), 알킬화(예를 들어, 리신 또는 아르기닌 잔기에서의 알킬 기, 예컨대 메틸의 첨가), 이소프레닐화 또는 프레닐화(예를 들어, 이소프레노이드 기, 예컨대 파르네솔 또는 게라닐게라니올의 첨가), C 말단에서의 아미드화, 글리코실화(예를 들어, 당단백질을 생성시키는 아스파라긴, 하이드록시리신, 세린 또는 트레오닌 중 어느 하나로의 글리코실 기의 첨가)를 포함하지만, 이들로 제한되지는 않는다. 당의 비효소 부착, 폴리시알화(예를 들어, 폴리시알산의 부가), 글리피에이션(예를 들어, 글리코실포스파티딜이노시톨(GPI) 앵커 형성, 하이드록실화, 요오드화(예를 들어, 갑상선 호르몬의) 및 포스포릴화(예를 들어, 보통 세린, 티로신, 트레오닌 또는 히스티딘에 대한 포스페이트 기의 첨가)로서 여겨지는 당화반응과 구별되어.
본원에 개시된 단백질은 "야생형" 단백질 및 이의 변이체, 돌연변이체 및 유도체를 포함할 수 있다. 본원에 사용된 것과 같이 "야생형"이라는 용어는 당업자에 의해 이해되는 분야의 용어이고, 돌연변이체 또는 변이체 형태와 구별되는 것과 같이 자연에서 발행하는 유기체, 균주, 유전자 또는 특징의 통상적인 형태를 의미한다. 본원에 사용된 것과 같이 "변이체", "돌연변이체" 또는 "유도체"는 기준 단백질 또는 폴리펩타이드 분자와 다른 아미노산 서열을 갖는 단백질 분자를 지칭한다. 변이체 또는 돌연변이체는 기준 분자에 비해 아미노산 잔기의 하나 이상의 삽입, 결실 또는 치환을 가질 수 있다. 변이체 또는 돌연변이체는 기준 분자의 단편을 포함할 수 있다. 예를 들어, 돌연변이체 또는 변이체 분자는 기준 폴리펩타이드에 비해 적어도 하나의 아미노산 잔기의 하나 이상의 삽입, 결실 또는 치환을 포함할 수 있다.
단백질과 관련하여, "결실"은 하나 이상의 아미노산 잔기의 부재를 발생시키는 아미노산 서열의 변경을 지칭한다. 결실은 적어도 1개, 2개, 3개, 4개, 5개, 10개, 20개, 50개, 100개, 200개 이상의 아미노산 잔기를 제거할 수 있다. 결실은 내부 결실 및/또는 말단 결실(예를 들어, 기준 폴리펩타이드의 N-말단 절두, C-말단 절두 또는 둘 모두)을 포함할 수 있다. 기준 폴리펩타이드 서열의 "변이체", "돌연변이체" 또는 "유도체"는 기준 폴리펩타이드 서열에 비해 결실을 포함할 수 있다.
단백질과 관련하여, "단편"은 기준 서열과 서열이 동일하지만 기준 서열보다 길이가 짧은 아미노산 서열의 부분이다. 단편은 기준 서열의 최대 전체 길이에 적어도 하나의 아미노산 잔기를 뺀 것까지를 포함할 수 있다. 예를 들어, 단편은 각각 기준 폴리펩타이드의 5개 내지 1000개의 인접 아미노산 잔기를 포함할 수 있다. 일부 실시형태에서, 단편은 기준 폴리펩타이드의 적어도 5개, 10개, 15개, 20개, 25개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 250개 또는 500개의 인접 아미노산 잔기를 포함할 수 있다. 단편은 분자의 소정의 영역으로부터 우선적으로 선택될 수 있다. "적어도 단편"이라는 용어는 전장 폴리펩타이드를 포함한다. 단편은 전장 단백질에 비해 N-말단 절두, C-말단 절두, 또는 절두 둘 모두를 포함할 수 있다. 기준 폴리펩타이드 서열의 "변이체", "돌연변이체" 또는 "유도체"는 기준 폴리펩타이드 서열의 단편을 포함할 수 있다.
단백질과 관련하여, "삽입" 및 "부가"라는 단어는 하나 이상의 아미노산 잔기를 부가시키는 아미노산 서열의 변경을 지칭한다. 삽입 또는 부가는 1개, 2개, 3개, 4개, 5개, 10개, 20개, 30개, 40개, 50개, 60개, 70개, 80개, 90개, 100개, 150개, 200개, 또는 이것 초과의 아미노산 잔기를 지칭할 수 있다. 기준 폴리펩타이드 서열의 "변이체", "돌연변이체" 또는 "유도체"는 기준 폴리펩타이드 서열에 비해 삽입 또는 부가를 포함할 수 있다. 단백질의 변이체는 N-말단 삽입, C-말단 삽입, 내부 삽입, 또는 N-말단 삽입, C-말단 삽입 및 내부 삽입의 임의의 조합을 가질 수 있다.
단백질과 관련하여, "퍼센트 동일성" 및 "% 동일성"이라는 구절은 표준화된 알고리즘을 사용하여 정렬된 적어도 2개의 아미노산 서열 사이의 잔기 일치의 백분율을 지칭한다. 아미노산 서열 정렬의 방법은 잘 공지되어 있다. 일부 정렬 방법은 보존적 아미노산 치환을 고려한다. 하기 더 자세히 기재된 이러한 보존적 치환은 일반적으로 치환의 부위에서 전하 및 소수화도를 보존하여서, 폴리펩타이드의 구조(및 따라서 기능)를 보존한다. 아미노산 서열에 대한 퍼센트 동일성은 당해 분야에 이해된 것처럼 결정될 수 있다. (예를 들어, 미국 특허 제7,396,664호를 참조하고, 이것은 본원에 그 전체가 참고로 포함된다). 흔히 사용되고 자유롭게 이용 가능한 서열 비교 알고리즘의 세트는 National Center for Biotechnology Information(NCBI) Basic Local Alignment Search Tool(BLAST)에 의해 제공되고, 이것은 이의 웹사이트에서 NCBI(메릴랜드주 베데스다)를 포함하는 몇몇 소스로부터 이용 가능하다. BLAST 소프트웨어 세트는 공지된 아미노산 서열을 다양한 데이터베이스로부터의 다른 아미노산 서열과 정렬하기 위해 사용된 "blastp"를 포함하는 다양한 서열 분석 프로그램을 포함한다.
단백질과 관련하여, 퍼센트 동일성은 예를 들어 특정 서열 번호(예를 들어, 서열 번호 1 내지 서열 번호 32 중 어느 것에 의해 암호화된 폴리펩타이드 서열)에 의해 정의된 것과 같이 전체 정의된 폴리펩타이드 서열의 길이에 걸쳐 측정될 수 있거나, 더 짧은 길이, 예를 들어 더 큰 정의된 폴리펩타이드 서열로부터 취한 단편, 예를 들어 적어도 15개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 70개 또는 적어도 150개의 인접 잔기의 단편의 길이에 걸쳐 측정될 수 있다. 이러한 길이는 오직 예시적이고, 표, 도면 또는 서열 목록에서 본원에 기재된 서열에 의해 뒷받침된 임의의 단편 길이가 퍼센트 동일성이 측정될 수 있는 길이를 기재하기 위해 사용될 수 있다고 이해된다.
단백질과 관련하여, 본원에 고려되는 것과 같은 변이체, 돌연변이체 또는 유도체의 아미노산 서열은 기준 아미노산 서열에 비해 보존적 아미노산 치환을 포함할 수 있다. 예를 들어, 변이체, 돌연변이체 또는 유도체 단백질은 기준 분자에 비해 보존적 아미노산 치환을 포함할 수 있다. "보존적 아미노산 치환"은 기준 폴리펩타이드의 특성을 최소로 방해하는 것으로 치환이 예측된 상이한 아미노산에 대한 아미노산의 치환인 치환이다. 바꾸어 말하면, 보존적 아미노산 치환은 기준 폴리펩타이드의 구조 및 기능을 실질적으로 보존한다. 하기 표는 본원에 고려된 예시적인 보존적 아미노산 치환의 목록을 제공한다:
Figure pct00001
보존적 아미노산 치환은 일반적으로 (a) 예를 들어 베타 시트 또는 알파 나선 구성으로서 치환의 영역에서 폴리펩타이드 골격의 구조, (b) 치환의 부위에서 분자의 전하 또는 수소화도, 및/또는 (c) 측쇄의 벌크를 유지한다. 비보존적 아미노산은 통상적으로 (a) 예를 들어 베타 시트 또는 알파 나선 구성으로서 치환의 영역에서 폴리펩타이드 골격의 구조, (b) 치환의 부위에서 분자의 전하 또는 수소화도, 및/또는 (c) 측쇄의 벌크를 파괴한다.
개시된 단백질, 돌연변이체, 변이체, 또는 본원에 기재된 것은 기준 폴리펩타이드에 의해 나타난 하나 이상의 기능적 활성 또는 생물학적 활성(예를 들어, 야생형 단백질에 의해 나타난 하나 이상의 기능적 활성 또는 생물학적 활성)을 가질 수 있다.
개시된 단백질은 실질적으로 단리되거나 정제될 수 있다. "실질적으로 단리되거나 또는 정제된"이라는 용어는 이의 자연 환경으로부터 제거되고, 이들이 자연적으로 연관된 다른 성분과 적어도 60% 유리, 바람직하게는 적어도 75% 유리, 및 더 바람직하게는 적어도 90% 유리, 훨씬 더 바람직하게는 적어도 95% 유리인 단백질을 지칭한다.
본원에 개시된 단백질은 "번역 주형"으로부터 발현될 수 있다. 본원에 사용된 것과 같이 "번역 주형"은 폴리펩타이드 또는 단백질을 합성하기 위해 리보솜에 의해 사용될 수 있는 발현 주형으로부터 전사의 RNA 산물을 지칭한다.
본원에 개시된 단백질은 "반응 혼합물"에서 발현될 수 있다. 본원에 사용된 것과 같이 "반응 혼합물"과 같은 용어는 소정의 반응을 수행하기 위해 필요한 시약을 함유하는 용액을 지칭한다. 반응 혼합물은 반응을 수행하기 위해 필요한 모든 시약을 함유하면 완전한 것으로 지칭된다. 반응 혼합물에 대한 성분은 전체 성분의 하나 이상을 각각 함유하는 별개의 용기에서 별개로 저장될 수 있다. 성분은 상업화를 위해 별도로 패키징될 수 있고, 유용한 상업용 키트는 반응 혼합물을 위한 반응 성분 중 하나 이상을 함유할 수 있다.
무세포 단백질 합성
무세포 단백질 합성(CFPS) 및 CFPS에서 사용하기 위한 세포 추출물을 제조하는 방법이 당해 분야에 공지되어 있다. (예를 들어, Carlson 등, "Cell-free protein synthesis: Applications come of age," Biotech. Adv. Vol. 30, Issue 5, Sept-Oct 2012, Pages 1185-1194; Hodgman 등, "Cell-free synthetic biology: Thinking outside the cell," Metabol. Eng. Vol. 14, Issue 3, May 2012, Pages 261-269; 및 Harris 등, "Cell-free biology: exploiting the interface between synthetic biology and synthetic chemistry," Curr. Op. Biotech. Vol. 23, Issue 5, October 2012, Pages 672-678을 참조하고; 또한 미국 특허 제7,312,049호; 미국 특허 제7,008,651호 및 미국 특허 제6994986호를 참조하고; 또한 미국 공개 출원 제20170306320호; 미국 공개 출원 제20160362708호; 미국 공개 출원 제20160060301호; 미국 공개 출원 제20120088269호; 미국 공개 출원 제20090042244호; 미국 공개 출원 제2008024821호; 미국 공개 출원 제20080138857호; 미국 공개 출원 제20070154983호; 미국 공개 출원 제20070141661호; 미국 공개 출원 제20050186655호; 미국 공개 출원 제20050148046l호; 미국 공개 출원 제20050064592호; 미국 공개 출원 제20050032086호; 미국 공개 출원 제20040209321호; 및 미국 공개 출원 제20040038332호를 참조하고; 이들의 내용은 그 전체가 본원에 참고로 포함된다).
개시된 조성물은 시험관내 단백질의 서열 정의된 생물중합체를 제조하기 위한 플랫폼을 포함한다. 시험관내 서열 정의된 중합체 또는 단백질을 제조하기 위한 플랫폼은 유기체, 및 특히 클로스트리디아의 종, 예컨대 클로스트리듐 아우토에토게눔으로부터의 세포 추출물을 포함한다. CFPS가 세포의 미정제 용해물로부터 제조된 촉매 단백질의 총체를 이용할 수 있으므로, 세포 추출물(이의 조성은 성장 배지, 용해 방법 및 가공 조건에 민감함)은 추출물-기반 CFPS 반응의 중요한 성분이다. 다양한 방법은 참고로 포함된 2014년 10월 2일에 공개된 미국 공개 출원 제20140295492호에 개시된 것을 포함하는 무세포 단백질 합성에 유능한 추출물을 제조하기 위해 존재한다.
플랫폼은 발현 주형, 번역 주형, 또는 발현 주형 및 번역 주형 둘 모두를 포함할 수 있다. 발현 주형은 서열 정의된 생물중합체(예를 들어, 폴리펩타이드 또는 단백질)로 번역될 수 있는 적어도 하나의 RNA를 전사하기 위한 기질로서 작용한다. 번역 주형은 서열 정의된 생물중합체를 합성하기 위해 리보솜에 의해 사용될 수 있는 RNA 산물이다. 소정의 실시형태에서, 플랫폼은 발현 주형 및 번역 주형 둘 모두를 포함한다. 소정의 구체적인 실시형태에서, 플랫폼은 커플링된 전사/번역("Tx/Tl") 시스템일 수 있고, 여기서 번역 주형 및 서열 정의된 생물중합체의 합성은 동일한 세포 추출물에서 발생한다.
플랫폼은 발현 주형으로부터 번역 주형을 생성할 수 있는 하나 이상의 중합효소를 포함할 수 있다. 중합효소는 외인성으로 공급될 수 있거나 추출물을 제조하기 위해 사용된 유기체로부터 공급될 수 있다. 소정의 구체적인 실시형태에서, 중합효소는 추출물을 제조하기 위해 사용된 유기체에 존재하는 플라스미드 및/또는 추출물을 제조하기 위해 사용된 유기체의 게놈에서의 통합 부위로부터 발현된다.
플랫폼은 직각 번역 시스템을 포함할 수 있다. 직각 번역 시스템은 유기체의 직각 번역 기계와 평행하게 및/또는 이와 독립적으로 작동하도록 설계된 하나 이상의 직각 성분을 포함할 수 있다. 소정의 실시형태에서, 직각 번역 시스템 및/또는 직각 성분은 비천연적 아미노산의 혼입에 구성된다. 직각 성분은 직각 단백질 또는 직각 RNA일 수 있다. 소정의 실시형태에서, 직각 단백질은 직각 합성효소일 수 있다. 소정의 실시형태에서, 직각 RNA는 직각 tRNA 또는 직각 rRNA일 수 있다. 직각 rRNA 성분의 예는 미국 공개 출원 제20170073381호 및 미국 공개 출원 제2016006030호에 기재되어 있고, 이의 내용은 그 전체가 참고로 포함된다. 소정의 실시형태에서, 하나 이상의 직각 성분은 올리고뉴클레오타이드 주형의 발현에 의해 생체내 또는 시험관내 제조될 수 있다. 하나 이상의 직각 성분은 게놈 기록된 유기체에 존재하는 플라스미드로부터 발현되거나, 유전 기록된 유기체의 게놈에서 통합 부위로부터 발현되거나, 게놈 기록된 유기체에 존재하는 플라스미드 및 유전 기록된 유기체의 게놈에서 통합 부위 둘 모두로부터 동시발현되거나, 시험관내 전사 및 번역 반응에서 발현하거나, 인자(예를 들어, 플랫폼 또는 반응 혼합물에 첨가된 직각 tRNA 또는 직각 합성효소)로서 외인성으로 첨가될 수 있다.
예시적인 실시형태
하기 실시형태는 예시적이고, 청구된 배상의 범위를 제한하는 것으로 해석되지 않아야 한다.
실시형태 1. 시스템으로서, (a) 하나 이상의 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로 (i) 세포에서 관심 있는 유전자를 발현하기 위한 프로모터; (ii) 클로닝을 위한 제1 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 카운터 선택 가능한 마커; (iv) 클로닝을 위한 제2 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); 및 (v) 전사 종결 부위를 포함하는, 골격 벡터; (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1는 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터; (ii) 클로닝을 위한 제1 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자1은 제1 골든 게이트 부위 및 제2 골든 게이트 부위 사이에 삽입되는, 제1 공여자 벡터; (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로 (i) 클로닝을 위한 제1 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 전사 종결 부위; (iii) 세포에서 관심 있는 유전자를 발현하기 위한 프로모터; 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)을 포함하는, 제2 공여자 벡터; 및 (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터; (ii) 클로닝을 위한 제1 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자2는 제1 골든 게이트 부위와 제2 골든 게이트 부위 사이에 삽입되는, 제3 공여자 벡터의 상기의 성분 중 하나 이상을 포함하고, 선택적으로 상기 시스템은 (a)와 (b); (a)와 (c); (a)와 (d); (b)와 (c); (b)와 (d); (c)와 (d); (a), (b)와 (c); (a), (b)와 (d); (a), (c)와 (d); (b), (c)와 (d); 및 (a), (b), (c)와 (d)로부터 선택된 성분의 임의의 조합을 포함하는, 시스템.
실시형태 2. 실시형태 1에 있어서, 상기 시스템은 (a) 골격 벡터, (b) p공여자1, (c) p공여자2 및 (d) p공여자3의 성분 중 2개 이상을 포함하는, 시스템.
실시형태 3. 실시형태 1 또는 실시형태 2에 있어서, 상기 시스템은 (a) 골격 벡터; 및 (b) p공여자1, (c) p공여자2 및 (d) p공여자3의 성분 중 1개 이상을 포함하는, 시스템.
실시형태 4. 상기 실시형태 중 어느 것에 있어서, 상기 시스템은 (a) 골격 벡터, (b) p공여자1, (c) p공여자2 및 (d) p공여자3의 성분을 포함하는, 시스템.
실시형태 5. 시스템으로서, (a) 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로 (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 카운터 선택 가능한 마커; (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); 및 (v) 전사 종결 부위(TT)를 포함하는, 골격 벡터; (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1는 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터; (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, 제1 공여자 벡터의 상기의 성분 중 하나 이상을 포함하는 시스템.
실시형태 6. 시스템으로서: (a) 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로 (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 카운터 선택 가능한 마커, 예를 들어 독소, 예컨대 ccdB; (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); 및 (v) 말단 전사 종결 부위(TT)를 포함하는, 골격 벡터; (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 골격 벡터에서 GG1의 오버행에 혼성화하는 오버행을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, 제1 공여자 벡터; (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로 (i) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 바깥을 절단하고 p공여자1에서 GG2의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 제1 전사 종결 부위(T1); (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제2 프로모터(P2); 및 (iv) 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 바깥을 절단하고 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하는, 제2 공여자 벡터; 및 (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 상류(5')를 절단하고 p공여자2에서 GG3의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및 (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)(즉, 이의 인식 부위의 하류(3')를 절단하고 골격 벡터에서 GGT의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자2는 GG3과 GGT 사이에 삽입되는, 제3 공여자 벡터의 상기의 성분 중 하나 이상을 포함하는, 시스템.
실시형태 7. 시스템으로서, (a) 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로 (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 카운터 선택 가능한 마커, 예를 들어 독소, 예컨대 ccdB; (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); 및 (v) 말단 전사 종결 부위(TT)를 포함하는, 골격 벡터; (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 골격 벡터에서 GG1의 오버행에 혼성화하는 오버행을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, 제1 공여자 벡터; (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로 (i) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 바깥을 절단하고 p공여자1에서 GG2의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 제1 전사 종결 부위(T1); (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제2 프로모터(P2); 및 (iv) 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 바깥을 절단하고 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하는, 제2 공여자 벡터; 및 (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 상류(5')를 절단하고 p공여자2에서 GG3의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및 (iv) 클로닝을 위한 제4 골든 게이트 부위(GG4)(즉, 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자2는 GG3과 GG4 사이에 삽입되는, 제3 공여자 벡터; (e) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제4 공여자 벡터(p공여자4)이되, p공여자4는 5'→3'로 (i) 클로닝을 위한 제4 골든 게이트 부위(GG4)(즉, 이의 인식 부위의 바깥을 절단하고 p공여자3에서 GG4의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 제2 전사 종결 부위(T2); (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제3 프로모터(P3); 및 (iv) 클로닝을 위한 제5 골든 게이트 부위(GG5)(즉, 이의 인식 부위의 바깥을 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하는, 제4 공여자 벡터; 및 (f) 관심 있는 유전자의 무세포 발현을 위한 제5 공여자 벡터(p공여자5)이되, p공여자5는 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제5 골든 게이트 부위(GG5)(즉, 이의 인식 부위의 상류(5')를 절단하고 공여자4에서 GG5의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제3 유전자(유전자3); 및 (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)(즉, 이의 인식 부위의 하류(3')를 절단하고 골격 벡터에서 GGT의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자3은 GG5와 GGT 사이에 삽입되는, 제5 공여자 벡터의 상기의 성분 중 하나 이상을 포함하는 시스템.
실시형태 8. 상기 실시형태 중 어느 것에 있어서, p공여자1, p공여자3, p공여자5는 각각 제1 유전자, 제2 유전자 및 제3 유전자, 예컨대 각각 유전자1, 유전자2, 및/또는 유전자3을 포함하고, 선택적으로 유전자1, 유전자2, 및/또는 유전자3은 무세포 시스템에서의 발현을 위해 코돈-최적화되고, 선택적으로, 무세포 시스템은 클로스트리디아로부터의 세포 용해물을 포함하고; 그리고/또는 선택적으로 유전자1, 유전자2, 및/또는 유전자3은 세포, 선택적으로 클로스트리디아 세포에서의 발현을 위해 코돈-최적화된, 시스템.
실시형태 9. 상기 실시형태 중 어느 것에 있어서, p공여자r2 및 p공여자4는 클로스트리디아 또는 클로스트리디아로부터 제조된 무세포 추출물에서 유전자를 발현하도록 조작된 프로모터를 포함하는, 시스템.
실시형태 10. 상기 실시형태 중 어느 것에 있어서, GG1은 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 11. 상기 실시형태 중 어느 것에 있어서, GG2는 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 12. 상기 실시형태 중 어느 것에 있어서, GG3은 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 13. 상기 실시형태 중 어느 것에 있어서, GG4는 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 14. 상기 실시형태 중 어느 것에 있어서, GG5는 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 15. 상기 실시형태 중 어느 것에 있어서, GGT는 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소에 대한 인식 부위인, 시스템.
실시형태 16. 상기 실시형태 중 어느 것에 있어서, 카운터 선택 가능한 마커는 ccdB와 같은 독소인, 시스템.
실시형태 17. 상기 실시형태에 있어서, 무세포 RNA 합성을 위한 프로모터는 T7 RNA 중합효소 프로모터인. 시스템.
실시형태 18. 상기 실시형태 중 어느 것에 있어서, (i) 선택적으로 p공여자1은 도 2에 제시되고 선택적으로 p공여자1 옵션 1(서열 번호 24), p공여자1 옵션 2(서열 번호 27) 및 p공여자1 옵션 3(서열 번호 30)으로부터 선택된 폴리뉴클레오타이드 서열을 포함하고; (ii) 선택적으로 p공여자3은 도 2에 제시되고 선택적으로 p공여자3 옵션 1(서열 번호 25), p공여자3 옵션 2(서열 번호 28) 및 p공여자3 옵션 3(서열 번호 31)으로부터 선택된 폴리뉴클레오타이드 서열을 포함하고; (iii) 선택적으로 p공여자5는 도 2에 제시되고 선택적으로 p공여자5 옵션 1(서열 번호 26), p공여자5 옵션 2(서열 번호 29) 및 p공여자5 옵션3(서열 번호 32)으로부터 선택된 폴리뉴클레오타이드 서열을 포함하는. 시스템.
실시형태 19. 상기 실시형태 중 어느 것의 시스템의 성분 중 어느 것에 의해 형질전환된 세포.
실시형태 20. 관심 있는 유전자, 예컨대 유전자1, 유전자2 또는 유전자3을 발현하는 방법으로서, 관심 있는 유전자를 실시형태 1 내지 실시형태 14 중 어느 것의 벡터로 클로닝하는 단계 및 무세포 시스템에서 또는 세포에서(선택적으로 클로스트리디아 세포로부터 제조된 무세포 추출물을 포함하는 무세포 시스템에서 또는 클로스트리디아 세포에서) 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
실시형태 21. 세포에서 다수의 관심 있는 유전자, 예컨대 유전자1, 유전자2 또는 유전자3을 발현하는 방법으로서, 다수의 관심 있는 유전자를 실시형태 1 내지 실시형태 18 중 어느 것의 하나 이상의 벡터로 클로닝하는 단계, 다수의 관심 있는 유전자를 실시형태 1 내지 실시형태 18 중 어느 것의 골격 벡터로 추가로 클로닝하는 단계, 골격 벡터를 세포 또는 무세포 추출물로 도입하는 단계 및 세포에서 또는 무세포 추출물에서 다수의 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
실시형태 22. 실시형태 20 또는 실시형태 21에 있어서, 다수의 관심 있는 유전자는 다수의 상이한 프로모터로부터 발현되는, 방법.
실시형태 23. 폴리뉴클레오타이드 또는 2개 이상의 폴리뉴클레오타이드들의 조합으로서, 폴리뉴클레오타이드 또는 폴리뉴클레오타이드들은 서열 번호 1 내지 서열 번호 32로부터 선택된 하나 이상의 폴리뉴클레오타이드 서열을 포함하고, 선택적으로 폴리뉴클레오타이드 또는 폴리뉴클레오타이드들은 도 2에 제시된 것과 같은 하나 이상의 폴리뉴클레오타이드 서열, 선택적으로 p공여자1 옵션 1(서열 번호 24), p공여자3 옵션 1(서열 번호 25), p공여자5 옵션 1(서열 번호 26), p공여자1 옵션 2(서열 번호 27), p공여자3 옵션 2(서열 번호 28), p공여자5 옵션 2(서열 번호 29), p공여자1 옵션 3(서열 번호 30), p공여자3 옵션 3(서열 번호 31) 및 p공여자5 옵션 3(서열 번호 32)으로부터 선택된 폴리뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드 또는 2개 이상의 폴리뉴클레오타이드들의 조합.
실시형태 24. 폴리뉴클레오타이드 또는 2개 이상의 폴리뉴클레오타이드들의 조합으로서, 폴리뉴클레오타이드 또는 2개 이상의 폴리뉴클레오타이드들의 조합은 서열 번호 1 내지 서열 번호 32로부터 선택된 하나 이상의 폴리뉴클레오타이드 및 이들의 조합을 포함하는, 폴리뉴클레오타이드 또는 2개 이상의 폴리뉴클레오타이드들의 조합.
실시예
하기 실시예는 예시적이고, 청구된 대상의 범위를 제한하는 것으로 해석되지 않아야 한다.
실시예 1 - 세포에서 생물학적 설계를 가속하기 위한 모듈식 무세포 단백질 발현 플라스미드
경로의 무세포 프로토타이핑은 설계를 알리고 개발 사이클을 가속하는 것으로 나타났다(Karim, A.S. & Jewett, M.C. A cell-free framework for rapid biosynthetic pathway prototyping and enzyme discovery. Metabolic Engineering 36, 116-126 (2016)). 무세포 프레임워크는 유입으로서 오직 단일 유전자를 요하고, 생성된 단백질은 이후 생체내 사용에 가장 유망한 설계를 확인하도록 혼합되고 일치될 수 있다. 그에 반해 생체내 조작은 유전자가 오페론에서 배열되는 것을 요한다. 또 다른 도전과제는 유전자의 코돈 용법이 각각의 유기체에 상이하다는 것이다.
통상적인 워크플로우에서, 무세포 플랫폼, 예컨대 E. 콜라이-유래된 무세포 플랫폼에 대해 코돈-최적화된 유전자를 합성하고, 이후 원하는 합성 경로를 달성하기 위해 발현된 유전자의 이상적인 조합을 발견하기 위해 무세포 플랫폼에서의 유전자를 시험할 것이다. 유전자의 이 조합은 이후 관심 있는 숙주(예를 들어, 가스-발효하는 클로스트리디아)에 대해 코돈-최적화되고, 이후 합성되고 오페론으로 어셈블링될 것이다. 무세포 발현은 통상적으로 T7 프로모터로 수행되는 반면, 생체내 발현은 통상적으로 상이한 프로모터를 사용하여 달성되고, 각각의 분야는 특이적 벡터(예를 들어, 무세포 발현에 최적화된 벡터 및 표적 숙주에서의 발현에 최적화된 벡터)를 요한다. 이 공정은 통상적으로 유전자당 6주 내지 9주 및 비용 $600가 걸린다.
현재의 워크플로우
Figure pct00002
제안된 워크플로우
Figure pct00003
제안된 계획에서, 유전자는 (E. 콜라이로부터 꽤 상이한 GC 함량, 예를 들어 E. 콜라이 50%에 대해 클로스트리듐 30%를 가질 수 있는) 관심 있는 숙주에 코돈-최적화될 것이고, 이후 무세포 어셈블리가 완료된 후 직접적인 어셈블리를 허용하는 도입된 골든 게이트 부위를 갖는 변형된 무세포 벡터로 합성될 것이다. 생체내 발현은 대개 또한 라이브러리에서 상이한 프로모터의 사용을 요하고, 제안된 개념은 이것이 가능하게 한다. 이는 비용 및 시간 요건을 반으로 줄인다.
무세포 벡터에 대한 어떠한 변화가 발현에 부정적으로 영향을 미친다는 것이 이전에 발견되었다. 놀랍게도 RBS 및 프로모터 영역 주위의 상이한 위치에서의 골든 게이트 부위의 도입은 하향조절을 통해 무세포 발현에 부정적으로 영향을 미치지 않고, 경우들에서 심지어 더 높은 발현으로 이어졌다. 표적 숙주(에를 들어, 클로스트리디아)에서 생체내 시험을 위한 발현 벡터의 효율적인 어셈블리를 위해, 골든 게이트 절단 부위 및 오버행은 수혜자 및 공여자 벡터 둘 모두로 도입되었다. 일 실시형태에서, 수혜자 벡터는 어셈블링된 작제물의 효율적인 스크리닝을 촉진하기 위해 클로스트리디아, 항생제 내성 유전자 및 ccdB 카운터 선택 가능한 마커에서 플라스미드 전파에 적합한 그람 양성 레플리콘을 함유한다. 공여자 벡터는 T7 프로모터를 갖는 무세포 발현 벡터 또는 종결자 및 클로스트리디아 프로모터를 갖는 서브클로닝 벡터를 구성한다. 2개의 골든 게이트 절단 부위 및 적절한 오버행을 각각의 공여자 벡터로 도입하였다. 이 변형은 리보솜 결합 부위(RBS) 영역에서 발생하고, 무세포 벡터에서 T7 프로모터의 RBS와 START 코돈 사이의 뉴클레오타이드 길이를 변경한다. 이 변형이 발현에 상당히 영향을 미치지 않을 것이라는 것을 보장하기 위해, 변형된 T7 프로모터를 갖는 모든 9개의 무세포 벡터는 변형된 T7 프로모터의 활성을 측정하도록 형광 리포터 유전자로서 sfGFP를 발현하도록 사용되었다. (변형된 T7 프로모터 서열, 즉 p공여자1 옵션 1(서열 번호 24), p공여자3 옵션 1(서열 번호 25), p공여자5 옵션 1(서열 번호 26), p공여자1 옵션 2(서열 번호 27), p공여자3 옵션 2(서열 번호 28), p공여자5 옵션 2(서열 번호 29), p공여자1 옵션 3(서열 번호 30), p공여자3 옵션 3(서열 번호 31) 및 p공여자5 옵션 3(서열 번호 32)에 대해 도 2를 참조한다). 결과는 부정적으로 영향을 받지 않는 발현이 없을 뿐만 아니라, 9개의 변형된 T7 프로모터 중 8개가 실제로 향상된 프로모터 활성(약 40% 이하의 개선)을 나타내고, 3개의 유전자 경로가 변형된 무세포 벡터로부터 직접 생체내 발현을 위해 성공적으로 어셈블링되었다는 것을 나타냈다. (도 4를 참조한다).
도 1은 개시된 벡터 및 시스템의 하나의 실시형태을 예시한다. 도 1에 예시된 것처럼, LanzaTech 발현 벡터 pMTL8225-P-GG는 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터로서 사용된다. 표시된 것처럼, pMTL8225-P-GG는 5'→3'로 (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 카운터 선택 가능한 마커, 예를 들어, 독소 예컨대 ccdB; (iv) 클로닝을 위한 제6 골든 게이트 부위(GG6)(즉, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); 및 제3 전사 종결 부위(T3)를 포함한다.
개시된 벡터는 또한 관심 있는 유전자를 발현하기 위한 무세포 발현 벡터인 하나 이상의 공여자 벡터를 포함한다. 실시예에 의해, 도 1의 실시형태는 각각 유전자1, 유전자2 및 유전자3을 발현하는 p공여자1, p공여자3, 및 p공여자5로 나타낸 무세포 발현 벡터인 3개의 공여자 벡터를 갖는다.
예에 의해, p공여자1은 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1)(즉, 이의 인식 부위의 상류(5')를 절단하고 pMTL8225-P-GG에서 GG1 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및 (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입된다.
개시된 벡터는 또한 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 하나 이상의 공여자 벡터를 포함한다. 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 하나 이상의 공여자 벡터는 함께 다른 강도의 프로모터의 라이브러리를 포함할 수 있다. 실시예에 의해, 도 1의 실시형태는 p공여자2 및 p공여자 4로 나타낸 관심 있는 유전자의 세포에서 발현을 위한 공여자 프로모터를 포함하는 2개의 공여자 벡터를 갖는다.
예에 의해, p공여자2는 5'→3'로 (i) 클로닝을 위한 제2 골든 게이트 부위(GG2)(즉, 이의 인식 부위의 바깥을 절단하고 p공여자1에서 GG2의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 제1 전사 종결 부위(T1); (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제2 프로모터(P2) 및 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 바깥을 절단하고 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함한다.
예에 의해, p공여자3은 5'→3'로: (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제3 골든 게이트 부위(GG3)(즉, 이의 인식 부위의 상류(5')를 절단하고 p공여자2에서 GG3의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및 (iv) 클로닝을 위한 제4 골든 게이트 부위(GG4)(즉, 이의 인식 부위의 하류(3')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고; 여기서 선택적인 유전자2는 GG3과 GG4 사이에 삽입된다.
예에 의해, p공여자4는 5'→3'로 (i) 클로닝을 위한 제4 골든 게이트 부위(GG4)(즉, 이의 인식 부위의 바깥을 절단하고 p공여자3에서 GG4의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (ii) 제2 전사 종결 부위(T2); (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제3 프로모터(P3) 및 클로닝을 위한 제5 골든 게이트 부위(GG5)(즉, 이의 인식 부위의 바깥을 절단하고 이의 역보체 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함한다.
예에 의해, p공여자5는 5'→3'로 (i) 무세포 RNA 합성을 위한 프로모터(예를 들어, T7 RNA 중합효소를 위한 프로모터); (ii) 클로닝을 위한 제5 골든 게이트 부위(GG5)(즉, 이의 인식 부위의 상류(5')를 절단하고 p공여자4에서 GG5의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위); (iii) 선택적으로 관심 있는 제3 유전자(유전자3); 및 (iv) 클로닝을 위한 제6 골든 게이트 부위(GG6)(즉, 이의 인식 부위의 하류(3')를 절단하고 pMTL8225-P-GG에서 GG1의 오버행에 혼성화하는 오버행(예를 들어, 5' 오버행)을 제공하도록 선택적으로 배향된 BsaI 부위 또는 BbsI 부위 또는 AarI 부위와 같은 TypeIIS 제한 효소를 위한 인식 부위)를 포함하고, 여기서 선택적인 유전자3은 GG5와 GG6 사이에 삽입된다.
이렇게 설계되어, 개시된 시스템의 벡터는 무세포 시스템에서 관심 있는 유전자를 발현하도록 사용될 수 있고, 여기서 p공여자1, p공여자2 및 p공여자5 중 하나 이상은 무세포 시스템에서 각각 유전자1, 유전자2 및 유전자3 중 하나 이상을 발현하도록 사용될 수 있다. 본 발명자들은 시스템을 확장하고, 3개 미만의 유전자의 어셈블리를 허용하는 추가 벡터를 구축하였다. 예를 들어, 2개 이상의 유전자 경로에 대해, 수혜자 벡터로의 2개 또는 1개의 유전자의 어셈블리가 가능하게 하는 적합한 공여자 및 수혜자 벡터를 사용할 수 있다. (도 6 내지 도 8을 참조한다).
추가로, 개시된 시스템의 벡터는 세포에서 관심 있는 유전자를 발현하도록 사용될 수 있는 상이한 강도를 갖는 프로모터의 라이브러리를 제공하도록 사용될 수 있고, 여기서 p공여자2 및 p공여자4는 세포에서 관심 있는 유전자를 발현하기 위해 사용될 수 있는 상이한 전략을 갖는 프로모터를 제공할 수 있는 벡터를 나타낸다. 더욱이, 골든 게이트 부위의 사용을 통해 이렇게 설계되어, 다수의 프로모터 및 유전자는 다수의 상이한 프로모터를 사용하여 다수의 상이한 유전자를 발현하기 위한 단일 벡터를 제공하기 위해 골격 발현 벡터, 예컨대 pMTL8225-P-GG로 삽입될 수 있다.
도 2는 골든 게이트 부위를 포함하도록 무세포 발현 벡터를 변형하기 위한 다양한 옵션을 예시한다. 예시된 것처럼, T7 프로모터를 포함하는 원래의 발현 벡터는 1/5 오버행 상류 오버행을 생성하는 상류 BsaI 부위(20번 내지 25번 위치)를 제거하도록 변형되었다. BsaI 부위 또는 BbsI 부위는 리보솜 결합 부위(RBS)의 하류에 생성되는데, 이것은 RBS 서열을 남기거나 RBS 서열을 변경한다. 이러한 변형을 포함하는 무세포 발현 벡터는 무세포 시스템에서 발현 수준을 나타냈는데, 이는 비변형된 벡터만큼 적어도 양호하였다. (도 3을 참조한다).
공여자 플라스미드를 사용하여, sfGFP 발현에 대한 경로의 다양한 성분은 세포에서의 발현을 위해 골격 벡터로 어셈블링되었다. (도 4를 참조한다). 어셈블링된 발현 벡터로 형질전환된 15개의 세포 중 5개는 형광을 나타냈다. (도 5를 참조한다).
실시예 2 - 세포에서 생물학적 설계를 가속하기 위한 모듈식 무세포 발현 플라스미드
내용이 하기에 제공된 Karim, A.S 등이 저술한 제목이 "Modular cell-free expression plasmids to accelerate biological design in cells"인 초안 원고를 참조한다.
요약
생물공학 산업은 재생형 자원으로부터 고가 제품을 제조하는 것을 목표로 한다. 에스체리치아 콜라이와 같은 사용하기 쉬운 유기체인 모델 미생물이 리그노셀룰로스 바이오매스 또는 합성가스와 같은 원하는 공급원료를 사용하는 데 필요한 기전이 대개 부족하므로, 이는 도전적일 수 있다. 비모델 유기체, 예컨대 클로스트리듐은 산업적으로 입증되었고, 대사 특징을 원했지만, 주류 사용에 몇몇 장애를 갖는다. 즉, 이 종은 종래의 실험실 미생물보다 더 천천히 성장하고, 이들을 조작하기 위한 유전 도구는 훨씬 덜 일반적이다. 세포 설계를 가속화하기 위한 이 장애를 해결하기 위해, 무세포 합성 생물학은 비모델 유기체를 규명하고 시험관내 대사 경로를 신속히 시험하기 위한 접근법으로서 나타났다. 불행하게도, 무세포 시스템은 세포 발현과 적합하지 않은 최소 조절로 특수화된 DNA 구성을 요할 수 있다. 이 작업에서, 본 발명자들은 무세포 발현에 대한 원하는 효소의 T7 발현을 허용하고 클로스트리듐 발현 벡터로 골든 게이트 어셈블리를 지시하는 모듈식 벡터 시스템을 개발한다. Joint Genome Institute의 DNA 합성 공동체 과학 프로그램(DNA Synthesis Community Science Program)을 사용하여, 본 발명자들은 본 발명자들의 프로젝트에 필요한 이들 플라스미드 및 유전자를 설계하고 합성하여서 본 발명자들이 시험관내 실험과 생체내 실험 사이에 DNA를 용이하게 셔틀링하게 한다. 본 발명자들은 다음에 이 벡터가 기능적 효소의 무세포 발현에 충분하다는 것을 검증하여서 이전의 최신 기술과 동등하게 수행한다. 마지막으로, 본 발명자들은 68% 내지 90%의 범위의 효율로 C. 아우토에토게눔 발현에 대한 자동화된 6개-부분 DNA 어셈블리를 입증하였다. 본 발명자들은 개발 사이클을 짧게 하여 시험관내 및 생체내 생합성 경로의 손쉬운 시험을 위해 프레임워크가 가능할 것이라고 기대한다.
서론
생물공학 산업은 대개 저렴하고 흔한 공급원료, 예컨대 리그노셀룰로스 바이오매스 및 합성가스로부터 화학 생성물을 제조하려 추구한다.1-3 대부분의 합성 생물학자가 이의 사용 용이성으로 인해 에스체리치아 콜라이 및 사카로마이세스 세레비시아에와 같은 모델 유기체와 작업하고, 이들 유기체는 접근 가능한 공급원료, 생성물 및 일하기 위한 안정한 조작 환경에 의해 제한될 수 있다. 예를 들어, 이 유기체는 합성가스에서 탄소에 접근하는 데 필요한 대사 경로를 자연히 보유하지 않고; 오히려, 조사자들은 비모델 유기체의 다양한 속 및 이 고유한 생화학 형질전환을 할 수 있는 경로로 돌렸다.4 하나의 이러한 속은 셀룰로오스용해성 C. 써모셀룸뿐만 아니라 가스-발효하는, 아세토젠성 C. 아우토에토게눔을 포함하는 클로스트리듐이다.5-7 생명공학 및 상업적 개발에 대한 이의 이용성에도 불구하고, 이 종은 종래의 실험실 마생물보다 더 천천히 성장하고, 절대혐기성미생물이고, 이들을 조작하기 위한 유전 도구는 여전히 개발 중이고 훨씬 덜 일반적이다.
무세포 합성 생물학의 개발은 비모델 유기체를 규명하고8-10, 시험관내 대사 경로를 신속히 시험하도록 추구하였다.11-14 시험관내 직접 효소를 제조하기 위해 무세포 유전자 발현(CFE)15을 사용함으로써, 대사 경로는 유기체를 재조작하거나 각각의 조작 사이클 사이에 새로운 DNA 요소를 작제할 필요 없이 시험될 수 있다.13,16-20 이 접근법은 더 많은 효소 변이체를 시험하는 능력, 반응 조건 및 효소 농도를 정확히 조율하는 능력, 및 생체내 생화학 생성을 위한 유망한 후보 경로를 하향-선택하기 위한 더 짧은 조작 사이클로부터 이익이다.21 무세포 경로 프로토타이핑이 믹스-앤-매치 방식으로 수행되지만,13 세포 발현은 오페론으로의 어셈블리를 요한다. 추가적으로 클로스트리듐 발현에 특수화된 플라스미드 및 CFE에 대한 것은 본래 적합하지 않고, 예를 들어 상이한 프로모터(무세포 발현은 통상적으로 직각 T7 시스템에 의존함) 및 추가 요소, 예컨대 그람-양성 레플리콘 기원, 특이적 항생제 카세트 및 낮은 GC 함량을 요한다.22 이는 시험관내 확인된 성공적인 경로 설계를 위한 클로스트리듐 최적화된 DNA가 클로스트리듐에서 형질전환 전에 별개로 합성되고 클로닝되어야 해서, 몇주의 노력 및 상당한 비용을 부가한다는 것을 의미한다. 이 공정의 간소화는 대사 조작 분야에 대한 비모델 유기체를 조작하는 능력을 증가시킬 것이다.
이 작업에서, 본 발명자들은 C. 아우토에토게눔에서 무세포 프로토타이핑 노력 및 균주 조작을 신속히 가교시키고 전체 조작 사이클 시간을 감소시키기 위해 표준 무세포 벡터 pJL1 10, 19,23 , 24 및 보편적 클로스트리듐 셔틀 벡터 시스템 pMTL8000022에 기초한 모듈식 플라스미드 시스템을 제시한다. 조작 적합 발현 플라스미드는 특히 상당히 중요한 리보솜 결합 부위 주위에 오픈 리딩 프레임의 유전 맥락에 대한 영향을 최소화하도록 미세한 조정을 요한다.13,19 처음에, 본 발명자들은 본 발명자들의 상위-수행 무세포 발현 벡터, pJL1(Addgene #69496)를 닮고, C. 아우토에토게눔에서의 발현을 위해 유전자 및 프로모터(골든 게이트 어셈블리25 적합성)의 융통성 있는 배열이 가능하게 하는 몇몇 플라스미드 구성을 설계하였다. 다음에, 본 발명자들은 이 새로운 벡터가 기능적으로 활성인 생합성 효소의 CFE에 충분하다는 것을 입증하였다. 이후, 본 발명자들은 C. 아우토에토게눔 발현에 대한 6개 부분까지를 어셈블링할 때 68% 내지 90%의 범위의 DNA 어셈블리 효율을 입증하였다. 본 발명자들은 마지막으로 2개의 상이한 자동화 시스템에서 전체 워크플로우의 자동화를 나타냈다. 고쓰루풋 및 자동화 가능한 워크플로우와 함께 이 모듈식 '무세포 대 클로스트리듐' 벡터 시스템은 C. 아우토에토게눔 또는 다른 클로스트리듐 종에 대한 부담 개발 노력을 가속시킬 것이다. 여기서 학습된 원칙 또는 아마도 벡터 자체는 무세포 프로토타이핑과 세포 검증 사이의 이행의 지연을 감소시킴으로써 다른 비모델 유기체에서 생물학적 설계를 또한 가속시킬 수 있었다.
재료 및 방법
균주 및 플라스미드. '무세포 대 클로스트리듐' 벡터 시스템의 생성 및 클로닝을 위해, E. 콜라이 균주 TOP10(Invitrogen)을 사용하였다. 처음에, 카운터-선택 가능한 마커 ccdB(BsaI 인식 부위와 플랭킹됨)는 수혜자 클로스트리듐 발현 벡터(pCExpress)를 생성하도록 pMTL82251 및 pMTL8315122로 클로닝되었다. 벡터 pD2 및 pD4의 작제는 플라스미드, pCR-blunt(Invitrogen)로 JGI에 의해 증폭되거나 합성된 종결자 및 프로모터 부분(BsaI 인식 부위와 플랭킹됨)의 TOPO(Invitrogen) 클로닝을 수반하였다. '무세포 대 클로스트리듐' 벡터는 pD1, pD3 및 pD5를 생성하도록 3개의 변형에서 RBS와 START 코돈 사이에 BsaI 인식 부위를 함유하도록 T7 프로모터 영역에서 변형된 pJL1 플라스미드(Addgene #69496)로부터 유래되었다. 모든 수혜자 및 공여자 벡터는 DNA 시퀀싱에 의해 검증되었다.
C. 아우토에토게눔에 대한 DNA 코돈-최적화된 유전자는 LanzaTech의 인하우스 코돈 최적화 소프트웨어를 사용하여 생성되었다. E. 콜라이 채택된 서열은 Twist Biosciences(미국 캘리포니아주)로부터의 코돈 최적화 도구를 사용하여 생성되었다. 관심 있는 유전자는 '무세포 대 클로스트리듐' 벡터 pD1, pD3 및 pD5에서 JGI에 의해 제공되었다. 이 연구에 사용된 모든 벡터 DNA 서열은 표 1에 열거되어 있고, 모든 DNA 부분은 표 2에 열거되어 있다. 표 2로부터의 부분을 함유하는 58개의 모듈식 벡터는 표 3에 열거되어 있다. 무세포 검정에 사용된 생합성 유전자는 표 4에 열거되어 있고, GG 어셈블리에 사용된 것은 표 5에 열거되어 있다.
무세포 검정. CFE에 대한 모든 세포 추출물은 에스체리치아 콜라이 BL21 Star(DE3)(NEB)에 의해 제조되었다.21 이들 세포를 성장시키고, 수확하고, 용해하고, 이전에 기재된 방법을 사용하여 제조하였다.19,26 CFE 반응은 이전의 간행물에 기재된 것처럼 2-mL의 에펜도르프(Eppendorf) 관에서 15- 또는 30-μL 부피에서 변형된 PANOx-SP 시스템을 사용하여 개별?Ю막? 각각의 효소를 발현하도록 수행되었다.27,28 20시간 후 단백질 측정을 취했다. 형광을 측정함으로써 활성 슈퍼-폴더 GFP(sfGFP) 단백질 수율을 정량화하였다. 이를 하기 위해, 2마이크로리터의 총 CFE 반응물을 96웰 절반 면적 검정 플레이트(Costar 3694; Corning Incorporated, 뉴욕주 코닝)의 편평 바닥의 중간에서 첨가하였다. sfGFP는 510 nm 컷오프 필터에 의해 528 nm에서 방출을 측정하면서 485 nm에서 여기되었다. sfGFP의 형광은 표준 곡선에 따라 농도(μg/mL)로 전환되었다.29 모든 다른 단백질은 단백질 제조 동안 혼입을 위해 보충된 방사성 14C-류신(10 μM)으로 CFE 반응을 사용하여 측정되었다. 본 발명자들은 방사성 단백질 샘플을 침전시키기 위해 트리클로로아세트산(TCA)을 사용하였다. TCA-침전된 샘플로부터의 방사성 계수치는 액체 섬광에 의해 측정되었고, 이는 이후 이전에 보고된 것처럼 제조된 각각의 단백질의 가용성 및 총 수율을 정량화한다(MicroBeta2; PerkinElmer).27,30
무세포 활성 검정은 1.5-mL의 에펜도르프 관에서 15-μL 부피로 실행되었다. (CFE 반응을 통한) 모든 효소-풍부한 용해물은 C14 측정에 의해 결정된 것과 같이 풍부한 효소의 0.4 μM 농도로 첨가되었고, 잔량은 총 반응 부피의 50% 이하로 '블랭크 CFE' 반응물(DNA 첨가 없음)이다. 반응에서 120 mM 글루코스, 3 mM NAD+, 5 mM CoA, 100 mM BisTris pH 7, 8 mM 아세트산마그네슘 염, 0.1 U/μL의 카탈라제의 최종 농도를 달성하도록 소분자를 첨가하였다. 반응을 20시간 동안 실행하고, 5% TCA로 켄칭하고, 이전에 기재된 것처럼 HPLC를 통해 측정하였다.13,19
수동 워크플로우를 사용하는 골든 게이트 어셈블리. GeneArt 유형 IIs (BsaI) 어셈블리 키트(Invitrogen, 캘리포니아주)를 사용하여 2개-부분 내지 6개-부분 DNA 어셈블리를 수행하였다. 구체적으로는, 75 ng의 수혜자 벡터를 사용하였다. 다른 부분(pD1, pD2, pD3, pD4 및 pD5)을 GeneArt Type IIs 효소 믹스와 함께 수혜자 벡터와 관련하여 1:1 몰비로 첨가하였다. 이후, 반응물을 유전자증폭기(1분 동안 37℃, 1분 동안 16℃, 30X 사이클링됨, 이어서 4℃에서 냉각함)에서 항온처리하였다. 이후, 어셈블리 혼합물을 E. 콜라이 상위 10개의 화학적으로 유능한 세포(ThermoFisher Scientific, 캘리포니아주)로 형질전환하고, 적절한 항생제를 함유하는 LB 한천에 플레이팅하였다. 생성된 콜로니를 클로닝되는 부분의 존재에 대해 PCR을 통해 스크리닝한 후, NGS를 통해 서열을 확인하였다.
자동화 워크플로우를 사용하는 골든 게이트 어셈블리. 액체 취급 로봇 Hamilton STARLet 또는 Labcyte Echo 525를 사용하여 2개의 자동화 어셈블리 워크플로우를 개발하였다.31 2 nM인 각각의 개별 DNA 부분에 대한 최종 농도에 의해 어셈블리 반응을 수행하였다.25 Hamilton STARLet에 대한 어셈블리 반응 부피는 하기와 같이 제조되어 20 μL였다: 총 20 μL로 2 μL의 각각의 DNA 부분(10 nM), 10 μL의 GeneArt Type IIs Assembly Kit BsaI(Invitrogen A15917) 및 탈이온수. Labcyte Echo 525를 사용할 때, 반응 부피는 2 μL의 최종 부피로 크기감소되었다. NanoDrop 2000 분광기(Thermo Fisher Scientific)를 사용하여 280 nm에서의 흡광도에 의해 모든 DNA 샘플을 정량화하였다. 하기 매개변수를 사용하여 INHECO 열 블록에서 반응물을 항온처리하였다: 2시간 동안 37℃, 5분 동안 50℃, 10분 동안 80℃, 이후 형질전환까지 -20℃에서 저장하였다. INHECO 블록을 사용하여 형질전환을 또한 수행하였다: 2 μL의 각각의 반응 혼합물을 20 μL의 Invitrogen One Shot Top10 화학적으로 유능한 세포(C404003)에 첨가하고, 4℃에서 20분 동안 항온처리하였다. 이후, 세포를 60℃에서 45초 동안 열 충격하고, 이후 4℃에서 2분 동안 회수하였다. 이후, 이화대사 억제(SOC) 배지를 갖는 180 μL의 Super Optimal Broth(Invitrogen 15544034)를 세포 혼합물에 첨가하고, 세포를 37℃에서 2시간 동안 회수하였다. 마지막으로, 비희석된 배양 부피로 이루어진 7 μL의 각각의 형질전환 반응물을 적절한 항생제를 함유하는 Lennox Lysogeny Broth(LB) + 한천 플레이트에 플레이팅하고, 37℃에서 밤새 항온처리하였다. 본 발명자들은 어셈블링된 영역에 걸쳐 서열에 2개의 콜로니를 무작위로 선택한다. NGS 시퀀싱은 스크리닝된 클론의 90% 초과가 완전한 어셈블리를 나타낸다는 것을 확인시켜주었다.
결과 및 토의
모듈식 '무세포 대 클로스트리듐' 벡터 시스템의 설계. 본 발명자들의 목표는 무세포 플라스미드와 세포 플라스미드 사이의 DNA의 용이한 교환이 가능하게 하는 DNA 벡터 시스템을 개발하는 것이었다. 이 무세포 대 클로스트리듐 프레임워크는 반복적 DNA 합성 및 서브클로닝을 최소화하고 DNA의 재사용이 가능하게 하여, 시험관내 및 생체내 생합성 경로의 손쉽고 신속한 시험을 허용한다. 전통적인 접근법은 무세포 발현 및 무세포 시험을 위한 후보 유전자의 최적화 및 합성, 이어서 클로스트리듐 발현을 위한 유전자의 별개의 최적화 및 합성을 요하고(도 9a), 상당한 시간이 걸리고 조사 노력을 느리게 한다. 여기서 제시된 워크플로우는 클로스트리듐에서 무세포 시험 및 경로 어셈블리 둘 모두에 사용될 수 있는 클로스트리듐에 대한 코돈 최적화 및 합성의 단일 회차를 허용하여서(도 9a), 이 복잡한 유기체에서 조사 및 개발의 시간 및 비용을 감소시킨다. 구체적으로는, DNA 합성 시간 및 비용의 50% 감소가 있을뿐만 아니라 생체내 벡터 어셈블리 전에 무세포/공여자 벡터로 오직 1회차의 클로닝이 있다. 이 목표를 달성하기 위해, CFE 발현 플라스미드가 클로스트리듐 발현 벡터로 직접 다수의 DNA 부분 어셈블리에 직접 사용될 수 있도록(도 9b), 이것은 골든 게이트(GG) 부위의 추가를 통해 변형되었다. 제자리에의 이러한 시스템에 의해, 유전자는 이들 플라스미드에서 클로스트리듐 코돈-채택된 서열에 의해 한번 순서화되고, 이들 플라스미드를 사용하여 무세포 반응에서 프로토타이핑되고, 이후 유전자 변이체의 최고의 수행은 1개-단계 GG 어셈블리를 통해 동일한 플라스미드로부터 생체내 발현 플라스미드로 어셈블링될 수 있었다.
출발점으로서, 본 발명자들은 6개의 전체 벡터를 설계하였다. 3개의 벡터, pD1, pD3 및 pD5는 표준 CFE 발현 플라스미드인 pJL1 벡터(Addgene #69496)의 T7 프로모터 영역 내에 GG 부위(BsaI 인식 부위)를 추가함으로써 작제되었다. 이 벡터는 GG 부위를 플랭킹하는 클로스트리듐 프로모터 및 종결자와 함께 ccdB 생존 유전자를 플랭킹하는 2개의 GG 부위의 추가에 의해 pMTL80000 보편적 클로스트리듐 발현 벡터22에 기초하여 새로운 수혜자 벡터에서 어셈블리에 대한 유전자 공여자 벡터로서 작용하도록 설계되었다. 본 발명자들은 프로모터-종결자 공여자 벡터로서 작용하도록 pD2 및 pD4를 또한 작제하였다. 6개의 벡터(5개의 공여자 벡터 및 1개의 수혜자 벡터)의 이 시스템은 pD1, pD3 및 pD5를 사용한 유전자의 시험관내 발현, 이어서 본 발명자들의 클로스트리듐 발현 벡터로 직접 6개 이하의 DNA 부분(pD1, pD2, pD3, pD4 및 pD5에 의해 제공된 인서트)의 1개-단계 어셈블리를 허용할 것이다. 본 발명자들은 더 적은 유전자가 원해질 때 이들 벡터의 상이한 조합이 1개-유전자 삽입(도 12a) 또는 2개-유전자 삽입(도 12b)을 어셈블링하도록 사용될 수 있다는 것을 주목한다. 다중-시스트론성 공여자 벡터를 사용함으로써 발현 오페론에서 3개 초과의 유전자를 조합하는 것이 또한 가능하다(도 12c).
Joint Genome Institutes(JGI) 유전자 합성 프로그램을 사용하여, GG 시스템은 다양한 프로모터, 예컨대 P fdx 17, P pta 18 , P pfor 19 및 P wl 18 로 수혜자 및 공여자 벡터를 생성하도록 확장되었다. 추가로, GG 부위는 다양한 프로모터를 갖는 2개 내지 6개 부분 사이의 어딘가의 어셈블리를 허용하도록 수혜자 벡터에서 변해서, 총 58개의 모듈식 벡터를 생성시켰다(도 12d; 표 3). 상이한 DNA 부분(표 2)을 사용한 다양한 어셈블리 옵션은 이 벡터 시스템의 다양성을 증가시킨다.
CFE에 대한 벡터 시스템의 평가. 최고 수율의 무세포 시스템은 T7 RNA 중합의 이점을 취하고, 플라스미드 구성의 변경에 의해 실질적으로 영향을 받는다.32,33 예를 들어, mRNA를 제조하기 위해 T7 RNA 중합효소를 레버리징하는 pJL1 벡터를 사용한 본 발명자들의 이전의 작업은 약 2.7 g/L의 슈퍼-폴더 녹색 형광 단백질(sfGFP)의 단백질 수율을 달성하였다.34 GG 적합성에 대해 본 발명자들의 튼튼한 pJL1 벡터를 채택하기 위해, 본 발명자들은 pJL1에서 3개의 BsaI 부위 설계의 삽입을 시험하려고 선택한다(도 10a; 표 2). 구체적으로는, 서열 TCAT, AATG 또는 CTTA를 갖는 GG 부위는 리보솜 결합 부위(RBS)와 개시 코돈 사이에 도입되고, 이는 1개 내지 3개의 뉴클레오타이드에 의해 이들 2개의 요소 사이에 스페이서 길이를 증가시켰다. 이는 각각 3개의 가능한 BsaI 절단 부위를 갖는 3개의 구별되는 공여자 벡터를 생성하였다. 본 발명자들은 처음에 단백질 발현에 대한 GG 부위의 영향을 평가하기 위해 sfGFP를 생성하기 위해 PANOx-SP 시스템에 기초하여 무세포 유전자 발현 반응에서 이들 9개의 설계의 각각을 평가하였다. 20시간 후, 무세포 반응은 비변경된 pJL1 플라스미드보다 sfGFP의 상당히 또는 약간 더 높은 농도를 생성하였다(도 10b). 공여자 벡터가 적합해지기 위해서, 본 발명자들은 3개의 벡터의 각각에 대해 동일한 변이체를 선택해야 했다. 이와 같이, 본 발명자들은 최고-수행 세트로서 변이체 2를 선택한다. 변이체 2 GG 벡터는 C. 아세토부틸리쿰 ATCC 824에서 부티르산 대사로부터 효소 포스포트랜스부티릴라제(Ptb) 및 부티레이트 키나제(Buk)의 발현에 의해 추가로 검증되었다(도 10c). 이 실험은 상이한 단백질의 발현의 유전 맥락의 중요성을 강조하여서, sfGFP의 거의 동일한 발현에도 불구하고 가변적인 양의 Ptb 및 Buk에 대한 단백질을 생성시킨다.
본 발명자들은 다음에 C. 아우토에토게눔-최적화된 유전자가 본 발명자들의 확립된 무세포 검정에서 충분히 발현되는지를 평가하였다. 이를 시험하기 위해, 본 발명자들은 pD1, pD3 및 pD5에서 다양한 유기체로부터 산/알코올 발효와 관련된 16개의 클로스트리듐-최적화된 생합성 유전자의 패널(표 4)을 구성하였다. 이들 유전자의 몇몇은 아세틸-CoA로부터의 부탄올의 생성을 위한 이전의 연구에 사용되었지만, 나머지는 이들 유전자와의 서열 유사성을 통해 확인되었다. 20시간 CFE 반응 후 본 발명자들은 일련의 발현이 모두 본 발명자들이 E. 콜라이-코돈-최적화된 sfGFP, Ptb 또는 Buk에 대해 관찰한 것보다 상당히 더 낮다(10배)는 것을 관찰하였다(도 10d). 그러나, 1 μM 초과의 농도에서의 전장 효소의 발현은 본 발명자들이 프로토타이핑하기에 충분한 것으로 발견한 시험관내 경로 어셈블리에 대해 희석 후 적어도 0.1 μM 효소를 제공한다.13 이와 같이, 본 발명자들은 C. 아우토에토게눔-최적화된 서열이 생합성 경로를 프로토타이핑하기에 충분한지를 시험하도록 진행하였다. 처음에, 본 발명자들은 실제로 발현된 이 효소가 전장에서 발현되었다는 것을 확인하기 위해 SDS-PAGE, 이어서 14C 자기방사법을 통해 단백질 겔에서 16개의 효소를 실행하였다(도 14a, 14b). 단백질 번역 및 폴딩을 느리게 하기 위한 반응 온도의 감소 및 DNA 주형 서열(예를 들어, RBS, 코딩 서열)의 변경은 중요한 동족체가 가용성 형태로 발현되지 않을 때 추구될 수 있다. 이후, 본 발명자들은 이들 효소의 활성을 시험하기 위해 부탄산을 제조하기 위한 생합성 경로를 구성하기 위해 이들 효소를 사용하였다. 이 경로는 E. 콜라이 미정제 용해물에 존재하는 자연적 대사, 이어서 부탄산을 제조하기 위한 4개의 효소 단계를 사용하여 글루코스로부터 아세틸-CoA로 흐른다. 도 2d로부터의 효소의 12개의 조합을 글루코스 및 보인자와 혼합하여, 각각의 조합은 7 mM 초과의 부탄산을 생성하였다(도 14c). 이 효소는 정제를 통한 더 자세한 활성 연구 검정 및 정의된 기질을 사용하여 추가로 연구될 수 있다. 잘 발현되지 않은 효소에 대해, E. 콜라이-코돈-최적화된 버전을 별개로 발현시키는 것은 효소 발현을 개선할 수 있다(도 13; 표 4). 가용성 단백질 수율이 E. 콜라이-기반(50% GC 함량) 세포 추출물에서 C. 아우토에토게눔(31% GC 함량) 코돈-최적화된 서열을 사용하여 일반적으로 더 낮지만, 본 발명자들의 데이터는 C. 아우토에토게눔 최적화된 효소 서열이 E. 콜라이 미정제 용해물에서 활성이라는 것을 제시한다. 가까운 GG-적합 벡터에 의해, 본 발명자들은 다음에 생체내 발현 플라스미드를 작제하도록 추구하였다.
CFE 벡터로부터 클로스트리듐 발현 플라스미드로의 6개-부분 DNA 어셈블리. pD 벡터가 CFE에서 성공적으로 검증되면, 이 변형된 벡터는 이후 다양한 생합성 유전자를 갖는 클로스트리듐 발현 벡터로 직접 다중-부분 어셈블리의 시험에 사용되었다. 구체적으로는, 본 발명자들은 (i) 2개의 GG 부위(pCExpress)를 플랭킹하는 프로모터(P1) 및 종결자(T3)를 함유하는 pMTL8315 골격에 기초한 수혜자 벡터, (ii) 둘 모두 종결자 및 프로모터 조합을 함유하는 pD2 및 pD4(즉, T1-P2 및 T2-P3), 및 (iii) 유전자 1, 유전자 2 및 유전자 3을 함유하는 pD1, pD3 및 pD5를 함유하는 6개-부분 GG 어셈블리를 수행하였다(도 11a; 표 1). 어셈블리 혼합물은 본 발명자들의 E. 콜라이 클로닝 균주로 형질전환되었고, 6개의 콜로니는 PCR에 의해 선별되고 유전자형분석되었는데, 이는 선별된 콜로니의 90% 내지 100%가 정확히 어셈블링된 모든 6개 부분을 갖는 플라스미드를 갖는다는 것을 나타냈다(도 11b). 이들은 시퀀싱을 통해 확인되었다. 6개-부분 어셈블리는 적어도 5개의 추가 설계에 대해 유전자 및 프로모터-종결자 조합의 상이한 세트를 사용하여 검증되었다(표 5). 총 20개에서 수동 어셈블리는 70% 내지 95%의 범위의 효율로 수행되었다.
이후, 어셈블링된 작제물은 생합성 경로 활성에 대해 시험하기 위해 클로스트리디아로 형질전환될 수 있다. 본 발명자들은 E. 콜라이 무세포 시스템에서의 경로의 최적화가 클로스트리디아에서 세포 설계를 알려준다는 것을 이전에 나타냈다.13 이 작업은 무세포 활성 데이터와 생체내 발현 사이의 양의 상관관계를 나타냈다. 클로스트리디아에서 작제하기 위해 시험관내 시험된 200개 초과의 경로 조합의 분획의 하향-선택은 조사 노력을 6개월 초과로 절약하였다. 이 모듈식 벡터 시스템과 클로스트리디아-기반 무세포 발현의 조합10은 더한 양의 상관관계 및 간결화된 조사 파이프라인으로 이어져야 한다.
워크플로우 자동화. 워크플로우 자동화는 쓰루풋 및 신뢰성을 개선할 수 있다. CFE 반응은 액체-취급 로봇공학을 사용아여 일상적으로 수행될 수 있다.35,36 이 반응은 단백질 발현에서의 유의미한 변화 없이 2 μL로 규모축소될 수 있다.37 게다가, 생체내 발현을 위한 GG 어셈블리가 또한 자동화될 수 있다. 수동 워크플로우를 사용하여 6개 이하의 DNA 부분의 성공적인 어셈블리를 입증한 후, 본 발명자들은 이후 본 발명자들의 DNA 어셈블리 쓰루풋을 증가시키기 위해 자동화 워크플로우를 개발하였다(도 11a). 생물학적 시스템의 복잡함으로 인해, 최적 조작 해결을 얻기 위해 상이한 프로모터와 함께 많은 수의 효소 동족체를 시험하는 것이 대개 필요하다. 실제로, 3개의 유전자 오페론에 대한 바로 5개의 동족체 및 3개의 프로모터의 시험은 3,375개의 상이한 순열을 생성시킬 것이다. 그러나, 이 실험 쓰루풋은 수동 기법 및 절차를 사용할 때 어렵고 번거롭다. 자동화된 잘 알려진 설계는 생성될 수 있는 설계의 수, 이 설계가 생성될 수 있는 속도를 증가시키는 것을 돕고, 이것은 구축되고 시험되는 최고의 후보를 우선시화하는 설계 공간을 좁게 하는 것을 돕와 자원을 절약한다.38 본 발명자들의 부담 조작 파이프라인의 쓰루풋, 효율 및 정확성을 증가시키고, 반복 업무로부터 조사자들을 해방시키고, 결과 재현성을 증가시키기 위해, 본 발명자들은 2개의 자동화 시스템에서 골든 게이트 DNA 어셈블리 자동화 프로토콜을 검증하였다. 실험을 실행하기 위한 작제물 및 워크리스트의 설계 둘 모두는 J5 소프트웨어에 의해 생성되었다.39,40 본 발명자들은 90% 초과의 효율로 Hamilton STARLet 액체-취급 로봇 및 Labcyte Echo 525 acoustic 액체-취급 로봇 둘 모두를 사용하여 3개-부분 내지 6개-부분 GG 어셈블리를 어셈블링하였다.
결론
이 연구에서, 본 발명자들은 무세포 유전자 발현 및 클로스트리듐 발현 플라스미드로의 클로닝 둘 모두에 대해 모듈식 벡터의 세트를 기재한다. 이 프레임워크는 더 짧은 조작 사이클을 위한 시험관내 및 생체내 생합성 경로의 손쉬운 시험을 허용하고, 너무 길고 비싼 재합성 및/또는 서브클로닝 없이 본 발명자들의 시험관내 팀, 본 발명자들의 생체내 팀과 JGI 사이의 개선된 워크플로우가 가능하게 한다. '무세포 대 클로스트리듐' 벡터 시스템은 90% 이하의 효율로 한번에 6개 이하의 부분(고유한 프로모터 및 종결자 서열을 갖는 3개의 오픈 리딩 프레임)의 골든 게이트 어셈블리에 대해 사용하기 쉽고, JGI의 Community Science Program 플랫폼으로 직접 공급한다. 더 긴 오페론에 대해, 유전자는 각각의 CFE 벡터(pD1, pD3 및 pD5)에 순차적으로 배치될 수 있다. 실험실 자동화와 함께 이들 벡터는 본 발명자들의 워크플로우의 속도 및 효율을 이미 증가시켰고, 시험관내 생합성 경로, 이어서 생체내 클로닝 파이프라인를 프로토타이핑하는 능력을 계속해서 촉진할 것이다. 이 벡터 시스템의 표준화는 새로 단순화된 워크플로우를 허용한다. pJL1 무세포 벡터 및 이의 변이체는 다수의 박테리아 무세포 시스템(즉, E. 콜라이,19 클로스트리듐,10 슈도모나스,23 스트렙토마이세스,24,41 비브리오 나트리에겐스42,43)에서 통상적으로 사용된다. 게다가, pMTL 벡터 시스템은 몇몇 클로스트리디아 종(즉, 아우토에토게눔, 리융달리, 아세토부틸리쿰, 베이저링키, 디피실, 스포로게네세스, 퍼프린겐스, 파스퇴리아눔, 티로부틸리쿰)뿐만 아니라 다른 그람-음성 및 그람-양성 모델 유기체, 예컨대 E. 콜라이 및 바실러스에서 입증되었다.22,44 종합하면, pJL1 벡터를 사용할 수 있는 박테리아 무세포 시스템의 폭 및 골든 게이트 클로닝의 편재는 본 발명자들의 플라스미드 벡터 시스템의 넓은 적용가능성을 제시한다. 앞날을 생각하며, 본 발명자들은 벡터의 이 시스템이 조사자들이 대사 조작 노력을 가속화하기 위해 다수의 유기체에 걸쳐 이들의 기존의 워크플로우로 시험관내 프로토타이핑 실행을 더 통합하게 한다고 기대한다.
참고문헌
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
보충 정보
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
상기 설명에서, 다양한 치환 및 변형이 본 발명의 범위 및 정신으로부터 벗어나지 않으면서 본원에 개시된 발명에 이루어질 수 있다는 것이 당업자에게 자명할 것이다. 적합하게 본원에 예시적으로 기재된 발명은 본원에 구체적으로 개시되지 않은 임의의 요소 또는 요소들, 제한 또는 제한들의 부재 하에 실행될 수 있다. 사용된 용어 및 표현은 제한의 면이 아니라 설명의 면으로 사용되고, 도시되고 기재된 특징 또는 이의 부분의 임의의 균등물을 배제하는 것의 이러한 용어 및 표현의 사용에서 의도되지 않지만, 본 발명의 범위 내에 다양한 변형이 가능하다고 인식된다. 이와 같이, 본 발명이 구체적인 실시형태에 의해 예시되고 본원에 개시된 개념의 선택적인 특징, 변형 및/또는 변경이 당업자에 의해 유예될 수 있지만, 이러한 변형 및 변경이 본 발명의 범위 내에 있는 것으로 여겨진다고 이해되어야 한다.
본원에 기재된 모두 방법은 달리 본원에 표시되지 않는 한 또는 달리 문맥에 의해 명확히 상충되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예의 사용은 단순히 본 발명을 더 잘 예시하도록 의도되고, 달리 청구되지 않는 한 본 발명의 범위에 대한 제한을 부여하지 않는다. 본 명세서에서의 언어는 본 발명의 실행에 필수적인 것으로서 임의의 청구되지 않은 요소를 나타내는 것으로 해석되지 않아야 한다.
본원에서 다수의 특허 및 비특허 참조문헌에 대한 인용이 이루어진다. 인용된 참고문헌은 본원에 그 전체가 참고로 포함된다. 인용된 참고문헌에서의 용어의 정의와 비교하여 본 명세서에서의 용어의 정의 사이에 불일치가 있는 경우에, 그 용어는 본 명세서에서의 정의에 기초하여 해석되어야 한다.
SEQUENCE LISTING <110> Northwestern University LanzaTech, Inc. Jewett, Michael C. Karim, Ashty S. Koepke, Michael Juminaga, Darmawi Liew, Fungmin <120> MODULAR, CELL-FREE PROTEIN EXPRESSION VECTORS TO ACCELERATE BIOLOGICAL DESIGN IN CELLS <130> 702581.01878_NU2019-034-02 <150> US 62/943,036 <151> 2019-12-03 <160> 32 <170> PatentIn version 3.5 <210> 1 <211> 2557 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 1 gtcgcgctgg agaccctgct aacaaagccc gaaaggaagc tgagttggct gctgccaccg 60 ctgagcaata actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc 120 tgaaagccaa ttctgattag aaaaactcat cgagcatcaa atgaaactgc aatttattca 180 tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact 240 caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc 300 caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat 360 caccatgagt gacgactgaa tccggtgaga atggcaaaag cttatgcatt tctttccaga 420 cttgttcaac aggccagcca ttacgctcgt catcaaaatc actcgcatca accaaaccgt 480 tattcattcg tgattgcgcc tgagcgagac gaaatacgcg atcgctgtta aaaggacaat 540 tacaaacagg aatcgaatgc aaccggcgca ggaacactgc cagcgcatca acaatatttt 600 cacctgaatc aggatattct tctaatacct ggaatgctgt tttcccgggg atcgcagtgg 660 tgagtaacca tgcatcatca ggagtacgga taaaatgctt gatggtcgga agaggcataa 720 attccgtcag ccagtttagt ctgaccatct catctgtaac atcattggca acgctacctt 780 tgccatgttt cagaaacaac tctggcgcat cgggcttccc atacaatcga tagattgtcg 840 cacctgattg cccgacatta tcgcgagccc atttataccc atataaatca gcatccatgt 900 tggaatttaa tcgcggcttc gagcaagacg tttcccgttg aatatggctc ataacacccc 960 ttgtattact gtttatgtaa gcagacagtt ttattgttca tgatgatata tttttatctt 1020 gtgcaatgta acatcagaga ttttgagaca caacgtgaga tcaaaggatc ttcttgagat 1080 cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 1140 gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 1200 gcgcagatac caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac 1260 tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 1320 ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 1380 cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 1440 gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 1500 gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 1560 gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 1620 cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcgatc 1680 ccgcgaaatt aatacgactc actataggga caccacaacg gtttccctct agaaataatt 1740 ttgtttaact ttaagaagga gaggtctctt catggaactt aataatgtaa tattggaaaa 1800 agaaggaaaa gtagctgtag taacgattaa tagacccaaa gcattaaatg cattaaattc 1860 agatacttta aaagaaatgg attatgttat aggtgaaata gaaaatgatt cagaagtact 1920 tgcagttata cttacaggtg cgggagagaa aagctttgtt gcaggagctg acatatcgga 1980 aatgaaggaa atgaatacta ttgaaggtag aaaatttggc atactaggta ataaagtgtt 2040 tagaaggttg gaattgcttg aaaagccagt aattgctgca gttaatggat ttgcacttgg 2100 cggcggctgt gagatagcta tgtcttgcga tataagaatc gcatcttcaa atgcaagatt 2160 tggacagcct gaagttggat taggtattac accagggttt ggcggcactc agagattatc 2220 tagattagta ggtatgggaa tggctaagca acttatattt acagcacaaa atataaaggc 2280 agatgaagct ttaagaatag gacttgtaaa taaagtagta gaaccttctg aattaatgaa 2340 tactgcaaaa gaaatagcta ataaaatagt ctctaatgca ccagtggcag ttaaattatc 2400 aaaacaagca ataaatagag gtatgcaatg tgacatagat acggcacttg ctttcgaatc 2460 agaagcattt ggtgaatgct tctctactga agaccaaaaa gatgctatga cagcatttat 2520 tgaaaaacga aagattgaag gattcaaaaa tagataa 2557 <210> 2 <211> 3789 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 2 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgacg cgttagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc aggcgaggtc tcccgctaat aagaagaagt 360 gtgaaaaagc gcagctgaaa tagctgcgct tttttgtgtc ataaggcgcg ctcactatct 420 gcggaacctg cctccttatc tgataaaaaa tattcgctgc atctttgact tgttattttc 480 tttcaaatgc ctaatggaat tgtgagcgga taacaattaa ttatctttta aaattataac 540 aaatgtgata aaatacaggg gatgaaaaca ttatctaaaa attaaggagg tgtttctaat 600 gagagaccgt cctgaattct gcagatatcc atcacactgg cggccgctcg agcatgcatc 660 tagagggccc aattcgccct atagtgagtc gtattacaat tcactggccg tcgttttaca 720 acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 780 tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 840 cagcctatac gtacggcagt ttaaggttta cacctataaa agagagagcc gttatcgtct 900 gtttgtggat gtacagagtg atattattga cacgccgggg cgacggatgg tgatccccct 960 ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg tggtgcatat 1020 cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccag tctccgttat 1080 cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg ccattaacct 1140 gatgttctgg ggaatataaa tgtcaggcat gagattatca aaaaggatct tcacctagat 1200 ccttttcacg tagaaagcca gtccgcagaa acggtgctga ccccggatga atgtcagcta 1260 ctgggctatc tggacaaggg aaaacgcaag cgcaaagaga aagcaggtag cttgcagtgg 1320 gcttacatgg cgatagctag actgggcggt tttatggaca gcaagcgaac cggaattgcc 1380 agctggggcg ccctctggta aggttgggaa gccctgcaaa gtaaactgga tggctttctt 1440 gccgccaagg atctgatggc gcaggggatc aagctctgat caagagacag gatgaggatc 1500 gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 1560 gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 1620 gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 1680 tgaactgcaa gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 1740 agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 1800 ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 1860 tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 1920 acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 1980 ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgagcat 2040 gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 2100 ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 2160 tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 2220 ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 2280 ccttcttgac gagttcttct gaattattaa cgcttacaat ttcctgatgc ggtattttct 2340 ccttacgcat ctgtgcggta tttcacaccg catcaggtgg cacttttcgg ggaaatgtgc 2400 gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 2460 aataaccctg ataaatgctt caataatagc acgtgaggag ggccaccatg gccaagttga 2520 ccagtgccgt tccggtgctc accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg 2580 accggctcgg gttctcccgg gacttcgtgg aggacgactt cgccggtgtg gtccgggacg 2640 acgtgaccct gttcatcagc gcggtccagg accaggtggt gccggacaac accctggcct 2700 gggtgtgggt gcgcggcctg gacgagctgt acgccgagtg gtcggaggtc gtgtccacga 2760 acttccggga cgcctccggg ccggccatga ccgagatcgg cgagcagccg tgggggcggg 2820 agttcgccct gcgcgacccg gccggcaact gcgtgcactt cgtggccgag gagcaggact 2880 gacacgtgct aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 2940 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 3000 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 3060 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 3120 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc 3180 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 3240 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 3300 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 3360 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 3420 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 3480 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 3540 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 3600 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 3660 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 3720 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 3780 aagcggaag 3789 <210> 3 <211> 4737 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 3 atggatttta atttaacaag agaacaagaa ttagtaagac agatggttag agaatttgct 60 gaaaatgaag ttaaacctat agcagcagaa attgatgaaa cagaaagatt tccaatggaa 120 aatgtaaaga aaatgggtca gtatggtatg atgggaattc cattttcaaa agagtatggt 180 ggcgcaggtg gagatgtatt atcttatata atcgccgttg aggaattatc aaaggtttgc 240 ggtactacag gagttattct ttcagcacat acatcacttt gtgcttcatt aataaatgaa 300 catggtacag aagaacaaaa acaaaaatat ttagtacctt tagctaaagg tgaaaaaata 360 ggtgcttatg gattgactga gccaaatgca ggaacagatt ctggagcaca acaaacagta 420 gctgtacttg aaggagatca ttatgtaatt aatggttcaa aaatattcat aactaatgga 480 ggagttgcag atacttttgt tatatttgca atgactgaca gaactaaagg aacaaaaggt 540 atatcagcat ttataataga aaaaggcttc aaaggtttct ctattggtaa agttgaacaa 600 aagcttggaa taagagcttc atcaacaact gaacttgtat ttgaagatat gatagtacca 660 gtagaaaaca tgattggtaa agaaggaaaa ggcttcccta tagcaatgaa aactcttgat 720 ggaggaagaa ttggtatagc agctcaagct ttaggtatag ctgaaggtgc tttcaacgaa 780 gcaagagctt acatgaagga gagaaaacaa tttggaagaa gccttgacaa attccaaggt 840 cttgcatgga tgatggcaga tatggatgta gctatagaat cagctagata tttagtatat 900 aaagcagcat atcttaaaca agcaggactt ccatacacag ttgatgctgc aagagctaag 960 cttcatgctg caaatgtagc aatggatgta acaactaagg cagtacaatt atttggtgga 1020 tacggatata caaaagatta tccagttgaa agaatgatga gagatgctaa gataactgaa 1080 atatatgaag gaacttcaga agttcagaaa ttagttattt caggaaaaat ttttagataa 1140 tttaaggagg ttaagaggat gaatatagtt gtttgtttaa aacaagttcc agatacagcg 1200 gaagttagaa tagatccagt taagggaaca cttataagag aaggagttcc atcaataata 1260 aatccagatg ataaaaacgc acttgaggaa gctttagtat taaaagataa ttatggtgca 1320 catgtaacag ttataagtat gggacctcca caagctaaaa atgctttagt agaagctttg 1380 gctatgggtg ctgatgaagc tgtactttta acagatagag catttggagg agcagataca 1440 cttgcgactt cacatacaat tgcagcagga attaagaagc taaaatatga tatagttttt 1500 gctggaaggc aggctataga tggagataca gctcaggttg gaccagaaat agctgagcat 1560 cttggaatac ctcaagtaac ttatgttgag aaagttgaag ttgatggaga tactttaaag 1620 attagaaaag cttgggaaga tggatatgaa gttgttgaag ttaagacacc agttctttta 1680 acagcaatta aagaattaaa tgttccaaga tatatgagtg tagaaaaaat attcggagca 1740 tttgataaag aagtaaaaat gtggactgcc gatgatatag atgtagataa ggctaattta 1800 ggtcttaaag gttcaccaac taaagttaag aagtcatcaa ctaaagaagt taaaggacag 1860 ggagaagtta ttgataagcc tgttaaggaa gcagctgcat atgttgtctc aaaattaaaa 1920 gaagaacact atatttaagt taggagggat ttttcaatga ataaagcaga ttacaagggc 1980 gtatgggtgt ttgctgaaca aagagacgga gaattacaaa aggtatcatt ggaattatta 2040 ggtaaaggta aggaaatggc tgagaaatta ggcgttgaat taacagctgt tttacttgga 2100 cataatactg aaaaaatgtc aaaggattta ttatctcatg gagcagataa ggttttagca 2160 gcagataatg aacttttagc acatttttca acagatggat atgctaaagt tatatgtgat 2220 ttagttaatg aaagaaagcc agaaatatta ttcataggag ctactttcat aggaagagat 2280 ttaggaccaa gaatagcagc aagactttct actggtttaa ctgctgattg tacatcactt 2340 gacatagatg tagaaaatag agatttattg gctacaagac cagcgtttgg tggaaatttg 2400 atagctacaa tagtttgttc agaccacaga ccacaaatgg ctacagtaag acctggtgtg 2460 tttgaaaaat tacctgttaa tgatgcaaat gtttctgatg ataaaataga aaaagttgca 2520 attaaattaa cagcatcaga cataagaaca aaagtttcaa aagttgttaa gcttgctaaa 2580 gatattgcag atatcggaga agctaaggta ttagttgctg gtggtagagg agttggaagc 2640 aaagaaaact ttgaaaaact tgaagagtta gcaagtttac ttggtggaac aatagccgct 2700 tcaagagcag caatagaaaa agaatgggtt gataaggacc ttcaagtagg tcaaactggt 2760 aaaactgtaa gaccaactct ttatattgca tgtggtatat caggagctat ccagcattta 2820 gcaggtatgc aagattcaga ttacataatt gctataaata aagatgtaga agccccaata 2880 atgaaggtag cagatttggc tatagttggt gatgtaaata aagttgtacc agaattaata 2940 gctcaagtta aagctgctaa taattaagtc ggctcggaga ccctgctaac aaagcccgaa 3000 aggaagctga gttggctgct gccaccgctg agcaataact agcataaccc cttggggcct 3060 ctaaacgggt cttgaggggt tttttgctga aagccaattc tgattagaaa aactcatcga 3120 gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat ttttgaaaaa 3180 gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg gcaagatcct 3240 ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat ttcccctcgt 3300 caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc ggtgagaatg 3360 gcaaaagctt atgcatttct ttccagactt gttcaacagg ccagccatta cgctcgtcat 3420 caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa 3480 atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac cggcgcagga 3540 acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct aatacctgga 3600 atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga gtacggataa 3660 aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg accatctcat 3720 ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct ggcgcatcgg 3780 gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg cgagcccatt 3840 tatacccata taaatcagca tccatgttgg aatttaatcg cggcttcgag caagacgttt 3900 cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca gacagtttta 3960 ttgttcatga tgatatattt ttatcttgtg caatgtaaca tcagagattt tgagacacaa 4020 cgtgagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 4080 acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 4140 tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 4200 ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 4260 atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 4320 agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 4380 cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 4440 agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 4500 acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 4560 gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 4620 ctatggaaaa acgccagcaa cgcgatcccg cgaaattaat acgactcact atagggacac 4680 cacaacggtt tccctctaga aataattttg tttaacttta agaaggagag gtctcta 4737 <210> 4 <211> 4202 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 4 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctat 240 ttaggtgacg cgttagaata ctcaagctat gcatcaagct tggtaccgag ctcggatcca 300 ctagtaacgg ccgccagtgt gctggaattc agggaggtct ccgctcaatc atactcgagg 360 cgcgcagcct gaatggcgaa tggcgctagc ataatcaatc gtcccttcgt gtaaacgaag 420 gggcgttttt tatttggcgc gtcgttttac aacggagata gtcataatag ttccagaata 480 gttcaattta gaaattagac taaacttcaa aatgtttgtt aaatatatac caaactagta 540 tagatatttt ttaaatactg gacttaaaca gtagtaattt gcctaaaaaa ttttttcaat 600 tttttttaaa aaatcctttt caagttgtac attgttatgg taatatgtaa ttgaagaagt 660 tatgtagtaa tattgtaaac gtttcttgat ttttttacat ccatgtagtg cttaaaaaac 720 caaaatatgt cacatgcaat tgtatatttc aaataacaat atttattttc tcgttaaatt 780 cacaaataat ttattaataa tatcaataac caagattata cttaaatgga tgtttatttt 840 ttaacacttt tatagtaaat atatttattt tatgtagtaa aaaggttata attataattg 900 tatttattac aattaattaa aataaaaaat agggttttag gtaaaattaa gttattttaa 960 gaagtaatta caataaaaat tgaagttatt tctttaagga gggaattatt cttaagagac 1020 cgtcctgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagaggg 1080 cccaattcgc cctatagtga gtcgtattac aattcactgg ccgtcgtttt acaacgtcgt 1140 gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 1200 agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagccta 1260 tacgtacggc agtttaaggt ttacacctat aaaagagaga gccgttatcg tctgtttgtg 1320 gatgtacaga gtgatattat tgacacgccg gggcgacgga tggtgatccc cctggccagt 1380 gcacgtctgc tgtcagataa agtctcccgt gaactttacc cggtggtgca tatcggggat 1440 gaaagctggc gcatgatgac caccgatatg gccagtgtgc cagtctccgt tatcggggaa 1500 gaagtggctg atctcagcca ccgcgaaaat gacatcaaaa acgccattaa cctgatgttc 1560 tggggaatat aaatgtcagg catgagatta tcaaaaagga tcttcaccta gatccttttc 1620 acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 1680 atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 1740 tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 1800 gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca 1860 aggatctgat ggcgcagggg atcaagctct gatcaagaga caggatgagg atcgtttcgc 1920 atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 1980 ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 2040 gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 2100 caagacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 2160 ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 2220 gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 2280 cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 2340 atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 2400 gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgag catgcccgac 2460 ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 2520 ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 2580 atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 2640 ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 2700 gacgagttct tctgaattat taacgcttac aatttcctga tgcggtattt tctccttacg 2760 catctgtgcg gtatttcaca ccgcatcagg tggcactttt cggggaaatg tgcgcggaac 2820 ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 2880 ctgataaatg cttcaataat agcacgtgag gagggccacc atggccaagt tgaccagtgc 2940 cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc gagttctgga ccgaccggct 3000 cgggttctcc cgggacttcg tggaggacga cttcgccggt gtggtccggg acgacgtgac 3060 cctgttcatc agcgcggtcc aggaccaggt ggtgccggac aacaccctgg cctgggtgtg 3120 ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag gtcgtgtcca cgaacttccg 3180 ggacgcctcc gggccggcca tgaccgagat cggcgagcag ccgtgggggc gggagttcgc 3240 cctgcgcgac ccggccggca actgcgtgca cttcgtggcc gaggagcagg actgacacgt 3300 gctaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat 3360 gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 3420 caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 3480 accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 3540 ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 3600 aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 3660 accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 3720 gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 3780 ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 3840 gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 3900 gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 3960 ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 4020 aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 4080 gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 4140 tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 4200 ag 4202 <210> 5 <211> 2944 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 5 gtgtggagac cctgctaaca aagcccgaaa ggaagctgag ttggctgctg ccaccgctga 60 gcaataacta gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa 120 agccaattct gattagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc 180 aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc 240 gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac 300 atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc 360 atgagtgacg actgaatccg gtgagaatgg caaaagctta tgcatttctt tccagacttg 420 ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt 480 cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca 540 aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc 600 tgaatcagga tattcttcta atacctggaa tgctgttttc ccggggatcg cagtggtgag 660 taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc 720 cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc 780 atgtttcaga aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc 840 tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga 900 atttaatcgc ggcttcgagc aagacgtttc ccgttgaata tggctcataa caccccttgt 960 attactgttt atgtaagcag acagttttat tgttcatgat gatatatttt tatcttgtgc 1020 aatgtaacat cagagatttt gagacacaac gtgagatcaa aggatcttct tgagatcctt 1080 tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt 1140 gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc 1200 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 1260 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 1320 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 1380 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 1440 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 1500 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 1560 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat 1620 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcgatcccgc 1680 gaaattaata cgactcacta tagggacacc acaacggttt ccctctagaa ataattttgt 1740 ttaactttaa gaaggagagg tctcacttat gaaagaagta gtaatagcat cggcagtcag 1800 aacagcaatc ggaagttatg gaaaatcact taaagacgta ccagctgtag atcttggtgc 1860 cacagctatt aaagaggcag taaaaaaggc aggtataaaa ccagaagatg taaatgaagt 1920 tatacttggt aacgttttgc aggctggatt aggacaaaat cctgcaagac aagcttcttt 1980 taaagcagga cttcctgttg aaattcctgc tatgactatc aataaagtct gcggatctgg 2040 tttgagaaca gtatcactgg cagcacaaat aataaaggct ggagatgcag atgtaataat 2100 tgctggcggc atggaaaata tgtctagggc accttatctg gcgaataatg cgcgctgggg 2160 atataggatg ggcaatgcaa aatttgttga tgagatgatc acagatggac tatgggatgc 2220 attcaatgat tatcatatgg gaatcacggc agaaaatata gcagaaaggt ggaatatatc 2280 tagagaagaa caagatgaat ttgcattagc atcacaaaaa aaagcagaag aagccattaa 2340 atctggacag ttcaaggacg aaattgttcc tgttgtaata aagggaagaa aaggtgagac 2400 tgtagtagat acagatgagc atccaagatt tggatcaact atagagggac ttgcaaagct 2460 taagccggca tttaaaaaag atggaactgt tacagctggt aatgcatctg gactaaatga 2520 ttgtgctgct gtactcgtaa taatgagtgc tgaaaaagca aaggaactag gagtaaaacc 2580 tcttgctaaa attgtaagtt atggaagtgc aggagtagat cctgctataa tgggctatgg 2640 tccattttat gcaactaagg cagcaattga aaaagcagga tggactgtag atgaattaga 2700 tcttattgaa tcaaacgaag catttgctgc ccaatcttta gcagttgcca aagatttaaa 2760 atttgatatg aataaggtaa atgtaaatgg cggcgctatt gccctcggac accctattgg 2820 tgcatcaggg gcccgtattc ttgttacact tgttcatgcc atgcaaaaaa gggatgcaaa 2880 gaaaggatta gctactcttt gtataggcgg cggccaggga actgctatat tattagaaaa 2940 ataa 2944 <210> 6 <211> 6058 <212> DNA <213> Artificial <220> <223> Expression Vector for Clostridia species <400> 6 tcactgtccc ttattcgcac ctggcggtgc tcaacgggaa tcctgctctg cgaggctggc 60 cggctaccgc cggcgtaaca gatgagggca agcggatggc tgatgaaacc aagccaacca 120 ggaagggcag cccacctatc aaggtgtact gccttccaga cgaacgaaga gcgattgagg 180 aaaaggcggc ggcggccggc atgagcctgt cggcctacct gctggccgtc ggccagggct 240 acaaaatcac gggcgtcgtg gactatgagc acgtccgcga gctggcccgc atcaatggcg 300 acctgggccg cctgggcggc ctgctgaaac tctggctcac cgacgacccg cgcacggcgc 360 ggttcggtga tgccacgatc ctcgccctgc tggcgaagat cgaagagaag caggacgagc 420 ttggcaaggt catgatgggc gtggtccgcc cgagggcaga gccatgactt ttttagccgc 480 taaaacggcc ggggggtgcg cgtgattgcc aagcacgtcc ccatgcgctc catcaagaag 540 agcgacttcg cggagctggt gaagtacatc accgacgagc aaggcaagac cgatcgggcc 600 ccctgcagga taaaaaaatt gtagataaat tttataaaat agttttatct acaatttttt 660 tatcaggaaa cagctatgac cgcggccgct cactatctgc ggaacctgcc tccttatctg 720 ataaaaaata ttcgctgcat ctttgacttg ttattttctt tcaaatgcct aatggaattg 780 tgagcggata acaattaatt atcttttaaa attataacaa atgtgataaa atacagggga 840 tgaaaacatt atctaaaaat taaggaggtg ttactcatag agaccactgg atgtcttccg 900 gccgctaagt tggcagcatc acccgacgca ctttgcgccg aataaatacc tgtgacggaa 960 gatcacttcg cagaataaat aaatcctggt gtccctgttg ataccgggaa gccctgggcc 1020 aacttttggc gaaaatgaga cgttgatcgg cacgtaagag gttccaactt tcaccataat 1080 gaaataagat cactaccggg cgtatttttt gagttatcga gattttcagg agctaaggaa 1140 gctaaaatgg agaaaaaaat cactggatat accaccgttg atatatccca atggcatcgt 1200 aaagaacatt ttgaggcatt tcagtcagtt gctcaatgta cctataacca gaccgttcag 1260 ctggatatta cggccttttt aaagaccgta aagaaaaata agcacaagtt ttatccggcc 1320 tttattcaca ttcttgcccg cctgatgaat gctcatccgg aattccgtat ggcaatgaaa 1380 gacggtgagc tggtgatatg ggatagtgtt cacccttgtt acaccgtttt ccatgagcaa 1440 actgaaacgt tttcatcgct ctggagtgaa taccacgacg atttccggca gtttctacac 1500 atatattcgc aagatgtggc gtgttacggt gaaaacctgg cctatttccc taaagggttt 1560 attgagaata tgtttttcgt ctcagccaat ccctgggtga gtttcaccag ttttgattta 1620 aacgtggcca atatggacaa cttcttcgcc cccgttttca ccatgggcaa atattatacg 1680 caaggcgaca aggtgctgat gccgctggcg attcaggttc atcatgccgt ttgtgatggc 1740 ttccatgtcg gcagaatgct taatgaatta caacagtact gcgatgagtg gcaggggggg 1800 cgtaaacgcc gcgtggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg 1860 ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag 1920 gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa 1980 ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt 2040 cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg 2100 tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa 2160 ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat 2220 tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga 2280 taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat 2340 gaccaccgat atggccagtg tgccggtgtc cgttatcggg gaagaagtgg ctgatctcag 2400 ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc 2460 aggctccctt atacacagcc agtctgcagg tcgacgaaga ctagcatggt ctccgtgtca 2520 tgattgtaac aatttataaa taaaaatcac cttttagagg tggttttttt atttataaat 2580 tagtgtaggc gcgccgccat tatttttttg aacaattgac aattcatttc ttatttttta 2640 ttaagtgata gtcaaaaggc ataacagtgc tgaatagaaa gaaatttaca gaaaagaaaa 2700 ttatagaatt tagtatgatt aattatactc atttatgaat gtttaattga atacaaaaaa 2760 aaatacttgt tatgtattca attacgggtt aaaatataga caagttgaaa aatttaataa 2820 aaaaataagt cctcagctct tatatattaa gctaccaact tagtatataa gccaaaactt 2880 aaatgtgcta ccaacacatc aagccgttag agaactctat ctatagcaat atttcaaatg 2940 taccgacata caagagaaac attaactata tatattcaat ttatgagatt atcttaacag 3000 atataaatgt aaattgcaat aagtaagatt tagaagttta tagcctttgt gtattggaag 3060 cagtacgcaa aggctttttt atttgataaa aattagaagt atatttattt tttcataatt 3120 aatttatgaa aatgaaaggg ggtgagcaaa gtgacagagg aaagcagtat cttatcaaat 3180 aacaaggtat tagcaatatc attattgact ttagcagtaa acattatgac ttttatagtg 3240 cttgtagcta agtagtacga aagggggagc tttaaaaagc tccttggaat acatagaatt 3300 cataaattaa tttatgaaaa gaagggcgta tatgaaaact tgtaaaaatt gcaaagagtt 3360 tattaaagat actgaaatat gcaaaataca ttcgttgatg attcatgata aaacagtagc 3420 aacctattgc agtaaataca atgagtcaag atgtttacat aaagggaaag tccaatgtat 3480 taattgttca aagatgaacc gatatggatg gtgtgccata aaaatgagat gttttacaga 3540 ggaagaacag aaaaaagaac gtacatgcat taaatattat gcaaggagct ttaaaaaagc 3600 tcatgtaaag aagagtaaaa agaaaaaata atttatttat taatttaata ttgagagtgc 3660 cgacacagta tgcactaaaa aatatatctg tggtgtagtg agccgataca aaaggatagt 3720 cactcgcatt ttcataatac atcttatgtt atgattatgt gtcggtggga cttcacgacg 3780 aaaacccaca ataaaaaaag agttcggggt agggttaagc atagttgagg caactaaaca 3840 atcaagctag gatatgcagt agcagaccgt aaggtcgttg tttaggtgtg ttgtaataca 3900 tacgctatta agatgtaaaa atacggatac caatgaaggg aaaagtataa tttttggatg 3960 tagtttgttt gttcatctat gggcaaacta cgtccaaagc cgtttccaaa tctgctaaaa 4020 agtatatcct ttctaaaatc aaagtcaagt atgaaatcat aaataaagtt taattttgaa 4080 gttattatga tattatgttt ttctattaaa ataaattaag tatatagaat agtttaataa 4140 tagtatatac ttaatgtgat aagtgtctga cagtgtcaca gaaaggatga ttgttatgga 4200 ttataagcgg ccggccagtg ggcaagttga aaaattcaca aaaatgtggt ataatatctt 4260 tgttcattag agcgataaac ttgaatttga gagggaactt agatggtatt tgaaaaaatt 4320 gataaaaata gttggaacag aaaagagtat tttgaccact actttgcaag tgtaccttgt 4380 acctacagca tgaccgttaa agtggatatc acacaaataa aggaaaaggg aatgaaacta 4440 tatcctgcaa tgctttatta tattgcaatg attgtaaacc gccattcaga gtttaggacg 4500 gcaatcaatc aagatggtga attggggata tatgatgaga tgataccaag ctatacaata 4560 tttcacaatg atactgaaac attttccagc ctttggactg agtgtaagtc tgactttaaa 4620 tcatttttag cagattatga aagtgatacg caacggtatg gaaacaatca tagaatggaa 4680 ggaaagccaa atgctccgga aaacattttt aatgtatcta tgataccgtg gtcaaccttc 4740 gatggcttta atctgaattt gcagaaagga tatgattatt tgattcctat ttttactatg 4800 gggaaatatt ataaagaaga taacaaaatt atacttcctt tggcaattca agttcatcac 4860 gcagtatgtg acggatttca catttgccgt tttgtaaacg aattgcagga attgataaat 4920 agttaacttc aggtttgtct gtaactaaaa acaagtattt aagcaaaaac atcgtagaaa 4980 tacggtgttt tttgttaccc taagtttaaa ctcctttttg ataatctcat gaccaaaatc 5040 ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 5100 tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 5160 ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 5220 ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt aggccaccac 5280 ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 5340 gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 5400 aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 5460 acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 5520 gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 5580 gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 5640 cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 5700 aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 5760 gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 5820 cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca 5880 atacgcaggg ccccctgctt cggggtcatt atagcgattt tttcggtata tccatccttt 5940 ttcgcacgat atacaggatt ttgccaaagg gttcgtgtag actttccttg gtgtatccaa 6000 cggcgtcagc cgggcaggat aggtgaagta ggcccacccg cgagcgggtg ttccttct 6058 <210> 7 <211> 54 <212> DNA <213> Bacillus subtilis <400> 7 aagaagaagt gtgaaaaagc gcagctgaaa tagctgcgct tttttgtgtc ataa 54 <210> 8 <211> 45 <212> DNA <213> Bacillus subtilis <400> 8 ataatcaatc gtcccttcgt gtaaacgaag gggcgttttt tattt 45 <210> 9 <211> 52 <212> DNA <213> Lactococcus lactis <400> 9 aatttataaa taaaaatcac cttttagagg tggttttttt atttataaat ta 52 <210> 10 <211> 83 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 10 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctcctc atg 83 <210> 11 <211> 85 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 11 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctct tcatg 85 <210> 12 <211> 84 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 12 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaagaccat catg 84 <210> 13 <211> 82 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 13 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctctaa tg 82 <210> 14 <211> 84 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 14 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctct aatg 84 <210> 15 <211> 84 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 15 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggaagacat aatg 84 <210> 16 <211> 84 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 16 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctcact tatg 84 <210> 17 <211> 86 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 17 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctca cttatg 86 <210> 18 <211> 85 <212> DNA <213> Artificial <220> <223> Spacer Sequence for Expression Vector for Clostridia species <400> 18 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaagactac ttatg 85 <210> 19 <211> 190 <212> DNA <213> Artificial <220> <223> Modified promoter for fdx gene of Clostridium autoethanogenum <400> 19 ggccgctcac tatctgcgga acctgcctcc ttatctgata aaaaatattc gctgcatctt 60 tgacttgtta ttttctttca aatgcctaat ggaattgtga gcggataaca attaattatc 120 ttttaaaatt ataacaaatg tgataaaata caggggatga aaacattatc taaaaattaa 180 ggaggtgtta 190 <210> 20 <211> 477 <212> DNA <213> Artificial <220> <223> Modified promoter for pfor gene of Clostridium authethanogenum <400> 20 ggccgcaaaa tagttgataa taatgcagag ttataaacaa aggtgaaaag cattacttgt 60 attctttttt atatattatt ataaattaaa atgaagctgt attagaaaaa atacacacct 120 gtaatataaa attttaaatt aatttttaat tttttcaaaa tgtattttac atgtttagaa 180 ttttgatgta tattaaaata gtagaataca taagatactt aatttaatta aagatagtta 240 agtacttttc aatgtgcttt tttagatgtt taatacaaat ctttaattgt aaaagaaatg 300 ctgtactatt tactgtacta gtgacgggat taaactgtat taattataaa taaaaaataa 360 gtacagttgt ttaaaattat attttgtatt aaatctaata gtacgatgta agttatttta 420 tactattgct agtttaataa aaagatttaa ttatatactt gaaaaggaga ggaatat 477 <210> 21 <211> 562 <212> DNA <213> Artificial <220> <223> Modified promoter for wl gene of Clostridium autoethanogenum <400> 21 ggccgcagat agtcataata gttccagaat agttcaattt agaaattaga ctaaacttca 60 aaatgtttgt taaatatata ccaaactagt atagatattt tttaaatact ggacttaaac 120 agtagtaatt tgcctaaaaa attttttcaa ttttttttaa aaaatccttt tcaagttgta 180 cattgttatg gtaatatgta attgaagaag ttatgtagta atattgtaaa cgtttcttga 240 tttttttaca tccatgtagt gcttaaaaaa ccaaaatatg tcacatgcaa ttgtatattt 300 caaataacaa tatttatttt ctcgttaaat tcacaaataa tttattaata atatcaataa 360 ccaagattat acttaaatgg atgtttattt tttaacactt ttatagtaaa tatatttatt 420 ttatgtagta aaaaggttat aattataatt gtatttatta caattaatta aaataaaaaa 480 tagggtttta ggtaaaatta agttatttta agaagtaatt acaataaaaa ttgaagttat 540 ttctttaagg agggaattat at 562 <210> 22 <211> 486 <212> DNA <213> Artificial <220> <223> Modifed promoter for pta gene of Clostridium autoethanogenum <400> 22 ggccgcaata tgatatttat gtccattgtg aaagggatta tattcaacta ttattccagt 60 tacgttcata gaaattttcc tttctaaaat attttattcc atgtcaagaa ctctgtttat 120 ttcattaaag aactataagt acaaagtata aggcatttga aaaaataggc tagtatattg 180 attgattatt tattttaaaa tgcctaagtg aaatatatac atattataac aataaaataa 240 gtattagtgt aggattttta aatagagtat ctattttcag attaaatttt tgattatttg 300 atttacatta tataatattg agtaaagtat tgactagcaa aattttttga tactttaatt 360 tgtgaaattt cttatcaaaa gttatatttt tgaataattt ttattgaaaa atacaactaa 420 aaaggattat agtataagtg tgtgtaattt tgtgttaaat ttaaagggag gaaatgaaca 480 tgaaac 486 <210> 23 <211> 83 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter and ribosome binding site <400> 23 taatacgact cactataggg agaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agatatacat atg 83 <210> 24 <211> 83 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 24 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctcctc atg 83 <210> 25 <211> 82 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 25 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctctaa tg 82 <210> 26 <211> 84 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 26 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggtctcact tatg 84 <210> 27 <211> 85 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 27 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctct tcatg 85 <210> 28 <211> 84 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 28 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctct aatg 84 <210> 29 <211> 86 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BsaI site <400> 29 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaggtctca cttatg 86 <210> 30 <211> 84 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BbsI site <400> 30 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaagaccat catg 84 <210> 31 <211> 84 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BbsI site <400> 31 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg aggaagacat aatg 84 <210> 32 <211> 85 <212> DNA <213> Artificial <220> <223> Modified sequence for T7 promoter, ribosome binding site, and BbsI site <400> 32 taatacgact cactataggg acaccacaac ggtttccctc tagaaataat tttgtttaac 60 tttaagaagg agaagactac ttatg 85

Claims (40)

  1. 시스템으로서,
    하기 성분 중 하나 이상을 포함하는, 시스템:
    (a) 하나 이상의 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 상기 골격 벡터는 5'→3'로
    (i) 세포에서 관심 있는 유전자를 발현하기 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위(Golden Gate site);
    (iii) 선택적으로 카운터 선택 가능한 마커;
    (iv) 클로닝을 위한 제2 골든 게이트 부위; 및
    (v) 전사 종결 부위를 포함하는, 골격 벡터;
    (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위;
    (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위를 포함하고; 여기서 선택적인 유전자1은 제1 골든 게이트 부위와 제2 골든 게이트 부위 사이에 삽입되는, p공여자1;
    (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로
    (i) 클로닝을 위한 제1 골든 게이트 부위;
    (ii) 전사 종결 부위;
    (iii) 세포에서 관심 있는 유전자를 발현하기 위한 프로모터; 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위를 포함하는, p공여자2; 및
    (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위;
    (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위를 포함하고; 여기서 선택적인 유전자2는 제1 골든 게이트 부위와 제2 골든 게이트 부위 사이에 삽입되는, p공여자3.
  2. 제1항에 있어서, 상기 시스템은 (a) 골격 벡터, (b) p공여자1, (c) p공여자2 및 (d) p공여자3의 성분 중 2개 이상을 포함하는, 시스템.
  3. 제1항에 있어서, 상기 시스템은 (a) 골격 벡터; 및 (b) p공여자1, (c) p공여자2 및 (d) p공여자3의 성분 중 1개 이상을 포함하는, 시스템.
  4. 제1항에 있어서, 상기 시스템은 성분 (a) 골격 벡터, (b) p공여자1, (c) p공여자2 및 (d) p공여자3을 포함하는, 시스템.
  5. 제1항에 있어서, 상기 시스템은 성분으로서
    (a) 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로
    (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1);
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 카운터 선택 가능한 마커;
    (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2); 및
    (v) 전사 종결 부위(TT)를 포함하는, 골격 벡터;
    (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, p공여자1을 포함하는, 시스템.
  6. 제1항에 있어서, 상기 시스템은 성분으로서
    (a) 하나 이상의 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로
    (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1);
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 카운터 선택 가능한 마커;
    (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT); 및
    (v) 전사 종결 부위(TT)를 포함하는, 골격 벡터;
    (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, p공여자1;
    (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로
    (i) 클로닝을 위한 제2 골든 게이트 부위(GG2);
    (ii) 제1 전사 종결 부위(T1);
    (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제2 프로모터(P2); 및
    (iv) 클로닝을 위한 제3 골든 게이트 부위(GG3)를 포함하는, p공여자2; 및
    (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제3 골든 게이트 부위(GG3);
    (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및
    (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)를 포함하고; 여기서 선택적인 유전자2는 GG3과 GGT 사이에 삽입되는, p공여자3을 포함하는, 시스템.
  7. 제1항에 있어서, 상기 시스템은 성분으로서
    (a) 하나 이상의 공여자 벡터로부터의 공여자 서열의 삽입을 위한 골격 벡터이되, 골격 벡터는 5'→3'로
    (i) 세포에서 관심 있는 유전자를 발현하기 위한 제1 프로모터(P1);
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 카운터 선택 가능한 마커,;
    (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT); 및
    (v) 말단 전사 종결 부위(TT)를 포함하는, 골격 벡터;
    (b) 관심 있는 유전자의 무세포 발현을 위한 제1 공여자 벡터(p공여자1)이되, p공여자1은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제1 골든 게이트 부위(GG1);
    (iii) 선택적으로 관심 있는 제1 유전자(유전자1); 및
    (iv) 클로닝을 위한 제2 골든 게이트 부위(GG2)를 포함하고; 여기서 선택적인 유전자1은 GG1과 GG2 사이에 삽입되는, p공여자1;
    (c) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제2 공여자 벡터(p공여자2)이되, p공여자2는 5'→3'로
    (i) 클로닝을 위한 제2 골든 게이트 부위(GG2);
    (ii) 제1 전사 종결 부위(T1);
    (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제2 프로모터(P2); 및
    (iv) 클로닝을 위한 제3 골든 게이트 부위(GG3)를 포함하는, p공여자2; 및
    (d) 관심 있는 유전자의 무세포 발현을 위한 제3 공여자 벡터(p공여자3)이되, p공여자3은 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제3 골든 게이트 부위(GG3);
    (iii) 선택적으로 관심 있는 제2 유전자(유전자2); 및
    (iv) 클로닝을 위한 제4 골든 게이트 부위(GG4)를 포함하고; 여기서 선택적인 유전자2는 GG3과 GG4 사이에 삽입되는, p공여자3;
    (e) 세포에서 관심 있는 유전자를 발현하는 데 사용하기 위한 공여자 프로모터를 포함하는 제4 공여자 벡터(p공여자4)이되, p공여자4는 5'→3'로
    (i) 클로닝을 위한 제4 골든 게이트 부위(GG4);
    (ii) 제2 전사 종결 부위(T2);
    (iii) 세포에서 관심 있는 유전자를 발현하기 위한 제3 프로모터(P3); 및
    (iv) 클로닝을 위한 제5 골든 게이트 부위(GG5)를 포함하는, p공여자4; 및
    (f) 관심 있는 유전자의 무세포 발현을 위한 제5 공여자 벡터(p공여자5)이되, p공여자5는 5'→3'로
    (i) 무세포 RNA 합성을 위한 프로모터;
    (ii) 클로닝을 위한 제5 골든 게이트 부위(GG5);
    (iii) 선택적으로 관심 있는 제3 유전자(유전자3); 및
    (iv) 클로닝을 위한 말단 골든 게이트 부위(GGT)를 포함하고; 여기서 선택적인 유전자3은 GG5와 GGT 사이에 삽입되는, p공여자5를 포함하는, 시스템.
  8. 제5항에 있어서, p공여자1은 유전자1을 포함하고, 선택적으로 유전자1은 무세포 시스템에서의 발현을 위해 또는 세포에서의 발현을 위해 코돈 최적화된, 시스템.
  9. 제6항에 있어서, p공여자1 및 p공여자3은 각각 유전자1 및 유전자2를 포함하고, 선택적으로 유전자1 및 유전자2는 무세포 시스템에서의 발현을 위해 또는 세포에서의 발현을 위해 코돈 최적화된, 시스템.
  10. 제7항에 있어서, p공여자1, p공여자3, p공여자5는 각각 유전자1, 유전자2 및 유전자3을 포함하고, 유전자1, 유전자2 및 유전자3은 무세포 시스템에서의 발현을 위해 또는 세포에서의 발현을 위해 코돈 최적화된, 시스템.
  11. 제8항에 있어서, 유전자1은 클로스트리디아(Clostridia)로부터의 세포 용해물을 포함하는 무세포 시스템에서의 발현을 위해 코돈-최적화되거나, 유전자1은 클로스트리디아 세포에서의 발현을 위해 코돈-최적화된, 시스템.
  12. 제9항에 있어서, 유전자1 및 유전자2는 클로스트리디아로부터의 세포 용해물을 포함하는 무세포 시스템에서의 발현을 위해 코돈-최적화되거나, 유전자1 및 유전자2는 클로스트리디아 세포에서의 발현을 위해 코돈-최적화된, 시스템.
  13. 제10항에 있어서, 유전자1, 유전자2 및 유전자3은 클로스트리디아로부터의 세포 용해물을 포함하는 무세포 시스템에서의 발현을 위해 코돈-최적화되거나, 유전자1, 유전자2 및 유전자3은 클로스트리디아 세포에서의 발현을 위해 코돈-최적화된, 시스템.
  14. 제6항에 있어서, p공여자2는 클로스트리디아 또는 클로스트리디아로부터의 무세포 추출물에서 유전자를 발현하도록 조작된 프로모터를 포함하는, 시스템.
  15. 제7항에 있어서, p공여자2 및 p공여자4는 클로스트리디아 또는 클로스트리디아로부터의 무세포 추출물에서 유전자를 발현하도록 조작된 프로모터를 포함하는, 시스템.
  16. 제5항에 있어서, 클로닝을 위한 제1 골든 게이트 부위(GG1) 및 클로닝을 위한 제2 골든 게이트 부위(GG2)는 동일하거나 상이하고, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행을 제공하도록 선택적으로 배향된 TypeIIS 제한 효소에 대한 인식 부위를 포함하는, 시스템.
  17. 제6항에 있어서, 클로닝을 위한 제1 골든 게이트 부위(GG1), 클로닝을 위한 제2 골든 게이트 부위(GG2), 클로닝을 위한 제3 골든 게이트 부위(GG3) 및 클로닝을 위한 말단 골든 게이트(GGT)는 동일하거나 상이하고, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행을 제공하도록 선택적으로 배향된 TypeIIS 제한 효소에 대한 인식 부위를 포함하는, 시스템.
  18. 제7항에 있어서, 클로닝을 위한 제1 골든 게이트 부위(GG1), 클로닝을 위한 제2 골든 게이트 부위(GG2), 클로닝을 위한 제3 골든 게이트 부위(GG3), 클로닝을 위한 제4 골든 게이트(GG4), 클로닝을 위한 제5 골든 게이트 부위(GG5) 및 클로닝을 위한 말단 골든 게이트(GGT)는 동일하거나 상이하고, 이의 인식 부위의 상류(5')를 절단하고 이의 역보체 오버행에 혼성화하는 오버행을 제공하도록 선택적으로 배향된 TypeIIS 제한 효소에 대한 인식 부위를 포함하는, 시스템.
  19. 제16항에 있어서, 상기 TypeIIS 제한 효소는 BsaI 부위, BbsI 부위 및 AarI 부위로부터 선택되는, 시스템
  20. 제17항에 있어서, 상기 TypeIIS 제한 효소는 BsaI 부위, BbsI 부위 및 AarI 부위로부터 선택되는, 시스템
  21. 제18항에 있어서, 상기 TypeIIS 제한 효소는 BsaI 부위, BbsI 부위 및 AarI 부위로부터 선택되는, 시스템
  22. 제5항에 있어서, 상기 제1 공여자 벡터의 무세포 RNA 합성을 위한 프로모터는 박테리오파지 DNA-의존적 RNA 중합효소에 대한 프로모터인, 시스템.
  23. 제6항에 있어서, 상기 제1 공여자 벡터 및 제3 공여자 벡터 중 하나 이상의 무세포 RNA 합성을 위한 프로모터는 박테리오파지 DNA-의존적 RNA 중합효소에 대한 프로모터인, 시스템.
  24. 제7항에 있어서, 제1 공여자 벡터, 제3 공여자 벡터 및 제5 공여자 벡터 중 하나 이상의 무세포 RNA 합성을 위한 프로모터는 박테리오파지 DNA-의존적 RNA 중합효소에 대한 프로모터인, 시스템.
  25. 제5항에 있어서, p공여자1은 서열 번호 24, 서열 번호 27; 및/또는 서열 번호 30의 폴리뉴클레오타이드 서열을 포함하는, 시스템.
  26. 제6항에 있어서, p공여자1은 서열 번호 24, 서열 번호 27; 및/또는 서열 번호 30의 폴리뉴클레오타이드 서열을 포함하고/하거나; p공여자3은 서열 번호 25, 서열 번호 28 또는 서열 번호 31의 폴리뉴클레오타이드 서열을 포함하는, 시스템.
  27. 제7항에 있어서, p공여자1은 서열 번호 24, 서열 번호 27 또는 서열 번호 30의 폴리뉴클레오타이드 서열을 포함하고/하거나; p공여자3은 서열 번호 25, 서열 번호 28 또는 서열 번호 31의 폴리뉴클레오타이드 서열을 포함하고/하거나; p공여자5는 서열 번호 26, 서열 번호 29 또는 서열 번호 32의 폴리뉴클레오타이드 서열을 포함하는, 시스템.
  28. 제5항의 시스템에 의해 형질전환된 세포.
  29. 제6항의 시스템에 의해 형질전환된 세포.
  30. 제7항의 시스템에 의해 형질전환된 세포.
  31. 관심 있는 유전자, 예컨대 유전자1을 발현하는 방법으로서, 관심 있는 유전자를 제5항의 시스템의 벡터로 클로닝하는 단계 및 무세포 시스템에서 또는 세포에서 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
  32. 관심 있는 유전자, 예컨대 유전자1 또는 유전자2를 발현하는 방법으로서, 관심 있는 유전자를 제6항의 시스템의 벡터로 클로닝하는 단계 및 무세포 시스템에서 또는 세포에서 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
  33. 유전자1, 유전자2 또는 유전자3을 포함하는 관심 있는 유전자를 발현하는 방법으로서, 관심 있는 유전자를 제7항의 시스템의 벡터로 클로닝하는 단계 및 무세포 시스템에서 또는 세포에서 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
  34. 유전자1 및 유전자2를 포함하는 세포에서 다수의 관심 있는 유전자를 발현하는 방법으로서, 다수의 관심 있는 유전자를 제6항의 시스템의 하나 이상의 벡터로 클로닝하는 단계, 다수의 관심 있는 유전자를 제6항의 시스템의 골격 벡터로 추가로 클로닝하는 단계, 골격 벡터를 세포로 도입하는 단계 및 세포에서 다수의 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
  35. 제34항에 있어서, 상기 다수의 관심 있는 유전자는 다수의 상이한 프로모터로부터 발현되는, 방법.
  36. 유전자1, 유전자2 또는 유전자3을 포함하는 세포에서 다수의 관심 있는 유전자를 발현하는 방법으로서, 다수의 관심 있는 유전자를 제7항의 시스템의 하나 이상의 벡터로 클로닝하는 단계, 다수의 관심 있는 유전자를 제8항의 골격 벡터로 추가로 클로닝하는 단계, 골격 벡터를 세포로 도입하는 단계 및 세포에서 다수의 관심 있는 유전자를 발현하는 단계를 포함하는, 방법.
  37. 제36항에 있어서, 상기 다수의 관심 있는 유전자는 다수의 상이한 프로모터로부터 발현되는, 방법.
  38. 세포에서 발현을 위한 유전자를 선택하는 방법으로서,
    하기 단계 중 하나 이상을 포함하는, 방법.
    (a) 제5항, 제6항 또는 제7항의 시스템의 벡터로 유전자를 클로닝하는 단계;
    (b) 무세포 발현 시스템에서 유전자의 발현을 시험하는 단계;
    (c) 상기 무세포 발현 시스템에서 발현된 유전자를 선택하는 단계;
    (d) 상기 선택 유전자를 클로스트리듐 발현 벡터로 클로닝하는 단계; 및
    (e) 클로스트리듐에서 발현 벡터 및 유전자의 시험 발현에 의해 클로스트리듐을 형질전환하는 단계.
  39. 폴리뉴클레오타이드로서, 서열 번호 1 내지 서열 번호 32 중 어느 것의 폴리뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드.
  40. 2개 이상의 별개의 폴리뉴클레오타이드의 조합으로서, 2개 이상의 별개의 폴리뉴클레오타이드의 각각은 서열 번호 1 내지 서열 번호 32 중 어느 것의 폴리뉴클레오타이드 서열을 포함하는, 조합.
KR1020227018753A 2019-12-03 2020-12-03 세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터 KR20220093189A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962943036P 2019-12-03 2019-12-03
US62/943,036 2019-12-03
PCT/US2020/063162 WO2021113546A1 (en) 2019-12-03 2020-12-03 Modular, cell-free protein expression vectors to accelerate biological design in cells

Publications (1)

Publication Number Publication Date
KR20220093189A true KR20220093189A (ko) 2022-07-05

Family

ID=76222265

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227018753A KR20220093189A (ko) 2019-12-03 2020-12-03 세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터

Country Status (8)

Country Link
US (1) US20230015505A1 (ko)
EP (1) EP4069839A4 (ko)
JP (1) JP2023504175A (ko)
KR (1) KR20220093189A (ko)
CN (1) CN114746549A (ko)
AU (1) AU2020397919A1 (ko)
CA (1) CA3160450A1 (ko)
WO (1) WO2021113546A1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004007677A2 (en) * 2002-07-11 2004-01-22 The Ohio State University Research Foundation In vitro transcription assay for t box antitermination system
WO2008074794A1 (en) * 2006-12-19 2008-06-26 Dsm Ip Assets B.V. Butanol production in a prokaryotic cell
US20110239315A1 (en) * 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
CN108103089B (zh) * 2017-11-29 2022-08-05 赛业(广州)生物科技有限公司 一种无缝多片段克隆的构建方法

Also Published As

Publication number Publication date
CN114746549A (zh) 2022-07-12
EP4069839A4 (en) 2024-01-03
JP2023504175A (ja) 2023-02-01
EP4069839A1 (en) 2022-10-12
WO2021113546A1 (en) 2021-06-10
US20230015505A1 (en) 2023-01-19
CA3160450A1 (en) 2021-06-10
AU2020397919A1 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
DK2855662T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2443163T3 (en) POLYMERIZATION OF ISOPREN FROM RENEWABLE RESOURCES
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
KR20200064980A (ko) 종양 세포에서 면역 조절제 및 항-암 치료제를 생산하도록 프로그램된 미생물
KR20120136349A (ko) 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템
KR102683284B1 (ko) 세균 감염의 치료를 위한 살세균제와 라이소좀향성 알칼리화제와의 조합물
KR20110076868A (ko) 분리 조건 및/또는 안전한 작업 범위 하에서의 c5 탄화수소가 없는 이소프렌의 제조 방법 및 조성물
KR20110122672A (ko) 이소프렌 및 공-산물을 제조하는 방법
DK2768848T3 (en) METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS
KR20140015136A (ko) 3-히드록시프로피온산 및 다른 생성물의 제조 방법
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
TW201111512A (en) Improved isoprene production using the DXP and MVA pathway
TW201120204A (en) Fuel compositions comprising isoprene derivatives
KR20140101890A (ko) 3-히드록시이소부티르산의 생명공학적 제조
KR20190013627A (ko) 재조합 콜라겐의 수산화를 제어하기 위한 효모 균주 및 방법
AU2024204421A1 (en) Therapeutic genome editing in Wiskott-Aldrich syndrome and X-linked thrombocytopenia
CN114836459B (zh) 一种胞嘧啶碱基编辑***及其应用
CN107429222B (zh) 在体外培养分节丝状菌的方法
KR20200086303A (ko) 숙주 세포에서의 향미 화합물 생산
CN116083398B (zh) 分离的Cas13蛋白及其应用
KR20220093189A (ko) 세포에서 생물학적 설계를 가속화하기 위한 모듈식 무세포 단백질 발현 벡터
AU2022434560A1 (en) Use of ccl11
KR101834286B1 (ko) 다중 유전자 발현 조절능이 있는 크리스퍼 간섭을 이용한 코리네박테리움 글루타미쿰의 형질전환용 키트

Legal Events

Date Code Title Description
E902 Notification of reason for refusal