KR20020059413A - Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules - Google Patents

Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules Download PDF

Info

Publication number
KR20020059413A
KR20020059413A KR1020027003842A KR20027003842A KR20020059413A KR 20020059413 A KR20020059413 A KR 20020059413A KR 1020027003842 A KR1020027003842 A KR 1020027003842A KR 20027003842 A KR20027003842 A KR 20027003842A KR 20020059413 A KR20020059413 A KR 20020059413A
Authority
KR
South Korea
Prior art keywords
domain
triplet
library
nucleic acid
polypeptide
Prior art date
Application number
KR1020027003842A
Other languages
Korean (ko)
Inventor
레이늘스테펜제이
린드보존에이
터펜토마스
Original Assignee
토마스 갈레고스
라지 스케일 바이올로지 코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 토마스 갈레고스, 라지 스케일 바이올로지 코퍼레이션 filed Critical 토마스 갈레고스
Publication of KR20020059413A publication Critical patent/KR20020059413A/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Toxicology (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은, 각각 링커 영역에 의해 결합되는, 2개 이상의 핵산 또는 폴리펩티드 도메인을 포함하는 DNA, RNA 또는 단백질 분자의 생성을 위한 방법 및 조성물을 개시한다. 본 방법을 사용하여 이중-도메인 또는 다중-도메인 폴리펩티드를 코딩하는 핵산의 랜덤 링커 라이브러리를 생성한다. 링커 영역은 길이 및 서열 둘 모두의 변이성을 그 특징으로 한다.The present invention discloses methods and compositions for the production of DNA, RNA or protein molecules comprising two or more nucleic acid or polypeptide domains, each bound by a linker region. The method is used to generate a random linker library of nucleic acids encoding dual- or multi-domain polypeptides. The linker region is characterized by variability in both length and sequence.

Description

이중-도메인 또는 다중-도메인 분자를 위한 다양한 길이 및 서열의 링커 영역의 생성법{CREATION OF VARIABLE LENGTH AND SEQUENCE LINKER REGIONS FOR DUAL-DOMAIN OR MULTI-DOMAIN MOLECULES}CREAATION OF VARIABLE LENGTH AND SEQUENCE LINKER REGIONS FOR DUAL-DOMAIN OR MULTI-DOMAIN MOLECULES}

이중-도메인 폴리펩티드, 또는 이러한 폴리펩티드를 코딩하는 이중-도메인 핵산은 패턴화된 후 원래 폴리펩티드 또는 핵산에 비해 새롭고도 유리한 특성을 가질 수 있다. 이러한 폴리펩티드 도메인은 일반적으로 링커 영역 또는 링커 도메인을 사용하여 결합되어 있다. 상기와 같은 폴리펩티드 작제물의 일반 명칭은 D1-L-D2(여기서, D1및 D2는 동일하거나 상이한 2 구조 도메인이며, L은 링커임)이다. 예를 들어, 링커 도메인과 커플링된 막-스패닝 (spanning) 단백질인 아데닐릴 사이클라제의 2개의 세포질성 도메인은 가용성 단백질을 형성한다 (Tang 등, Science, 268: 1769-1772 (1995)). 효소 활성을 유지하는 이러한 가용성 형태의 아데닐릴 사이클라제의 이점은, 상기 가용성 형태가 천연 효소보다 훨씬 많은 양으로 생산될 수 있다는 것이다 (Dessauer 등, J. Biol. Chem., 16967-16974 (1996)).Dual-domain polypeptides, or dual-domain nucleic acids encoding such polypeptides, may be new and advantageous over the original polypeptide or nucleic acid after being patterned. Such polypeptide domains are generally linked using a linker region or linker domain. The generic name of such polypeptide constructs is D 1 -LD 2 , where D 1 and D 2 are the same or different two structural domains and L is a linker. For example, two cytoplasmic domains of adenylyl cyclase, a membrane-spanning protein coupled with a linker domain, form a soluble protein (Tang et al., Science, 268: 1769-1772 (1995)). . The advantage of this soluble form of adenylyl cyclase to maintain enzymatic activity is that the soluble form can be produced in much larger amounts than natural enzymes (Dessauer et al., J. Biol. Chem., 16967-16974 (1996). )).

2개의 도메인을 결합시킴으로써 생성되는 폴리펩티드의 다른 유형은 단일 사슬 항체 또는 scFv이다. 이러한 단일 사슬 폴리펩티드는, 선택된 면역글로불린 (Ig)의 중쇄 (H) 및 경쇄 (L)로부터의 가변성 (V) 영역을 포함하며, 천연 Ig의 항원 결합 부위를, 그의 크기를 소분하여 재생한다 (Skerra, A. 등 (1988) Science, 240: 1038-1041; Pluckthun, A. 등 (1989) Methods Enzymol. 178: 497-515; Winter, G. 등 (1991) Nature, 349: 293-299); Bird 등 (1988) Science 242:423; Huston 등 (1988) Proc. Natl. Acad. Sci. USA 85:5879; 미국 특허 제4,704,692호, 동 제4,853,871호, 동 제4,946,778,5호, 동 제5,260,203호, 동 제5,455,030호 참조). 다수의 미국 특허와, J. Huston 및 그의 동료의 국제 특허 출원 공보에는, 링커 펩티드에 의해 결합되어 있으며 임의로 절단가능한 부위를 포함하는, 단일 사슬 항체를 포함하여 다양한 2개의 사슬 또는 2개의 도메인 단백질이 기재되어 있다 (미국 특허 제5888773호, 동 제5877305호, 동 제5861156호, 동 제 5837846호, 동 제5753204호, 동 제5534254호, 동 제5525491호, 동 제5482858호, 동 제5476786호, 동 제5330902호, 동 제5302526호, 동 제5258498호, 동 제5132405호, 동 제5091513호, 동 제5013653호, WO 9323537A1 (1993년 11월 25일)).Another type of polypeptide produced by combining two domains is a single chain antibody or scFv. Such single chain polypeptides comprise variable (V) regions from the heavy (H) and light (L) chains of selected immunoglobulins (Ig) and regenerate the antigen binding site of native Ig by subdividing its size (Skerra). (1988) Science, 240: 1038-1041, Pluckthun, A. et al. (1989) Methods Enzymol. 178: 497-515; Winter, G. et al. (1991) Nature, 349: 293-299); Bird et al. (1988) Science 242: 423; Huston et al. (1988) Proc. Natl. Acad. Sci. USA 85: 5879; U.S. Patent Nos. 4,704,692, 4,853,871, 4,946,778,5, 5,260,203, 5,455,030). Many US patents and international patent application publications by J. Huston and his colleagues describe a variety of two chain or two domain proteins, including single chain antibodies, linked by a linker peptide and comprising an optionally cleavable site. (US Pat. No. 5,88,773, 5,583,305, 5,586,156, 5,537,846, 5,557,204, 5,552,254, 5,552,551, 5,548,858, 5,547,86, etc.). 5330902, 5305625, 55259898, 5122405, 550913, 5013653, WO 9323537A1 (November 25, 1993).

scFv는, 펩티드 링커에 의해 결합된 N-말단의 VH도메인 및 C-말단의 VL도메인 (또는 그 반대)로 이루어진다. VH및 VL영역의 정확한 폴딩은 scFv의 항원 결합능의 유지에 중요하다. 링커 영역의 길이 및 서열은 정확한 폴딩 및 생물학적 기능에 있어서의 중요한 파라미터이다. scFv 사슬은 더 큰 Fv 단편 또는 훨씬 더큰 Ig 분자 (4개의 사슬의 복합체임)보다 발현시키기가 용이하다.The scFv consists of the N-terminal V H domain and the C-terminal V L domain (or vice versa) bound by a peptide linker. Accurate folding of the V H and V L regions is important for maintaining the antigen binding capacity of the scFv. The length and sequence of the linker region is an important parameter in correct folding and biological function. scFv chains are easier to express than larger Fv fragments or even larger Ig molecules (which are complexes of four chains).

라이보자임은 라이보자임 중 특정 표적화 서열에 상보적인 핵산 서열을 포함하는 다른 RNA 분자를 절단하는 촉매적 RNA 분자이다. 2개의 라이보자임 도메인과 같은 2개의 동일하거나 상이한 핵산 도메인은 하나 이상의 RNA 기질 구조 상에 작용할 수 있는 2기능성 라이보자임을 생성하도록 결합될 수 있다. 헤어핀 라이보자임, 해머헤드 라이보자임 및 RNAse P 라이보자임을 포함하여, 라이보자임의 일반적인 작제 방법이 당업계에 공지되어 있다. Castanotto 등 (1994)의 문헌 [Advances in Pharmacology, 25: 289-317]에 라이보자임 (I군, 해머헤드, 액스헤드 (axhead), 헤어핀 및 RNAse P 포함)이 개설되어 있다. 특정의 목적 서열, 예를 들어 HIV 서열을 유리하게 표적화할 수 있는 라이보자임이 기재되어 왔다 (Ho, A. 등, WO 9426877 (1994); Yu 등 (1993) Proc. Natl. Acad. USA, 90:6340-6344, 및 Dropulic 등 (1992) J. Virol., 66:1432-1441).Ribozymes are catalytic RNA molecules that cleave other RNA molecules, including nucleic acid sequences that are complementary to a particular targeting sequence. Two identical or different nucleic acid domains, such as two ribozyme domains, can be combined to produce a bifunctional ribozyme that can act on one or more RNA substrate structures. General methods of constructing ribozymes are known in the art, including hairpin ribozymes, hammerhead ribozymes, and RNAse P ribozymes. Livorzyme (including group I, hammerhead, axhead, hairpin and RNAse P) is described in Advances in Pharmacology, 25: 289-317 by Castanotto et al. (1994). It has been described that ribozymes can advantageously target certain target sequences, such as HIV sequences (Ho, A. et al., WO 9426877 (1994); Yu et al. (1993) Proc. Natl. Acad. USA, 90 : 6340-6344, and Dropulic et al. (1992) J. Virol., 66: 1432-1441).

해머헤드 라이보자임 및 헤어핀 라이보자임은 안티센스 및 엔도리보뉴클레오티다제 활성을 포함하는 촉매 분자이다. 그의 세포내 발현은, 예를 들어 HIV 감염에 대하여 상당한 저항성을 부여할 수 있다. 해머헤드 라이보자임이 하기 문헌 [Rossie 등 (1991), Pharmac. Ther., 50:245-254; Forster 등 (1987) Cell, 48:211-220; Uhlenbeck, OC (1987) Nature, 328:596-600; Haseloff, J. 등 (1988) Nature, 334:334:585; Dropulic 등의 상기 문헌; 및 Castanotto 등의 상기 문헌] 및 본원에 인용된 참고문헌에 기재되어 있다. 헤어핀 라이보자임은 문헌 [Hampel 등 (1990) Nucl Acids Res., 18:299-304; Hampel 등, EP 0360257 (1990);Haseloff, J.P. 등, US 5,254,678 (1993); Kraus, G. 등, US 5,958,768 (1999); Ho, A. 등, WO 9426877 (1994); Ojwang 등 (1992) Proc. Natl. Acad. USA, 89: 10802-10806; Yamada 등 (1994) Gene Therapy 1: 39-45; Leavitt 등 (1995) Proc. Natl. Acad. USA, 92: 699-703; Leavitt 등, Human Gene Therapy, 5: 1151-1120; 및 Yamada 등 (1994) Virology, 205: 121-126]에 개시되어 있다.Hammerhead ribozymes and hairpin ribozymes are catalytic molecules that include antisense and endoribonucleotidase activity. Its intracellular expression can, for example, confer significant resistance to HIV infection. Hammerhead ribozymes are described in Rossie et al. (1991), Pharmac. Ther., 50: 245-254; Forster et al. (1987) Cell, 48: 211-220; Uhlenbeck, OC (1987) Nature, 328: 596-600; Haseloff, J. et al. (1988) Nature, 334: 334: 585; Such documents as Dropulic et al .; And Castanotto et al., Supra, and references cited therein. Hairpin ribozymes are described in Hamel et al. (1990) Nucl Acids Res., 18: 299-304; Hampel et al., EP 0360257 (1990); Haseloff, J.P. Et al., US 5,254,678 (1993); Kraus, G. et al., US 5,958,768 (1999); Ho, A. et al., WO 9426877 (1994); Ojwang et al. (1992) Proc. Natl. Acad. USA, 89: 10802-10806; Yamada et al. (1994) Gene Therapy 1: 39-45; Leavitt et al. (1995) Proc. Natl. Acad. USA, 92: 699-703; Leavitt et al., Human Gene Therapy, 5: 1151-1120; And Yamada et al. (1994) Virology, 205: 121-126.

편의를 위하여, 하나 이상의 염기가 존재할 수 있는 위치를 나타내는 통상의 단일 문자 뉴클레오티드 코드를 표 1에 제공한다.For convenience, a conventional single letter nucleotide code indicating where one or more bases may be present is provided in Table 1.

RNA의 경우 DNA의 경우For RNA For DNA r = g 또는 a g 또는 a (퓨린)r = g or a g or a (purine) y = u 또는 c t 또는 c (피리미딘)y = u or c t or c (pyrimidine) s = g 또는 c g 또는 cs = g or c g or c w = a 또는 u a 또는 tw = a or u a or t v = a, g 또는 c a, g 또는 cv = a, g or c a, g or c x = c, u, 또는 a c, t, 또는 ax = c, u, or a c, t, or a n = a, g, c, 또는 u a, g, c, 또는 tn = a, g, c, or u a, g, c, or t (명확하게, r:y 페어링에 있어서, r=g일 경우, y=c 등임.(Clearly, in r: y pairing, y = c, etc. when r = g.

헤어핀 라이보자임의 일반적인 기질 서열은nnng/cn*gucnnnnnnnn(여기서,n*g는 절단 부위임)이다. 해머헤드 라이보자임은 임의의nux서열을 절단한다. 따라서, 헤어핀 리더 서열 내의 동일한 기질 표적인guc가 해머헤드 라이보자임에 의한 표적화가 가능하다.The general substrate sequence of the hairpin ribozyme is nnng / cn * gucnnnnnnnn where n * g is the cleavage site. Hammerhead ribozymes cleave any nux sequence. Thus, targeting by the same substrate target guc in the hairpin leader sequence to be a hammerhead ribozyme is possible.

2개의 DNA 도메인이 결합하여 이중-도메인 DNA 분자를 형성할 수도 있다. 특정 DNA 도메인은 DNA 폴리머라제, 엔도뉴클레아제, 및 전사 인자와 같은 단백질에 결합한다. 따라서, 2개의 결합 DNA 도메인이 결합하여 하나 이상의 DNA 결합 단백질에 결합하는 이중-도메인 DNA 분자를 형성할 수 있다.Two DNA domains may combine to form a double-domain DNA molecule. Certain DNA domains bind to proteins such as DNA polymerases, endonucleases, and transcription factors. Thus, two binding DNA domains can bind to form a double-domain DNA molecule that binds to one or more DNA binding proteins.

당업계의 숙련자라면, 유리하게는 결합하여 하나 이상의 기능을 가지는 이중-도메인 핵산 또는 폴리펩티드를 형성할 수 있는 다른 핵산 또는 폴리펩티드 도메인의 존재를 알 것이다. 또한, 숙련자라면 이러한 생성물을 생성하는 일반적으로 바람직한 방법을 인식할 수 있다.Those skilled in the art will advantageously know the presence of other nucleic acid or polypeptide domains that can bind to form a dual-domain nucleic acid or polypeptide having one or more functions. The skilled person will also recognize generally preferred methods of producing such products.

이중-도메인 DNA, 라이보자임 또는 단백질 분자의 바람직한 특성은, (1) DNA 도메인을 구성하거나, (2) 라이보자임 서열을 코딩하거나 (3) 단백질 도메인을 코딩하는 핵산을 변경시킴으로써 최적화될 수 있다. 이는 다양한 종래의 기술을 통해 성취된다. 하나의 접근법에 있어서, 링커 영역의 서열 또는 길이는, 이중-도메인 분자를 최적화하기 위하여 다양화된다. 링커 영역의 길이 및 서열은 실제 이중-도메인 단백질의 기능에 중요할 수 있다.Preferred properties of a dual-domain DNA, ribozyme or protein molecule can be optimized by (1) constructing a DNA domain, (2) encoding a ribozyme sequence or (3) altering the nucleic acid encoding a protein domain. have. This is accomplished through various conventional techniques. In one approach, the sequence or length of the linker region is varied to optimize the dual-domain molecule. The length and sequence of the linker region may be important for the function of the actual dual-domain protein.

다양한 펩티드 길이의 링커를 포함하는 scFv 이중-도메인 단백질을 생성하는 방법이 당업계에 공지되어 있다 (예를 들어 U.S. 5,837,242). 링커의 서열 또는 길이 변화는 scFv의 안정성, 프로테아제 감수성, 결합 활성 및 발현 수준에 악영향을 미칠 수 있다. 링커 서열 또는 길이의 변화의 이중-도메인 폴리펩티드의 기능(들)에 대한 영향이 일반적으로 예측될 수 없었기 때문에, 링커 중 특정 아미노산 잔기를 다양화하거나 그의 전체 길이를 변화시키는 경우의 생활성에 대한 상기 영향은 이전에는 일반적으로 측정될 수 없었다.Methods for generating scFv dual-domain proteins comprising linkers of various peptide lengths are known in the art (eg U.S. 5,837,242). Changes in the sequence or length of the linker can adversely affect the stability, protease sensitivity, binding activity and expression level of the scFv. Since the effect on the function (s) of the dual-domain polypeptide of the linker sequence or the change in length is generally unpredictable, the above effect on the viability when varying the specific amino acid residue in the linker or changing its overall length Was not generally measurable before.

따라서, L이 랜덤 길이 및 서열을 가지는 D1-L-D2(또는 더 큰 차수)를 코딩하는 핵산 라이브러리의 생성을 가능하게 하는 방법에 대한 필요성이 존재한다.이중-도메인 단백질을 상기 라이브러리로부터 발현시킬 수 있으며, 목적 특성을 분석할 수 있다. 일단, 단백질이 "최적" 특성을 가지는 것으로 확인되면, 상기 단백질을 코딩하는 클론의 뉴클레오티드 서열을 분석함으로써 그의 서열을 결정할 수 있다. 이러한 접근법은 목적 특성을 가지는 것을 찾을 때까지 개개의 클론을 생성 및 시험할 필요가 없다.Thus, there is a need for a method that enables the generation of nucleic acid libraries that encode D 1 -LD 2 (or larger orders), wherein L has a random length and sequence. A dual-domain protein can be expressed from the library. Can analyze the desired characteristics. Once a protein is identified as having "optimal" properties, its sequence can be determined by analyzing the nucleotide sequence of the clone encoding the protein. This approach does not require the creation and testing of individual clones until one finds the ones that have the desired properties.

폴리머라제 연쇄 반응 (PCR)을 사용하여 상이한 서열 또는 상이한 길이를 가지는 링커로 결합된 2개의 도메인을 가지는 핵산 생성물 라이브러리를 생성하여 왔다. 현재 입수가능한 방법 중 어느 것도 핵산 집단의 링커 영역 내로 랜덤 길이 및 랜덤 서열 둘 모두의 동시 도입을 가능하게 하지는 않는다.Polymerase chain reaction (PCR) has been used to generate nucleic acid product libraries with two domains joined by linkers of different sequences or different lengths. None of the currently available methods allow for the simultaneous introduction of both random lengths and random sequences into the linker region of a nucleic acid population.

발현 시스템Expression system

이종성 단백질을 위한 다수의 발현 시스템이 당업계에 공지되어 있다. 이는, 신속하고 풍부한 생성이라는 이점은 가지지만 (단백질을 변성 및 재생 사이클에 처하지 않을 경우) 적절하게 폴딩된 가용성 단백질을 생성할 수 없는 경우가 다수 있어 한정되는 박테리아 시스템을 포함한다. 바큘로바이러스 시스템은 단백질 용해성 개선 가능성을 증가시키는 곤충 세포의 분비 경로를 통하여 발현을 지시한다 (Kretzschmar, T. 등 (1996) J. Immunol. Methods 195:93-101; Brocks, B. 등 (1997), Immunotechnology 3:173-184). 바이러스 조작 및 곤충 세포 성장은 시간이 걸리며 비용이 많이 들기 때문에, 상기 시스템은 특정 유형의 단백질, 예를 들어 종양-특이적 또는 개인-특이적 단백질, 예를 들어 이디오타입 scFv 폴리펩티드의 발현에는 덜 적합하다. 따라서, 당업계에서는 유용한 이중-도메인 단백질을 생산하는 적합하고 신속하며 경제적인 발현 시스템에 대한 필요성이 존재하였는데, 이들 중 하나의 예가 B-세포 림프종 치료용의 이디오타입 scFv 백신이다. 본 발명은 이러한 필요에 부응한다.Many expression systems for heterologous proteins are known in the art. This includes bacterial systems that have the advantage of rapid and abundant production but are often unable to produce properly folded soluble proteins (when the protein is not subjected to denaturation and regeneration cycles). The baculovirus system directs expression through the secretory pathway of insect cells that increases the likelihood of improving protein solubility (Kretzschmar, T. et al. (1996) J. Immunol. Methods 195: 93-101; Brocks, B. et al. (1997) ), Immunotechnology 3: 173-184). Because viral manipulation and insect cell growth are time consuming and expensive, the system is less likely to express certain types of proteins, such as tumor-specific or individual-specific proteins, such as idiotype scFv polypeptides. Suitable. Thus, there is a need in the art for a suitable, rapid and economical expression system that produces useful dual-domain proteins, one example of which is an idiotype scFv vaccine for the treatment of B-cell lymphoma. The present invention addresses this need.

발명의 개요Summary of the Invention

본 발명자들은 적절한 코딩 핵산으로부터 이중-도메인 또는 다중-도메인 (>2) 폴리펩티드 라이브러리를 생성하는 접근법을 발명하였는데, 본 라이브러리는, 각각의 쌍의 폴리펩티드 도메인을 결합시키는 다양한 길이 및 서열의 랜덤 링커를 가지는 구성원을 그 특징으로 한다. 링커를 코딩하는 뉴클레오티드 서열은 반복 패턴의 축중 (degenerate) 트리플렛 염기를 포함한다. 제1 및 제2 (및/또는 고차원) 도메인은 동일하거나 서로 상이할 수 있다. 전체 링커 영역의 아미노산 조성은 1 내지 약 20개의 상이한 아미노산을 포함할 수 있는데, 각각의 반복 패턴의 축중 트리플렛 염기는 1 내지 약 12개의 상이한 아미노산을 코딩한다. 바람직한 링커 길이는 1 내지 50개의 아미노산 범위이다. 하나의 실시 형태에 있어서, 폴리펩티드는 단일 사슬 면역글로불린 또는 단일 사슬 항체 (scFv) 분자인데, 여기서, 하나의 도메인은 면역글로불린 VH도메인이며, 다른 하나의 도메인은 면역글로불린 VL도메인이다.We have invented an approach to generate a bi-domain or multi-domain (> 2) polypeptide library from an appropriate coding nucleic acid, which library has random linkers of varying length and sequence that bind each pair of polypeptide domains. The member is characterized by that. The nucleotide sequence encoding the linker comprises a degenerate triplet base of the repeating pattern. The first and second (and / or high dimensional) domains may be the same or different from each other. The amino acid composition of the entire linker region may comprise from 1 to about 20 different amino acids, wherein the degenerate triplet base of each repeating pattern encodes from 1 to about 12 different amino acids. Preferred linker lengths range from 1 to 50 amino acids. In one embodiment, the polypeptide is a single chain immunoglobulin or single chain antibody (scFv) molecule, where one domain is an immunoglobulin V H domain and the other domain is an immunoglobulin V L domain.

더욱 구체적으로는, 본 발명은 각각이 (a) 제1 및 제2 도메인; (b) (i) 크기 및 뉴클레오티드 서열이 다양하며, (ii) 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 랜덤화 링커 라이브러리의 구성원이며, 도메인을 분리 및 결합시키는 링커를 가지는 이중-도메인 핵산 분자 라이브러리에 관한 것이다.More specifically, the present invention provides a kit comprising: (a) the first and second domains; (b) is a member of a randomized linker library of varying sizes and nucleotide sequences, and (ii) a degenerate repeating triplet nucleotide in a repeating pattern and having a linker that separates and binds a domain to a dual-domain nucleic acid molecular library It is about.

상기 라이브러리에 있어서, 링커의 반복 패턴의 축중 반복 트리플렛 뉴클레오티드는 하기 특성을 가진다:In the library, the degenerate repeat triplet nucleotides of the repeating pattern of the linker have the following characteristics:

(i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet;

(ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet;

(iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet.

바람직하게는, 각각의 반복 트리플렛의 제1 및 제2 위치의 뉴클레오티드는 임의의 2개의 데옥시아데노신, 데옥시구아노신, 데옥시사이티딘 또는 데옥시티미딘으로부터 선택된다. 다른 실시 형태에 있어서, (i) 각각의 반복 트리플렛의 1 위치는 데옥시아데노신 또는 데옥시구아노신이며; (ii) 각각의 반복 트리플렛의 2위치는 데옥시사이티딘 또는 데옥시구아노신이고; (iii) 각각의 반복 트리플렛의 3 위치는 데옥시티미딘이다.Preferably, the nucleotides in the first and second positions of each repeating triplet are selected from any two deoxyadenosine, deoxyguanosine, deoxycytidine or deoxythymidine. In another embodiment, (i) one position of each repeating triplet is deoxyadenosine or deoxyguanosine; (ii) the 2 position of each repeating triplet is deoxycytidine or deoxyguanosine; (iii) the 3 position of each repeat triplet is deoxythymidine.

다른 실시 형태에 있어서, 2개의 상이한 반복 패턴의 축중 트리플렛 염기를 조합하여 이중-도메인 분자 생성에 사용되는 링커 집단을 생성한다. 상이한 반복 패턴의 축중 트리플렛 염기의 조합을 사용하여 상기 집단으로부터 수득되는 링커 서열의 복잡성을 증가시킨다. 또한 상이한 반복체를 사용하여 링커 영역에 상이한 구조적 또는 생화학적 특성을 도입할 수 있다. 예를 들어 축중 트리플렛vwc및축중 트리플렛nvt가 비주형화 (nontemplated) 서열로 사용된다. 이러한 예에 있어서, 축중 링커 서열은(vwc) x (nvt) y(여기서, x는 1 내지 20이며, y는 1 내지 20임)이다. 상기 조합은 각각의 반복체 내의 상이한 아미노산 조합을 포함하며, 길이가 상이한 링커를 생성한다.In another embodiment, two different repeating patterns of degenerate triplet bases are combined to create a population of linkers used to generate double-domain molecules. The combination of degenerate triplet bases of different repeating patterns is used to increase the complexity of the linker sequences obtained from the population. Different repeats can also be used to introduce different structural or biochemical properties into the linker region. For example, degenerate triplet vwc and derivatized triplet nvt are used as nontemplated sequences. In this example, the degenerate linker sequence is (vwc) x (nvt) y where x is 1-20 and y is 1-20. The combination includes different amino acid combinations within each repeat and produces linkers of different lengths.

본 라이브러리의 하나의 실시 형태에 있어서, 하나 이상의 도메인이 단백질에 결합한다. 다른 실시 형태에 있어서, 도메인 둘 모두가 단백질에 결합한다.In one embodiment of the library, one or more domains bind to a protein. In other embodiments, both domains bind to the protein.

또다른 실시 형태에 있어서, 하나 이상, 바람직하게는 둘 모두의 도메인이 라이브러리의 구성원이 아닌 핵산에 결합한다.In another embodiment, one or more, preferably both domains bind to a nucleic acid that is not a member of the library.

임의의 본 핵산 라이브러리에 있어서, 제1 및 제2 도메인은 바람직하게는 코딩 서열이다.In any of the present nucleic acid libraries, the first and second domains are preferably coding sequences.

상기한 바와 같이, 라이브러리는 바람직하게는 식물 또는 식물 세포에서 제조된다.As mentioned above, the library is preferably prepared in a plant or plant cell.

또한 본 발명은 상기 라이브러리로부터 선택되는 이중-도메인 또는 다중-도메인 핵산 분자를 제공한다.The present invention also provides a dual-domain or multi-domain nucleic acid molecule selected from the above libraries.

또한, 각각이 하기 식:In addition, each of the following formula:

D1-L-D2(N-말단으로부터 C-말단임)D 1 -LD 2 (from C-terminus to N-terminus)

[식 중,[In the meal,

(a) D1및 D2는 폴리펩티드 도메인이며,(a) D 1 and D 2 are polypeptide domains,

(b) L은 크기 및 서열이 다양한 링커의 랜덤화 라이브러리의 구성원인 펩티드 또는 폴리펩티드 링커로서, 라이브러리는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 핵산 서열에 의해 코딩됨](b) L is a peptide or polypeptide linker that is a member of a randomization library of linkers of varying sizes and sequences, wherein the library is encoded by a nucleic acid sequence consisting of degenerate repeat triplet nucleotides of a repeating pattern]

으로 기재되는 이중-도메인 폴리펩티드 분자 라이브러리를 제공한다.Provided is a dual-domain polypeptide molecule library described.

바람직한 실시 형태에 있어서, 본 발명은 각각이 폴리펩티드 도메인 D를 포함하는 다중-도메인 폴리펩티드 분자 라이브러리에 관한 것인데, 각각의 D 쌍은 펩티드 또는 폴리펩티드 링커 L에 의해 결합되며, 각각의 분자는 식 DxLy로 기재되는데, 여기서, x는 2 내지 약 n의 정수로서, 이 때 n은 바람직하게는 약 20이며, y는 1 내지 (n-1)의 정수이되, 단, 임의의 x 값에 대하여, y는 바람직하게는 x-1이며; D1은 단일 C-말단 링커에 결합되고; Dn("최종" C-말단 도메인)은 단일 N-말단 링커에 결합되며; 각각의 D2내지 Dn-1은 N-말단 및 C-말단 링커에 결합되고; 각각의 L은, 크기 및 서열이 다양한 링커의 랜덤화 라이브러리의 구성원으로서, 상기 링커 라이브러리는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 핵산 서열에 의해 코딩된다.In a preferred embodiment, the invention relates to a multi-domain polypeptide molecular library, each comprising a polypeptide domain D, wherein each D pair is bound by a peptide or polypeptide linker L, wherein each molecule is formula D x L wherein y is an integer from 2 to about n, where n is preferably about 20 and y is an integer from 1 to (n-1), provided that for any x value, y is preferably x-1; D 1 is bonded to a single C-terminal linker; D n (“final” C-terminal domain) is bound to a single N-terminal linker; Each D 2 to D n-1 is bonded to an N-terminal and C-terminal linker; Each L is a member of a randomization library of linkers of varying sizes and sequences, wherein the linker library is encoded by a nucleic acid sequence consisting of degenerate repeat triplet nucleotides of a repeating pattern.

바람직한 라이브러리는 각각이 하기 식:Preferred libraries are each of the following formula:

D1-L-D2 D 1 -LD 2

[식 중,[In the meal,

(a) D1및 D2는 폴리펩티드 도메인이며,(a) D 1 and D 2 are polypeptide domains,

(b) L은 크기 및 서열이 다양한 링커의 랜덤화 라이브러리의 구성원인 펩티드 또는 폴리펩티드 링커로서, 라이브러리는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 핵산 서열에 의해 코딩됨](b) L is a peptide or polypeptide linker that is a member of a randomization library of linkers of varying sizes and sequences, wherein the library is encoded by a nucleic acid sequence consisting of degenerate repeat triplet nucleotides of a repeating pattern]

으로 기재되는 이중-도메인 폴리펩티드 분자 라이브러리이다.Is a dual-domain polypeptide molecule library described.

상기 이중- 또는 다중-도메인 폴리펩티드 분자 라이브러리에 있어서, 각각의 라이브러리 중 링커는 바람직하게는 (i) 약 1 내지 50개의 아미노산 잔기의 길이를 가지며, (ii) 1 내지 약 20개의 상이한 아미노산으로 이루어지고, (iii) 각각의 반복 패턴의 축중 트리플렛 염기는 1 내지 12개의 상이한 아미노산을 코딩한다.In said bi- or multi-domain polypeptide molecular library, the linker in each library preferably comprises (i) a length of about 1 to 50 amino acid residues, and (ii) consists of 1 to about 20 different amino acids, , (iii) the degenerate triplet base of each repeating pattern encodes 1-12 different amino acids.

상기 이중 도메인 또는 다중-도메인 폴리펩티드 분자 라이브러리에 있어서, 링커를 코딩하는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드는 바람직하게는 하기 특성을 가진다:In the dual domain or multi-domain polypeptide molecule library, the degenerate repeat triplet nucleotides of the repeating pattern encoding the linker preferably have the following properties:

(i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet;

(ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet;

(iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet.

바람직하게는, 각각의 반복 트리플렛의 제1 및 제2 위치 중 뉴클레오티드는 임의의 2개의 데옥시아데노신, 데옥시구아노신, 데옥시사이티딘 또는 데옥시티미딘으로부터 선택된다. 그의 하나의 실시 형태에 있어서, (i) 각각의 반복 트리플렛의 1 위치는 데옥시아데노신 또는 데옥시구아노신이며; (ii) 각각의 반복 트리플렛의 2 위치는 데옥시사이티딘 또는 데옥시구아노신이며; (iii) 각각의 반복 트리플렛의 3 위치는 데옥시티미딘이다.Preferably, the nucleotides in the first and second positions of each repeating triplet are selected from any two deoxyadenosine, deoxyguanosine, deoxycytidine or deoxythymidine. In one embodiment thereof, (i) one position of each repeating triplet is deoxyadenosine or deoxyguanosine; (ii) the 2 position of each repeating triplet is deoxycytidine or deoxyguanosine; (iii) the 3 position of each repeat triplet is deoxythymidine.

상기 이중- 또는 다중-도메인 폴리펩티드 라이브러리는 바람직하게는 식물 세포에서 생성된다.Said bi- or multi-domain polypeptide library is preferably produced in plant cells.

본 발명의 특정 실시 형태는 상기 라이브러리로부터 선택되는 임의의 이중-도메인 (또는 다중-도메인) 폴리펩티드 분자를 포함한다. 하나의 실시 형태는 제3 폴리펩티드 도메인에 결합된 이중 도메인 scFv 폴리펩티드인 상기 라이브러리로부터 선택되는 3 도메인 펩티드를 제공한다. 제3 도메인은 바람직하게는 치료 용도를 가지는 독소 폴리펩티드, 또는 진단 용도 또는 연구 도구로서의 용도를 가지는 효소이다. 상기 폴리펩티드는 바람직하게는 식물 세포에서 생성된다.Certain embodiments of the present invention include any dual-domain (or multi-domain) polypeptide molecule selected from the above library. One embodiment provides a three domain peptide selected from said library that is a dual domain scFv polypeptide bound to a third polypeptide domain. The third domain is preferably an toxin polypeptide having a therapeutic use or an enzyme having a diagnostic use or as a research tool. The polypeptide is preferably produced in plant cells.

본 발명은 또한 하기 단계를 포함하는 상기 이중-도메인 핵산 라이브러리의 생성 방법에 관한 것이다:The present invention also relates to a method of producing said dual-domain nucleic acid library comprising the following steps:

a. 제1 및 제2 도메인을 포함하는 2개의 주형 DNA 서열을 얻는 단계;a. Obtaining two template DNA sequences comprising the first and second domains;

b. 각각의 프라이머쌍이 상류 프라이머 및 하류 프라이머를 포함하며, 각각의 프라이머는 5' 말단 및 3' 말단을 가지고, 제1 도메인용 하류 프라이머 또는 제2 도메인용 상류 프라이머가 비주형화 서열을 포함하며, 여기서, 비주형화 서열은 반복 패턴의 축중 반복 트리플렛 뉴클레오티드를 포함하고, 이 때, 반복 패턴의 축중 반복 트리플렛 뉴클레오티드의 2개 이상의 5' 말단 트리플렛은 동일한 축중 서열을 가지는, 제1 및 제2 도메인을 증폭시키는 증폭 프라이머쌍을 제조하는 단계;b. Each primer pair comprises an upstream primer and a downstream primer, each primer having a 5 'end and a 3' end, wherein the downstream primer for the first domain or the upstream primer for the second domain comprises an untyped sequence, wherein The non-templated sequence comprises a degenerate repeat triplet nucleotide of a repeating pattern, wherein at least two 5 'terminal triplets of the degenerate repeat triplet nucleotide of the repeating pattern have the same degenerate sequence and amplify the first and second domains Preparing a primer pair;

c. 증폭 프라이머를 이용하여 도메인을 증폭시켜 비-주형화 서열에서 상이한 길이 및 서열을 가지는 하나 이상의 핵산 도메인 집단을 생성하는 단계; 및c. Amplifying the domains using amplification primers to produce one or more populations of nucleic acid domains having different lengths and sequences in the non-templating sequence; And

d. 단계 (c)에서 생성한 핵산 도메인을 라이게이션시켜 이중-도메인 분자 집단을 생성하는 단계.d. Ligating the nucleic acid domain generated in step (c) to generate a dual-domain molecule population.

상기 방법에 있어서, 하나 이상의 프라이머 중 반복 패턴의 축중 반복 트리플렛 뉴클레오티드는 바람직하게는 하기 특성을 가진다:In this method, the degenerate repeating triplet nucleotides of the repeating pattern in one or more primers preferably have the following properties:

(i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet;

(ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet;

(iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet.

상기 이중- 또는 다중-도메인 폴리펩티드 분자 라이브러리의 하나의 실시 형태에 있어서, 길이가 10개 이상의 잔기로 이루어진 라이브러리 중 링커는 3개 이상의 상이한 잔기를 포함하여야 하며, 길이가 20개 이상의 잔기로 이루어진 라이브러리 중 링커는 4개 이상의 상이한 잔기를 포함하여야 한다.In one embodiment of the above bi- or multi-domain polypeptide molecular library, the linker in the library of 10 or more residues in length must comprise at least 3 different residues, and in the library of 20 or more residues in length. The linker must comprise at least four different residues.

상기 방법에 있어서, 하나 이상의 프라이머는 바람직하게는 비-주형화 엔도뉴클레아제 인식 부위를 포함한다.In the method, the one or more primers preferably comprise a non-templated endonuclease recognition site.

상기 방법에 있어서, 주형 DNA 서열은 바람직하게는 mRNA의 역전사에 의해 만들어진다.In this method, the template DNA sequence is preferably made by reverse transcription of mRNA.

본 방법은 추가로 이중-도메인 핵산 집단을 벡터에 라이게이션시키는 단계를 포함하며, 추가로 이 벡터를 숙주 내로 도입하는 단계를 포함한다. 이러한 방법에 있어서, 핵산 도메인은 일반적으로 폴리펩티드 도메인을 코딩하며, 본 방법은 바람직하게는 이중-도메인 핵산에 의해 코딩되는 이중-도메인 폴리펩티드를 발현시키는 단계도 포함한다. 추가의 단계에 있어서, 본 방법은 벡터로부터 RNA를 전사시키는 단계를 포함할 수 있다.The method further comprises the step of ligating the dual-domain nucleic acid population to the vector, further comprising introducing the vector into the host. In such a method, the nucleic acid domain generally encodes a polypeptide domain, and the method also preferably comprises expressing the dual-domain polypeptide encoded by the dual-domain nucleic acid. In a further step, the method may comprise transcription of RNA from the vector.

식물 발현에 있어서, 벡터는 식물 세포에서의 핵산의 복제 및/또는 발현과 양립할 수 있어야 한다. 본 방법은 바람직하게는 전사 RNA를 식물 세포 내로 도입하여 이중-도메인 (또는 다중-도메인) 폴리펩티드를 발현시키는 단계를 포함한다.In plant expression, the vector must be compatible with the replication and / or expression of nucleic acids in plant cells. The method preferably comprises introducing transcriptional RNA into plant cells to express a dual-domain (or multi-domain) polypeptide.

또한 본 발명은, 상기 방법에 의해 제조되는, 이중-도메인 폴리펩티드 집단 또는 상기 집단으로부터 선택되는 이중-도메인 폴리펩티드를 제공한다. 바람직하게는, 집단 또는 선택된 폴리펩티드는 식물 세포에서 생성된다.The present invention also provides a dual-domain polypeptide population or a dual-domain polypeptide selected from the population, produced by the above method. Preferably, the population or selected polypeptides are produced in plant cells.

또한, 하기 단계를 포함하는 이중 도메인 (또는, 적합하게 변형된 다중-도메인) 폴리펩티드의 제조 방법을 제공한다:Also provided are methods of making a dual domain (or, suitably modified, multi-domain) polypeptide, comprising the following steps:

(a) 폴리펩티드의 제1 도메인을 코딩하는 핵산을, 링커의 제1 부분을 코딩하는 핵산에 결합시켜 제1 핵산 작제물을 생성하는 단계;(a) binding a nucleic acid encoding a first domain of a polypeptide to a nucleic acid encoding a first portion of a linker to produce a first nucleic acid construct;

(b) 링커의 제2 부분을 코딩하는 핵산을, 폴리펩티드의 제2 도메인을 코딩하는 핵산에 결합시켜 제2 핵산 작제물을 생성하는 단계;(b) binding the nucleic acid encoding the second portion of the linker to the nucleic acid encoding the second domain of the polypeptide to generate a second nucleic acid construct;

(c) 일시적 식물 발현 벡터 내로 제1 및 제2 작제물을 프레임에 맞게 (inframe) 혼입하여, 발현시 폴리펩티드가 식 D1-L-D2로 기재되는 링커에 의해 분리되는 제1 및 제2 도메인을 보유하도록 하는 단계;(c) incorporating the first and second constructs in-frame into the transient plant expression vector such that upon expression the first and second domains are separated by a linker described by the formula D 1 -LD 2 . Retaining;

(d) 식물 (또는 식물 세포)를 벡터로 트랜스펙션시켜 식물이 일시적으로 폴리펩티드를 생산하게 하는 단계; 및(d) transfecting the plant (or plant cell) with the vector to cause the plant to temporarily produce a polypeptide; And

(e) 폴리펩티드를 기능적으로 폴딩된 가용성의 단백질로서 회수하는 단계.(e) recovering the polypeptide as a functionally folded soluble protein.

일반 참고문헌General Reference

달리 나타내지 않는 한, 본 발명의 다수의 측면의 실시는 당업계의 기술수준 이내인 통상의 분자생물학, 재조합 DNA 기술 및 면역학 기술을 이용한다. 이러한 기술은 과학 문헌, 예를 들어 Sambrook, J. 등, Molecular Cloning: A Laboratory Manual, 제2판, Cold Spring Harbor Press, Cold Spring Harbor, NY, 1989, Ausubel, F.M. 등, Current Protocols in Molecular Biology, Wiley-Interscience, NY, current volume; Albers, B. 등, Molecular Biology of the Cell, 제2판, Garland Publishing, Inc., New York, NY (1989); Lewin, BM, Genes IV, Oxford University Press, Oxford (1990); Watson, J.D. 등, Recombinant DNA, 제2판, Scientific American Books, New York, 1992; Darnell, JOE 등, Molecular Cell Biology, Scientific American Books, Inc., New York, NY (1986); Old, R.W. 등, Principles of gene Manipulation: An Introduction to Genetic Engineering, 제2판, University of California Press, Berkeley, CA (1981); DNA Cloning: A Practical Approach, vol. I & II (D. Glover, ed.); Oligonucleotide Synthesis(N. Gait, ed., Current Edition); Nucleic Acid Hybridization (B. Hames & S. Higgins, eds., Current Edition); Transcription and Translation (B. Hames & S. Higgins, eds., Current Edition); Methods in Enzymology: Guide to Molecular Cloning Techniques (Berger and Kimball, eds., 1987); Hartlow, E. 등, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1988), Collegian, J.E. 등 eds., Current Protocols in Immunology, Wiley-Interscience, New York 1991 에 상세하게 기재되어 있다. 단백질 구조 및 기능은 Schulz, GE 등, Principles of protein Structure, Springer-Verlag, New York, 1978, 및 Creighton, TE, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., San Francisco, 1983에서 논의되어 있다.Unless otherwise indicated, the practice of many aspects of the invention utilizes conventional molecular biology, recombinant DNA techniques, and immunology techniques that are within the skill of the art. Such techniques are described in scientific literature, for example Sambrook, J. et al., Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Press, Cold Spring Harbor, NY, 1989, Ausubel, F.M. Et al., Current Protocols in Molecular Biology, Wiley-Interscience, NY, current volume; Albers, B. et al., Molecular Biology of the Cell, 2nd edition, Garland Publishing, Inc., New York, NY (1989); Lewin, BM, Genes IV, Oxford University Press, Oxford (1990); Watson, J.D. Et al., Recombinant DNA, 2nd edition, Scientific American Books, New York, 1992; Darnell, JOE et al., Molecular Cell Biology, Scientific American Books, Inc., New York, NY (1986); Old, R.W. Et al., Principles of gene Manipulation: An Introduction to Genetic Engineering, 2nd edition, University of California Press, Berkeley, CA (1981); DNA Cloning: A Practical Approach, vol. I & II (D. Glover, ed.); Oligonucleotide Synthesis (N. Gait, ed., Current Edition); Nucleic Acid Hybridization (B. Hames & S. Higgins, eds., Current Edition); Transcription and Translation (B. Hames & S. Higgins, eds., Current Edition); Methods in Enzymology: Guide to Molecular Cloning Techniques (Berger and Kimball, eds., 1987); Hartlow, E. et al., Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1988), Collegian, J.E. Eds., Current Protocols in Immunology, Wiley-Interscience, New York 1991. Protein structures and functions are described in Schulz, GE et al., Principles of protein Structure, Springer-Verlag, New York, 1978, and Creighton, TE, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., San Francisco, 1983.

정의Justice

본원에서 사용되는 하기 용어는, 달리 특정되지 않는 한, 하기 의미를 가진다.As used herein, the following terms have the following meanings unless otherwise specified.

폴리펩티드 또는 단백질 "도메인"은 일반적으로 특정 구조 및/또는 생화학적 기능을 부여하는 방식으로 폴딩된 폴리펩티드 사슬 영역을 나타낸다 (Schulz 등의 상기 문헌). 도메인은 구조적 또는 기능적인 면에서 정의될 수 있다. 기능적 도메인은 단일 구조 도메인일 수 있지만, 하나 이상의 구조 도메인을 포함할 수도 있다. 이러한 기능은 효소적 촉매 활성, 리간드 결합, 원자의 킬레이팅 또는 내인성 형광성을 포함할 수 있다. 상기에 논의된 바와 같이, 그리고 본 발명에 특히 중요하듯이, Ig 분자의 VH및 VL영역은 각각 단일 구조 도메인을 형성하는데, 이는 항원-조합 부위를 형성하는 데에 있어서 협력하여 작용한다. 도메인의 기능은 독특한 폴딩 형상에 의해 상당 정도 강요된다. "도메인"은, 단백질 기술에 가장 일반적으로 사용되기는 하지만, 특정 기능(예를 들어 라이보자임의 촉매 활성 또는 단백질 결합)을 수행하는 핵산 구조체, 또는 폴리펩티드 도메인의 코딩 서열인 핵산의 영역을 기술할 수도 있다. 결합 파트너 (수용체 또는 리간드)에 대한 결합에 의해 규정되는 결합 도메인은 Ig 분자의 VH및 VL영역에 의해 예시되는데 (하기 참조), 이들 각각은 항원-조합 부위를 형성하는 데에 있어서 협력하여 작용하는 단일 구조 도메인을 형성한다. 기타, 잘 알려진 결합 도메인으로는 각각의 리간드, 예를 들어 펩티드 호르몬에 결합하는 세포 표면 수용체의 세포외 도메인이 있다. 또한, 그의 각각의 수용체에 결합하는 에리트로포이에틴, GM-CSF 또는 엔케팔린과 같은 폴리펩티드 또는 펩티드 리간드 부분은 기능 (결합) 도메인으로 여겨진다. 형광능에 책임이 있는 단백질 (예를 들어 녹색 형광 단백질- GFP)의 일부가 또한 기능 도메인으로 여겨진다.Polypeptide or protein " domains " generally refer to polypeptide chain regions that are folded in a manner that confers specific structural and / or biochemical functions (Schulz et al., Supra). Domains can be defined structurally or functionally. The functional domain can be a single structural domain, but can also include one or more structural domains. Such functions may include enzymatic catalytic activity, ligand binding, chelating of atoms or endogenous fluorescence. As discussed above, and as particularly important for the present invention, the V H and V L regions of the Ig molecule each form a single structural domain, which acts cooperatively in forming the antigen-combination site. The function of the domain is greatly constrained by the unique folding geometry. A "domain" may describe a region of nucleic acid, which is the coding sequence of a polypeptide domain, or a nucleic acid construct that performs a particular function (eg, catalytic activity or protein binding of ribozymes), although most commonly used in protein technology. have. Binding domains defined by binding to a binding partner (receptor or ligand) are exemplified by the V H and V L regions of the Ig molecule (see below), each of which cooperates to form an antigen-binding site. It forms a single structural domain that acts. Other well known binding domains include the extracellular domains of cell surface receptors that bind to each ligand, eg, peptide hormone. In addition, polypeptide or peptide ligand moieties that bind to their respective receptors, such as erythropoietin, GM-CSF or enkephalin, are considered functional (binding) domains. Some of the proteins responsible for fluorescence (eg green fluorescent protein-GFP) are also considered functional domains.

DNA 또는 RNA 분자의 결합 도메인은, 단백질, (바람직하게는) 예를 들어 전사 인자 (예를 들어 cAMP 응답 요소 결합 단백질,cAMPResponseElementBindingProtein (CREB)), 제한 효소 (예를 들어 EcoRI) 또는 DNA 폴리머라제 (예를 들어 Taq DNA 폴리머라제)에 결합하는 분자의 일부이다.Binding domain of the DNA or RNA molecules, proteins, and (preferably), for example, transcription factors (e.g. cAMP response element binding protein, c AMP R esponse E lement B inding P rotein (CREB)), restriction enzyme (e.g. For example EcoRI) or DNA polymerase (eg Taq DNA polymerase).

본 발명은 일부는 이중-도메인 분자의 생성 방법에 관한 것이다. 바람직한이중-도메인 분자에 있어서, 2개의 도메인 사이의 링커 영역은 다양한 반면, 결합되는 도메인의 서열은 일정하게 유지된다.The present invention is directed, in part, to methods of producing double-domain molecules. In a preferred dual-domain molecule, the linker region between the two domains varies while the sequence of the domain to which it is bound remains constant.

"주형 DNA"는 "증폭 프라이머쌍" (증폭 반응에 사용되는 올리고뉴클레오티드 프라이머 집단)에 의해 증폭되는 DNA를 나타낸다. 상기 DNA는 생물학적 (재조합) 또는 합성 (화학적) 수단에 의해 제조될 수 있다. 또한, mRNA를 역전사시켜 증폭 반응에 사용되는 주형 DNA를 형성할 수 있다." Template DNA " refers to DNA that is amplified by "amplification primer pairs" (oligonucleotide primer populations used in amplification reactions). The DNA can be prepared by biological (recombinant) or synthetic (chemical) means. In addition, mRNA can be reverse transcribed to form template DNA for use in the amplification reaction.

"상류 프라이머"는 주형 DNA의 안티센스 가닥에 어닐링하는 올리고뉴클레오티드 프라이머, 또는 올리고뉴클레오티드 프라이머의 혼합물이다." Upstream primers " are oligonucleotide primers, or mixtures of oligonucleotide primers, that anneal to the antisense strand of template DNA.

"하류 프라이머"는 주형 DNA의 센스 가닥에 어닐링하는 올리고뉴클레오티드 프라이머, 또는 올리고뉴클레오티드 프라이머의 혼합물이다.A " downstream primer " is an oligonucleotide primer, or mixture of oligonucleotide primers, that anneals to the sense strand of template DNA.

"비주형화 서열"은 반복 뉴클레오티드 트리플렛을 포함하는 증폭 프라이머 부분이다. 상기 서열의 목적이 다양성을 링커 라이브러리 내로 도입하는 것일 경우, 상기 서열은 증폭되는 DNA 서열, 예를 들어 폴리펩티드 도메인 코딩 영역에 상보적이지 않다." Untyped sequence " is the portion of an amplification primer comprising a repeating nucleotide triplet. If the purpose of the sequence is to introduce diversity into the linker library, the sequence is not complementary to the DNA sequence to be amplified, eg, the polypeptide domain coding region.

"반복 패턴의 축중 트리플렛 염기"라는 문구는, 3개의 염기의 세트 (트리플렛)이 비주형화 서열 중에서 반복되어, 반복 트리플렛 중 개개의 염기가 규정된 배열로부터 독립적으로 선택되는 반복 모티프를 생성하는 핵산 서열을 나타낸다. 예를 들어, 반복 트리플렛이nws일 경우 (표 1 참조),n은 a, c, g, 또는 t일 수 있으며;w는 a 또는 t일 수 있고,s는 g 또는 c일 수 있어 반복 패턴의 축중을 가능하게 한다. 본원에 있어서, 상기 반복 트리플렛은 서로 인접해 있다. 상기 "반복패턴의 축중 트리플렛 염기"를 포함하는 증폭 프라이머의 비주형화 서열은 시험관내에서 제조된다.The phrase “ degenerate triplet base in a repeating pattern ” refers to a nucleic acid sequence in which a set of three bases (triplet) is repeated in a non-templating sequence, creating a repeating motif in which each base of the repeating triplet is independently selected from a defined sequence. Indicates. For example, if the repeating triplet is nws (see Table 1), n can be a, c, g, or t; w can be a or t, and s can be g or c to enable decondensation of the repeating pattern. In the present application, the repeating triplets are adjacent to each other. Untemplated sequences of amplification primers comprising the above "degenerate triplet bases of repeating patterns" are prepared in vitro.

"증폭화/증폭"은 전체 주형 DNA, 또는 그의 일부가 1회 이상, 바람직하게는 다회 복제되는 반응을 나타낸다." Amplification / amplification " refers to a reaction in which the entire template DNA, or part thereof, is replicated one or more times, preferably multiple times.

"라이게이션화/라이게이션"은 효소적 및/또는 화학적 방법을 사용하여 2개 이상의 DNA 가닥을 공유결합적으로 커플링시키는 것 (3' 말단에서 5' 말단으로)을 나타낸다." Ligation / Ligation " refers to the covalent coupling of two or more DNA strands (from 3 'end to 5' end) using enzymatic and / or chemical methods.

"비주형화 엔도뉴클레아제 인식 부위"는 제한 엔도뉴클레아제에 의해 인식되는 비주형화 서열 내의 서열이다.Untyped endonuclease recognition site ” is a sequence within an untyped sequence recognized by a restriction endonuclease.

본원에서의 "라이브러리"라는 용어의 한가지 용도는, 크기 및 뉴클레오티드 서열이 다양한 링커 서열에 의해 결합되는 도메인으로 이루어진 핵산 분자의 집단, 세트 또는 집합을 나타내는데, 이는 상기 방법을 사용하여 제조된다. 뉴클레오티드 서열이 상이한 라이브러리에 포함된 라이브러리 구성원의 수는 반복 패턴의 축중 트리플렛 염기에 포함된 서열의 수에 의해 결정된다. "라이브러리"라는 용어는 핵산 라이브러리에 의해 코딩되는 폴리펩티드 집단에도 적용된다.One use of the term “ library ” herein refers to a population, set or collection of nucleic acid molecules consisting of domains in which size and nucleotide sequences are joined by various linker sequences, which are prepared using the above methods. The number of library members included in a library of differing nucleotide sequences is determined by the number of sequences contained in the degenerate triplet base of the repeating pattern. The term "library" also applies to a population of polypeptides encoded by a nucleic acid library.

본원에서 사용되는 핵산 수준의 "링커"는 2개의 폴리펩티드 도메인을 코딩하는 2개의 핵산 도메인 또는 2개의 핵산 서열을 결합시키는 핵산 분자 또는 서열이다. 링커 서열은 하기 특성을 가지는 축중 반복 트리플렛 뉴클레오티드 패턴을 가진다:As used herein, a “ linker ” at the nucleic acid level is a nucleic acid molecule or sequence that binds two nucleic acid domains or two nucleic acid sequences that encode two polypeptide domains. The linker sequence has a degenerate repeat triplet nucleotide pattern with the following characteristics:

(i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet;

(ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet;

(iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet.

단백질 수준에서, 링커는 링커 핵산 서열의 펩티드 발현 생성물이다. 바람직한 실시 형태에 있어서, 본 발명의 링커는 Gly4Ser 또는 그의 반복체를 코딩하거나 (Gly4Ser 또는 그의 반복체인) 서열을 제외한다.At the protein level, the linker is the peptide expression product of the linker nucleic acid sequence. In a preferred embodiment, the linkers of the invention Except for encoding a Gly 4 Ser or His or repeats (Gly 4 Ser or a repeated chain) sequences.

본원에서 사용되는 핵산 수준의 "링커의 라이브러리" (또는 "링커 라이브러리")는 핵산 분자 또는는 서열의 세트 또는 집합체 또는 집단인데, 이들 각각은 2개의 폴리펩티드 도메인을 코딩하는 2개의 핵산 도메인 또는 2개의 핵산 서열을 결합시키며, 각각의 라이브러리 구성원은 하기 특성을 가지는 축중 반복 트리플렛 뉴클레오티드 패턴을 가진다:As used herein, a “ library of linkers ” (or “ linker libraries ”) at the nucleic acid level are nucleic acid molecules or sets or collections or populations of sequences, each of which is two nucleic acid domains or two nucleic acids encoding two polypeptide domains. Binding sequences, each library member has a degenerate repeat triplet nucleotide pattern with the following characteristics:

(i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet;

(ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet;

(iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet.

단백질 수준에서, 링커 라이브러리는 라이브러리의 링커 핵산 구성원의 집단의 발현 산물의 세트이다.At the protein level, a linker library is a set of expression products of a population of linker nucleic acid members of the library.

"단일 사슬 항체" (scFv; 또한 다른 사람들은 "scAb"라 부름)는 단일 사슬 폴리펩티드 분자로서, 여기에서 Ig 중쇄 가변성 (VH) 도메인 및 Ig 경쇄 가변성(VL) 도메인이, scFv가 원래의 항체 (이로부터 VH및 VL도메인이 유도됨)가 특이적인 항원 (또는 항원결정부)에 대해 결합능 및 특이성을 보유하는 입체구조를 취하도록 허용하는 비교적 짧은 펩티드 링커에 의해 인위적으로 결합된다.A "single chain antibody"(scFv; also called "scAb" by others) is a single chain polypeptide molecule, wherein the Ig heavy chain variable (V H ) domain and the Ig light chain variable (V L ) domain, where the scFv is originally Antibodies (from which the V H and V L domains are derived) are artificially bound by a relatively short peptide linker that allows for a conformation that retains binding capacity and specificity for specific antigens (or epitopes).

분자생물학 분야의 본 발명은, 길이 및 서열이 다양한 링커 라이브러리에 의해 결합되는 이중-도메인 핵산 및/또는 단백질 라이브러리에 관한 것이다.The present invention in the field of molecular biology relates to bi-domain nucleic acid and / or protein libraries in which lengths and sequences are bound by various linker libraries.

도 1은 식물 원형질체에서 실시예 1에서 생성된 scFv 단백질의 웨스턴 블롯 분석을 보여준다. CJ는 (Gly4Ser)3링커를 가진 scFv 이다. 레인의 숫자는 클론의 번호를 나타낸다. 크기는 킬로달톤 (kD)으로 왼편에 보여준다.1 shows Western blot analysis of the scFv protein produced in Example 1 in plant protoplasts. CJ is a scFv with (Gly 4 Ser) 3 linker. The number in the lane represents the number of clones. The size is shown on the left side in kilodaltons (kD).

도 2는 전체 식물에서 실시예 2에서 생성된 scFv 단백질의 웨스턴 블롯 분석을 보여준다. CJ는 (Gly4Ser)3링커를 가진 scFv 이다. 레인의 숫자는 클론의 번호를 나타낸다. 크기는 kDa로 왼편에 보여준다.2 shows Western blot analysis of the scFv protein produced in Example 2 in whole plants. CJ is a scFv with (Gly 4 Ser) 3 linker. The number in the lane represents the number of clones. The size is shown on the left as kDa.

도 3은 전체 식물에서 실시예 3에서 생성된 scFv 단백질의 Coomassie 염색된 SDS-PAGE 분석을 보여준다. 레인의 숫자는 클론의 번호를 나타내고, 화살표는 scFv 단백질을 가리킨다. 크기는 kD 으로 왼편에 보여준다.3 shows Coomassie stained SDS-PAGE analysis of the scFv protein produced in Example 3 in whole plants. The number in the lane indicates the number of clones and the arrow points to the scFv protein. The size is shown in kD on the left.

본 발명은 발현 시스템, 바람직하게는 식물 기재의 발현 시스템을 이용하여이중 도메인 단백질, 예를 들면, B 세포 림프종을 치료하는 개개인의 종양 특이적 면역원을 생산하는 것이다. 본원에 기재된 식물 기재의 일시적인 이종 발현 시스템은 놀랍게도 풍부하고, 놀랍게도 강력한 면역원성을 가진 정확하게 폴딩된 폴리펩티드를 생산한다. 이 시스템은 그러한 단백질 또는 폴리펩티드의 유용한 양의 신속하고 경제적인 생산을 허용한다.The present invention uses an expression system, preferably a plant-based expression system, to produce tumor specific immunogens for individuals treating dual domain proteins, such as B cell lymphoma. The plant-based transient heterologous expression systems described herein produce surprisingly rich, accurately folded polypeptides with surprisingly strong immunogenicity. This system allows for the rapid and economic production of useful amounts of such proteins or polypeptides.

이중 도메인 산물을 코딩하는 핵산을 하기에 상세히 기재한, 적당한 식물 바이러스 벡터를 사용하여, 식물내로 도입하여, 식물 세포, 식물 부분 및 전체 식물내에서 적절하게 폴딩된 이중 도메인 단백질의 발현 및 신속한 생산을 야기한다.Nucleic acid encoding a dual domain product is introduced into the plant using suitable plant viral vectors, described in detail below, to allow for the rapid production and expression of properly folded double domain proteins in plant cells, plant parts and whole plants. Cause.

본원에 기재된, (1) 적당한 링커 및 (2) 일시적인 발현 시스템의 선택은 유용한 이중 도메인 폴리펩티드 분자가 이들의 의도한 목적, 예를 들면, 종양 특이적 면역원에 사용을 허용하는 입체구조로 용액에서 폴딩 형태로 식물 세포에 의해 분비되는 것을 확신한다. 본 발명에 따라 생산된 scFv는 유리하게는 성공적으로 혼입된 식물 세포에서 우세하게 분비되는 단백질 종으로 수득된다. 이것은 백신 조성물로서의 경우를 포함하여, 본원에 기재된 사용을 위한 간단한 선발 및 직접적이고, 신속한 정제를 허용한다.The choice of (1) suitable linkers and (2) transient expression systems described herein allows folding of useful dual domain polypeptide molecules in solution in a conformation that allows their use for their intended purposes, eg, tumor specific immunogens. To ensure that it is secreted by the plant cells in form. The scFv produced according to the invention is advantageously obtained as a protein species which is predominantly secreted in successfully incorporated plant cells. This allows for simple selection and direct, rapid purification for the use described herein, including as a vaccine composition.

식물 발현 시스템이 본원에 열거된 이유로 바람직한 반면에, 본 발명은 임의의 특정 시스템에 한정할 의도는 아니다. 이중 도메인(또는 다중 도메인) 핵산 및 단백질의 생산에서 다양한 정도의 복합성의 랜덤 링커 라이브러리의 생성을 위한 본 접근을 다른 원핵세포 및 진핵세포 숙주, 예를 들면 박테리아, 효모 세포 또는 포유동물 세포에 적용할 수 있다.While plant expression systems are preferred for the reasons listed herein, the present invention is not intended to be limited to any particular system. This approach for the generation of random linker libraries of varying degrees of complexity in the production of bidomain (or multidomain) nucleic acids and proteins may be applied to other prokaryotic and eukaryotic hosts, such as bacteria, yeast cells or mammalian cells. Can be.

하기에 기재된 Ig V 도메인을 포함한 scFv 백신외에, 본 발명은 정확한 폴딩 및 증진된 면역원성을 달성하기 위해 유사한 방식으로 식물에서 발현될 수 있는 다른 단백질 항원에 직접 적용될 수 있다. 예는 태아성암항원(CEA), 전립선 선암종에 존재하는 전립선 특이 항원(PSA), 흑색종에 존재하는 티로시나제, 및 많은 다른 공지 및 아직까지 발견되지 않은 종양 항원과 같은, 특정 유형의 종양 또는 종양 군에 공통인 항원을 포함한다. 다른 유형의 클론으로 분포된 (자가) 항원은 α, β, γ 또는 δ사슬 V 부위(또는 이의 조합)의 부분을 포함하는 T 세포 수용체 (TCR) 도메인이다. 그러한 TCR-기재 항원은 마커일 수 있고, 그러므로, 특정 T 세포 백혈병 및 림프종뿐만 아니라 자가면역질환의 표적일 수 있다. 그리하여, 확인가능한 T 세포 클론 또는 특정 TCR 사슬 V 부위의 용법과 관련된 자가면역질환은 본원에 기재된 접근에 의해 제조된 TCR V 부위 폴리펩티드에 해당하는 폴리펩티드 항원으로써 면역화시킴으로써 조절/치료된다.In addition to scFv vaccines comprising the Ig V domains described below, the invention can be applied directly to other protein antigens that can be expressed in plants in a similar manner to achieve accurate folding and enhanced immunogenicity. Examples include certain types of tumors or groups of tumors, such as fetal cancer antigens (CEA), prostate specific antigens (PSA) present in prostate adenocarcinoma, tyrosinase present in melanoma, and many other known and not yet discovered tumor antigens. It contains antigens common to. (Self) antigens distributed to other types of clones are T cell receptor (TCR) domains that include portions of α, β, γ or δ chain V sites (or combinations thereof). Such TCR-based antigens may be markers and therefore may be targets of autoimmune diseases as well as certain T cell leukemias and lymphomas. Thus, autoimmune diseases associated with the use of identifiable T cell clones or specific TCR chain V sites are modulated / treated by immunization with polypeptide antigens corresponding to TCR V site polypeptides prepared by the approaches described herein.

본 발명의 범위내의 다른 이중 도메인 단백질은 또다른 목적 도메인과 조합된 바이러스 코트 단백질 도메인을 포함한다. 필요하다면, 이 분자를 코트 단백질의 특성을 이용하여 정제한다.Other dual domain proteins within the scope of the present invention include viral coat protein domains in combination with another target domain. If necessary, this molecule is purified using the properties of the coat protein.

단백질 도메인은 세포 표면 상에서 발현된 것에 제한되지 않고; 하나 또는 양자 폴리펩티드가 세포질 단백질 또는 가용성 형태로 기능하는 단백질로부터 유도되는 이중 도메인 단백질이 또한 의도된다. 예는 IL-1β및 폴리펩티드 호르몬과 같은 시토카인을 포함한다.Protein domains are not limited to those expressed on the cell surface; Also contemplated are dual domain proteins in which one or both polypeptides are derived from a cytoplasmic protein or a protein that functions in soluble form. Examples include cytokines such as IL-1β and polypeptide hormones.

본 발명의 링커 접근을 사용하여 이중- 또는 다중-도메인 단백질로서 결합되는 다른 바람직한 폴리펩티드 도메인은 전사 인자이다. 이것은 일제히 또는 연속적으로 작용하는 상이한 전사 인자의 활성 도메인이 링커에 의해 분리된 단일 사슬 분자로서 조합되도록 하기 위해 조립될 수 있다. 링커 크기 및 복합성은 전사 인자에 대한 기능성 조건, 예를 들면, 이들이 거의 동시에 결합하고 작용해야 한다면 이러한 인자에 대한 핵산 결합 자리 사이의 거리에 기초하여 선택된다. 그러한 이중 도메인 또는 다중 도메인 폴리펩티드는 전사를 증진, 활성화 또는 편성하는데 유리한 특성을 보여주리라 기대된다. 이것은 하나 이상의 인자가 작용하고 하나가 이의 농도 또는 유용성에 있어서 제한적인 경우에 특히 유용할 수 있다. 이 제한은 다른 점에서는 제한되는 인자의 도메인이 항상 하나의 도메인 또는 도메인들 또는 하나 이상의 비제한적인 전사 인자에 결합되는 인위적인 이중 도메인 또는 다중 도메인 전사 인자를 생성함으로써 극복된다.Another preferred polypeptide domain that is bound as a dual- or multi-domain protein using the linker approach of the invention is a transcription factor. It can be assembled to allow the active domains of different transcription factors acting together or in succession to be combined as single chain molecules separated by a linker. Linker size and complexity are selected based on the functional conditions for the transcription factor, for example, the distance between nucleic acid binding sites for these factors if they must bind and act almost simultaneously. Such bidomain or multidomain polypeptides are expected to show advantageous properties in promoting, activating or organizing transcription. This may be particularly useful where one or more factors work and one is limited in their concentration or utility. This limitation is overcome by creating an artificial dual domain or multi domain transcription factor in which the domain of the factor being limited is always bound to one domain or domains or one or more non-limiting transcription factors.

대안적으로, 전사 인자 도메인을 본 접근을 사용하여 독소와 같은 저해 부분에 결합하여, 전사 인자 도메인의 표적 DNA에의 결합이 독소로 하여금 그것의 기능을 수행하고 전사를 저해하거나 그렇지 않으면 세포 기능을 봉쇄하도록 할 수 있다. 적당한 유연성의 링커를 가진 촉진 또는 저해 전사 인자 구축물의 이용은 단백질의 혼합물을 사용하여 또는 미리선발된 개개의 링커의 제한된 배열에 의해 결합된 단백질 도메인에 의해 지금까지는 가능하지 않은 세포 기능에 대해 새로운 수준의 조절의 달성을 허용한다. 랜덤 링커 라이브러리 접근은 본원에 기재된 적절한 수단에 의해 선택될 수 있는 훨씬 더 큰 배열의 선택을 생성한다.Alternatively, binding the transcription factor domain to an inhibitory moiety such as a toxin using this approach, such that binding of the transcription factor domain to the target DNA causes the toxin to perform its function and inhibit transcription or otherwise block cellular function. You can do that. The use of a facilitating or inhibiting transcription factor construct with a linker of moderate flexibility is a new level of cellular function that has not been possible to date by using a mixture of proteins or by a protein domain bound by a limited array of individual preselected linkers. Allows to achieve the regulation of. The random linker library approach produces a much larger array of choices that can be selected by appropriate means described herein.

랜덤 링커 라이브러리 접근을 사용하여 본 발명에 따라서 제조된 이중- 또는다중-도메인 폴리펩티드는 외적으로 표적 세포에 전달될 수 있거나, 표적 세포내로 삽입되고 자율적으로 또는 세포 인자의 조절하에 기능하는 발현 시스템에서 조합될 수 있다. 이것은 폴리펩티드를 코딩하는 핵산을 선택적인 또는 비선택적인 수단에 의해 적당한 세포로 전달하는 바이러스 벡터와 같은 종래의 벡터를 사용하여 분자 생물학의 일상적인 방법을 사용하여 수행할 수 있다.Bi- or multi-domain polypeptides prepared according to the invention using a random linker library approach can be delivered externally to target cells or combined in expression systems inserted into target cells and function autonomously or under the control of cellular factors. Can be. This can be accomplished using routine methods of molecular biology using conventional vectors, such as viral vectors, which deliver nucleic acids encoding polypeptides to appropriate cells by selective or non-selective means.

본 발명의 산물은 이중 (또는 다중) 도메인 핵산 분자, 예를 들면, 환자에 투여할 목적이고, 발현될 경우, 환자내에서 면역원성 이중 도메인 단백질을 생산하는 2기능성 DNA 백신의 형태로 사용될 수 있다.The products of the present invention can be used in the form of bifunctional DNA vaccines that are intended for administration to a dual (or multi) domain nucleic acid molecule, eg, a patient, and when expressed, produce an immunogenic dual domain protein in the patient. .

다르게 지정되지 않는다면, 본 발명의 실시는 당업계의 기술 내에 있는, 분자 생물학의 종래 기술인 재조합 DNA 기술 및 면역학을 이용한다. 그러한 기술은 이전에 열거된 참고문헌에서 더욱 상세히 기재된다.Unless otherwise specified, the practice of the present invention utilizes recombinant DNA techniques and immunology, which are conventional techniques of molecular biology, which are within the skill of the art. Such techniques are described in more detail in the references listed previously.

두 개의 폴리펩티드 도메인 사이의 링커 부위 L에 집중할 때, 어떤 아미노산 치환 또는 첨가가 예를 들면, 생화학 또는 생물학적 검정에서 시험한 링커, 그러므로, 다중 도메인 폴리펩티드의 특정 특성을 최적화할 것인가를 예측하는 것은 어려울 것이다. L의 길이 및 서열은 용해도, 폴딩 및 입체구조, 프로테아제 감수성 또는 발현 수준과 같은 특성에의 충격 때문에 폴리펩티드 산물의 활성에 영향을 줄 수 있다.When concentrating on the linker region L between two polypeptide domains, it will be difficult to predict which amino acid substitutions or additions will optimize certain properties of the linker tested in biochemical or biological assays, therefore, multi-domain polypeptides, for example. . The length and sequence of L may affect the activity of the polypeptide product due to impact on properties such as solubility, folding and conformation, protease sensitivity or expression levels.

본 발명은 발현될 경우에, 길이 및 서열 양자에서 가변적인 링커 부위를 가진 폴리펩티드의 라이브러리를 초래하는 핵산 라이브러리를 생성시키는 접근을 제공한다. 본 발명은 실행자에게 그러한 라이브러리를 생성하고 분석가능하게 하여,길이 또는 서열이 변하나, 양자가 변하지는 않는 선행기술에 대해 이점을 제공한다.The present invention provides an approach for generating nucleic acid libraries that, when expressed, result in a library of polypeptides having linker sites that vary in length and sequence. The present invention allows practitioners to create and analyze such libraries, providing advantages over the prior art that vary in length or sequence, but not both.

본 발명은 목적 단백질 도메인을 코딩하는 공지의 주형 핵산의 사용에 기초한다. 첫번째 도메인을 코딩하는 핵산이 주형의 안티센스 가닥에 상보적인 상류 프라이머 및 주형 DNA 의 센스 가닥에 상보적이고 이의 5' 말단에 뉴클레오티드의 반복된 트리플렛을 함유할 수 있는 하류 프라이머를 사용하여 PCR 반응에서 증폭된다.The present invention is based on the use of known template nucleic acids encoding the protein domain of interest. The nucleic acid encoding the first domain is amplified in a PCR reaction using an upstream primer complementary to the antisense strand of the template and a downstream primer that is complementary to the sense strand of the template DNA and may contain a repeated triplet of nucleotides at its 5 'end. .

이어서 두번째 도메인에 대한 핵산이 주형 DNA의 안티센스 가닥에 상보적이고 이의 5' 말단에 반복된 뉴클레오티드 트리플렛 서열을 가질 수 있는 상류 프라이머 및 주형 DNA 의 센스 가닥에 상보적인 하류 프라이머를 사용하여 PCR 반응에서 증폭된다.The nucleic acid for the second domain is then amplified in the PCR reaction using an upstream primer that is complementary to the antisense strand of the template DNA and may have a repeated nucleotide triplet sequence at its 5 'end and a downstream primer complementary to the sense strand of the template DNA. .

길이 및 서열에서 원하는 가변성을 수득하기 위해, 첫번째 도메인에 대한 하류 프라이머 및/또는 두번째 도메인에 대한 상류 프라이머가 뉴클레오티드의 반복된 트리플렛을 포함해야 한다. 생성된 두 개의 PCR 산물은 이어서 조합되어 이중 도메인 단백질을 코딩하거나, 링커 부위에 의해 결합되는 이중 DNA 또는 이중 RNA 도메인을 포함하는 핵산을 형성한다. 이 생성된 분자 (단백질, DNA 또는 RNA)는 이어서 당업자에 공지된 다양한 수단에 의해 분석될 수 있다.In order to obtain the desired variability in length and sequence, the downstream primer for the first domain and / or the upstream primer for the second domain should comprise a repeated triplet of nucleotides. The resulting two PCR products are then combined to form a nucleic acid comprising a dual DNA or dual RNA domain that encodes a dual domain protein or is bound by a linker site. This resulting molecule (protein, DNA or RNA) can then be analyzed by various means known to those skilled in the art.

단백질 및 핵산의 구조 및 이의 도메인은 주지의 생화학적 및 생물리학적 방법, 특히 X-선 결정학 및 이차원 핵자기공명 (2D-NMR) 분광학에 의해 결정된다. 3D 구조의 조사가 거대분자의 도메인의 윤곽을 그리는데 충분할 수 있다. 예를 들면, 이합체 효소인 글루타티온 환원효소의 3D 구조는 각 서브유닛이 3개의 구조적 도메인, 즉 FAD 결합 도메인, NADP 결합 도메인 및 이합체 사이의 중간면을 형성하는 세번째 도메인으로 구성된다는 것을 설명한다. 상기 Schulz 등 참조. Ig VH및 VL도메인은 협력하여 항체의 항원 결합 주머니를 형성한다. 그리하여 이러한 구조적 도메인은 분자의 기능에 중요한 독특한 모양으로 폴딩된다.The structure of the proteins and nucleic acids and their domains are determined by known biochemical and biophysical methods, in particular X-ray crystallography and two-dimensional nuclear magnetic resonance (2D-NMR) spectroscopy. Examination of the 3D structure may be sufficient to outline the domain of the macromolecule. For example, the 3D structure of the dimeric enzyme glutathione reductase explains that each subunit consists of three structural domains: a third domain that forms the intermediate plane between the FAD binding domain, the NADP binding domain and the dimer. See Schulz et al., Supra. The Ig V H and V L domains work together to form the antigen binding pocket of the antibody. Thus, these structural domains are folded into unique shapes that are important for the function of the molecule.

도메인의 클로닝Cloning of Domains

도메인을 임의의 수많은 기술에 의해 분리할 수 있다. 일반적으로, 목적 폴리펩티드 (또는 RNA) 도메인을 코딩하는 핵산 서열을 도메인을 나타내는 올리코뉴클레오티드 프로브와의 혼성화에 기초하여 cDNA 라이브러리 또는 게놈 DNA 라이브러리로부터 클로닝한다.Domains can be separated by any number of techniques. Generally, the nucleic acid sequence encoding the polypeptide of interest (or RNA) domain is cloned from a cDNA library or genomic DNA library based on hybridization with an oligonucleotide probe representing the domain.

본 발명에 대해, 바람직한 핵산 및 단백질은 포유동물, 더욱 바람직하게는 인간 서열이다.For the present invention, preferred nucleic acids and proteins are mammalian, more preferably human sequences.

대안적으로, DNA를 DNA 또는 RNA 주형과 함께 시작하는 올리고뉴클레오티드 프라이머를 사용하여 증폭 기술에 의해 분리한다 (예를 들면, Dieffenfach 등, PCR Primer: A Laboratory Manual (1995) 참조). 이러한 프라이머를 이용하여 프로브 (약 수천 뉴클레오티드 이하의 길이의 범위임)를 구성하는 전체 길이 코딩 서열 또는 부분적인 서열을 증폭할 수 있다. 생성된 프로브 서열을 이어서 사용하여 목적 전체 길이 핵산의 포유동물 라이브러리를 스크리닝한다. 합성 올리고뉴클레오티드 프라이머의 사용 및 RNA 또는 DNA 주형의 증폭이 미국 특허 4,683,195 및4,683,202; PCR Protocols: A Guide to Methods 및 Applications (Innis 등, 저, 1990)에 기재된다. PCR 및 결합효소 연쇄반응 (LCR)과 같은 방법을 사용하여 mRNA, cDNA, 또는 게놈 또는 cDNA 라이브러리로부터 직접 도메인의 핵산 서열을 증폭할 수 있다. 축중 올리고뉴클레오티드를 고안하여 도메인을 코딩하는 공지의 서열을 사용하여 도메인 동족체를 증폭할 수 있다. 제한효소 자리를 프라이머내로 혼입할 수 있다. PCR 반응에 의해 증폭된 유전자를 아가로스 겔 상에서 정제하고 적당한 벡터내로 클로닝할 수 있다.Alternatively, DNA is isolated by amplification techniques using oligonucleotide primers starting with DNA or RNA templates (see, for example, Dieffenfach et al., PCR Primer: A Laboratory Manual (1995)). Such primers can be used to amplify the full length coding sequence or partial sequence making up the probe (which is in the range of up to about several thousand nucleotides in length). The resulting probe sequences are then used to screen mammalian libraries of desired full length nucleic acids. The use of synthetic oligonucleotide primers and the amplification of RNA or DNA templates are described in US Pat. Nos. 4,683,195 and 4,683,202; PCR Protocols: A Guide to Methods and Applications (Innis et al., 1990). Methods such as PCR and ligase chain reaction (LCR) can be used to amplify nucleic acid sequences of domains directly from mRNA, cDNA, or genome or cDNA libraries. Degenerate oligonucleotides can be designed to amplify domain homologs using known sequences encoding domains. Restriction enzyme sites can be incorporated into primers. Genes amplified by the PCR reaction can be purified on agarose gels and cloned into appropriate vectors.

발현 클로닝에서, 핵산은 프로브로서 발현된 폴리펩티드의 항원결정부에 대해 특이적인 항체 (또는 다른 결합 파트너)를 사용하여 발현 라이브러리로부터 분리된다. 다중클론 또는 단클론 항체 (mAb)가 클로닝되는 도메인의 하나 이상의 펩티드 절편으로써 면역화에 의해 생성될 수 있다.In expression cloning, the nucleic acid is isolated from the expression library using an antibody (or other binding partner) specific for the epitope of the polypeptide expressed as a probe. Polyclonal or monoclonal antibodies (mAbs) can be generated by immunization with one or more peptide fragments of the domain being cloned.

핵산 프로브, 바람직하게는 올리고뉴클레오티드를 바람직하게는 극한 혼성화 조건하에 사용하여 라이브러리를 스크리닝하여 다형성 변이체 또는 목적 폴리펩티드 도메인을 코딩하는 대립 유전자를 분리한다. 대안적으로, 항체-기재 발현 클로닝은 다형성 또는 대립 변이체 또는 종간 동족체의 클로닝을 허용한다.The library is screened using nucleic acid probes, preferably oligonucleotides, preferably under extreme hybridization conditions, to isolate alleles encoding polymorphic variants or target polypeptide domains. Alternatively, antibody-based expression cloning allows cloning of polymorphic or allelic variants or interspecies homologues.

cDNA 라이브러리의 공급원의 선택 및 mRNA로부터 이의 생산은 종래의 방법을 사용하여 행한다 (Gubler 등, Gene 25:263-269 (1983); Sambrook 등, Molecular Cloning, A Laboratory Manual (제2판 1989); Current Protocols in Molecular Biology (Ausubel 등, 저, 1994 또는 최신판).Selection of sources of cDNA libraries and their production from mRNA is done using conventional methods (Gubler et al., Gene 25: 263-269 (1983); Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd edition 1989); Current Protocols in Molecular Biology (Ausubel et al., 1994, or latest edition).

게놈 DNA 라이브러리를 제조하는 방법은 당업계에서 통상적이다. 예를 들면, 조직으로부터 추출된 DNA를 기계적으로 전단하거나 효소적으로 절단하여 구배 원심분리에 의해 분리된 약 12-20kb의 절편을 수득하고, 적당한 발현 벡터내로 삽입할 수 있다. 이러한 벡터는 시험관 내에서 파아지내로 패키징된다. 재조합 파아지를 플라크 혼성화에 의해 분석한다 (Benton 등, Science 196:180-182 (1977)). 군체 혼성화를 예를 들면, 일반적으로 [Grunstein 등, Proc. Natl, Acad. Sci. USA., 72:3961-3965 (1975)]에 기재된 바와 같이 수행한다.Methods of making genomic DNA libraries are common in the art. For example, DNA extracted from tissue can be mechanically sheared or enzymatically cleaved to yield a fragment of about 12-20 kb separated by gradient centrifugation and inserted into a suitable expression vector. Such vectors are packaged in phage in vitro. Recombinant phage is analyzed by plaque hybridization (Benton et al., Science 196: 180-182 (1977)). Colony hybridization is generally described, for example, by Grunstein et al., Proc. Natl, Acad. Sci. USA., 72: 3961-3965 (1975).

합성 올리고뉴클레오티드를 사용하여 프로브로서 사용하거나 도메인 폴리펩티드의 발현을 위해 재조합 "유전자"를 구축할 수 있다.Synthetic oligonucleotides can be used as probes or to construct recombinant “genes” for expression of domain polypeptides.

올리고뉴클레오티드를 고체상 포스포르아미다이트 트리에스테르 방법 (Beaucage 등, Tetrahedron Letts. 22:1859-1862 (1981))을 사용하고, 자동화 합성기 (Van Devanter 등, Nucleic Acids Res. 12:6159-6168 (1984))를 사용하여 화학적으로 합성할 수 있다. 올리고뉴클레오티드의 정제는 전형적으로 천연 아크릴아미드 겔 전기영동 또는 음이온 교환 HPLC에 의한다 (Pearson 등, J. Chrom. 255:137-149 (1983)).Oligonucleotides were subjected to a solid phase phosphoramidite triester method (Beaucage et al., Tetrahedron Letts. 22: 1859-1862 (1981)), and automated synthesizers (Van Devanter et al., Nucleic Acids Res. 12: 6159-6168 (1984). Can be synthesized chemically. Purification of oligonucleotides is typically by natural acrylamide gel electrophoresis or anion exchange HPLC (Pearson et al., J. Chrom. 255: 137-149 (1983)).

클로닝된 유전자 및 합성 올리고뉴클레오티드의 서열은 유전자의 센스 및 안티센스 가닥을 나타내는, 통상 40-120bp 길이의 일련의 중첩되는 올리고뉴클레오티드를 사용하여 사슬 종결 방법 (Wallace 등, Gene 16:21-26 (1981))과 같은 종래의 방법에 의해 확인할 수 있다.The sequence of cloned genes and synthetic oligonucleotides is a chain termination method using a series of overlapping oligonucleotides, typically 40-120 bp in length, that represents the sense and antisense strands of the gene (Wallace et al., Gene 16: 21-26 (1981)). Can be confirmed by a conventional method such as

원하는 폴리펩티드를 코딩하는 핵산은 전형적으로 핵산의 복제 및/또는 발현을 위해 원핵세포 또는 진핵세포의 형질전환 또는 트랜스펙션전에 중간체 벡터내로클로닝된다. 이러한 중간체 벡터, 예를 들면, 플라스미드 또는 셔틀 벡터가 원핵세포에서 전형적으로 사용하기 위한 것이다.Nucleic acids encoding a desired polypeptide are typically cloned into an intermediate vector prior to the transformation or transfection of prokaryotic or eukaryotic cells for replication and / or expression of the nucleic acid. Such intermediate vectors, such as plasmids or shuttle vectors, are typically for use in prokaryotic cells.

링커 부위Linker site

링커 L의 기능은 첫번째 및 두번째 폴리펩티드 (또는 핵산) 도메인을 하나의 단일 거대분자로서 결합하고, 두 개의 도메인을 정확하게 폴딩되도록 허용하고, 이로인해 기능성 분자로 조립시키는 것이다. 아미노산 링커 L이 VH및 VL도메인을 결합하는 scFv 구현예에서, L은 1 내지 약 50 잔기로 길이가 다양할 수 있다. 개개의 L은 바람직하게는 1 내지 약 20개의 상이한 아미노산으로 구성되고, 축중 트리플렛 염기의 각각의 반복된 패턴은 1 내지 약 12개의 상이한 아미노산을 코딩한다. 최적의 링커는 생성된 scFv (a)가 가용성이고 (b)가 항원에 결합하거나 (c)가 관련된 면역 반응을 유도하기 위해 항원으로서 작용할 수 있도록 하기 위해 VH및 VL도메인의 정확한 폴딩에 현저히 기여한다.The function of the linker L is to bind the first and second polypeptide (or nucleic acid) domains as one single macromolecule and allow the two domains to be accurately folded and thereby assemble into functional molecules. In scFv embodiments, wherein the amino acid linker L binds the V H and V L domains, L may vary in length from 1 to about 50 residues. Each L preferably consists of 1 to about 20 different amino acids and each repeated pattern of degenerate triplet bases encodes 1 to about 12 different amino acids. The optimal linker is markedly correct for the correct folding of the V H and V L domains so that the resulting scFv (a) is soluble and (b) binds to the antigen or (c) can act as an antigen to elicit an associated immune response. Contribute.

하나의 구현예에서 링커는 사용될 경우에 최종 산물이 만날 것으로 기대되는 프로테아제에 의한 절단에 저항성일 것이다.In one embodiment the linker will, if used, be resistant to cleavage by proteases that the final product is expected to meet.

대조적으로, 링커는 또한 하나 또는 몇 개의 도메인을 적당한 시기에 서로로부터 분리하기 위해 사용될 수 있는 프로테아제에 대한 절단가능한 자리로서 이용되는 아미노산 또는 짧은 서열을 혼입하기 위해 고안될 수 있다.In contrast, linkers can also be designed to incorporate amino acids or short sequences that are used as cleavable sites for proteases that can be used to separate one or several domains from each other at appropriate times.

부가적으로, 링커는 링커의 특성에 기초하여 융합 도메인의 발현 산물의 부차적인 정제를 촉진시키는 또다른 분자 또는 매트릭스에 친화력을 제공하도록 고안될 수 있다. 하나의 예는 금속 (예를 들면, 니켈) 친화성 칼럼상의 정제를 허용하는 히스티딘 (His) 태그의 혼입을 포함한다. 다른 친화성 태그는 당업계에 주지되어 있고, 여기에서 기재될 필요가 없다.In addition, the linker may be designed to provide affinity to another molecule or matrix that facilitates secondary purification of the expression product of the fusion domain based on the nature of the linker. One example includes the incorporation of a histidine (His) tag that allows purification on a metal (eg nickel) affinity column. Other affinity tags are well known in the art and need not be described herein.

결합된 두 개의 도메인에 의존하여, L의 서열 및 길이는 폭넓게 다양할 수 있다.Depending on the two domains bound, the sequence and length of L can vary widely.

링커는 두 개의 폴리펩티드 도메인을 융합시키고, 동시에, 하나 (또는 양자)의 도메인의 특성에 기초한 정제 및 특성규명을 촉진시키는 그들의 능력에 기초하여 선택될 수 있다. 예는 선택된 단백질 도메인 및 글루타티온 S-트란스퍼라제 (GST)의 융합을 포함하는데, 이는 이어서 글루타티온-아가로스의 친화성 매트릭스상에서 정제될 수 있다 (Smith 등 (1988) Gene, 67:31-40). Smith 등에 의해 사용된 링커는 이후에 아미노산 서열 PGISGGGGG [서열 번호 1]을 가진 "글리신 킹커 (glycine kinker)"로서 공지된 글리신 풍부 연속을 도입하도록 Guan 등 (Anal. Biochem. 192:262-267 (1991))에 의해 변형되었다. 본 발명의 범주내에 있는 그러한 링커는, 이의 융합 파트너 (그 예로, 단백질 티로신 포스파타아제)로부터 GST의 절단을 촉진시킨다.Linkers can be selected based on their ability to fuse two polypeptide domains and, at the same time, facilitate purification and characterization based on the properties of one (or both) domains. Examples include the fusion of a selected protein domain and glutathione S-transferase (GST), which can then be purified on an affinity matrix of glutathione-agarose (Smith et al. (1988) Gene, 67: 31-40). . The linker used by Smith et al. Introduced Guan et al. (Anal. Biochem. 192: 262-267 (1991) to introduce a glycine rich continuation known as “glycine kinker” having the amino acid sequence PGISGGGGG [SEQ ID NO: 1]. Transformed by)). Such linkers within the scope of the present invention promote the cleavage of GST from its fusion partner (eg, protein tyrosine phosphatase).

3 종류의 융합 단백질을 제조하는 벡터가 당업계에 주지되어 있고, 많은 것이 시판된다. 예를 들면, New Engl and Biolabs 는 벡터내로 클로닝된 도메인 서열에 융합될 수 있는 말토오스 결합 단백질을 코딩하는 벡터인 pMAL-p2를 제공한다. pMAL-p2에서, 말토오스 결합 단백질 및 첨가된 도메인 사이의 링커의 아미노산 서열은 NNNNNNNNNNLGIEGR [서열 번호 2]이다. 아스파라긴의 연속은 아밀로오스친화성 칼럼상의 융합 단백질의 정제를 촉진시킨다.Vectors for producing three kinds of fusion proteins are well known in the art and many are commercially available. For example, New Engl and Biolabs provide pMAL-p2, a vector encoding a maltose binding protein that can be fused to a domain sequence cloned into a vector. In pMAL-p2, the amino acid sequence of the linker between the maltose binding protein and the added domain is NNNNNNNNNNLGIEGR [SEQ ID NO: 2]. Continuation of asparagine facilitates the purification of fusion proteins on amylose affinity columns.

Ig VH및 VL도메인을 scFv에 결합시키기 위해 사용된 링커는 통상적으로 (Gly4-Ser)3으로서 표시되는, 15개의 아미노산 서열 GGGGSGGGGSGGGGS (서열 번호 3)이다. scFv 제조를 위한 수 많은 다른 링커가 [Lawrence 등, FEBS Letters, 425:479-484 (1998), Solar 등, Protein Engineering, 8:717-723 (1995), Alfthan 등, Protein Engineering, 8:725-731 (1995), Newton 등, Biochemistry, 35:545-553 (1996), Ager 등, Human Gene Therapy, 7:2157-2164 (1996) 및 Koo 등, Applied and Environmental Microbiology, 64:2490-2496 (1998)]에 기재되어 있다. 본 발명의 라이브러리 접근은 상기에 주목된 것을 넘어서서 많은 유용한 링커를 생성할 것이다.The linker used to bind the Ig V H and V L domains to the scFv is the 15 amino acid sequence GGGGSGGGGSGGGGS (SEQ ID NO: 3), commonly designated as (Gly 4 -Ser) 3 . Numerous other linkers for scFv production are described in Lawrence et al., FEBS Letters, 425: 479-484 (1998), Solar et al., Protein Engineering, 8: 717-723 (1995), Alfthan et al., Protein Engineering, 8: 725-. 731 (1995), Newton et al., Biochemistry, 35: 545-553 (1996), Ager et al., Human Gene Therapy, 7: 2157-2164 (1996) and Koo et al., Applied and Environmental Microbiology, 64: 2490-2496 (1998) )]. The library approach of the present invention will generate many useful linkers beyond those noted above.

링커 부위에서 가변적인 길이 및 서열의 생성Generation of variable lengths and sequences at the linker site

바람직한 접근은 각 라이브러리 구성원이 L에서 모든 다른 것과 다른 두 개의 도메인 폴리펩티드 (D1-L-D2)의 라이브러리를 생성하는 것이다. 즉, 도메인 사이의 랜덤은 그들을 결합하는 링커에서 발견된다. 이것은 특히 식물 발현 시스템에서, D1-L-D2산물의 배열의 생성을 허용하는데, 이로부터 최적으로 폴딩되고, 최적으로 기능하는 산물중에서 하나, 또는 배열을 선택할 수 있다.The preferred approach is for each library member to produce a library of two domain polypeptides (D 1 -LD 2 ) that are different from all others in L. That is, randomness between domains is found in the linkers that bind them. This allows the generation of an array of D 1 -LD 2 products, particularly in plant expression systems, from which one can choose, or arrangement, among the products that are optimally folded and function optimally.

이 접근에서, 두 개의 클로닝된 도메인을 증폭하고 가변적인 길이 및 가변적인 서열의 링커를 PCR과 같은 증폭 방법을 사용하여 그들 사이에 도입한다. 이것을 달성하기 위해, 상류 도메인에 대한 하류 프라이머의 3' 말단 및 하류 도메인에대한 상류 프라이머의 3' 말단의 부분은 증폭되는 각각의 도메인 서열에 상보적이다. ("하류" 및 "상류"는 링커에 상대적이다). 그러나, 상류 도메인에 대한 하류 프라이머의 5' 말단 및/또는 하류 도메인에 대한 상류 프라이머의 5' 말단의 부분은 증폭되는 각각의 도메인에 상보적이지 않다. "비주형화된 서열(nontemplated sequence)"로 일컬어지는, 프라이머의 상기 비상보적인 절편은 핵산 수준에서, 상류를 하류 도메인에 결합하는 축중 트리플렛 염기의 반복된 패턴을 포함한다.In this approach, two cloned domains are amplified and linkers of variable length and variable sequences are introduced between them using amplification methods such as PCR. To achieve this, the 3 'end of the downstream primer for the upstream domain and the part of the 3' end of the upstream primer for the downstream domain are complementary to each domain sequence to be amplified. (“Downstream” and “upstream” are relative to the linker). However, the 5 'end of the downstream primer for the upstream domain and / or the portion of the 5' end of the upstream primer for the downstream domain is not complementary to each domain to be amplified. Said non-complementary fragment of a primer, referred to as a "nontemplated sequence", comprises a repeated pattern of degenerate triplet bases that bind upstream to the downstream domain at the nucleic acid level.

D1및 D2를 증폭시키는 상류 및 하류 프라이머를 DNA 중합효소 및 증폭을 위한 다른 필요한 반응물과 혼합한다. 상세한 것은 상기 Innis 등을 참조. 반응 혼합물을 DNA 이중가닥을 녹이고, 주형에 프라이머의 어닐링(annealing) 및 PCR 산물의 중합을 허용하기 위해 복수 온도 사이클을 시킨다. 첫번째 사이클 동안 DNA 중합효소는 온도가 이중가닥을 녹이기 위해 충분히 올라갈 때까지 "첫번째 가닥" 합성을 수행한다. 그 후에, 온도가 어닐링 온도로 낮추어질 때, 프라이머는 첫번째 가닥 DNA에 어닐링할 것이다. DNA 중합효소는 이어서 사이클의 중합 온도에 도착할 때 "두번째 가닥"을 만들 것이다. 이것은 증폭되는 도메인의 대수 축적을 초래한다. 비주형화된 서열 때문에, 증폭된 도메인을 코딩하는 DNA는 상류 산물의 3' 말단 및 하류 산물의 5' 말단에서 축중 염기의 반복된 패턴을 가진 분자의 모집단 (라이브러리)를 형성할 것이다.The upstream and downstream primers that amplify D 1 and D 2 are mixed with DNA polymerase and other necessary reactants for amplification. See Innis et al., Supra, for details. The reaction mixture is subjected to multiple temperature cycles to dissolve DNA double strands and to allow annealing of primers and polymerization of PCR products in the template. During the first cycle, the DNA polymerase performs "first strand" synthesis until the temperature rises enough to melt the double strands. Thereafter, when the temperature is lowered to the annealing temperature, the primer will anneal to the first strand DNA. The DNA polymerase will then make a "second strand" when it reaches the polymerization temperature of the cycle. This results in logarithmic accumulation of domains to be amplified. Because of the unformatted sequence, the DNA encoding the amplified domain will form a population (library) of molecules with repeated patterns of degenerate bases at the 3 'end of the upstream product and the 5' end of the downstream product.

증폭 쌍의 비주형화된 서열에서 축중 트리플렛 염기의 반복된 패턴의 특성때문에, PCR 산물은 L 부위의 서열 및 길이에서 다양하다. 길이 다양성은 염기쌍 오부합(mismatching)으로 인하여 중심부에 버블(bubble) 또는 루프(loop)를 가진 프라이머의 L 부위의 이중가닥 형성에 가장 기인하는 것 같다. 3'-5' 핵산 말단가수분해효소 및 5'-3' 중합효소 활성은 프라이머 서열의 길이를 삭제하거나 연장하는데 이용된다.Due to the nature of the repeated pattern of degenerate triplet bases in the unformatted sequence of the amplification pair, the PCR products vary in sequence and length of the L site. Length diversity seems most likely to be due to double strand formation of the L region of the primer with a bubble or loop in the center due to base pair mismatching. The 3'-5 'nucleic acid terminal hydrolase and the 5'-3' polymerase activity are used to delete or extend the length of the primer sequence.

L 서열을 줄이기 위해, 반복된 트리플렛을 함유한 프라이머가 이미 L 서열을 함입한 상보적인 가닥에 어닐링된다. 축중 프라이머를 이어서 어닐링하여 쌍을 이루지 못한 염기의 자리에 버블을 가진 이중가닥을 형성하고, 하기에 도식화한 것처럼(밑줄로 표시), 쌍을 이루지 못한 3' 연장 (오버행(overhang))을 남길 수 있다.To reduce the L sequence, primers containing repeated triplets are annealed to complementary strands that have already incorporated the L sequence. Degenerate primers can then be annealed to form double strands with bubbles in place of unpaired bases, leaving unpaired 3 'extensions (overhangs), as illustrated below (underlined). have.

버블 및 3' 오버행을 가진 이중가닥Double strand with bubble and 3 'overhang

(상단 서열은 서열 번호 50이고; 하단 서열은 서열 번호 51이다)(Top sequence is SEQ ID NO: 50; bottom sequence is SEQ ID NO: 51)

3'-5' 핵산 말단가수분해효소 활성을 가진 PFU 또는 Vent와 같은 효소는 이중가닥의 어닐링된 부분에 도착할 때까지 상보적인 가닥의 5' 방향으로 3' 연장을 분해할 것이다. 이러한 방식으로 하나 이상의 트리플렛 반복서열이 PCR 산물로부터 제거될 것이고, 이로인해 하나 (또는 그 이상) 아미노산에 의해 펩티드 링커 L을 줄일 것이다.Enzymes such as PFU or Vent with 3'-5 'nucleic acid hydrolase activity will degrade the 3' extension in the 5 'direction of the complementary strand until it reaches the annealed portion of the double strand. In this way one or more triplet repeats will be removed from the PCR product, thereby reducing the peptide linker L by one (or more) amino acids.

링커 L의 연장에 대해, "상단" 가닥이 5' 연장을 가진 이중가닥이 하기와 같이 형성되기 위해 상보적인 가닥에 어닐링할 수 있다:For the extension of linker L, double strands with 5 'extension of "top" strand can be annealed to the complementary strand to form as follows:

버블 및 5' 오버행을 가진 이중가닥Double strand with bubble and 5 'overhang

(상단 서열은 서열 번호 50이고; 하단 서열은 서열 번호 51이다)(Top sequence is SEQ ID NO: 50; bottom sequence is SEQ ID NO: 51)

증폭 반응에 존재하는 중합효소, 예를 들면, Taq 중합효소는 하나 이상의 트리플렛 반복 코돈에 의해 PCR 산물을 연장시킬 수 있다. 이의 5'-3' 중합효소 활성때문에, 효소는 5' 연장을 채울 것이고, 이로인해 하나 이상의 반복된 트리플렛에 의해 링커 부위를 늘릴 것이다. 이것은 하나 이상의 아미노산에 의해 펩티드 링커를 연장할 것이다. PCR에서 중합효소가 3'-5' 핵산 말단가수분해효소 활성이 부족하고, 3'-5' 핵산 말단가수분해효소 활성을 가진 효소가 존재하지 않는다면, 트리플렛 뉴클레오티드의 연장이 단지 일어나야 한다.Polymerases present in the amplification reaction, such as Taq polymerase, can extend the PCR product by one or more triplet repeat codons. Because of its 5'-3 'polymerase activity, the enzyme will fill the 5' extension, thereby increasing the linker site by one or more repeated triplets. This will extend the peptide linker by one or more amino acids. If the polymerase lacks 3'-5 'nucleic acid end hydrolase activity in the PCR and no enzyme with 3'-5' nucleic acid end hydrolase activity exists, the extension of the triplet nucleotides should only occur.

버블 형성을 증진시키기 위해, 하나 이상의 프라이머의 5' 말단은 미끄러짐을 막기 위해 두 개 이상의 말단 코돈에서 동일한 축중 염기를 포함해야 한다. 즉, 도메인을 증폭하기 위해 사용된 프라이머의 하나 이상의 5' 말단에서 동일한 서열 (예를 들면, 5'rst-rst3', 또는 5'ysa-ysa3' 등)을 가진 두 개의 트리플렛 반복서열이 있음에 틀림없다.To enhance bubble formation, the 5 'end of one or more primers should contain the same degenerate base in two or more end codons to prevent slipping. That is, there are two triplet repeats with the same sequence (eg 5'rst-rst3 ', or 5'ysa-ysa3', etc.) at one or more 5 'ends of the primer used to amplify the domain. It must be.

융합된 핵산이 단백질을 발현하는 것이라면(scFv의 경우에서처럼) 중요한, 올바른 해독틀을 유지하기 위해, 몇 가지 규칙이 L 부위가 될, 프라이머의 비주형화된 부위의 축중을 고안할 때 관찰되어야 한다. 축중 트리플렛 반복서열은 하기 규칙 중의 하나를 준수해야 한다:In order to maintain the correct translation frame, which is important if the fused nucleic acid is to express a protein (as in the case of scFv), several rules should be observed when devising decondensation of the non-templated site of the primer, which will be the L site. The triplet repeating sequence must conform to one of the following rules:

(a) 트리플렛의 1 위치는 2 위치와 동일한 염기를 포함할 수 없거나;(a) the one position of the triplet may not comprise the same base as the two positions;

(b) 트리플렛의 2 위치는 3 위치와 동일한 염기를 포함할 수 없거나;(b) the two positions of the triplet may not comprise the same base as the three positions;

(c) 트리플렛의 1 위치는 3 위치와 동일한 염기를 포함할 수 없다.(c) The 1 position of the triplet may not contain the same base as the 3 position.

예를 들면, 반복된 트리플렛 rst 및 ysa은 상기 규칙을 준수할 것이다. 염기의 하기 조합은 그러한 규칙을 수행한다: rst=agt, act, ggt, gct 및 ysa=tca, tga, cca, cga. 다른 축중 서열은 또한 이러한 규칙을 수행할 수 있다. 예를 들면, str (gta, gtg, cta, 또는 ctg 일 수 있는) 또는 ayr (aca, acg, ata 또는 atg 일 수 있는)이 반복된 트리플렛로서 이용될 수 있다.For example, repeated triplets rst and ysa will obey the above rules. The following combination of bases fulfills such rules: rst = agt, act, ggt, gct and ysa = tca, tga, cca, cga. Other degenerate sequences may also follow this rule. For example, str (which can be gta, gtg, cta, or ctg) or ayr (which can be aca, acg, ata or atg) can be used as a repeated triplet.

본 발명에 유용한 또다른 축중 트리플렛 서열은 11개의 상이한 아미노산을 코딩하는 임의의 12개의 상이한 코돈일 수 있는 nvt이다. 축중 트리플렛 nws는 12개의 상이한 아미노산을 코딩하는 16개의 상이한 코돈 중 임의의 것일 수 있다. 축중 트리플렛 csy는 ccc(순응하지 않는) 일 수 있기 때문에, 이러한 규칙에 따르지 않는다. 유사하게, 동일한 염기의 트리플렛 (즉, ccc, aaa, ggg, 또는 ttt)일 수 있는 임의의 다른 축중 서열은 이러한 규칙에 따르지 않아, 반복된 트리플렛로서 배제될 것이다.Another degenerate triplet sequence useful in the present invention is nvt, which may be any 12 different codons encoding 11 different amino acids. The degenerate triplet nws can be any of 16 different codons that encode 12 different amino acids. The detrimental triplet csy does not obey this rule because it may be ccc (not compliant). Similarly, any other degenerate sequence that may be a triplet of the same base (ie, ccc, aaa, ggg, or ttt) will not be in accordance with this rule and will be excluded as a repeated triplet.

제한효소 인식서열을 프라이머내로 혼입하여, 예를 들면 서로에 관하여 IgV 부위 도메인 (또는 임의의 다른 폴리펩티드 도메인)의 클로닝 및 배향을 촉진시킬 수 있다. 예를 들면, 제한효소 자리는 D1도메인에 대한 상류 증폭 프라이머의 5' 말단에 혼입될 수 있는데, 이는 절편이 서브클로닝되는 제한된 벡터의 5' 말단에상류 도메인의 5' 말단의 결합을 촉진시킬 것이다. 마찬가지로 동일하거나 상이한 제한효소 자리가 하류 도메인에 대한 하류 증폭 프라이머의 5' 말단에 혼입될 수 있다. 생성된 PCR 산물은 이어서 PCR 산물에 상보적인 서열(들)을 가진 벡터내로 부차적인 결합을 위해 각각의 핵산 엔도뉴클레아제로써 절단될 수 있다. 대안적으로 동일한 제한효소 자리가 사용될 수 있고, 서브클론을 DNA 서열결정, PCR, 제한효소 절단 등에 의해 스크리닝하여 올바른 배향이 이루어졌는지를 결정할 수 있다.Restriction recognition sequences can be incorporated into primers to facilitate cloning and orientation of the IgV site domain (or any other polypeptide domain), for example with respect to each other. For example, the restriction site may be incorporated at the 5 'end of the upstream amplification primer to the D 1 domain, which will facilitate binding of the 5' end of the upstream domain to the 5 'end of the restricted vector in which the fragment is subcloned. will be. Likewise identical or different restriction enzyme sites can be incorporated at the 5 'end of the downstream amplification primer for the downstream domain. The resulting PCR product can then be cleaved with each nucleic acid endonuclease for secondary binding into a vector having sequence (s) complementary to the PCR product. Alternatively, the same restriction enzyme site can be used and subclones can be screened by DNA sequencing, PCR, restriction enzyme digestion, or the like to determine if the correct orientation is achieved.

PCR 산물의 라이게이션Ligation of PCR Products

상류 PCR 산물의 3' 말단 및 하류 PCR 산물의 5' 말단을 서로 라이게이션할 수 있다 (Methods in Enzymology: Guide to Molecular Cloning Techniques, Berger 등, 저, 1987). 이러한 산물의 양 말단이 평활 말단이라면, 5' 포스페이트가 T4 폴리뉴클레오티드 키나아제에 의해 인산화될 수 있고, 반응 산물을 T4 DNA 리가아제로써 라이게이션할 수 있다. PCR 산물의 말단이 상보적이거나 제한효소 절단을 통해 상보적으로 될 수 있다면, 이어서 상보적인 말단이 T4 DNA 리가아제로써 라이게이션되는 점착성 말단 라이게이션을 수행할 수 있다. 마찬가지로 상류 PCR 산물의 5' 말단 및/또는 하류 PCR 산물의 3' 말단을 평활 말단 또는 점착성 말단 라이게이션에서 제한된 벡터에 라이게이션할 수 있다.The 3 'end of the upstream PCR product and the 5' end of the downstream PCR product can be ligated with each other (Methods in Enzymology: Guide to Molecular Cloning Techniques, Berger et al., 1987). If both ends of the product are blunt ends, the 5 'phosphate can be phosphorylated by T4 polynucleotide kinase and the reaction product can be ligated with T4 DNA ligase. If the ends of the PCR product can be complementary or complementary through restriction enzyme cleavage, then sticky end ligation can be performed in which the complementary ends are ligated with T4 DNA ligase. Likewise, the 5 'end of the upstream PCR product and / or the 3' end of the downstream PCR product can be ligated to a restricted vector at either the blunt end or the sticky end ligation.

scFv와 같은, 이중 도메인 분자의 라이브러리의 링커 부위의 서열 및 길이 복합성을 증가시키기 위해, D1및 D2의 다중 PCR 반응 산물을 조합할 수 있다. 예를 들면, 축중 트리플렛이 6회 반복되는 D1및/또는 D2의 PCR 반응 산물을 축중 트리플렛이 9회 반복되는 D1및/또는 D2의 PCR 반응 산물과 조합하여 적당한 벡터내로 라이게이션할 수 있다. PCR 산물의 조합은 L 부위에서 관찰되는 길이 및 서열 복합성을 증가시킬 것이다.Multiple PCR reaction products of D 1 and D 2 can be combined to increase the sequence and length complexity of the linker region of a library of dual domain molecules, such as scFv. For example, a PCR reaction product of D 1 and / or D 2 in which the degenerate triplet is repeated six times may be combined with a PCR reaction product of D 1 and / or D 2 in which the degenerate triplet is repeated nine times and ligated into a suitable vector. Can be. Combination of PCR products will increase the length and sequence complexity observed at the L site.

라이브러리 또는 "라이브러리"에서 수득된 링커 서열의 복합성은 도메인을 증폭하기 위해 사용된 PCR 증폭 프라이머의 비주형 서열내로 고안된 상이한 아미노산의 수에 의해 미리 결정될 수 있다. 비주형화된 서열에 의해 코딩된 아미노산의 수는 각 코돈 트리플렛내로 고안된 뉴클레오티드 축중에 의해 결정된다.The complexity of the linker sequences obtained from the library or "library" can be predetermined by the number of different amino acids designed into the non-template sequence of the PCR amplification primers used to amplify the domains. The number of amino acids encoded by the untyped sequence is determined by the nucleotide deprivation designed into each codon triplet.

하나의 예에서, 라이브러리내에 존재하는 링커 서열의 원하는 복합성은 두 개의 아미노산, Ala 및 Gly에 제한된다. 상기 링커 조합에 바람직한 비주형화된 서열은 gct가 Ala를 코딩하고, ggt가 Gly를 코딩하는, 코돈 트리플렛 gst (=gct 및 ggt)의 반복서열일 것이다.In one example, the desired complexity of the linker sequence present in the library is limited to two amino acids, Ala and Gly. Preferred unformatted sequences for the linker combination would be repetitions of the codon triplet gst (= gct and ggt), where gct encodes Ala and ggt encodes Gly.

두번째 예에서, 라이브러리내에 존재하는 링커 서열의 원하는 복합성은 6개의 아미노산, Ala, Gly, Ser, Thr, Lys 및 Asp로 증가된다. 상기 링커 조합에 바람직한 비주형화된 서열은 하기 아미노산이 코딩되는, 코돈 트리플렛 rvt (=gct, ggt, agt, act, aat 및 gat)의 반복서열일 것이다:In a second example, the desired complexity of the linker sequence present in the library is increased to six amino acids, Ala, Gly, Ser, Thr, Lys and Asp. Preferred unformatted sequences for the linker combination will be repetitions of the codon triplet rvt (= gct, ggt, agt, act, aat and gat), encoded with the following amino acids:

gct-Ala ggt-Gly aat-Lysgct-Ala ggt-Gly aat-Lys

agt-Ser act-Thr gat-Aspagt-Ser act-Thr gat-Asp

동일한 접근을 사용하여 높은 수, 예를 들면 3- 또는 4개의 도메인 폴리펩티드의 다중 도메인 폴리펩티드를 생성한다. 이것은 모든 상이한 도메인을 포함할수 있거나 하나 이상의 도메인이 반복될 수 있다. 그러한 분자의 일반적인 구조는 하기와 같다 (D가 폴리펩티드 도메인이고, L이 링커이다):The same approach is used to generate multi-domain polypeptides of high numbers, such as three or four domain polypeptides. This may include all different domains or one or more domains may be repeated. The general structure of such a molecule is as follows (D is a polypeptide domain and L is a linker):

D1-L1-D1 D 1 -L 1 -D 1 D1-L1-D2 D 1 -L 1 -D 2 D1-L1-D2-L2-D2 D 1 -L 1 -D 2 -L 2 -D 2 D1-L1-D2-L2-D3 D 1 -L 1 -D 2 -L 2 -D 3 D1-L1-D2-L2-D3-L3-D4 D 1 -L 1 -D 2 -L 2 -D 3 -L 3 -D 4 Etc

다양한 도메인 사이의 상이한 링커는 복합성에서 다양할 수 있다. 이것은 이의 의도된 목적에 대해 각 도메인의 올바른 기능에 대해 요구되는 구조적 관계에 의존할 것이다. 그리하여, 단일 이디오타입(idiotype) 또는 단일 리간드 결합 특이성을 가진 scFv 분자의 예에서, 두 개의 도메인은 올바른 결합을 위해 협력하여 기능해야 한다. 세번째 도메인 D3가 독소인 원하는 결합 특이성의 scFv인 3-도메인 폴리펩티드에서, 독소 도메인 및 두 개의 결합 도메인 중의 하나 사이의 "상호작용"에 구속이 거의 없다. 그 경우에, scFv 도메인 중의 하나 및 독소 도메인 사이의 링커 L2가 상이할 수 있고, scFv 폴리펩티드를 함유하는 두 개의 도메인 (D1및 D2) 사이의 링커 L1보다 덜 복잡할 수 있다.Different linkers between the various domains may vary in complexity. This will depend on the structural relationships required for the correct functioning of each domain for its intended purpose. Thus, in the example of a scFv molecule with a single idiotype or single ligand binding specificity, the two domains must function in concert for correct binding. In a 3-domain polypeptide which is an scFv of the desired binding specificity where the third domain D 3 is a toxin, there is little constraint on the "interaction" between the toxin domain and one of the two binding domains. In that case, the linker L 2 between one of the scFv domains and the toxin domain may be different and less complex than the linker L 1 between the two domains (D 1 and D 2 ) containing the scFv polypeptide.

다중 도메인 폴리펩티드의 라이브러리에서, 도메인의 모든 쌍이 필수적으로 본 발명에 따른 링커에 의해 결합되는 것은 아니다. 그리하여, 두 개 이상의 인접한 도메인이 (1) 이들의 천연 상태(이들이 천연적으로 이중- 또는 다중-도메인 단백질로부터 유래된다면)로 일어날 수 있는 바와 같이 직접 결합되거나 (2) 당업계에 주지된 "종래의" 링커에 의해 결합될 수 있다. 여전히 또다른 구현예에서, 본 발명을 사용하여 확인되고, 랜덤 링커 라이브러리의 구성원으로서 유도된 특정 링커가 다중 도메인 폴리펩티드에서 두 개의 제시된 도메인 사이의 작위 링커로서 사용하기 위한 바람직한 선택일 수 있다. 이러한 다양한 구현예가 하기(비제한적인) 방식으로 묘사될 수 있다:In a library of multidomain polypeptides, not all pairs of domains are necessarily bound by the linker according to the invention. Thus, two or more contiguous domains can be directly bonded as can occur in (1) their natural state (if they are naturally derived from a double- or multi-domain protein) or (2) as known in the art. May be bound by a "linker". In yet another embodiment, certain linkers identified using the present invention and derived as members of a random linker library may be a preferred choice for use as a pseudo linker between two presented domains in a multi-domain polypeptide. These various embodiments can be depicted in the following (non-limiting) manner:

D1-L1-D2-D3 D 1 -L 1 -D 2 -D 3

D1-L1-D2-D3-D4 D 1 -L 1 -D 2 -D 3 -D 4

D1-L1-D2-D3-D4-D5 D 1 -L 1 -D 2 -D 3 -D 4 -D 5

D1-L1-D2-D3-D4-L2-D5 D 1 -L 1 -D 2 -D 3 -D 4 -L 2 -D 5

등.Etc.

상기 제시된 4개의 식에서, L1및 L2는 본 발명의 라이브러리의 랜덤 링커 구성원을 나타낸다. L을 결합하지 않고 인접한 도메인에 결합된 제시된 모든 다른 도메인은 (1) 상기에 기재된 바와 같이 서로 직접 결합될 수 있고; (2) 당업계에 공지된 종래의 링커에 의해 결합될 수 있거나; (3) 본 발명에 따른 랜덤 링커 라이브러리에서 발견되나 특정 위치에서 예정되고, 작위의, 변하지 않는 링커로서 삽입된 고정된 링커에 의해 결합될 수 있다. 요약 섹션에서 주목한 바와 같이, 본원의 상기 다중-도메인 폴리펩티드는 약 20개의 도메인 이하로 구성될 수 있다. 예를 들면, 10-도메인 폴리펩티드는 본 발명에 따라 대략 1 내지 9개의 링커 L을 가질 수 있다. 10 도메인 폴리펩티드가 두 개의 도메인을 결합하는 하나의 그러한 링커 L1상에 가진다면, 다른 8개의 도메인은 상호간에 직접 결합하거나 종래의 또는 다른 예정된 링커군에 의해 결합된다.In the four formulas presented above, L 1 and L 2 represent random linker members of the library of the present invention. All other presented domains bound to adjacent domains without binding L may (1) be directly bonded to each other as described above; (2) can be bound by conventional linkers known in the art; (3) found in the random linker library according to the present invention but may be bound by fixed linkers inserted as predetermined, unchanging linkers at specific locations. As noted in the Summary section, the multi-domain polypeptide herein may consist of up to about 20 domains. For example, a 10-domain polypeptide may have approximately 1 to 9 linkers L in accordance with the present invention. If a ten domain polypeptide has on one such linker L 1 that binds two domains, the other eight domains are directly bound to each other or by conventional or other predetermined linker groups.

이중-도메인 폴리펩티드의 생산을 위한 발현 시스템Expression system for the production of dual-domain polypeptides

각각 이의 이점 및 단점을 가진, 박테리아, 곤충, 포유동물 및 식물에서 수 많은 주지의 이종 발현 시스템이 상기에 논의되었다. 본 발명은 특히 식물 발현에 적합하다.Numerous well-known heterologous expression systems in bacteria, insects, mammals and plants, each having their advantages and disadvantages, have been discussed above. The present invention is particularly suitable for plant expression.

수 많은 형질전환 방법은 식물에서 이종 단백질의 발현을 허용한다. 일부는 목적 단백질을 코딩하는 DNA 서열을 식물 게놈내로 삽입함으로써 트랜스제닉(transgenic) 식물의 구축을 포함한다. 트랜스제닉 식물을 수득하기 위해 필요한 시간은 종양 백신 폴리펩티드와 같은 특정 구현예의 신속한 생산에 대해 너무 길 수 있다. 매력적인 해결책은(그러한 안정한 형질전환에 대한 대안) 발현 벡터로써 식물의 일시적인 트랜스펙션이다. 바이러스 벡터를 숙주세포내로 도입하고, 발현을 증폭시키기 위해 감염에 의해 전이시키기가 더 용이하여 바람직하지만, 그러한 일시적인 발현을 할 수 있는 바이러스 및 비바이러스 벡터 양자가 유용하다 (Kumagai, M.H. 등 (1993) Proc. Nat. Acad. Sci. USA 90:427-430; Shivprasad, S. 등 (1999) Virology 255:312-323; Turpen, T.H. 등 (1995) BioTechnology 13:53-57; Pietrzak, M. 등 (1986) Nucleic Acid Re. 14:5857-5868; Hooykaas, P.J.J. 및 Schilperoort, R.A. (1992) Plant Mol. Biol. 19:15-38).Many transformation methods allow for the expression of heterologous proteins in plants. Some involve the construction of transgenic plants by inserting the DNA sequence encoding the protein of interest into the plant genome. The time required to obtain transgenic plants may be too long for rapid production of certain embodiments, such as tumor vaccine polypeptides. An attractive solution (an alternative to such stable transformation) is the transient transfection of plants with expression vectors. Although viral vectors are easier to transfer into the host cell and transferred by infection to amplify expression, both viral and nonviral vectors capable of such transient expression are useful (Kumagai, MH et al. (1993) Proc. Nat. Acad. Sci. USA 90: 427-430; Shivprasad, S. et al. (1999) Virology 255: 312-323; Turpen, TH et al. (1995) BioTechnology 13: 53-57; Pietrzak, M. et al. 1986) Nucleic Acid Re. 14: 5857-5868; Hooykaas, PJJ and Schilperoort, RA (1992) Plant Mol. Biol. 19: 15-38).

본 발명의 키메라 유전자, 벡터 및 재조합 바이러스 핵산을 분자 생물학의 종래 기술을 사용하여 구축한다. 식물에서 이종 단백질을 발현하는 바이러스 벡터는 바람직하게는 (1) 천연 바이러스 서브게놈 프로모터 (Dawson, W.O. 등 (1988)Phytopathology 78:783-789 및 French, R. 등 (1986) Science 231:1294-1297), (2) 바람직하게는, 하나 이상의 비천연적인 바이러스 서브게놈 프로모터 (Donson, J. 등 (1991) Proc. Nat. Acad. Sci. USA 88:7204-7208 및 Kumagai, M.H. 등 (1993) Proc. Nat. Acad. Sci. USA 90:427-430), (3) 바이러스 코트 단백질을 코딩하는 서열 (천연 또는 비천연), 및 (4) 원하는 이종 단백질을 코딩하는 핵산을 포함한다. 단지 비천연 서브게놈 프로모터를 포함하는 벡터가 또한 사용될 수 있다. 본 벡터에 대한 최소 요건은 복제효소 유전자 및 천연 또는 비천연 서브게놈 프로모터에 의해 유도되어, 발현되는 코딩 서열의 조합이다. 바이러스 복제효소는 바이러스 게놈으로부터 발현되고, 염색체외에서 복제하도록 요구된다. 서브게놈 프로모터는 외래 또는 이종 코딩 서열 및 바이러스 복제를 촉진시키는 바이러스 단백질, 이동에 필요한 단백질, 캡시드 단백질 등을 코딩하는 것과 같은 임의의 다른 유용한 유전자의 발현을 허용한다. 바이러스 벡터는 코딩된 바이러스 코트 단백질에 의해 피낭이 형성되어, 재조합 식물 바이러스를 수득한다. 이 재조합 바이러스는 적당한 숙주 식물을 감염시키는데 사용된다. 재조합 바이러스 핵산은 그리하여 복제되고, 숙주 식물에서 전신성으로 확산되고 RNA 및 단백질을 합성하여 식물에서 원하는 이종 단백질을 수득한다. 게다가, 재조합 벡터는 상기 코딩 서열의 원하는 발현에 충분한 기간 동안 비바이러스 이종 코딩 서열 및 조절 원소를 유지한다.Chimeric genes, vectors, and recombinant viral nucleic acids of the invention are constructed using conventional techniques in molecular biology. Viral vectors expressing heterologous proteins in plants are preferably (1) native viral subgenomic promoters (Dawson, WO et al. (1988) Phytopathology 78: 783-789 and French, R. et al. (1986) Science 231: 1294-1297 ), (2) preferably at least one non-natural viral subgenomic promoter (Donson, J. et al. (1991) Proc. Nat. Acad. Sci. USA 88: 7204-7208 and Kumagai, MH et al. (1993) Proc Nat. Acad. Sci. USA 90: 427-430), (3) a sequence encoding a viral coat protein (natural or unnatural), and (4) a nucleic acid encoding a desired heterologous protein. Vectors containing only non-natural subgenomic promoters can also be used. The minimum requirement for this vector is a combination of a transcriptase gene and a coding sequence derived and expressed by a natural or unnatural subgenomic promoter. Viral replication enzymes are expressed from the viral genome and are required to replicate extrachromosomes. Subgenomic promoters allow the expression of foreign or heterologous coding sequences and any other useful genes such as those encoding viral proteins that facilitate viral replication, proteins necessary for migration, capsid proteins, and the like. Viral vectors are formed by encapsulation by the encoded viral coat protein, yielding a recombinant plant virus. This recombinant virus is used to infect a suitable host plant. Recombinant viral nucleic acids are thus replicated, diffuse systemically in the host plant and synthesize RNA and protein to obtain the desired heterologous protein in the plant. In addition, the recombinant vector retains the nonviral heterologous coding sequence and regulatory elements for a period sufficient for the desired expression of the coding sequence.

토바모바이러스 군의 구성원이 바람직하지만, 재조합 바이러스 핵산이 임의의 적당한 식물 바이러스의 핵산으로부터 제조된다. 천연 바이러스 핵산 서열은 바이러스 핵산의 필요한 생물학적 기능 (복제, 전사 등)이 보존된다면, 공지의 기술에 의해 변형될 수 있다. 주목한 바와 같이, 하나 이상의 서브게놈 프로모터가 삽입될 수 있다. 이것은 감염되거나 트랜스펙션된 식물 숙주에서 인접한 이종 코딩 서열의 발현을 조절할 수 있다. 천연 바이러스 코트 단백질은 이 RNA에 의해 코딩될 수 있거나, 이 코트 단백질은 삭제될 수 있고, 상이한 식물 바이러스 ("비천연" 또는 "외래 바이러스")의 코트 단백질을 코딩하는 서열에 의해 대체될 수 있다. 외래 바이러스 코트 단백질 유전자는 천연 또는 비천연 서브게놈 프로모터의 조절하에 위치할 수 있다. 외래 바이러스 코트 단백질은 기능성, 감염성 비리온을 생산하기 위해 재조합 바이러스 핵산의 피낭을 형성할 수 있어야 한다. 바람직한 구현예에서, 코트 단백질은 천연 바이러스 프로모터 또는 비천연 서브게놈 프로모터에 인접하여 위치한 핵산 서열에 의해 코딩되는 외래 바이러스 코트 단백질이다. 바람직하게는, 이종 단백질, 예를 들면, 식물에서 발현되는 면역원성 폴리펩티드를 코딩하는 핵산은 천연 서브게놈 프로모터의 조절하에 위치한다.Members of the tobamovirus family are preferred, but recombinant viral nucleic acids are prepared from nucleic acids of any suitable plant virus. Natural viral nucleic acid sequences can be modified by known techniques as long as the required biological function (replication, transcription, etc.) of the viral nucleic acid is preserved. As noted, one or more subgenomic promoters may be inserted. This can regulate the expression of adjacent heterologous coding sequences in infected or transfected plant hosts. The native viral coat protein may be encoded by this RNA or this coat protein may be deleted and replaced by a sequence encoding a coat protein of a different plant virus ("non-natural" or "foreign virus"). . The foreign viral coat protein gene may be located under the control of a natural or unnatural subgenomic promoter. The foreign viral coat protein must be able to form the cysts of the recombinant viral nucleic acid to produce a functional, infectious virion. In a preferred embodiment, the coat protein is a foreign viral coat protein encoded by a nucleic acid sequence located adjacent to a native viral promoter or a non-natural subgenomic promoter. Preferably, the nucleic acid encoding a heterologous protein, eg, an immunogenic polypeptide expressed in a plant, is located under the control of a native subgenomic promoter.

이종 단백질 (면역원성 scFv 폴리펩티드로서 예시된)의 정확한 폴딩 및 풍부한 생산에 부분적으로 관련된, 본 발명의 중요한 원소는 새로이 합성된 단백질을 식물 분비 경로로 이끄는 신호 펩티드 서열의 존재이다. 신호 펩티드를 코딩하는 서열을 폴리펩티드를 코딩하는 DNA와 틀에 맞추어 융합하여 발현시킨다. 바람직한 신호 펩티드는 α-아밀라아제 신호 펩티드이다.Partly involved in the accurate folding and abundant production of heterologous proteins (exemplified as immunogenic scFv polypeptides), an important element of the present invention is the presence of signal peptide sequences that lead newly synthesized proteins to the plant secretory pathway. The sequence encoding the signal peptide is fused and expressed in conformity with the DNA encoding the polypeptide. Preferred signal peptides are α-amylase signal peptides.

또다른 구현예에서, 이동 단백질은 식물내에서 바이러스의 신속한 세포간 이동을 증진시키고, 전체 식물의 전신성 감염을 촉진시키기 때문에, 이동 단백질을 코딩하는 서열이 또한 바이러스 벡터내로 혼입된다.In another embodiment, the sequence encoding the mobile protein is also incorporated into the viral vector because the mobile protein promotes rapid intercellular migration of the virus in the plant and promotes systemic infection of the entire plant.

RNA 또는 DNA 식물 바이러스가 발현 벡터로서 사용하기에 적합하다. DNA 또는 RNA는 단일 또는 이중 가닥일 수 있다. 단일 가닥 RNA 바이러스는, 음성 가닥 RNA 바이러스가 또한 의도되지만, 바람직하게는 양성 가닥을 가질 수 있다.RNA or DNA plant viruses are suitable for use as expression vectors. DNA or RNA may be single or double stranded. Single stranded RNA viruses are also intended to be negative stranded RNA viruses, but may preferably have a positive strand.

재조합 바이러스 핵산은 적당한 생산 세포에서 클로닝함으로써 제조된다. 종래의 클로닝 기술(DNA 및 RNA 양자에 대해)이 주지되어 있다. 예를 들면, DNA 바이러스의 경우에, 생산 세포와 양립하는 복제원점이 바이러스 DNA로 스플라이싱될 수 있다.Recombinant viral nucleic acids are prepared by cloning in appropriate production cells. Conventional cloning techniques (for both DNA and RNA) are well known. For example, in the case of DNA viruses, the origin of replication compatible with the producing cell can be spliced into viral DNA.

RNA 바이러스의 경우에, 바이러스 게놈의 전체 길이 DNA 카피(copy)가 종래의 절차에 의해 먼저 제조된다: 예를 들면, 바이러스 RNA는 역전사되어 DNA의 서브게놈 조각을 형성하고, 이는 DNA 중합효소를 사용하여 이중 가닥이 된다. DNA를 적당한 벡터내로 클로닝하고, 생산 세포내에 삽입한다. DNA 조각의 지도를 작성하고, 적당한 서열로 조합하여 바이러스 게놈의 전체 길이 DNA 카피를 생산한다. 코트 단백질 유전자가 있거나 없는 서브게놈 프로모터 서열 (DNA)을 본원에 기재한 바와 같이 바이러스 핵산의 비필수 자리에 삽입한다. 비필수 자리는 바이러스 핵산 또는 조립된 식물 비리온의 생물학적 특성에 영향을 주지 않는 자리이다. 바이러스 RNA에 상보적인 cDNA를, (재조합)바이러스 RNA가 생산 세포에서 생산되도록 적당한 프로모터의 조절하에 위치한다. RNA가 감염성을 위해 캡핑되어야 한다면, 이것은 종래의 기술에 의해 행해진다.In the case of RNA viruses, full length DNA copies of the viral genome are first made by conventional procedures: For example, viral RNA is reverse transcribed to form subgenomic fragments of DNA, which uses DNA polymerase. Double stranded. The DNA is cloned into a suitable vector and inserted into the producing cell. The DNA fragments are mapped and combined into appropriate sequences to produce full length DNA copies of the viral genome. Subgenomic promoter sequences (DNAs) with or without coat protein genes are inserted in non-essential positions of the viral nucleic acid as described herein. Non-essential sites are those that do not affect the biological properties of viral nucleic acids or assembled plant virions. CDNA complementary to viral RNA is placed under the control of an appropriate promoter such that (recombinant) viral RNA is produced in the producing cell. If RNA must be capped for infectivity, this is done by conventional techniques.

적당한 프로모터의 예는 lac, lacuv5, trp, tac,lp1 및 ompF 프로모터를 포함한다. 바람직한 프로모터는 파아지 SP6 프로모터 또는 T7RNA 중합효소 프로모터이다.Examples of suitable promoters include the lac, lacuv5, trp, tac, lp1 and ompF promoters. Preferred promoters are the phage SP6 promoter or the T 7 RNA polymerase promoter.

생산 세포는 원핵세포 또는 진핵세포일 수 있고, 대장균, 효모, 식물 및 포유동물 세포를 포함한다.Producing cells can be prokaryotic or eukaryotic and include E. coli, yeast, plant and mammalian cells.

수많은 식물 바이러스 벡터가 유용하고, 당업계에 주지되어 있다 (Grierson, D. 등 (1984) Plant Molecular Biology, Blackie, London, pp. 126-146; Gluzman, Y. 등 (1988) Communications in Molecular Biology: Viral Vectors, Cold Spring Harbor Laboratory, New York, pp. 172-189). 바이러스 벡터 및 이의 조절 원소는 명백히 감염되는 식물 숙주와 양립해야 한다. 적당한 바이러스는Numerous plant viral vectors are useful and well known in the art (Grierson, D. et al. (1984) Plant Molecular Biology, Blackie, London, pp. 126-146; Gluzman, Y. et al. (1988) Communications in Molecular Biology: Viral Vectors, Cold Spring Harbor Laboratory, New York, pp. 172-189). Viral vectors and their regulatory elements must be compatible with the plant host that is apparently infected. Suitable viruses

(a) TMV, 담배 마일드 녹색 모자이크 바이러스 (TMGMV), 코우피 모자이크 바이러스 (CMV), 알팔파 모자이크 바이러스 (AMV), 오이 녹색 얼룩 모자이크 바이러스 - 수박계통 (CGMMV-W), 귀리 모자이크 바이러스 (OMV)와 같은 담배 모자이크 바이러스 (TMV) 군 유래의 것,(a) TMV, Tobacco Mild Green Mosaic Virus (TMGMV), Kofi Mosaic Virus (CMV), Alfalfa Mosaic Virus (AMV), Cucumber Green Stain Mosaic Virus-Watermelon System (CGMMV-W), Oat Mosaic Virus (OMV) and From the same tobacco mosaic virus (TMV) family,

(b) BMV, 잠두 얼룩 바이러스 및 코우피 황화 얼룩 바이러스와 같은, 브롬 모자이크 바이러스(BMV) 군 유래의 바이러스,(b) viruses from the Bromine mosaic virus (BMV) family, such as BMV, apocalypse stain virus and kofi sulfide stain virus,

(c) 벼 괴사 바이러스 (RNV)와 같은 다른 바이러스, 토마토 금색 모자이크 바이러스 (TGMV), 카사바 잠재 바이러스 (CLV) 및 옥수수 줄무늬 바이러스 (MSV)와 같은 제미니바이러스이다.(c) other viruses such as rice necrosis virus (RNV), geminiviruses such as tomato gold mosaic virus (TGMV), cassava latent virus (CLV) and corn streaked virus (MSV).

바람직한 숙주는 니코티아나 벤타미아나 (Nicotiana benthamiana)이다. 용어가 여기에 사용될 때, 숙주 식물은 전체 식물, 식물 세포, 잎, 뿌리, 줄기, 꽃 또는 임의의 다른 식물 부분일 수 있다. 식물 또는 식물 세포를 종래의 방법을 사용하여 키운다.Preferred hosts are Nicotiana benthamiana. As the term is used herein, a host plant can be an entire plant, plant cell, leaf, root, stem, flower or any other plant part. Plants or plant cells are grown using conventional methods.

니코티아나 벤타미아나를 사용하기 위한 바람직한 바이러스 벡터는 TMV 및 토마토 모자이크 바이러스 (ToMV)의 하이브리드 융합을 포함한 발현 벡터 pBSG1250 (pTTOSA 유도체)이다 (Kumagai, MH. 등 (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683). 삽입된 서브게놈 프로모터는 TMV 핵산과 양립해야 하고, 감염된 식물에서 올바르게 위치한 (예를 들면, 인접한) 핵산 서열을 전사할 수 있어야 한다. 코트 단백질은 바이러스로 하여금 식물 숙주를 전신성으로 감염시키도록 해야 한다. TMV 코트 단백질은 니코티아나 벤타미아나의 전신성 감염을 증진시킨다.A preferred viral vector for using Nicotiana Ventamiana is the expression vector pBSG1250 (pTTOSA derivative) including hybrid fusion of TMV and tomato mosaic virus (ToMV) (Kumagai, MH. Et al. (1995) Proc. Natl. Acad. Sci. USA 92: 1679-1683). The inserted subgenomic promoter must be compatible with the TMV nucleic acid and be capable of transcribing correctly positioned (eg adjacent) nucleic acid sequences in the infected plant. The coat protein should allow the virus to infect the plant host systemically. TMV coat protein enhances systemic infection of Nicotiana Ventamiana.

재조합 바이러스 벡터로 식물의 감염은 감염을 증진시키는 것으로 공지된 수 많은 종래의 기술을 이용하여 수행된다. 이것은 이에 제한되지 않고, 잎 손상, 요액 중의 손상 및 고속 물 분무를 포함한다. 바이러스 벡터는 손으로, 기계적으로 또는 단일 잎의 고압 분무에 의해 전달될 수 있다.Infection of plants with recombinant viral vectors is carried out using a number of conventional techniques known to enhance infection. This is not so limited and includes leaf damage, damage in urine and high speed water spray. The viral vector can be delivered by hand, mechanically or by high pressure spraying of a single leaf.

단백질/폴리펩티드 산물의 정제Purification of Proteins / Polypeptide Products

식물에서 생산된 이중 도메인 폴리펩티드는 바람직하게는 표준 기술을 사용하여 회수되고 정제된다. 적당한 방법은 식물 또는 생산되는 식물 부분을 액체 질소에서 균질화 또는 분쇄후, 단백질의 추출을 포함한다. 어떤 이유로 식물을 균질화하는 것이 바람직하지 않다면, 폴리펩티드는 진공 침윤 및 원심분리에 이은 멸균 여과에 의해 제거될 수 있다. 단백질 수득율은 임의의 수용가능한 기술에 의해 평가될 수 있다. 폴리펩티드는 크기, 등전점 또는 다른 물리적 특성에 따라 정제된다. 식물 재료로부터 총 분비된 단백질의 분리에 이어, 추가의 정제 단계가 수행될 수 있다. 면역침전 또는, 바람직하게는, 원하는 폴리펩티드의 항원결정부에 대해 특이적인 항체를 가진, 친화성 크로마토그래피와 같은 면역학적 방법이 사용될 수 있다.Dual domain polypeptides produced in plants are preferably recovered and purified using standard techniques. Suitable methods include homogenizing or pulverizing the plant or plant part produced in liquid nitrogen, followed by extraction of the protein. If for some reason it is not desirable to homogenize the plant, the polypeptide can be removed by vacuum infiltration and centrifugation followed by sterile filtration. Protein yield can be assessed by any acceptable technique. Polypeptides are purified according to size, isoelectric point or other physical property. Following the separation of total secreted protein from the plant material, additional purification steps can be performed. Immunological methods such as immunoprecipitation or, preferably, affinity chromatography with antibodies specific for the epitope of the desired polypeptide can be used.

정제를 용이하게 하기 위해, 바이러스 벡터는, 정제 단계에서 이용될 수 있는 친화성 태그를 가진 단백질이 생산되도록 조작될 수 있다. 그러한 태그의 예는 금속 (예를 들면, 니켈) 친화성 칼럼상에서 정제를 허용하는 히스티딘 (His) 태그이다. 다른 친화성 태그가 당업계에 주지되어 있고, 여기에서 기재될 필요가 없다.To facilitate purification, the viral vector can be engineered to produce a protein with an affinity tag that can be used in the purification step. An example of such a tag is a histidine (His) tag that allows purification on a metal (eg nickel) affinity column. Other affinity tags are well known in the art and need not be described herein.

다양한 고체 지지체가 본 방법에서 사용될 수 있다: 아가로오스, Sephadex, 셀룰로오스 또는 다른 중합체의 유도체. 예를 들면, Sepharose에 고정된 포도상구균 단백질 A (또는 단백질 L)를 이용하여, 먼저 용액 중의 특이 항체로써 단백질을 인큐베이션하고, 혼합물을 항체-표적 단백질 복합체를 결합하고 유지하는 고정된 단백질 A로써 접촉시킴으로써 표적 단백질을 분리할 수 있다.Various solid supports can be used in the process: agarose , Sephadex , Derivatives of cellulose or other polymers. For example, Sepharose Using Staphylococcus Protein A (or Protein L) immobilized on, isolate the target protein by first incubating the protein with a specific antibody in solution and contacting the mixture with immobilized Protein A, which binds and maintains the antibody-target protein complex. can do.

임의의 이전 또는 다른 주지의 방법을 사용하여, 폴리펩티드를 식물 재료로부터 약 50% 초과, 더욱 바람직하게는 약 75% 초과, 더더욱 바람직하게는 약 95% 초과의 순도로 정제한다.Using any previous or other known method, the polypeptide is purified from the plant material to a purity of greater than about 50%, more preferably greater than about 75%, even more preferably greater than about 95%.

정확한 폴딩의 측정Accurate Folding Measurement

면역원성과 같은 특정 특성에 결정적인 것이 용액 중의 단백질의 입체구조이다. 용액 중의 이중 도메인 폴리펩티드의 관련된 항원결정부의 입체구조는 바람직하게는 천연 단백질의 동일한 항원결정부를 닮거나 흉내낸다. 식물에서 폴리펩티드를 생산하고, 이들을 식물의 분비 경로로 이동시킴으로써, 본 발명은 폴리펩티드가 가용성의, 최적으로 폴딩된 형태로 분비되는 것을 확신한다.Critical to certain properties, such as immunogenicity, is the conformation of the proteins in solution. The conformation of the relevant epitope of the dual domain polypeptide in solution preferably resembles or mimics the same epitope of the native protein. By producing polypeptides in plants and transferring them into the plant's secretory pathway, the present invention ensures that the polypeptides are secreted in soluble, optimally folded form.

정확한 폴딩을 결정할 때 사용되는 바람직한 시약은 특이 항체, 바람직하게는 mAb인데, 이는 (1) 사슬이 정확하게 폴딩될 때 폴리펩티드의 항원결정부에 결합하나, (2) 항원결정부가 변성될 경우에는 결합하지 않는다. 항체는 돗 블롯 (dot blot), 웨스턴 블롯, 면역침전, 방사면역분석시험(RIA), 및 효소 결합된 면역흡수시험 (ELISA)와 같은 효소 면역분석시험 (EIA)을 포함한, 임의의 수 많은 면역학적 분석시험에 사용된다. 바람직한 구현예에서, 그러한 항체가 유용할 경우, 웨스턴 블롯 및 ELISA를 사용하여 식물에서 생산된 이중 도메인 (또는 다중 도메인) 폴리펩티드의 관련된 부분의 정확한 폴딩을 확인한다.The preferred reagent used in determining the correct folding is a specific antibody, preferably mAb, which (1) binds to the epitope of the polypeptide when the chain is correctly folded, but (2) does not bind if the epitope is denatured. Do not. Antibodies can be any number of immunizations, including dot blots, western blots, immunoprecipitations, radioimmunoassays (RIAs), and enzyme immunoassays (EIAs) such as enzyme-linked immunosorbent assays (ELISAs). It is used for chemical assays. In a preferred embodiment, when such antibodies are useful, Western blots and ELISAs are used to confirm the precise folding of the relevant portions of the dual domain (or multi domain) polypeptides produced in plants.

이중 도메인 분자의 부가적인 분석Additional Analysis of Dual Domain Molecules

이중 도메인 폴리펩티드를 코딩하는 DNA의 서열을 결정하여, 이의 코딩된 산물의 연역된 아미노산 서열을 수득할 수 있다. DNA 분자를 서브클로닝했다면, 이를 제한효소를 이용하여 벡터로부터 잘라내어 생성된 절편을 아가로오스 겔 상에서 분석하여 절편의 크기를 결정한다.The sequence of the DNA encoding the dual domain polypeptide can be determined to obtain the deduced amino acid sequence of its encoded product. Once the DNA molecules have been subcloned, they are cut out of the vector using restriction enzymes and the resulting fragments are analyzed on an agarose gel to determine the size of the fragments.

DNA 분자 자체가 목적 결합 도메인을 가진다면, 서브클로닝된 DNA 분자 (또는 절단된 절편)를 관련된 리간드에의 결합에 대해 검정할 수 있다.If the DNA molecule itself has the desired binding domain, the subcloned DNA molecule (or truncated fragment) can be assayed for binding to the associated ligand.

DNA 분자가 이중 도메인 리보자임을 코딩한다면, 이어서 리보자임 RNA를 벡터로부터 전사할 수 있다. 코딩 서열을 제한효소로 절단하고 RNA 중합효소(리보뉴클레오티드 및 다른 필요한 인자와 더불어)와 접촉시켜 이중 도메인 RNA를 전사한다. 리보자임을 이어서 정량하고 이의 효소 활성을 적당한 검정시험에서 측정할 수 있다.If the DNA molecule encodes a dual domain ribozyme, then the ribozyme RNA can be transcribed from the vector. The coding sequence is cleaved with restriction enzymes and contacted with RNA polymerase (along with ribonucleotides and other necessary factors) to transcribe double domain RNA. Ribozyme can then be quantified and its enzymatic activity can be determined in a suitable assay.

이중 도메인 폴리펩티드를 코딩하는 DNA 분자를 먼저 발현한다. 원한다면, DNA를 부가적으로 변형하여 적당한 숙주 또는 시험관내 전사/번역 시스템에서 발현을 허용하거나 최적화할 서열을 포함할 수 있다. 일단 발현되면, 폴리펩티드를 이어서 적당한 기능성 검정시험, 예를 들면, (도메인 중의 하나의) 효소 활성의 측정을 한다. 또한 이중 도메인 폴리펩티드의 양 및 물리적 특성을 예를 들면, SDS-PAGE 에 의해 결정할 수 있다. 전기 영동 분리에 이어 단백질의 직접적인 염색 또는 웨스턴 블롯팅 및 도메인 중의 하나의 항원결정부를 인지하는 적당한 항체로써 프로빙할 수 있다. 도메인이 결합 활성을 가지거나, 상기에 기재된 다른 기능을 가진다면, 이것은 또한 종래의 수단에 의해 측정될 수 있다.The DNA molecule encoding the dual domain polypeptide is first expressed. If desired, the DNA may be further modified to include sequences that will allow or optimize expression in a suitable host or in vitro transcription / translation system. Once expressed, the polypeptide is then subjected to a suitable functional assay, eg, to measure the enzyme activity (of one of the domains). The amount and physical properties of the dual domain polypeptide can also be determined by, for example, SDS-PAGE. Electrophoretic separation can be followed by probing with a suitable antibody that recognizes the direct staining or western blotting of proteins and epitopes of one of the domains. If the domain has binding activity or has the other functions described above, this can also be measured by conventional means.

지금 일반적으로 본 발명을 기재할 때, 설명을 통해 제공되나, 다르게 지정되지 않는다면, 본 발명을 제한할 의도가 아닌, 하기 실시예를 참고하여 동일한 것이 더욱 쉽게 이해될 것이다.When describing the present invention in general, the same will be more readily understood by reference to the following examples, which are provided by way of explanation but, unless otherwise indicated, are not intended to limit the invention.

하기 실시예는 단지 설명을 위한 것이지, 제한하기 위해 제공되는 것이 아니다. 당업자는 본질적으로 유사한 결과를 수득하기 위해 변화되거나 변형될 수 있는 다양한 중요하지 않은 변수를 쉽게 인식할 것이다.The following examples are for illustrative purposes only and are not intended to be limiting. Those skilled in the art will readily recognize various non-critical variables that can be changed or modified to obtain essentially similar results.

실시예 1Example 1

CJ B 세포 림프종의 이디오타입을 포함하는 단일 환자(CJ)로부터 자가/종양 항원의 생성Generation of Autologous / Tumor Antigens from a Single Patient (CJ) Including the Idiotype of CJ B Cell Lymphoma

"CJ"로 표시된 면역원성 scFv 단백질은 인간 림프종 환자 (머리글자 CJ를 가진)로부터 유도되고, 이의 링커로서 (Gly4Ser)3를 가졌다. 환자 CJ는 초기의 수동적인 면역치료 시도에서 치료되었다. CJ 분자(구체적으로, 이의 V 부위 항원결정부 또는 항원결정부들)는 7D11이라 불리는 항-Id mAb에 의해 인지된다. 또한 (McCormick, AA 등, Proc. Natl. Acad. Sci. USA (1999) 96:703-708)을 참조.The immunogenic scFv protein labeled "CJ" was derived from a human lymphoma patient (with the initial CJ) and had as its linker (Gly 4 Ser) 3 . Patient CJ was treated in an initial passive immunotherapy attempt. The CJ molecule (specifically its V site epitope or epitopes) is recognized by an anti-Id mAb called 7D11. See also McCormick, AA et al., Proc. Natl. Acad. Sci. USA (1999) 96: 703-708.

인간 scFv 폴리펩티드를 제조하기 위한 초기 시도에서, CJ V 부위 유전자의 서열을 결정하고, (Gly3Ser)4링커를 사용하여 박테리아 발현 시스템내로 클로닝하였다. PEL-b 리더를 사용하여 주변세포질로 이동하였지만, CJ scFv 단백질을 불용성 봉입체내에 격리하였다. 마우스를 박테리아에서 제조된 CJ scFv 로써 면역화할 경우에, 어떤 항-CJ 항-이디오타입 항체 반응도 검출되지 않았다.In an initial attempt to prepare human scFv polypeptides, the sequence of the CJ V region gene was determined and cloned into the bacterial expression system using (Gly 3 Ser) 4 linker. The PEL-b leader was used to transfer to the periplasm, but the CJ scFv protein was sequestered in insoluble inclusion bodies. When mice were immunized with bacteria prepared CJ scFv, no anti-CJ anti-idiotype antibody response was detected.

CJ의 유도체는 본원에 기재된 일반적인 PCR 기재 클로닝 전략의 부분인 랜덤 길이 및 서열을 가진 링커를 생산함으로써 생성되었다.Derivatives of CJ were generated by producing linkers with random lengths and sequences that are part of the general PCR based cloning strategy described herein.

4개의 반응을 수행하였다. 첫번째 및 두번째에서, VH도메인을 코딩하는 서열을 하기 합성 올리고뉴클레오티드를 사용하여 환자 CJ의 림프종 세포의 cDNA 클론으로부터 증폭하였다:Four reactions were performed. In the first and second, the sequences encoding the V H domains were amplified from cDNA clones of lymphoma cells of patient CJ using the following synthetic oligonucleotides:

VHF: 5' gtggca tgcagg ttc aac tgg tgg agt ctg (서열 번호 4)V H F: 5 'gtg gca tgc agg ttc aac tgg tgg agt ctg (SEQ ID NO: 4)

VHR: 5'(asy) x tga gga gac ggt gac cag ggt tc (서열 번호 5)V H R: 5 ' (asy) x tga gga gac ggt gac cag ggt tc (SEQ ID NO: 5)

SphI 제한효소 자리를 밑줄 그었다. 제1 반응에서 x는 6이었고:SphI restriction enzyme sites are underlined. In the first reaction x was 6:

asy asy asy asy asy asy tga gga gac ggt gac cag ggt tc (서열 번호 6)asy asy asy asy asy asy tga gga gac ggt gac cag ggt tc (SEQ ID NO: 6)

제2 반응에서, x는 9 였고, 서열 번호 7을 제공하였다:In a second reaction, x was 9 and provided SEQ ID NO: 7:

asy asy asy asy asy asy asy asy asy tga gga gac ggt gac cag ggt tcasy asy asy asy asy asy asy asy asy tga gga gac ggt gac cag ggt tc

(일반적으로, 트리플렛(x)의 수는 1 내지 약 50 일 수 있다).(Generally, the number of triplets x may be from 1 to about 50).

세번째 및 네번째 PCR 반응에서, VL도메인을 코딩하는 서열을 하기 합성 뉴클레오티드를 사용하여 CJ의 cDNA 클론으로부터 증폭하였다:In the third and fourth PCR reactions, the sequences encoding the V L domains were amplified from the cDNA clones of CJ using the following synthetic nucleotides:

VLF: 5'(rst) z gac att cag atg acc cag tct cct tc (서열 번호 8)V L F: 5 ' (rst) z gac att cag atg acc cag tct cct tc (SEQ ID NO: 8)

VLR: 5' caccct aggcta tcg ttt gat cag tac ctt ggt ccc ctg (서열 번호 9)V L R: 5 'cac cct agg cta tcg ttt gat cag tac ctt ggt ccc ctg (SEQ ID NO: 9)

AvrII 자리를 밑줄 그었다. 제3 반응에서 z는 6이었고:AvrII is underlined. Z was 6 in the third reaction:

rst rst rst rst rst rst gac att cag atg acc cag tct cct tc (서열 번호 10)rst rst rst rst rst rst gac att cag atg acc cag tct cct tc (SEQ ID NO: 10)

제4 반응에서, z는 9 였다 (서열 번호 11):In a fourth reaction, z was 9 (SEQ ID NO: 11):

rst rst rst rst rst rst rst rst rst gac att cag atg acc cag tct cct tc (일반적으로, 트리플렛 (z)의 수는 1 내지 약 50 일 수 있다).rst rst rst rst rst rst rst rst rst gac att cag atg acc cag tct cct tc (generally, the number of triplets (z) may be from 1 to about 50).

증폭에 이어, 4개의 PCR 산물을 정제하고, VH사슬 PCR 산물에 대해 SphI 및VL사슬 PCR 산물에 대해 AvrII로써 절단하였다. 절단산물을 아가로오스 겔 상에서 전기영동하고, 4개의 절단된 PCR 절편을 정제하고, 라이게이션하고, 제한효소 SphI 및 AvrII로써 절단된 TMV 및 ToMV의 하이브리드 융합(상기 Kumagai 등)을 포함한 Geneware발현 벡터 pBSG1250 (pTTOSA 유도체)에 라이게이션하였다. 특정 Geneware벡터에서, SphI 자리는 TMV U1 CP 서브게놈 프로모터 및 α아밀라아제 신호 펩티드 서열의 하류에 위치한다. 프라이머 VHF 내의 SphI 자리는 α아밀라아제 신호 펩티드 서열내의 SphI 자리와 동일한 틀이다. VH및 VLPCR 절편의 Geneware벡터에 라이게이션후에, DNA를 폴리뉴클레오티드 키나아제 및 ATP로써 처리하여 초기 PCR 산물의 평활 5' 말단에 포스페이트를 함입하였다.Following amplification, four PCR products were purified and cleaved with AvrII for SphI and V L chain PCR products for the V H chain PCR products. Geneware including hybrid fusion of TMV and ToMV digested with restriction enzymes SphI and AvrII (Kumagai et al.), Electrophores the cleavage product on an agarose gel, purifies and ligated four cleaved PCR fragments The expression vector pBSG1250 (pTTOSA derivative) was ligated. Specific Geneware In the vector, the SphI locus is located downstream of the TMV U1 CP subgenomic promoter and the α amylase signal peptide sequence. The SphI site in primer V H F is the same frame as the SphI site in the α amylase signal peptide sequence. Geneware of V H and V L PCR Fragments After ligation to the vector, the DNA was treated with polynucleotide kinase and ATP to incorporate phosphate at the smooth 5 'end of the initial PCR product.

키나아제 반응에 이어, DNA를 다시 그 자체에 라이게이션하여, 원형 플라스미드를 생성하였다. 라이게이션된 DNA를 대장균 (전기천공법을 사용하여)내로 형질전환하고, 형질전환된 세포를 50㎍/ml 암피실린을 함유한 선택 배지상에서 도말하였다. 플라스미드 DNA를 개개의 암피실린-저항성 대장균 군체로부터 정제하고, T7 RNA 중합효소를 사용하여 전사하여 개개 클론의 감염성 전사체를 생성하였다.Following the kinase reaction, the DNA was ligated back to itself to generate a circular plasmid. The ligated DNA was transformed into E. coli (using electroporation) and the transformed cells were plated on selective medium containing 50 μg / ml ampicillin. Plasmid DNA was purified from individual ampicillin-resistant E. coli colonies and transcribed using T7 RNA polymerase to generate infectious transcripts of individual clones.

전사체를 [Lindbo 등, Plant Cell 5:1749-1759 (1993)]에 본질적으로 기재된 PEG 기재 트랜스펙션 절차를 이용하여 엔.타바쿰(N. tabacum) 식물 원형질체내로 트랜스펙션하고, 트랜스펙션된 원형질체를 몇 일 동안 원형질체 배양 배지에서 인큐베이션하였다. 후자 배지는 265mM 만니톨, 1X 무라시게(Murashige) 최소 유기배지 (Gibco/BRL), 1.5mM KH2PO4, 0.2㎍/ml 2,4-디클로로페녹시아세트산, 0.1㎍/ml 키네틴, 및 5% 코코넛 물 (Sigma)을 함유했다. 원형질체를 약 106세포/ml의 밀도로 배양하였다. 플라스미드 DNA를 각 클로닝 실험으로부터 10 내지 50 이상의 개개의 군체로부터 정제하였다.Transcripts were transfected into N. tabacum plant protoplasts using the PEG based transfection procedure essentially described in Lindbo et al., Plant Cell 5: 1749-1759 (1993). Selected protoplasts were incubated in protoplast culture medium for several days. The latter medium contains 265 mM mannitol, 1 × Murashige minimum organic medium (Gibco / BRL), 1.5 mM KH 2 PO 4 , 0.2 μg / ml 2,4-dichlorophenoxyacetic acid, 0.1 μg / ml kinetin, and 5% Contains coconut water (Sigma). Protoplasts were incubated at a density of about 10 6 cells / ml. Plasmid DNA was purified from 10 to 50 or more individual colonies from each cloning experiment.

트랜스펙션 후 대략 1 내지 4일에, 단백질 시료를 개개의 원형질체 시료로부터 수집하였다. 배양 배지(200-500㎕)를 속도 진공 증발 또는 Microcon 시료 농축기에 의해 약 10배 농축하였다.Approximately 1-4 days after transfection, protein samples were collected from individual protoplast samples. Culture medium (200-500 μl) was concentrated about 10-fold by rate vacuum evaporation or Microcon sample concentrator.

상기 클로닝 전략은 식물 세포에 의한 단백질 산물의 배양 배지내로의 분비를 증진시키기 위해 고안된 신호 펩티드 서열을 함유하기 때문에, 배지 시료를 또한 SDS-PAGE에 이은 쿠마씨 블루 (Coomassie blue) 염색 및/또는 웨스턴 블롯팅에 의해 분석하였다.Since the cloning strategy contains signal peptide sequences designed to enhance secretion of protein products into plant culture by plant cells, media samples may also be subjected to SDS-PAGE followed by Coomassie blue staining and / or Western Analyzes by blotting.

출발 scFv는 표준 (Gly4-Ser)3링커 서열을 함입했고; 다른 scFv 사슬은 4개의 프라이머(상기에서, 서열 번호 4-11)로부터 생성된 클로닝된 PCR 산물을 이용한 링커 라이브러리 클로닝 실험으로부터 수득된 형질전환체로부터 랜덤로 선택되었다. 당량 세포 수로부터의 배양 상징액을 전기영동하고 (SDS-PAGE), 겔을 mAb 7D11을 이용한 웨스턴 분석을 위해 니트로셀룰로오스 막에 옮겼다 (상기 참조).Starting scFv incorporated the standard (Gly 4 -Ser) 3 linker sequence; The other scFv chains were randomly selected from transformants obtained from linker library cloning experiments using cloned PCR products generated from four primers (above, SEQ ID NOs: 4-11). Culture supernatants from equivalent cell numbers were electrophoresed (SDS-PAGE) and gels were transferred to nitrocellulose membranes for western analysis using mAb 7D11 (see above).

랜덤로 스크리닝된 일부 선택된 링커 라이브러리 구성원은 종래의 링커 (Gly4-Ser)3를 가진 CJ scFv 만큼 또는 보다 많이 CJ 단백질을 발현하고 축적하는 것으로 드러났다.Some randomly screened selected linker library members have been shown to express and accumulate CJ proteins as much or more than CJ scFv with conventional linker (Gly 4 -Ser) 3 .

특히 대량의 CJ scFv 를 발현하는 그러한 라이브러리 구성원의 DNA의 서열을 결정하였다. 결과를 표 2에 보여준다. 선택된 클론에 대한 플라스미드 DNA를 제조하고, 표준 방법에 의해 서열을 결정하였다. 다양한 CJ-유도된 구축물의 핵산 서열로부터, 개개 클론의 링커 서열을 연역하였다. 표 2는 수득된 핵산 및 아미노산 링커 서열의 일부를 열거하고, 동일하나 (Gly4Ser)3링커를 가진 단백질에 대한 상대적인 발현의 양을 의미하는 "상대적인 발현"을 나타낸다.In particular, the sequences of DNA of such library members expressing large amounts of CJ scFv were determined. The results are shown in Table 2. Plasmid DNA for the selected clones was prepared and sequence determined by standard methods. From the nucleic acid sequences of the various CJ-derived constructs, the linker sequences of the individual clones were deduced. Table 2 lists some of the nucleic acid and amino acid linker sequences obtained and shows “relative expression” meaning the amount of expression relative to the same (Gly 4 Ser) 3 protein with a linker.

DNA 서열결정은 클론이 동일한 핵산 또는 아미노산 서열을 가지고 있지 않다는 것을 드러냈으나, 오히려 아미노산 및 핵산 길이 다양성을 증명하였다. 표 2는 L이 13 내지 20 개의 아미노산인 클론의 시료를 보여준다. 이 범위는 명백히 VH및 VL코딩 서열의 PCR 증폭 동안 잘못된 프라이밍의 결과였다. 본 실험에서 사용된 올리고뉴클레오티드의 링커 코딩 서열은 저 복합성 뉴클레오티드 서열 (즉,asy x 또는rst z 및)의 연속을 포함하기 때문에, 다중 잘못된 프라이밍 사건이 일어날 것 같다. PCR 동안 존재하는 DNA 중합효소/핵산 말단가수분해효소 활성과 접합할 때, 이것은 L 서열을 함유하는 코돈의 수에서 증가 또는 감소를 야기할 수 있었다.DNA sequencing revealed that the clones did not have identical nucleic acid or amino acid sequences, but rather demonstrated amino acid and nucleic acid length diversity. Table 2 shows a sample of clones in which L is 13-20 amino acids. This range was clearly the result of false priming during PCR amplification of the V H and V L coding sequences. Since the linker coding sequence of the oligonucleotide used in this experiment involves a sequence of low complexity nucleotide sequences (ie asy x or rst z and), multiple false priming events are likely to occur. When conjugated with DNA polymerase / nucleic acid hydrolase activity present during PCR, this could cause an increase or decrease in the number of codons containing the L sequence.

생산된 CJ scFv 단백질의 양은 또한 변했다 ((Gly4Ser)3링커를 가진 CJscFv에 대해). 이것은 링커 부위의 길이 및 서열이 식물 세포 또는 식물에 의해 생산된 단백질의 양에 영향을 준다는 것을 나타낸다.The amount of CJ scFv protein produced also varied (for CJscFv with (Gly 4 Ser) 3 linker). This indicates that the length and sequence of the linker site influences the amount of protein produced by the plant cell or plant.

실시예 2Example 2

전체 식물에서 scFv 산물의 발현Expression of scFv Products in Whole Plants

실시예 1에 기재된 방법은, 전체 식물이 scFv 산물을 생산하기 위해 적당한 발현 시스템과 더불어 사용된 것을 제외하고는 반복된다.The method described in Example 1 is repeated except that the entire plant was used with an appropriate expression system to produce the scFv product.

발현된 산물을 SDS-PAGE/쿠마씨 블루 염색 및/또는 웨스턴 블롯팅에 의해 스크리닝한다. 결과는 생산된 scFv 산물의 다양한 양을 나타낸다. 최고 수득율의 클론을 백신 scFv의 생산에 대해 선발한다.Expressed products are screened by SDS-PAGE / Coomassie blue staining and / or western blotting. The results show varying amounts of scFv product produced. The highest yield clones are selected for the production of vaccine scFv.

발현 시스템Expression system

CJ 인간 림프종의 V 부위를 가진 이중 도메인 scFv 절편을 코딩하는 DNA 절편은 실시예 1에서처럼 생성되었고, 벡터 pBSG1250에 클로닝하였다. 이 벡터에서, TMV 코트 단백질 서브게놈 프로모터는 CJ 서열의 삽입 자리의 하류에 위치한다. 감염에 이어, 상기 TMV 코트 단백질 서브게놈 프로모터는 식물 세포내의 전사 개시점 ("tsp")에서 CJ RNA 합성을 시작한다. CJ 서열과 동일한 틀로 융합된, 벼 α아밀라아제 신호 펩티드 (O'Neill, SD 등 (1990) Mol. Gen. Genet. 221:235-244)는 단백질을 분비 경로로 이동시키는 31 잔기 폴리펩티드를 코딩하고 (Firek, S. 등 (1994) Transgenic Res. 3:326-331), 신호 펩티드의 C-말단 Gly 및 발현된 CJ scFv 단백질의 N-말단 Met 사이에서 부차적으로 절단된다. CJ scFv를 코딩하는 서열을 30K 이동 단백질 및 ToMV 코트 단백질 (Tcp) 유전자 사이에 도입하였다. T7 파아지 프로모터를 바이러스 cDNA 의 상류에 도입하고, 감염성 게놈 양성 가닥 RNA의 전사를 허용하였다.DNA fragments encoding dual domain scFv fragments with the V region of CJ human lymphoma were generated as in Example 1 and cloned into the vector pBSG1250. In this vector, the TMV coat protein subgenomic promoter is located downstream of the insertion site of the CJ sequence. Following infection, the TMV coat protein subgenomic promoter initiates CJ RNA synthesis at the point of transcription (“tsp”) in plant cells. The rice α amylase signal peptide (O'Neill, SD et al. (1990) Mol. Gen. Genet. 221: 235-244), fused in the same framework as the CJ sequence, encodes a 31 residue polypeptide that shifts the protein to the secretory pathway ( Firek, S. et al. (1994) Transgenic Res. 3: 326-331), cleaved between the C-terminal Gly of the signal peptide and the N-terminal Met of the expressed CJ scFv protein. The sequence encoding the CJ scFv was introduced between the 30K shift protein and the ToMV coat protein (Tcp) gene. T7 phage promoter was introduced upstream of viral cDNA and allowed transcription of infectious genome positive strand RNA.

캡핑된 감염성 RNA를 시험관 내에서 1㎍ 플라스미드로부터, Ambion 사의 T7 메세지 키트를 사용하여 제조하였다. 메세지의 합성을 겔 전기영동에 의해 정량화하였고, 대략 2㎍의 시험관 내 전사된 바이러스 RNA를 엔.벤타미아나의 하부 잎(대략 1-2cm의 크기)에 마찰과 함께 적용하였다 (Dawson, WO 등 (1986) Proc. Natl. Acad. Sci. USA 83:1832-1836). CJ scFv 단백질을 코딩하는 서브게놈 RNA의 전사는 표시된 전사 개시점에서 감염 후에 시작되었다. 높은 수준의 서브게놈 RNA 종이 바이러스에 감염된 식물 세포에서 합성되었고 (Kumagai, MH. 등 (1993) Proc. Natl. Acad. Sci. USA 90:427-430), 번역 및 CJ scFv 단백질의 부차적인 축적을 위한 주형으로서 이용되었다.Capped infectious RNA was prepared from 1 μg plasmid in vitro using a T7 message kit from Ambion. Synthesis of the message was quantified by gel electrophoresis, and approximately 2 μg of in vitro transcribed viral RNA was applied with friction to the lower leaves (approximately 1-2 cm in size) of N. ventamiana (Dawson, WO et al. 1986) Proc. Natl. Acad. Sci. USA 83: 1832-1836). Transcription of subgenomic RNA encoding the CJ scFv protein began after infection at the indicated transcriptional initiation point. High-level subgenomic RNA species were synthesized in virus-infected plant cells (Kumagai, MH. Et al. (1993) Proc. Natl. Acad. Sci. USA 90: 427-430), resulting in translation and secondary accumulation of CJ scFv proteins. It was used as a template for.

클론의 특성규명Characterization of clones

감염 신호는 일부 가변적인 잎 얼룩 및 성장 지연과 함께, 부드러운 잎 변형으로서 5-6일 후에 보인다. 접종 후 11 내지 14일에, 분비된 단백질을 분리하였다. 잎 및 줄기 재료를 수확하고, 무게를 달고, 이어서 침윤 완충액 (lOOmM Tris HCl, pH 7.5 및 2mM EDTA) 중에서 2분 동안 700mm Hg 진공을 걸었다. 분비된 단백질 (이후 "사이 분획" 또는 "IF"라 일컬어짐)을 지지된 나일론 망 디스크 상에서 2000g (Beckman JA-14)에서 침윤된 잎으로부터 가벼운 원심분리에 의해 회수하고, Centricon-10 (Amicon) 농축기에서 약 10배 농축하였다. 총 단백질을 Bradford 방법 (Bradford, M. (1976) Anal. Biochem. 72:248-254)에 의해 측정하고, 사용할 때까지 -80℃에서 저장하였다.Infection signal is seen after 5-6 days as a soft leaf deformation, with some variable leaf staining and growth retardation. 11-14 days after inoculation, the secreted protein was isolated. The leaf and stem material was harvested, weighed and then subjected to 700 mm Hg vacuum for 2 minutes in infiltration buffer (100 mM Tris HCl, pH 7.5 and 2 mM EDTA). The secreted protein (hereinafter referred to as "between fractions" or "IF") is recovered by light centrifugation from infiltrated leaves at 2000 g (Beckman JA-14) on supported nylon mesh disks, and Centricon-10 (Amicon) It was concentrated about 10 times in the concentrator. Total protein was measured by Bradford method (Bradford, M. (1976) Anal. Biochem. 72: 248-254) and stored at −80 ° C. until use.

분비된 물질을 SDS-PAGE에 이은 CJ mAb 7D11을 이용한 웨스턴 블롯에 의해 가용성 CJ scFv 단백질의 존재에 대해 분석하였다. 약 3㎍의 IF 단백질을 SDS-PAGE에 의해 분리하고, 1시간 동안 150V에서 20% 메탄올을 가진 표준 Tris-글리신 완충액에서 니트로셀룰로오스 막에 옮겼다. 옮긴 후에, 블롯을 차단 완충액 (50 mM Tris pH 8, l5OmM NaCl, 1 mM EDTA, 2.5% 탈지분유, 2.5% BSA 및 0.05% Tween 20)으로 상온에서 20분 동안 처리한 후, 차단 완충액외에 1㎍/ml 정제된 7D11 항체에서 4℃에서 16시간 인큐베이션시켰다. 15분 3회 세척 (100 mM Tris pH 8, 150 mM NaCl, 1 mM EDTA 및 0.1% Tween 20)후에, 막을 차단 완충액외에 1㎍/ml 염소 항-마우스 IgG-HRP (Southern Biotechnology)에서 1시간 동안 인큐베이션시켰다. 15분 3회 세척 후에, 웨스턴 블롯을 제조자의 지시에 따라 증진된 화학발광 (ECL)(Amersham)에 의해 생성하였다. 노출 시간은 1 내지 5초의 범위였다. 식물 단백질에 대한 어떠한 교차 반응성도 관찰되지 않았다 (대조군 감염된 식물로부터 IF 추출물을 시험할 때).Secreted material was analyzed for the presence of soluble CJ scFv protein by Western blot using SDS-PAGE followed by CJ mAb 7D11. About 3 μg of IF protein was isolated by SDS-PAGE and transferred to nitrocellulose membrane in standard Tris-glycine buffer with 20% methanol at 150 V for 1 hour. After transfer, the blot was treated with blocking buffer (50 mM Tris pH 8, lOOmM NaCl, 1 mM EDTA, 2.5% skim milk powder, 2.5% BSA and 0.05% Tween 20) for 20 minutes at room temperature, followed by 1 μg in addition to blocking buffer. Incubated at 4 ° C. for 16 hours in a / ml purified 7D11 antibody. After three 15 minute washes (100 mM Tris pH 8, 150 mM NaCl, 1 mM EDTA and 0.1% Tween 20), the membranes were blocked for 1 hour in 1 μg / ml goat anti-mouse IgG-HRP (Southern Biotechnology) in addition to blocking buffer. Incubate. After three washes of 15 minutes, Western blot was generated by enhanced chemiluminescence (ECL) (Amersham) according to the manufacturer's instructions. Exposure time ranged from 1 to 5 seconds. No cross reactivity was observed for plant proteins (when testing IF extracts from control infected plants).

개개 클론의 서열을 결정하고, 해독틀 및 원래의 CJ Ig 서열과 아미노산 동일성을 분석하고, 이어서 감염된 식물에서 단백질 발현을 스크리닝하였다. 도 1은 단백질 축적의 다양한 수준을 증명한 9개의 개개 CJ scFv 발현 클론의 결과를 보여준다. 클론 20 및 30은 높은 수준의 발현뿐만 아니라, 단백질 이합체의 축적을 보여주었다. 클론 C는 (Gly3Ser)4링커의 변형을 포함했다.The sequence of the individual clones was determined, the amino acid identity with the translation frame and the original CJ Ig sequence was then screened for protein expression in infected plants. 1 shows the results of nine individual CJ scFv expressing clones demonstrating various levels of protein accumulation. Clones 20 and 30 showed high levels of expression as well as accumulation of protein dimers. Clone C included a variant of (Gly 3 Ser) 4 linker.

서열 데이타로부터, 개개 클론에 대한 링커 서열을 연역하였다. 표 3의 클론 번호는 표 2에 열거된 것과 동일하다. 상기에서와 같이, 상대적인 발현은 (Gly4Ser)3링커를 가진 scFv 단백질에 관한 것이다.From the sequence data, the linker sequences for the individual clones were deduced. The clone numbers in Table 3 are the same as listed in Table 2. As above, relative expression relates to the scFv protein with (Gly 4 Ser) 3 linker.

상기에서와 같이, 차이가 전체 식물에서 다양한 CJ scFv 기재 클론의 발현에서 관찰되었다. 흥미롭게도, 식물 원형질체에서 발현된 일부 클론은 전체 식물에서는 발현되지 않았다. 예를 들면, 식물 원형질체에서 강하게 발현되는 클론 #16은 전체 식물에서는 명백히 발현되지 않았다. 그럼에도 불구하고, 다양한 길이 및 서열을 가진 링커 부위를 생성하기 위해 개시된 방법은 식물 원형질체 또는 전체 식물에서 이들 발현을 위해 다수 클론의 스크리닝을 허용한다.As above, differences were observed in the expression of various CJ scFv based clones in the whole plant. Interestingly, some clones expressed in plant protoplasts were not expressed in whole plants. For example, clone # 16, which is strongly expressed in plant protoplasts, was not clearly expressed in whole plants. Nevertheless, the disclosed methods to generate linker sites with various lengths and sequences allow for the screening of multiple clones for their expression in plant protoplasts or whole plants.

랜덤 링커 라이브러리에 의해 최적화된, CJ 단백질의 질은 두 가지 방법에 의해 입증되었다. 먼저, CJ 단백질은 고정된 7D11 항-이디오타입 mAb를 사용하여 친화성 크로마토그래피에 의해 정제되었다. 상기 방법은 CJ 단백질이 생리 조건하에 항-Id 칼럼에 결합하는 것을 요구한다. 그러한 결합은 단백질이 정확하게 폴딩되지 않는다면, 일어나지 않을 것이다. 단백질을 정상적인 pH 하에 결합하고, 50mM 디에틸아민 pH 11.5 에 의해 용출하고, 이어서 즉시 정상적인 염수로 투석하였다. 물질을 7D11 및 표준 단백질 결정을 사용하여 ELISA에 의해 정량하였다.The quality of the CJ protein, optimized by the random linker library, was demonstrated by two methods. First, CJ protein was purified by affinity chromatography using immobilized 7D11 anti-idiotype mAb. The method requires that the CJ protein binds to the anti-Id column under physiological conditions. Such binding will not occur unless the protein is correctly folded. Proteins were bound under normal pH, eluted with 50 mM diethylamine pH 11.5 and then immediately dialyzed with normal saline. The material was quantified by ELISA using 7D11 and standard protein crystals.

CJ 단백질의 질에 대한 두번째, 더욱 엄격한 검정은 동물에서의 기능성 검정이었다. 클론 CJLL20 (링커 라이브러리 픽(pick) #20에 대해)을 7D11 친화성 크로마토그래피에 의해 정제하고, 각 30㎍의 3회 2주 면역화로 5마리의 마우스에 투여하였다. 세번째 주사후 10일에, 혈청을 채취하였다. 샌드위치 ELISA에서 천연 이디오타입 (1D12), 또는 이소타입 부합된 부적절한 인간 항체를 사용하여, 혈청을 CJ 이디오타입에 대한 특이 반응에 대해 시험하였다. 결과를 도 2에 보여준다.The second, more stringent assay for the quality of the CJ protein was the functional assay in animals. Clone CJLL20 (relative to linker library pick # 20) was purified by 7D11 affinity chromatography and administered to five mice with three 2-week immunizations of 30 μg each. Ten days after the third injection, serum was collected. Serum was tested for specific response to CJ idiotype using a native idiotype (1D12), or isotype matched inappropriate human antibody in a sandwich ELISA. The results are shown in FIG.

이종 인간 Ig 결정자에 대한 항체 반응은 비특이적으로 5마리 동물 중 단지 3마리에서 존재했고, 매우 낮은 양으로 존재했다 (무관한 인간 항체에 대한 쥐 혈청의 최소 교차 반응성으로서 검출됨).Antibody responses to heterologous human Ig determinants were nonspecifically present in only 3 of 5 animals and in very low amounts (detected as minimal cross reactivity of rat serum to irrelevant human antibodies).

모든 5마리의 마우스의 혈청은 높은 역가의 항-CJ 항체를 가졌다 (도 2). 그리하여, 이중 도메인 scFv 폴리펩티드에 의해 유도된 면역 반응은 예상되고, 원하는 데로, 원래 Ig의 원래 VH및 VL도메인에 대해 매우 특이적이었다. 이 결과는 식물에서 생산된 단백질이 정확하게 폴딩되어 대상에 투여되었을 때 적당한 면역 반응을 유도할 수 있음을 나타낸다.Serum from all five mice had high titers of anti-CJ antibodies (FIG. 2). Thus, the immune response induced by the dual domain scFv polypeptide was expected and, as desired, very specific for the original V H and V L domains of the original Ig. This result indicates that the protein produced in the plant can be correctly folded and elicit an appropriate immune response when administered to a subject.

실시예 3Example 3

전체 식물에서 scFv 산물의 발현Expression of scFv Products in Whole Plants

실시예 2에 기재된 방법이, 공지의 발현 특성을 가진 상이한 인간 scFv 가 scFv 산물을 생산하기 위해 적당한 발현 시스템과 더불어 사용된 것을 제외하고는 반복되었다.The method described in Example 2 was repeated except that different human scFvs with known expression properties were used with the appropriate expression system to produce the scFv product.

발현된 산물을 SDS-PAGE/쿠마씨 블루 염색에 의해 스크리닝하였다. 결과는 생산된 scFv 산물의 양이 링커 조성에 기초하여 다양하다는 것을 나타냈다. 최고 수득율의 클론을 백신 scFv의 생산에 대해 선발한다.Expressed products were screened by SDS-PAGE / Coomassie blue staining. The results indicated that the amount of scFv product produced varied based on the linker composition. The highest yield clones are selected for the production of vaccine scFv.

발현 시스템Expression system

Go19 인간 림프종의 V 부위를 가진 이중 도메인 scFv 절편을 코딩하는 DNA 절편은 실시예 1에서처럼 생성되었고, TMV 및 TMGMV-U5의 하이브리드 융합뿐만 아니라 SphI 및 AvrII 인서트 클로닝 자리를 가진 벼 α아밀라아제 신호 펩티드를 포함한, 변형된 30B 벡터인 p1324-MBP에 클로닝하였다 (Shivprasad, S. 등 (1999) Virology 255:312-323).DNA fragments encoding dual domain scFv fragments with the V region of Go19 human lymphoma were generated as in Example 1 and included a rice α amylase signal peptide with SphI and AvrII insert cloning sites as well as hybrid fusion of TMV and TMGMV-U5 And cloned into p1324-MBP, a modified 30B vector (Shivprasad, S. et al. (1999) Virology 255: 312-323).

이 벡터에서, TMV 코트 단백질 서브게놈 프로모터는 Go19 서열의 삽입 자리의 상류에 위치한다. 감염에 이어, 상기 TMV 코트 단백질 서브게놈 프로모터는 식물 세포내의 전사 개시점 ("tsp")에서 Go19 RNA 합성을 시작한다. Go19 서열과 동일한 틀로 융합된, 벼 α아밀라아제 신호 펩티드 (O'Neill, SD 등 (1990) Mol. Gen. Genet. 221:235-244)는 단백질을 분비 경로로 이동시키는 31 잔기 폴리펩티드를 코딩하고 (Firek, S. 등 (1994) Transgenic Res. 3:326-331), 신호 펩티드의 C-말단 Gly 및 발현된 Go19 scFv 단백질의 N-말단 Met 사이에서 부차적으로 절단된다. Go19 scFv를 코딩하는 서열을 30K 이동 단백질 및 TMGMV-U5 코트 단백질(Tcp) 유전자 사이에 도입하였다. T7 파아지 중합효소 프로모터를 바이러스 cDNA 의 상류에 도입하고, 감염성 게놈 양성 가닥 RNA의 전사를 허용하였다.In this vector, the TMV coat protein subgenomic promoter is located upstream of the insertion site of the Go19 sequence. Following infection, the TMV coat protein subgenomic promoter initiates Go19 RNA synthesis at the initiation point of transcription (“tsp”) in plant cells. The rice α amylase signal peptide (O'Neill, SD et al. (1990) Mol. Gen. Genet. 221: 235-244), fused in the same framework as the Go19 sequence, encodes a 31 residue polypeptide that shifts the protein to the secretory pathway ( Firek, S. et al. (1994) Transgenic Res. 3: 326-331), cleaved between the C-terminal Gly of the signal peptide and the N-terminal Met of the expressed Go19 scFv protein. The sequence encoding Go19 scFv was introduced between the 30K shift protein and the TMGMV-U5 coat protein (Tcp) gene. T7 phage polymerase promoter was introduced upstream of viral cDNA and allowed for transcription of infectious genomic positive strand RNA.

Go19 V 부위를 4개의 별도의 PCR 반응에서 증폭하였다. 첫번째 및 제2 반응에서, VH도메인을 코딩하는 서열을 하기 합성 올리고뉴클레오티드를 사용하여 환자 Go19의 림프종 세포로부터 유도된 cDNA 클론으로부터 증폭하였다:Go19 V sites were amplified in four separate PCR reactions. In the first and second reactions, sequences encoding the V H domains were amplified from cDNA clones derived from lymphoma cells of patient Go19 using the following synthetic oligonucleotides:

VHF: 5' cctgca tgctgg agg tgc agt tgg tgg aat c (서열 번호 26)V H F: 5 'cct gca tgc tgg agg tgc agt tgg tgg aat c (SEQ ID NO 26)

VHR: 5'(asy) x aga gga gac ggt gac cat ga (서열 번호 27)V H R: 5 ' (asy) x aga gga gac ggt gac cat ga (SEQ ID NO: 27)

SphI 제한효소 자리는 상기에 밑줄 그었다. 제1 반응에서 x는 4 였다:SphI restriction enzyme sites are underlined above. In the first reaction x was 4:

5'-asy asy asy asy aga gga gac ggt gac cat ga (서열 번호 28)5'-asy asy asy asy aga gga gac ggt gac cat ga (SEQ ID NO: 28)

제2 반응에 있어서, x는 9였다 (서열 번호 29):For the second reaction, x was 9 (SEQ ID NO: 29):

(일반적으로, 트리플렛 (x)의 갯수는 1 내지 약 50개일 수 있다)(Generally, the number of triplets (x) may be from 1 to about 50)

제3 및 제4 PCR 반응에 있어서, VL도메인을 코딩하는 서열을, 하기 합성 올리고뉴클레오티드를 사용하여 Go19 cDNA 클론으로부터 증폭시켰다:For the third and fourth PCR reactions, the sequences encoding the V L domains were amplified from Go19 cDNA clones using the following synthetic oligonucleotides:

AvrII 제한효소 부위를 밑줄로 표시하였다. 제1 반응에 있어서, z는 6이었다:AvrII restriction sites are underlined. For the first reaction, z was 6:

제2 반응에 있어서, z는 9로서, 하기 서열 번호 33의 서열을 생성하였다:For the second reaction, z is 9, resulting in the sequence of SEQ ID NO: 33:

(일반적으로, 트리플렛 (z)의 갯수는 1 내지 약 50개일 수 있다.(Generally, the number of triplets (z) may be from 1 to about 50.

PCR 증폭 이전에 VHR 및 VLR 올리고뉴클레오티드를 폴리뉴클레오티드 키나제 및 ATP로 처리하여 올리고뉴클레오티드의 5' 말단에 포스페이트를 부가하였다. 증폭에 이어, 4종의 PCR 생성물을 정제하고, VH및 VL생성물을 함께 라이게이션하여 scFv를 생성한다. scFv 라이게이션 생성물을 재정제하고, SphI 및 AvrII 제한효소로 절단하고, 절단 scFv를 겔 단리하여 Geneware (등록상표) 벡터 내로 라이게이션하였다. 라이게이션한 DNA로 (전기천공법을 이용하여) 이. 콜라이 (E. coli)를 형질전환시키고, 형질전환 세포를 50 ㎍/ml의 암피실린을 포함하는 선별 배지에 도말하였다. 플라스미드 DNA를 개개의 암피실린-내성 이. 콜라이 클론으로부터 정제하였다.Prior to PCR amplification, the V H R and V L R oligonucleotides were treated with polynucleotide kinase and ATP to add phosphate at the 5 'end of the oligonucleotide. Following amplification, four PCR products are purified and the V H and V L products are ligated together to generate scFv. The scFv ligation product was rearranged, digested with SphI and AvrII restriction enzymes, and cleaved scFv was gel isolated and ligated into Geneware® vector. With ligated DNA (using electroporation) E. coli was transformed and transformed cells were plated in selection medium containing 50 μg / ml of ampicillin. Plasmid DNA was converted to individual ampicillin-resistant E. coli. Purified from E. coli clones.

시험관내에서 Ambion제의 T7 메시지 키트를 이용하여, 대략 0.5 ㎍ 플라스미드로부터 캡핑된 감염성 RNA를 제조하였다. 메시지의 합성을 겔 전기영동으로 평가하였으며, pH 7.0의 100 mM 인산나트륨 중 정제 TMV-U1 코트 단백질을 사용하여, 시험관내에서 전사시킨 대략 2 ㎍의 바이러스 RNA를 실온에서 최소 6시간 동안 캡시드화하였다. 캡시드화 전사체를, 엔. 벤타미아나 (N. benthamiana)의 하부 잎 (대략 1 내지 2 cm의 크기)에 문질러서 적용한다 (W.O. Dawson 등 (1986) Proc. Natl. Acad Sci. USA 83:1832-1836). Go19 scFv 단백질을 코딩하는 서브게놈성RNA의 전사는, 지시된 전사 개시 지점에서의 감염 후 개시하였다. 고수준의 서브게놈성 RNA 종을 바이러스 감염 식물 세포에서 합성하였는데 (M.H. Kumagai 등 (1993) Proc. Natl. Acad. Sci. USA 90:427-430), 상기 서브게놈성 RNA 종은 Go19 scFv 단백질의 번역 및 후속 축적을 위한 주형으로 기능한다.In vitro infectious RNA was prepared from approximately 0.5 μg plasmid using Ambion's T7 message kit. Synthesis of the message was assessed by gel electrophoresis and approximately 2 μg of viral RNA transcribed in vitro was encapsidated for at least 6 hours at room temperature using purified TMV-U1 coat protein in 100 mM sodium phosphate at pH 7.0. . Encapsidated transcripts. Apply by rubbing to the lower leaves (approximately 1-2 cm in size) of N. benthamiana (W.O. Dawson et al. (1986) Proc. Natl. Acad Sci. USA 83: 1832-1836). Transcription of subgenomic RNA encoding Go19 scFv protein was initiated after infection at the indicated transcription initiation point. High levels of subgenomic RNA species were synthesized in virus infected plant cells (MH Kumagai et al. (1993) Proc. Natl. Acad. Sci. USA 90: 427-430), which subgenomic RNA species translated the Go19 scFv protein. And as a template for subsequent accumulation.

클론의 특성화Characterization of the clone

감염 징후는, 몇몇 다양한 잎 반점 및 생장 지연을 포함하는 온화한 잎 변형으로서 5 내지 6일 후에 명백해졌다. 접종한지 11 내지 14일 후, 분비 단백질을 단리하였다. 대략 0.1 g의 감염 잎 재료를 수확하여, 96웰 유리 섬유 여과 블록 (Whatman/Polyfiltronics)에 놓고, 침윤 완충제 (20 mM 트리스 HCl, pH 7.0, 1OmM 2-메르캅토에탄올)에 넣었다. 조직에 700 mm Hg 진공을 30초 동안 가하고, 진공을 방출하고, 1회 이상의 추가 라운드로 진공 공정을 반복한다. 잔류 완충제를 플레이트 원심분리기에서 30 x g의 저속 회전으로 제거한다. 플레이트 원심분리기에서, 1700 x g에서 온화하게 원심분리함으로써 분비 단백질 (이하, "간격 분획 (interstitial fraction) 또는 "IF"라 함)을 침윤 잎으로부터 회수하여 96웰 폴리프로필렌 플레이트 내로 수집하였다.Signs of infection were evident after 5-6 days as mild leaf modifications, including several various leaf spots and growth retardation. After 11-14 days of inoculation, secreted proteins were isolated. Approximately 0.1 g of infected leaf material was harvested, placed in 96-well glass fiber filtration blocks (Whatman / Polyfiltronics) and placed in infiltration buffer (20 mM Tris HCl, pH 7.0, 10 mM 2-mercaptoethanol). Apply 700 mm Hg vacuum to the tissue for 30 seconds, release the vacuum and repeat the vacuum process with one or more additional rounds. Residual buffer is removed at a slow rotation of 30 x g in a plate centrifuge. In a plate centrifuge, the secreted protein (hereinafter referred to as the "interstitial fraction or" IF ") was recovered from the infiltrating leaves and collected into 96 well polypropylene plates by gentle centrifugation at 1700 x g.

SDS-PAGE로 가용성 Go19 scFv 단백질의 존재를 분비 물질에 대하여 분석하였다. IF (대략 5 ㎍의 단백질을 포함하는 27 ㎕)를 SDS-PAGE로 분리하였다. 개개의 클론으로부터의 링커를 서열결정하고, 판독 프레임 및 아미노산 함량에 대하여 분석하고, 이어서 감염 식물에서의 단백질 발현을 스크리닝하였다. 도 3은, 22개의 개개의 Go19 scFv 발현 클론이 다양한 수준의 단백질 축적을 명백하게 나타낸다는 결과를 예시한다. 클론 C5 및 E1과 E9은, 발현은 고수준으로 나타내면서 프로테아제 분해는 최소였다.The presence of soluble Go19 scFv protein was analyzed for secretion by SDS-PAGE. IF (27 μl containing approximately 5 μg of protein) was isolated by SDS-PAGE. Linkers from individual clones were sequenced, analyzed for reading frame and amino acid content, and then screened for protein expression in infected plants. 3 illustrates the results that 22 individual Go19 scFv expressing clones clearly show various levels of protein accumulation. Clones C5 and E1 and E9 showed high levels of expression and minimal protease degradation.

서열 데이터로부터 개개의 클론에 있어서의 링커 서열을 표 4에 나타낸 바와 같이 추론하였다.From the sequence data, the linker sequences in the individual clones were inferred as shown in Table 4.

상기와 같이, 6.5 kDa 및 21 kDa 마커 밴드 사이에서, 단백질 축적의 존재에 의해 나타내어지는 분해 정도, 및 전체 식물에 있어서 다양한 Go19 scFv-기재 클론의 발현이 상이하다는 것이 관찰되었다. 본원에서 개시된 다양한 길이 및 서열을 가지는 링커 영역의 생성 방법은 식물 원형질체 또는 전체 식물에 있어서의 다수의 클론의 그의 발현에 대한 스크리닝을 가능하게 한다.As above, it was observed that between the 6.5 kDa and 21 kDa marker bands, the degree of degradation indicated by the presence of protein accumulation and the expression of various Go19 scFv-based clones in the whole plant were observed. Methods of generating linker regions having various lengths and sequences disclosed herein allow for the screening for their expression of plant protoplasts or multiple clones in whole plants.

실시예 4Example 4

scFv-검출가능하게 라벨링된 콘쥬게이트scFv-detectably labeled conjugates

HER-2/neu에 대한 mAb는 유방암 세포주 SK-Br-3 (ATCC HTB 30)을 6일 동안 배양할 경우 상기 세포주의 세포 생장을 저해한다. 이러한 처리는 화학치료제에 대하여 상기 세포를 민감화시킨다 (US 5,677,171).MAb against HER-2 / neu inhibits cell growth when the breast cancer cell line SK-Br-3 (ATCC HTB 30) is incubated for 6 days. This treatment sensitizes the cells to chemotherapeutic agents (US 5,677,171).

HER-2/neu (erbB-2) 단백질에 특이적으로 결합하는 scFv의 VH및 VL영역을 사용하여 실시예 1의 공정을 반복한다. 이러한 폴리펩티드를 코딩하는 scFv 유전자가 Wels 등의 문헌 [Biotechnology 10: 1128-1132 (1992)]에 기재되어 있다. 실시예 1에서와 동일한 반복 트리플렛 뉴클레오티드 서열을 사용하여, 실시예 1의 방법을 모델링하여, 적절한 PCR 프라이머를 사용하여 고추냉이 퍼옥시다제 유전자의 5'-말단에 erbB-2 scFv DNA 작제물의 3' 말단을 라이게이션시킨다.The process of Example 1 is repeated using the V H and V L regions of the scFv that specifically bind to the HER-2 / neu (erbB-2) protein. The scFv gene encoding such a polypeptide is described in Wels et al. Biotechnology 10: 1128-1132 (1992). Using the same repeating triplet nucleotide sequence as in Example 1, the method of Example 1 was modeled and 3 of the erbB-2 scFv DNA construct at the 5'-end of the horseradish peroxidase gene using appropriate PCR primers. 'Ligation the ends.

상청액 중 퍼옥시다제 활성을 측정함으로써 고 수율 클론을 동정한다. HER-2/neu를 과다발현하는 유방암 세포주 대조 샘플 상에서, 기질 및 크로모포어를 이용하여, 면역조직화학 검출법에 의해 고 친화성 및 결합성을 재측정하였다. HER-2/neu에 대한 통상의 라벨링된 mAb (예를 들어 DAKO Hercep Test, Dako Corp., Carpinteria, CA)를 비교하여 어느 클론이 허용가능한 scFv 단백질을 생성하는지를 측정하였다.High yield clones are identified by measuring peroxidase activity in the supernatant. On breast cancer cell line control samples overexpressing HER-2 / neu, high affinity and binding were remeasured by immunohistochemical detection using substrates and chromophores. Conventional labeled mAbs for HER-2 / neu (eg DAKO Hercep Test, Dako Corp., Carpinteria, Calif.) Were compared to determine which clones produced acceptable scFv proteins.

실시예 5Example 5

scFv-독소 콘쥬게이트 생성scFv-toxin conjugate generation

실시예 4의 공정을, 하기와 같이 변형시켜 반복하였다. (반복 트리플렛 뉴클레오티드로 만들어진) 본 발명의 링커 영역을 통하여, 리신 A 사슬 유전자를scFv DNA 작제물의 3' 말단에 라이게이션시킨다.The process of Example 4 was repeated as modified as follows. Through the linker region of the invention (made of repeating triplet nucleotides), the lysine A chain gene is ligated to the 3 'end of the scFv DNA construct.

식물 세포 클론을 24웰 플레이트에서 배양하고, 먼저 분비 단백질을 측정함으로써 스크리닝하였다 (PAGE, 이어서 쿠마씨 블루 염색). 각각의 클론을 배양한 웰로부터의 2일 배양물의 상청액에 있어서, 6웰 플레이트 (Costar)에서 SK-Br-3의 활성 배양물과 함께 인큐베이션시킴으로써 표적 세포에 대한 세포독성 활성을 시험한다. 이러한 표적에 대한 세포독성을 현미경 조사 48시간 후에 측정한다.Plant cell clones were cultured in 24-well plates and screened by first measuring secreted protein (PAGE followed by Coomassie blue staining). Supernatants of 2-day cultures from wells in which each clone was cultured were tested for cytotoxic activity against target cells by incubating with active cultures of SK-Br-3 in 6-well plates (Costar). Cytotoxicity to these targets is measured 48 hours after microscopic examination.

강력한 세포독성을 생성하는 고 생산 클론을 선발한다. 상기 배양물로부터 캘러스를 형성시켜 야외 생장 및 대규모 생산을 위한 식물을 재생시킨다.Select high production clones that produce potent cytotoxicity. Callus is formed from the culture to regenerate plants for outdoor growth and large scale production.

HER-2/neu에 대한 인간화 mAb는 FDA가 승인한 유방암 치료제이다 (HERCEPTIN, Genentech, Inc., South San Francisco, CA). 동일 항원에 특이적인 독소-콘쥬게이션 scFv는 인간 유방암 세포에 대하여 세포독성이 적어도 동일하거나 아마도 세포독성이 더욱 강할 것으로 예상된다.Humanized mAb for HER-2 / neu is an FDA approved breast cancer drug (HERCEPTIN, Genentech, Inc., South San Francisco, CA). Toxin-conjugation scFv specific for the same antigen is expected to be at least identical or perhaps more cytotoxic to human breast cancer cells.

실시예 6Example 6

이중-도메인 라이보자임의 제조Preparation of Bi-Domain Ribozymes

2개의 상이한 라이보자임 도메인을 코딩하는 DNA를 사용하는 것을 제외하고는, 실시예 1의 공정을 반복한다. 서브클로닝된 이중 라이보자임 도메인을 포함하는 벡터를 전사시켜 각각의 라이보자임 도메인의 특성을 가지는 RNA를 생성시킨다.The process of Example 1 is repeated except that DNA encoding two different ribozyme domains is used. Vectors comprising the subcloned double ribozyme domains are transcribed to produce RNA having the properties of each ribozyme domain.

전사 RNA 생성물의 양은, 분광광도계에 의한 측정법 등에 의해, 올리고뉴클레오티드 프로브와의 혼성화에 의해 측정할 수 있다. 라이보자임 도메인 활성의 양은 적절한 분석법을 사용하여 측정할 수 있다.The amount of the transcriptional RNA product can be measured by hybridization with the oligonucleotide probe by a spectrophotometer or the like. The amount of ribozyme domain activity can be measured using appropriate assays.

실시예 6Example 6

이중 DNA 도메인의 제조Preparation of Double DNA Domains

각각이 단백질에 결합하는 2종의 상이한 DNA를 사용한 것을 제외하고는, 실시예 1의 공정을 반복한다. 플라스미드 DNA를 다량으로 제조할 수 있으며, 이중 DNA 도메인 분자를 제한 엔도뉴클레아제로 잘라낼 수 있다. 생성 단편은 2개의 결합 DNA 도메인을 가지며, DNA 결합 단백질 (예를 들어 전사 인자, 제한 엔도뉴클레아제, 폴리머라제 등)에 대한 그의 결합능에 대해 분석할 수 있다.The process of Example 1 is repeated except that two different DNAs, each of which binds to a protein, are used. Plasmid DNA can be prepared in large quantities and double DNA domain molecules can be cut with restriction endonucleases. The resulting fragment has two binding DNA domains and can be assayed for its binding capacity to DNA binding proteins (eg, transcription factors, restriction endonucleases, polymerases, etc.).

상기에 인용된 참고문헌은, 본원에서 구체적으로 채택이 되었든, 되지 않았든, 참고문헌으로 모두 채택된다.All references cited above are hereby incorporated by reference, whether or not specifically adopted herein.

Claims (51)

각각이 하기를 가지는 이중-도메인 핵산 분자 라이브러리:Dual-domain nucleic acid molecular libraries, each having: (a) 제1 및 제2 도메인; 및(a) first and second domains; And (b) (i) 크기 및 뉴클레오티드 서열이 다양하며,(b) (i) vary in size and nucleotide sequence, (ii) 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진(ii) degenerate repeat triplet nucleotides in a repeat pattern 랜덤화 링커 라이브러리의 구성원이며, 상기 도메인을 분리 및 결합하는 링커.A member of a randomized linker library, wherein said linker separates and binds said domain. 제1항에 있어서, 상기 링커의 반복 패턴의 축중 반복 트리플렛 뉴클레오티드가 하기 특성을 가지는 것을 특징으로 하는 분자 라이브러리:The molecular library of claim 1, wherein the degenerate repeat triplet nucleotides of the repeating pattern of the linker have the following characteristics: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet. 제2항에 있어서, 각각의 반복 트리플렛의 제1 및 제2 위치의 뉴클레오티드가 데옥시아데노신, 데옥시구아노신, 데옥시사이티딘 또는 데옥시티미딘 중 임의의 2개로부터 선택되는 것을 특징으로 하는 분자 라이브러리.The method of claim 2, wherein the nucleotides in the first and second positions of each repeating triplet are selected from any two of deoxyadenosine, deoxyguanosine, deoxycytidine, or deoxythymidine. Molecular Library. 제3항에 있어서,The method of claim 3, (i) 각각의 반복 트리플렛의 1 위치가 데옥시아데노신 또는 데옥시구아노신이고;(i) one position of each repeating triplet is deoxyadenosine or deoxyguanosine; (ii) 각각의 반복 트리플렛의 2 위치가 데옥시사이티딘 또는 데옥시구아노신이며;(ii) the 2 position of each repeat triplet is deoxycytidine or deoxyguanosine; (iii) 각각의 반복 트리플렛의 3 위치가 데옥시티미딘인(iii) the 3 position of each repeat triplet is deoxythymidine 것을 특징으로 하는 분자 라이브러리.Molecular library, characterized in that. 제1항에 있어서, 상기 도메인 중 하나 이상이 단백질에 결합하는 것을 특징으로 하는 분자 라이브러리.The molecular library of claim 1, wherein at least one of the domains binds to a protein. 제5항에 있어서, 상기 도메인 둘 모두가 단백질에 결합하는 것을 특징으로 하는 분자 라이브러리.6. The molecular library of claim 5, wherein both domains bind to a protein. 제1항에 있어서, 상기 도메인 중 하나 이상이 라이브러리의 구성원이 아닌 핵산에 결합하는 것을 특징으로 하는 분자 라이브러리.The molecular library of claim 1, wherein at least one of the domains binds to a nucleic acid that is not a member of the library. 제7항에 있어서, 상기 도메인 둘 모두가 상기 라이브러리의 구성원이 아닌 핵산에 결합하는 것을 특징으로 하는 분자 라이브러리.8. The molecular library of claim 7, wherein both domains bind to nucleic acids that are not members of the library. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제1 및 상기 제2 도메인이 코딩 서열인 것을 특징으로 하는 분자 라이브러리.The molecular library according to any one of claims 1 to 4, wherein said first and said second domains are coding sequences. 제1항 내지 제8항 중 어느 한 항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 분자 라이브러리.The molecular library according to any one of claims 1 to 8, which is produced in plant cells. 제9항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 분자 라이브러리.10. The molecular library according to claim 9, which is produced in plant cells. 제1항 내지 제8항 중 어느 한 항의 라이브러리로부터 선택되는 이중-도메인 핵산 분자.A double-domain nucleic acid molecule selected from the library of any one of claims 1 to 8. 제9항의 라이브러리로부터 선택되는 이중-도메인 핵산 분자.A dual-domain nucleic acid molecule selected from the library of claim 9. 제10항의 라이브러리로부터 선택되는 이중-도메인 핵산 분자.A dual-domain nucleic acid molecule selected from the library of claim 10. 제11항의 라이브러리로부터 선택되는 이중-도메인 핵산 분자.A dual-domain nucleic acid molecule selected from the library of claim 11. 각각이 하기 식으로 기재되는 이중-도메인 폴리펩티드 분자 라이브러리:Dual-domain polypeptide molecular libraries, each of which is described by the formula: D1-L-D2 D 1 -LD 2 [식 중,[In the meal, (a) D1및 D2는 폴리펩티드 도메인이며,(a) D 1 and D 2 are polypeptide domains, (b) L은 크기 및 서열이 다양한 링커의 랜덤화 라이브러리의 구성원인 펩티드 또는 폴리펩티드 링커로서, 상기 라이브러리는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 핵산 서열에 의해 코딩된다].(b) L is a peptide or polypeptide linker that is a member of a randomization library of linkers of varying sizes and sequences, wherein the library is encoded by a nucleic acid sequence consisting of degenerate repeat triplet nucleotides of a repeating pattern. 각각의 쌍이 펩티드 또는 폴리펩티드 링커 L에 의해 결합되는 폴리펩티드 도메인 D를 각각 포함하는 다중-도메인 폴리펩티드 분자 라이브러리로서, 각각의 분자는 하기 식으로 기재되는 다중-도메인 폴리펩티드 분자 라이브러리:A multi-domain polypeptide molecule library, wherein each pair comprises a polypeptide domain D, each bound by a peptide or polypeptide linker L, wherein each molecule is a multi-domain polypeptide molecule library, wherein: DxLy D x L y [식 중,[In the meal, x는 2 내지 20의 정수이고,x is an integer from 2 to 20, y는 1 내지 19의 정수이되, 단, 임의의 x 값에 대하여, y는 x-1이고;y is an integer from 1 to 19, provided that for any value of x, y is x-1; D1은 단일 C-말단 링커에 결합되고;D 1 is bonded to a single C-terminal linker; 최종의 C-말단 D (C-terminal-most D)는 단일 N-말단 링커에 결합되고;The final C-terminal D is bound to a single N-terminal linker; 각각의 D2내지 D19는 N-말단 및 C-말단 링커에 결합되고;Each D 2 to D 19 is bonded to an N-terminal and C-terminal linker; 각각의 L은, 크기 및 서열이 다양한 링커의 랜덤화 라이브러리의 구성원으로서, 상기 링커 라이브러리는 반복 패턴의 축중 반복 트리플렛 뉴클레오티드로 이루어진 핵산 서열에 의해 코딩된다].Each L is a member of a randomization library of linkers of varying sizes and sequences, wherein the linker library is encoded by a nucleic acid sequence consisting of degenerate repeat triplet nucleotides of a repeating pattern. 제16항 또는 제17항에 있어서, 라이브러리 중 각각의 링커가18. The method of claim 16 or 17, wherein each linker in the library is (i) 약 1 내지 50개의 아미노산 잔기의 길이를 가지고,(i) has a length of about 1 to 50 amino acid residues, (ii) 1 내지 약 20개의 상이한 아미노산으로 이루어지고, 각각의 반복 패턴의 축중 트리플렛 염기는 1 내지 12개의 상이한 아미노산을 코딩(ii) consisting of 1 to about 20 different amino acids, wherein the degenerate triplet base of each repeating pattern encodes 1 to 12 different amino acids 하는 이중 도메인 폴리펩티드 분자 라이브러리, 또는 다중-도메인 폴리펩티드 분자 라이브러리.A dual domain polypeptide molecule library, or a multi-domain polypeptide molecule library. 제18항에 있어서, 상기 링커를 코딩하는 상기 반복 패턴의 축중 반복 트리플렛 뉴클레오티드가 하기 특성을 가지는 것을 특징으로 하는 폴리펩티드 분자 라이브러리:The polypeptide molecule library of claim 18, wherein the degenerate repeat triplet nucleotides of the repeating pattern encoding the linker have the following characteristics: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet. 제19항에 있어서, 각각의 반복 트리플렛의 제1 및 제2 위치의 뉴클레오티드가 데옥시아데노신, 데옥시구아노신, 데옥시사이티딘 또는 데옥시티미딘 중 임의의 2개로부터 선택되는 것을 특징으로 하는 폴리펩티드 분자 라이브러리.20. The method of claim 19, wherein the nucleotides in the first and second positions of each repeating triplet are selected from any two of deoxyadenosine, deoxyguanosine, deoxycytidine, or deoxythymidine. Polypeptide Molecular Library. 제20항에 있어서,The method of claim 20, (i) 각각의 반복 트리플렛의 1 위치는 데옥시아데노신 또는 데옥시구아노신이고;(i) one position of each repeating triplet is deoxyadenosine or deoxyguanosine; (ii) 각각의 반복 트리플렛의 2위치는 데옥시사이티딘 또는 데옥시구아노신이고;(ii) the 2 position of each repeating triplet is deoxycytidine or deoxyguanosine; (iii) 각각의 반복 트리플렛의 3 위치는 데옥시티미딘인(iii) the 3 position of each repeat triplet is deoxythymidine 것을 특징으로 하는 폴리펩티드 분자 라이브러리.Polypeptide molecule library, characterized in that. 제16항 또는 제17항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 이중-도메인 폴리펩티드 분자 라이브러리, 또는 다중-도메인 폴리펩티드 분자 라이브러리.18. The double-domain polypeptide molecule library, or multi-domain polypeptide molecule library, according to claim 16 or 17, which is produced in plant cells. 제18항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 폴리펩티드 분자 라이브러리.19. A polypeptide molecule library according to claim 18, which is produced in plant cells. 제19항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 폴리펩티드분자 라이브러리.20. A polypeptide molecule library according to claim 19, which is produced in plant cells. 제20항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 폴리펩티드 분자 라이브러리.The polypeptide molecule library of claim 20, wherein the polypeptide molecule is produced in a plant cell. 제21항에 있어서, 식물 세포에서 생성되는 것을 특징으로 하는 폴리펩티드 분자 라이브러리.The polypeptide molecule library of claim 21, wherein said polypeptide molecule is produced in a plant cell. 제16항의 라이브러리로부터 선택되는 이중-도메인 폴리펩티드 분자.A dual-domain polypeptide molecule selected from the library of claim 16. 제17항의 라이브러리로부터 선택되는 다중-도메인 폴리펩티드 분자.A multi-domain polypeptide molecule selected from the library of claim 17. 제18항의 라이브러리로부터 선택되는 이중 도메인 폴리펩티드 분자 또는 다중-도메인 폴리펩티드 분자.A dual domain polypeptide molecule or multi-domain polypeptide molecule selected from the library of claim 18. 제19항의 라이브러리로부터 선택되는 이중 도메인 폴리펩티드 분자 또는 다중-도메인 폴리펩티드 분자.A dual domain polypeptide molecule or multi-domain polypeptide molecule selected from the library of claim 19. 제20항의 라이브러리로부터 선택되는 이중 도메인 폴리펩티드 분자 또는 다중-도메인 폴리펩티드 분자.A dual domain polypeptide molecule or multi-domain polypeptide molecule selected from the library of claim 20. 제21항의 라이브러리로부터 선택되는 이중 도메인 폴리펩티드 분자 또는 다중-도메인 폴리펩티드 분자.A dual domain polypeptide molecule or multi-domain polypeptide molecule selected from the library of claim 21. 제3 폴리펩티드 도메인에 결합된 이중 도메인 scFv 폴리펩티드인, 제17항의 라이브러리로부터 선택되는 3 도메인 펩티드.A three domain peptide selected from the library of claim 17, which is a dual domain scFv polypeptide bound to a third polypeptide domain. 제33항에 있어서, 제3 도메인이 독소 폴리펩티드 또는 효소인 것을 특징으로 하는 3 도메인 폴리펩티드.The tri-domain polypeptide of claim 33, wherein the third domain is a toxin polypeptide or enzyme. 하기 단계를 포함하는, 제1항의 이중-도메인 핵산 라이브러리의 생성 방법:A method of producing the dual-domain nucleic acid library of claim 1, comprising the following steps: a. 제1 및 제2 도메인을 포함하는 2개의 주형 DNA 서열을 얻는 단계;a. Obtaining two template DNA sequences comprising the first and second domains; b. 각각의 프라이머쌍이 상류 프라이머 및 하류 프라이머를 포함하며, 각각의 프라이머는 5' 말단 및 3' 말단을 가지고, 제1 도메인용 하류 프라이머 또는 제2 도메인용 상류 프라이머가 비주형화 서열을 포함하며, 여기서, 비주형화 서열은 반복 패턴의 축중 반복 트리플렛 뉴클레오티드를 포함하고, 이 때, 반복 패턴의 축중 반복 트리플렛 뉴클레오티드의 2개 이상의 5' 말단 트리플렛은 동일한 축중 서열을 가지는, 제1 및 제2 도메인을 증폭시키는 증폭 프라이머쌍을 제조하는 단계;b. Each primer pair comprises an upstream primer and a downstream primer, each primer having a 5 'end and a 3' end, wherein the downstream primer for the first domain or the upstream primer for the second domain comprises an untyped sequence, wherein The non-templated sequence comprises a degenerate repeat triplet nucleotide of a repeating pattern, wherein at least two 5 'terminal triplets of the degenerate repeat triplet nucleotide of the repeating pattern have the same degenerate sequence and amplify the first and second domains Preparing a primer pair; c. 증폭 프라이머를 이용하여 도메인을 증폭시켜 비-주형화 서열에서 상이한 길이 및 서열을 가지는 하나 이상의 핵산 도메인 집단을 생성하는 단계; 및c. Amplifying the domains using amplification primers to produce one or more populations of nucleic acid domains having different lengths and sequences in the non-templating sequence; And d. 단계 (c)에서 생성한 핵산 도메인을 라이게이션시켜 이중-도메인 분자 집단을 생성하는 단계.d. Ligating the nucleic acid domain generated in step (c) to generate a dual-domain molecule population. 제35항에 있어서, 하나 이상의 상기 프라이머 중 상기 반복 패턴의 축중 반복 트리플렛 뉴클레오티드가 하기 특성을 가지는 것을 특징으로 하는 방법:36. The method of claim 35, wherein the degenerate repeating triplet nucleotides of the repeating pattern of one or more of the primers have the following properties: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없다.(iii) One position of each repeat triplet may not be the same nucleotide as three positions of the repeat triplet. 제35항에 있어서, 하나 이상의 프라이머가 비-주형화 엔도뉴클레아제 인식 부위를 포함하는 것을 특징으로 하는 방법.36. The method of claim 35, wherein the one or more primers comprise a non-templated endonuclease recognition site. 제35항에 있어서, 상기 주형 DNA 서열이 mRNA의 역전사에 의해 만들어지는 것을 특징으로 하는 방법.36. The method of claim 35, wherein said template DNA sequence is made by reverse transcription of mRNA. 제35항에 있어서, 이중-도메인 핵산 집단을 벡터에 라이게이션하는 단계를추가로 포함하는 것을 특징으로 하는 방법.36. The method of claim 35, further comprising ligating a dual-domain nucleic acid population to the vector. 제39항에 있어서, 상기 벡터를 숙주 내로 도입하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.40. The method of claim 39, further comprising introducing the vector into a host. 제40항에 있어서, 상기 핵산 도메인이 폴리펩티드 도메인을 코딩하는, 상기 이중-도메인 핵산에 의해 코딩되는 이중-도메인 폴리펩티드를 발현시키는 단계를 추가로 포함하는 것을 특징으로 하는 방법.41. The method of claim 40, further comprising expressing a dual-domain polypeptide encoded by the dual-domain nucleic acid, wherein the nucleic acid domain encodes a polypeptide domain. 제39항에 있어서, 상기 벡터로부터 RNA를 전사시키는 단계를 추가로 포함하는 것을 특징으로 하는 방법.40. The method of claim 39, further comprising the step of transcription of RNA from said vector. 제42항에 있어서, 상기 벡터가 식물 세포에서의 상기 핵산의 복제 및/또는 발현과 양립가능한, 전사 RNA를 식물 세포 내로 도입하는 단계 및 이중-도메인 폴리펩티드를 발현시키는 단계를 추가로 포함하는 것을 특징으로 하는 방법.The method of claim 42, further comprising introducing a transcriptional RNA into the plant cell and expressing a dual-domain polypeptide, wherein the vector is compatible with replication and / or expression of the nucleic acid in the plant cell. How to. 제41항의 방법에 의해 생성되는, 이중-도메인 폴리펩티드 집단, 또는 그로부터 선택되는 이중-도메인 폴리펩티드.A dual-domain polypeptide population produced by the method of claim 41, or a dual-domain polypeptide selected therefrom. 제43항의 방법에 의해 식물 세포에서 생성되는, 이중-도메인 폴리펩티드 집단, 또는 그로부터 선택되는 이중-도메인 폴리펩티드.A population of dual-domain polypeptides, or a dual-domain polypeptide selected therefrom, produced in a plant cell by the method of claim 43. 하기 단계를 포함하는 제27항의 폴리펩티드의 생성 방법:A method of producing a polypeptide of claim 27 comprising the following steps: (a) 폴리펩티드의 제1 도메인을 코딩하는 핵산을, 링커의 제1 부분을 코딩하는 핵산에 결합시켜 제1 핵산 작제물을 생성하는 단계;(a) binding a nucleic acid encoding a first domain of a polypeptide to a nucleic acid encoding a first portion of a linker to produce a first nucleic acid construct; (b) 링커의 제2 부분을 코딩하는 핵산을, 폴리펩티드의 제2 도메인을 코딩하는 핵산에 결합시켜 제2 핵산 작제물을 생성하는 단계;(b) binding the nucleic acid encoding the second portion of the linker to the nucleic acid encoding the second domain of the polypeptide to generate a second nucleic acid construct; (c) 일시적 식물 발현 벡터 내로 제1 및 제2 작제물을 프레임에 맞게 (in frame) 혼입하여, 발현시 폴리펩티드가 식 D1-L-D2로 기재되는 링커에 의해 분리되는 제1 및 제2 도메인을 보유하도록 하는 단계;(c) Incorporating the first and second constructs in frame into a transient plant expression vector such that upon expression the polypeptide is separated by a linker described by Formula D 1 -LD 2 . Retaining; (d) 식물을 벡터로 트랜스펙션시켜 식물이 일시적으로 폴리펩티드를 생산하게 하는 단계; 및(d) transfecting the plant with the vector to cause the plant to temporarily produce a polypeptide; And (e) 폴리펩티드를 기능적으로 폴딩된 가용성의 단백질로서 회수하는 단계.(e) recovering the polypeptide as a functionally folded soluble protein. 제46항에 있어서, 식물이 식물 세포인 것을 특징으로 하는 방법.47. The method of claim 46, wherein the plant is a plant cell. 2개의 폴리펩티드 도메인을 코딩하는 2개의 핵산 도메인 또는 2개의 핵산 서열을 결합시키며, 하기 특성을 가지는 축중 반복 트리플렛 뉴클레오티드의 패턴을 가지는 링커 핵산 분자 또는 서열:A linker nucleic acid molecule or sequence that binds two nucleic acid domains or two nucleic acid sequences encoding two polypeptide domains and has a pattern of degenerate repeat triplet nucleotides having the following characteristics: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없고;(iii) one position of each repeating triplet cannot be the same nucleotide as the 3 position of the repeating triplet; (iv) 상기 도메인을 결합시키는 상기 분자 또는 서열은 Gly4Ser 또는 그의 반복체를 코딩하지 않음.(iv) the molecule or sequence that binds the domain does not encode Gly 4 Ser or a repeat thereof. 각각이 2개의 폴리펩티드 도메인을 코딩하는 2개의 핵산 도메인 또는 2개의 핵산 서열을 결합시키며, 각각이 하기 특성을 가지는 축중 반복 트리플렛 뉴클레오티드의 패턴을 가지는 링커 핵산 분자 또는 서열의 라이브러리:A library of linker nucleic acid molecules or sequences each having two nucleic acid domains or two nucleic acid sequences encoding two polypeptide domains, each having a pattern of degenerate repeat triplet nucleotides having the following characteristics: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없고;(iii) one position of each repeating triplet cannot be the same nucleotide as the 3 position of the repeating triplet; (iv) 상기 도메인을 결합시키는 상기 분자 또는 서열 각각은 Gly4Ser 또는그의 반복체를 코딩하지 않음.(iv) each of the molecules or sequences that bind the domains does not encode Gly 4 Ser or a repeat thereof. 하기 단계를 포함하는, 제49항의 링커 핵산 분자 또는 서열 라이브러리의 제조 방법:A method of making a linker nucleic acid molecule or sequence library of claim 49, comprising the following steps: (a) 제1 및 제2 도메인을 포함하는 2개의 주형 DNA 서열을 얻는 단계;(a) obtaining two template DNA sequences comprising the first and second domains; (b) 각각의 프라이머쌍이 상류 프라이머 및 하류 프라이머를 포함하며, 각각의 프라이머는 5' 말단 및 3' 말단을 가지고, 제1 도메인용 하류 프라이머 또는 제2 도메인용 상류 프라이머가 비주형화 서열을 포함하며, 여기서, 비주형화 서열은 반복 패턴의 축중 반복 트리플렛 뉴클레오티드를 포함하고, 이 때, 반복 패턴의 축중 반복 트리플렛 뉴클레오티드의 2개 이상의 5' 말단 트리플렛은 동일한 축중 서열을 가지는, 제1 및 제2 도메인을 증폭시키는 증폭 프라이머쌍을 제조하는 단계;(b) each primer pair comprises an upstream primer and a downstream primer, each primer having a 5 'end and a 3' end, wherein the downstream primer for the first domain or the upstream primer for the second domain comprises an untyped sequence; Wherein the untemplated sequence comprises degenerate repeat triplet nucleotides of a repeating pattern, wherein two or more 5 ′ terminal triplets of the degenerate repeat triplet nucleotides of the repeating pattern have the same degenerate sequence; Preparing an amplification primer pair for amplification; (c) 증폭 프라이머를 이용하여 도메인을 증폭시켜 비-주형화 서열에서 상이한 길이 및 서열을 가지는 하나 이상의 핵산 도메인 집단을 생성하는 단계;(c) amplifying the domains using amplification primers to produce one or more populations of nucleic acid domains having different lengths and sequences in the non-templating sequence; (d) 단계 (c)에서 생성한 핵산 도메인을 라이게이션시켜 이중-도메인 분자 집단을 생성하는 단계; 및(d) ligating the nucleic acid domain generated in step (c) to generate a dual-domain molecular population; And (e) 상기 이중 도메인 분자 집단으로부터 상기 링커 핵산 분자 또는 서열을 절단해내거나 증폭시키는 단계.(e) cleaving or amplifying the linker nucleic acid molecule or sequence from the population of dual domain molecules. 2개의 폴리펩티드 도메인을 코딩하는 2개의 핵산 도메인 또는 2개의 핵산 서열을 결합시키며, 하기:Joining two nucleic acid domains or two nucleic acid sequences encoding two polypeptide domains, wherein: (i) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 2 위치와 동일한 뉴클레오티드일 수 없거나;(i) one position of each repeating triplet may not be the same nucleotide as two positions of the repeating triplet; (ii) 각각의 반복 트리플렛의 2 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없거나;(ii) the 2 position of each repeat triplet may not be the same nucleotide as the 3 position of the repeat triplet; (iii) 각각의 반복 트리플렛의 1 위치는 반복 트리플렛의 3 위치와 동일한 뉴클레오티드일 수 없고;(iii) one position of each repeating triplet cannot be the same nucleotide as the 3 position of the repeating triplet; (iv) 상기 도메인을 결합시키는 상기 분자 또는 서열은 Gly4Ser 또는 그의 반복체를 코딩하지 않는(iv) the molecule or sequence that binds the domain does not encode Gly 4 Ser or a repeat thereof 특성을 가지는 축중 반복 트리플렛 뉴클레오티드의 패턴을 가지는 링커 핵산 분자 또는 서열의 제조 방법으로서, 하기 단계:A process for preparing a linker nucleic acid molecule or sequence having a pattern of degenerate repeat triplet nucleotides having characteristics, comprising the following steps: (a) 제49항의 방법에 따른 링커 핵산 분자 또는 서열 라이브러리의 제조 단계; 및(a) preparing a linker nucleic acid molecule or sequence library according to the method of claim 49; And (b) 상기 라이브러리로부터 상기 링커 분자 또는 서열을 선발 단리하는 단계(b) selecting and isolating said linker molecule or sequence from said library 를 포함하는 링커 핵산 분자 또는 서열의 제조 방법.Method for producing a linker nucleic acid molecule or sequence comprising a.
KR1020027003842A 1999-09-24 2000-09-22 Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules KR20020059413A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15597899P 1999-09-24 1999-09-24
US60/155,978 1999-09-24
PCT/US2000/025965 WO2001023543A1 (en) 1999-09-24 2000-09-22 Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules

Publications (1)

Publication Number Publication Date
KR20020059413A true KR20020059413A (en) 2002-07-12

Family

ID=22557557

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027003842A KR20020059413A (en) 1999-09-24 2000-09-22 Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules

Country Status (8)

Country Link
EP (1) EP1218501A1 (en)
JP (1) JP2003510073A (en)
KR (1) KR20020059413A (en)
AU (1) AU782856B2 (en)
CA (1) CA2385609A1 (en)
RU (1) RU2002110820A (en)
WO (1) WO2001023543A1 (en)
ZA (1) ZA200202066B (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2426194T3 (en) * 2005-08-02 2013-10-21 Planet Biotechnology, Inc. Enhanced toxin receptor chimeric proteins and toxin receptor chimeric proteins for the treatment and prevention of anthrax
KR102361890B1 (en) * 2017-03-16 2022-02-10 임문워크 아이엔씨 Linker unit and molecular structure comprising same

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5977438A (en) * 1988-02-26 1999-11-02 Biosource Technologies, Inc. Production of peptides in plants as viral coat protein fusions
US5747334A (en) * 1990-02-15 1998-05-05 The University Of North Carolina At Chapel Hill Random peptide library
AU5670194A (en) * 1992-11-20 1994-06-22 Enzon, Inc. Linker for linked fusion polypeptides
US6187564B1 (en) * 1997-07-10 2001-02-13 Beth Israel Deaconess Medical Center DNA encoding erythropoietin multimers having modified 5′ and 3′ sequences and its use to prepare EPO therapeutics

Also Published As

Publication number Publication date
EP1218501A1 (en) 2002-07-03
JP2003510073A (en) 2003-03-18
WO2001023543A1 (en) 2001-04-05
AU7601700A (en) 2001-04-30
AU782856B2 (en) 2005-09-01
ZA200202066B (en) 2003-05-28
CA2385609A1 (en) 2001-04-05
RU2002110820A (en) 2004-01-27

Similar Documents

Publication Publication Date Title
Owen et al. Synthesis of a Functional Anti–Phytochrome Single–Chain Fv Protein in Transgenic Tobacco
Anilionis et al. Structure of the glycoprotein gene in rabies virus
JPH03280883A (en) Recombination dna containing sequence from rna viruse, and gene-manipulating method using dna thereof
KR100270195B1 (en) DNA sequence encoding the gelonin polypeptide
JP2000102396A (en) Dna encoding epithelial cell specific growth factor
Alzhanova-Ericsson et al. A protein of the SR family of splicing factors binds extensively to exonic Balbiani ring pre-mRNA and accompanies the RNA from the gene to the nuclear pore.
KR100578461B1 (en) Stress-induced promoter derived from rice
JPH03501323A (en) Artificial gene encoding authentic human serum albumin, its use and method for its production
US5834236A (en) AATT repeat transcription enhancer element
AU779719B2 (en) Recombinant fusion molecules
WO1997049727A9 (en) Aatt promoter element and transcription factor
US7297478B1 (en) Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules
Steitz et al. Two ribosome binding sites from the gene 0.3 messenger RNA of bacteriophage T7
Peränen et al. Expression, purification, and properties of Rab8 function in actin cortical skeleton organization and polarized transport
KR20020059413A (en) Creation of variable length and sequence linker regions for dual-domain or multi-domain molecules
KR950012900B1 (en) Expression vector for anti-virus protein gene
Landsberger et al. Molecular characterization of nucleus-localized RNA-binding proteins from higher plants
US5340732A (en) Antiviral protein
KR100201358B1 (en) Process for the preparation of extracellular signal-regulated protein kinase-1 in e.coli
KR0155453B1 (en) Method of combined antibody against hepatitis-b virus by nicotiana tabacum
KR20050027838A (en) Recombinant human growth hormone expressed in plants
KR20090130474A (en) Production of ga733-2 and antibody fc complex in transgenic plant
JP2001521756A5 (en)
CA2288432A1 (en) Expression of fungicide-binding polypeptides in plants for producing fungicide tolerance
KR20050027836A (en) Basic fibroblast growth factor expressed in plants

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination