KR20100037031A - 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법 - Google Patents
유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR20100037031A KR20100037031A KR1020097025740A KR20097025740A KR20100037031A KR 20100037031 A KR20100037031 A KR 20100037031A KR 1020097025740 A KR1020097025740 A KR 1020097025740A KR 20097025740 A KR20097025740 A KR 20097025740A KR 20100037031 A KR20100037031 A KR 20100037031A
- Authority
- KR
- South Korea
- Prior art keywords
- genetically modified
- microorganism
- thermophilic
- mesophilic
- gene
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000003209 gene knockout Methods 0.000 title description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims abstract description 306
- 244000005700 microbiome Species 0.000 claims abstract description 259
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 201
- 102000004190 Enzymes Human genes 0.000 claims abstract description 131
- 108090000790 Enzymes Proteins 0.000 claims abstract description 131
- 238000004519 manufacturing process Methods 0.000 claims abstract description 66
- 238000000855 fermentation Methods 0.000 claims abstract description 52
- 230000004151 fermentation Effects 0.000 claims abstract description 50
- 150000007524 organic acids Chemical class 0.000 claims abstract description 46
- 239000002029 lignocellulosic biomass Substances 0.000 claims abstract description 38
- 150000003839 salts Chemical class 0.000 claims abstract description 19
- 230000001965 increasing effect Effects 0.000 claims abstract description 17
- 230000002503 metabolic effect Effects 0.000 claims abstract description 17
- 230000001105 regulatory effect Effects 0.000 claims abstract description 6
- 241000193403 Clostridium Species 0.000 claims description 128
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 claims description 86
- 239000001913 cellulose Substances 0.000 claims description 76
- 229920002678 cellulose Polymers 0.000 claims description 76
- 235000000346 sugar Nutrition 0.000 claims description 59
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 claims description 57
- 239000013598 vector Substances 0.000 claims description 56
- 241000894006 Bacteria Species 0.000 claims description 43
- -1 hexose sugars Chemical class 0.000 claims description 42
- 102000003855 L-lactate dehydrogenase Human genes 0.000 claims description 37
- 108700023483 L-lactate dehydrogenases Proteins 0.000 claims description 37
- 239000010902 straw Substances 0.000 claims description 35
- 108010092060 Acetate kinase Proteins 0.000 claims description 33
- 241000933069 Lachnoclostridium phytofermentans Species 0.000 claims description 32
- 229920001221 xylan Polymers 0.000 claims description 29
- 150000004823 xylans Chemical class 0.000 claims description 29
- 239000004310 lactic acid Substances 0.000 claims description 27
- 235000014655 lactic acid Nutrition 0.000 claims description 27
- 150000007523 nucleic acids Chemical class 0.000 claims description 24
- 239000002028 Biomass Substances 0.000 claims description 23
- 102000039446 nucleic acids Human genes 0.000 claims description 23
- 108020004707 nucleic acids Proteins 0.000 claims description 23
- 108091022915 xylulokinase Proteins 0.000 claims description 22
- 108010021809 Alcohol dehydrogenase Proteins 0.000 claims description 21
- 102000007698 Alcohol dehydrogenase Human genes 0.000 claims description 21
- 241001137871 Thermoanaerobacterium saccharolyticum Species 0.000 claims description 21
- 108700040099 Xylose isomerases Proteins 0.000 claims description 21
- 240000008042 Zea mays Species 0.000 claims description 21
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 21
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 21
- 235000005822 corn Nutrition 0.000 claims description 21
- 102100029089 Xylulose kinase Human genes 0.000 claims description 20
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 claims description 19
- 241001137870 Thermoanaerobacterium Species 0.000 claims description 19
- 241000193453 [Clostridium] cellulolyticum Species 0.000 claims description 19
- 239000002773 nucleotide Substances 0.000 claims description 19
- 125000003729 nucleotide group Chemical group 0.000 claims description 19
- 230000001580 bacterial effect Effects 0.000 claims description 18
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 17
- 108700023175 Phosphate acetyltransferases Proteins 0.000 claims description 15
- 229910052799 carbon Inorganic materials 0.000 claims description 15
- 239000010907 stover Substances 0.000 claims description 15
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 14
- 241000193448 Ruminiclostridium thermocellum Species 0.000 claims description 14
- 239000000835 fiber Substances 0.000 claims description 14
- 150000002402 hexoses Chemical class 0.000 claims description 14
- 240000000111 Saccharum officinarum Species 0.000 claims description 13
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 13
- 150000002972 pentoses Chemical class 0.000 claims description 13
- 239000010802 sludge Substances 0.000 claims description 13
- 108010018080 L-arabinose isomerase Proteins 0.000 claims description 12
- 241001520808 Panicum virgatum Species 0.000 claims description 11
- 241000186339 Thermoanaerobacter Species 0.000 claims description 11
- 241000609240 Ambelania acida Species 0.000 claims description 10
- 239000010905 bagasse Substances 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 10
- 238000003780 insertion Methods 0.000 claims description 10
- 230000037431 insertion Effects 0.000 claims description 10
- 244000025254 Cannabis sativa Species 0.000 claims description 9
- 240000007594 Oryza sativa Species 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 9
- 150000001720 carbohydrates Chemical class 0.000 claims description 9
- 235000009566 rice Nutrition 0.000 claims description 9
- 108090000416 L-ribulose-5-phosphate 4-epimerases Proteins 0.000 claims description 8
- 241000193445 [Clostridium] stercorarium Species 0.000 claims description 8
- 241000894007 species Species 0.000 claims description 8
- 241000219000 Populus Species 0.000 claims description 7
- 230000002068 genetic effect Effects 0.000 claims description 7
- 239000011121 hardwood Substances 0.000 claims description 7
- 230000007062 hydrolysis Effects 0.000 claims description 7
- 238000006460 hydrolysis reaction Methods 0.000 claims description 7
- 150000008163 sugars Chemical class 0.000 claims description 7
- 239000002023 wood Substances 0.000 claims description 7
- 241000193446 Thermoanaerobacterium thermosaccharolyticum Species 0.000 claims description 6
- 239000002154 agricultural waste Substances 0.000 claims description 6
- 239000000523 sample Substances 0.000 claims description 6
- 239000011122 softwood Substances 0.000 claims description 6
- 239000002699 waste material Substances 0.000 claims description 6
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 5
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 5
- 240000000385 Brassica napus var. napus Species 0.000 claims description 5
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 5
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 5
- 241000178957 Caldanaerobius polysaccharolyticus Species 0.000 claims description 5
- 241000626621 Geobacillus Species 0.000 claims description 5
- 241000193385 Geobacillus stearothermophilus Species 0.000 claims description 5
- 235000010469 Glycine max Nutrition 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 244000081757 Phalaris arundinacea Species 0.000 claims description 5
- 229920001131 Pulp (paper) Polymers 0.000 claims description 5
- 241000746413 Spartina Species 0.000 claims description 5
- 235000013339 cereals Nutrition 0.000 claims description 5
- 241000321602 Caldanaerobius zeae Species 0.000 claims description 4
- 241000178334 Caldicellulosiruptor Species 0.000 claims description 4
- 244000068988 Glycine max Species 0.000 claims description 4
- 241001147742 Saccharococcus Species 0.000 claims description 4
- 241000124033 Salix Species 0.000 claims description 4
- 241001468159 Thermoanaerobacterium thermosulfurigenes Species 0.000 claims description 4
- 239000010903 husk Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 241001455623 Anaerocellum Species 0.000 claims description 3
- 241001626813 Anoxybacillus Species 0.000 claims description 3
- 241001468259 Anoxybacillus flavithermus Species 0.000 claims description 3
- 241001520170 Anoxybacillus gonensis Species 0.000 claims description 3
- 241001487119 Anoxybacillus kamchatkensis Species 0.000 claims description 3
- 240000005430 Bromus catharticus Species 0.000 claims description 3
- 241000511681 Caldicellulosiruptor kristjanssonii Species 0.000 claims description 3
- 241000556413 Caldicellulosiruptor owensensis Species 0.000 claims description 3
- 241000178335 Caldicellulosiruptor saccharolyticus Species 0.000 claims description 3
- 208000035484 Cellulite Diseases 0.000 claims description 3
- 240000003433 Miscanthus floridulus Species 0.000 claims description 3
- 241000933952 Paenibacillus campinasensis Species 0.000 claims description 3
- 241001621940 Parageobacillus caldoxylosilyticus Species 0.000 claims description 3
- 241000193390 Parageobacillus thermoglucosidasius Species 0.000 claims description 3
- 206010049752 Peau d'orange Diseases 0.000 claims description 3
- 235000016536 Sporobolus cryptandrus Nutrition 0.000 claims description 3
- 241000186337 Thermoanaerobacter ethanolicus Species 0.000 claims description 3
- 241000193447 Thermoanaerobacter thermohydrosulfuricus Species 0.000 claims description 3
- 241000216452 Thermoanaerobacterium aotearoense Species 0.000 claims description 3
- 241001147773 Thermoanaerobacterium xylanolyticum Species 0.000 claims description 3
- 230000036232 cellulite Effects 0.000 claims description 3
- 229920001282 polysaccharide Polymers 0.000 claims description 3
- 239000005017 polysaccharide Substances 0.000 claims description 3
- 150000004804 polysaccharides Chemical class 0.000 claims description 3
- 241001429558 Caldicellulosiruptor bescii Species 0.000 claims description 2
- 241000511679 Caldicellulosiruptor lactoaceticus Species 0.000 claims description 2
- 241000179039 Paenibacillus Species 0.000 claims description 2
- 230000001413 cellular effect Effects 0.000 claims description 2
- 230000030279 gene silencing Effects 0.000 claims description 2
- 230000003301 hydrolyzing effect Effects 0.000 claims 2
- 235000010676 Ocimum basilicum Nutrition 0.000 claims 1
- 240000007926 Ocimum gratissimum Species 0.000 claims 1
- 241001147744 Saccharococcus thermophilus Species 0.000 claims 1
- GUJOJGAPFQRJSV-UHFFFAOYSA-N dialuminum;dioxosilane;oxygen(2-);hydrate Chemical compound O.[O-2].[O-2].[O-2].[Al+3].[Al+3].O=[Si]=O.O=[Si]=O.O=[Si]=O.O=[Si]=O GUJOJGAPFQRJSV-UHFFFAOYSA-N 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 22
- 108020004414 DNA Proteins 0.000 description 134
- 239000013612 plasmid Substances 0.000 description 93
- 229940088598 enzyme Drugs 0.000 description 92
- 235000010980 cellulose Nutrition 0.000 description 67
- 239000000047 product Substances 0.000 description 67
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 63
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 61
- 108091033319 polynucleotide Proteins 0.000 description 52
- 102000040430 polynucleotide Human genes 0.000 description 52
- 239000002157 polynucleotide Substances 0.000 description 52
- 210000004027 cell Anatomy 0.000 description 49
- 239000012634 fragment Substances 0.000 description 40
- 230000014509 gene expression Effects 0.000 description 34
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 30
- 108020005544 Antisense RNA Proteins 0.000 description 29
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 29
- 230000001461 cytolytic effect Effects 0.000 description 29
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 28
- 229920001184 polypeptide Polymers 0.000 description 28
- 108090000765 processed proteins & peptides Proteins 0.000 description 28
- 102000004196 processed proteins & peptides Human genes 0.000 description 28
- 230000037361 pathway Effects 0.000 description 25
- 229940076788 pyruvate Drugs 0.000 description 24
- 101150025831 Ack gene Proteins 0.000 description 23
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 23
- 239000003184 complementary RNA Substances 0.000 description 23
- 101150104734 ldh gene Proteins 0.000 description 23
- 235000011054 acetic acid Nutrition 0.000 description 22
- 229960000583 acetic acid Drugs 0.000 description 21
- 230000002779 inactivation Effects 0.000 description 21
- 230000015572 biosynthetic process Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 108010008221 formate C-acetyltransferase Proteins 0.000 description 18
- SRBFZHDQGSBBOR-SOOFDHNKSA-N D-ribopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@@H]1O SRBFZHDQGSBBOR-SOOFDHNKSA-N 0.000 description 16
- 230000034659 glycolysis Effects 0.000 description 16
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 15
- 239000002609 medium Substances 0.000 description 15
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 14
- 239000003550 marker Substances 0.000 description 14
- 239000000758 substrate Substances 0.000 description 14
- 210000000349 chromosome Anatomy 0.000 description 13
- 238000010367 cloning Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 230000002829 reductive effect Effects 0.000 description 13
- 108010059892 Cellulase Proteins 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 229940106157 cellulase Drugs 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 230000003362 replicative effect Effects 0.000 description 12
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 10
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 10
- 229920002488 Hemicellulose Polymers 0.000 description 10
- 108091092195 Intron Proteins 0.000 description 10
- 229940093915 gynecological organic acid Drugs 0.000 description 10
- 235000005985 organic acids Nutrition 0.000 description 10
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 9
- 101150070013 pfl gene Proteins 0.000 description 9
- IKHGUXGNUITLKF-UHFFFAOYSA-N Acetaldehyde Chemical compound CC=O IKHGUXGNUITLKF-UHFFFAOYSA-N 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 230000037353 metabolic pathway Effects 0.000 description 8
- 230000035755 proliferation Effects 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 230000003248 secreting effect Effects 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- 238000002744 homologous recombination Methods 0.000 description 7
- 230000006801 homologous recombination Effects 0.000 description 7
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 7
- 101150108780 pta gene Proteins 0.000 description 7
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 6
- ZAQJHHRNXZUBTE-WUJLRWPWSA-N D-xylulose Chemical compound OC[C@@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-WUJLRWPWSA-N 0.000 description 6
- 206010059866 Drug resistance Diseases 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 6
- 239000006227 byproduct Substances 0.000 description 6
- 235000014633 carbohydrates Nutrition 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 229930182830 galactose Natural products 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- 239000000543 intermediate Substances 0.000 description 6
- 239000012978 lignocellulosic material Substances 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000004060 metabolic process Effects 0.000 description 6
- 239000000811 xylitol Substances 0.000 description 6
- 229960002675 xylitol Drugs 0.000 description 6
- 101710088194 Dehydrogenase Proteins 0.000 description 5
- TVXBFESIOXBWNM-UHFFFAOYSA-N Xylitol Natural products OCCC(O)C(O)C(O)CCO TVXBFESIOXBWNM-UHFFFAOYSA-N 0.000 description 5
- 241001351214 [Clostridium] straminisolvens Species 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 101150055766 cat gene Proteins 0.000 description 5
- 229960005091 chloramphenicol Drugs 0.000 description 5
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 229960003276 erythromycin Drugs 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- HEBKCHPVOIAQTA-UHFFFAOYSA-N meso ribitol Natural products OCC(O)C(O)C(O)CO HEBKCHPVOIAQTA-UHFFFAOYSA-N 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- HEBKCHPVOIAQTA-SCDXWVJYSA-N xylitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)CO HEBKCHPVOIAQTA-SCDXWVJYSA-N 0.000 description 5
- 235000010447 xylitol Nutrition 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 4
- 102000016912 Aldehyde Reductase Human genes 0.000 description 4
- 108010053754 Aldehyde reductase Proteins 0.000 description 4
- 235000018185 Betula X alpestris Nutrition 0.000 description 4
- 235000018212 Betula X uliginosa Nutrition 0.000 description 4
- 108091035707 Consensus sequence Proteins 0.000 description 4
- AEMOLEFTQBMNLQ-AQKNRBDQSA-N D-glucopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@H]1O AEMOLEFTQBMNLQ-AQKNRBDQSA-N 0.000 description 4
- 108010058076 D-xylulose reductase Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 4
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 4
- 241000187654 Nocardia Species 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 241000192608 Phormidium Species 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 4
- 241000186338 Thermoanaerobacter sp. Species 0.000 description 4
- 102000008579 Transposases Human genes 0.000 description 4
- 108010020764 Transposases Proteins 0.000 description 4
- 108010081577 aldehyde dehydrogenase (NAD(P)+) Proteins 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- FOCAUTSVDIKZOP-UHFFFAOYSA-N chloroacetic acid Chemical compound OC(=O)CCl FOCAUTSVDIKZOP-UHFFFAOYSA-N 0.000 description 4
- 229940106681 chloroacetic acid Drugs 0.000 description 4
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 4
- 239000005516 coenzyme A Substances 0.000 description 4
- 229940093530 coenzyme a Drugs 0.000 description 4
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 235000019441 ethanol Nutrition 0.000 description 4
- WBJINCZRORDGAQ-UHFFFAOYSA-N ethyl formate Chemical compound CCOC=O WBJINCZRORDGAQ-UHFFFAOYSA-N 0.000 description 4
- 229940097042 glucuronate Drugs 0.000 description 4
- 239000008101 lactose Substances 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000012269 metabolic engineering Methods 0.000 description 4
- 239000002207 metabolite Substances 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- JGFYQVQAXANWJU-UHFFFAOYSA-M sodium fluoroacetate Chemical compound [Na+].[O-]C(=O)CF JGFYQVQAXANWJU-UHFFFAOYSA-M 0.000 description 4
- 238000000844 transformation Methods 0.000 description 4
- 230000032258 transport Effects 0.000 description 4
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 4
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 241000195940 Bryophyta Species 0.000 description 3
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 3
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 101100335746 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) gapA gene Proteins 0.000 description 3
- 101150058595 MDH gene Proteins 0.000 description 3
- 239000007993 MOPS buffer Substances 0.000 description 3
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 244000269722 Thea sinensis Species 0.000 description 3
- 239000000074 antisense oligonucleotide Substances 0.000 description 3
- 238000012230 antisense oligonucleotides Methods 0.000 description 3
- 239000011942 biocatalyst Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000002860 competitive effect Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000009510 drug design Methods 0.000 description 3
- 239000000446 fuel Substances 0.000 description 3
- 101150073818 gap gene Proteins 0.000 description 3
- 229940059442 hemicellulase Drugs 0.000 description 3
- 108010002430 hemicellulase Proteins 0.000 description 3
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 3
- 239000008108 microcrystalline cellulose Substances 0.000 description 3
- 229940016286 microcrystalline cellulose Drugs 0.000 description 3
- 235000011929 mousse Nutrition 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 230000004108 pentose phosphate pathway Effects 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 108010060146 pyruvate formate-lyase activating enzyme Proteins 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000006188 syrup Substances 0.000 description 3
- 235000020357 syrup Nutrition 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000018412 transposition, RNA-mediated Effects 0.000 description 3
- 241001148471 unidentified anaerobic bacterium Species 0.000 description 3
- DSCUFZSWIGAJKM-UHFFFAOYSA-N 2-chloro-2-hydroxypropanoic acid Chemical compound CC(O)(Cl)C(O)=O DSCUFZSWIGAJKM-UHFFFAOYSA-N 0.000 description 2
- 108020004491 Antisense DNA Proteins 0.000 description 2
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- 241000192731 Chloroflexus aurantiacus Species 0.000 description 2
- 241001112695 Clostridiales Species 0.000 description 2
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 229930091371 Fructose Natural products 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- 239000005715 Fructose Substances 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108091029499 Group II intron Proteins 0.000 description 2
- 241000588749 Klebsiella oxytoca Species 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000862991 Leptothrix <Bacteria> Species 0.000 description 2
- 108010026217 Malate Dehydrogenase Proteins 0.000 description 2
- 102000013460 Malate Dehydrogenase Human genes 0.000 description 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 description 2
- 241001331072 Microbispora rosea subsp. aerata Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241000192497 Oscillatoria Species 0.000 description 2
- 102000004316 Oxidoreductases Human genes 0.000 description 2
- 108090000854 Oxidoreductases Proteins 0.000 description 2
- 241001483078 Phyto Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000187177 Streptomyces thermovulgaris Species 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 241000192707 Synechococcus Species 0.000 description 2
- 241001464792 Synechococcus lividus Species 0.000 description 2
- 241000123734 Thermoanaerobacterium sp. Species 0.000 description 2
- 241000202344 Thermoflavimicrobium dichotomicum Species 0.000 description 2
- 241000204652 Thermotoga Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- 241000605118 Thiobacillus Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241001464778 Zymobacter Species 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 150000001298 alcohols Chemical class 0.000 description 2
- 239000003816 antisense DNA Substances 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010364 biochemical engineering Methods 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 239000002962 chemical mutagen Substances 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000003636 conditioned culture medium Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004043 dyeing Methods 0.000 description 2
- RIUKRCNLZYDWHS-UHFFFAOYSA-N ethane;methanesulfonic acid Chemical compound CC.CS(O)(=O)=O RIUKRCNLZYDWHS-UHFFFAOYSA-N 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- CNNRFBWVTKFGRE-UHFFFAOYSA-N formic acid;2-oxopropanoic acid Chemical class OC=O.CC(=O)C(O)=O CNNRFBWVTKFGRE-UHFFFAOYSA-N 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 230000004153 glucose metabolism Effects 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 230000002414 glycolytic effect Effects 0.000 description 2
- 229930182470 glycoside Natural products 0.000 description 2
- 150000002338 glycosides Chemical class 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 210000003093 intracellular space Anatomy 0.000 description 2
- 230000008252 l-arabinose utilization pathway Effects 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 239000003120 macrolide antibiotic agent Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000010627 oxidative phosphorylation Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229940107700 pyruvic acid Drugs 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 239000002351 wastewater Substances 0.000 description 2
- 230000004127 xylose metabolism Effects 0.000 description 2
- AUTALUGDOGWPQH-UBLOVXTBSA-N (2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanal;(2r,3s,4r)-2,3,4,5-tetrahydroxypentanal Chemical compound OC[C@@H](O)[C@H](O)[C@@H](O)C=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O AUTALUGDOGWPQH-UBLOVXTBSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- SJZRECIVHVDYJC-UHFFFAOYSA-M 4-hydroxybutyrate Chemical compound OCCCC([O-])=O SJZRECIVHVDYJC-UHFFFAOYSA-M 0.000 description 1
- 230000002407 ATP formation Effects 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 241001495177 Acetivibrio cellulolyticus Species 0.000 description 1
- 241001109646 Acetivibrio ethanolgignens Species 0.000 description 1
- 101100398788 Acetivibrio thermocellus (strain ATCC 27405 / DSM 1237 / JCM 9322 / NBRC 103400 / NCIMB 10682 / NRRL B-4536 / VPI 7372) ldh gene Proteins 0.000 description 1
- 241000589212 Acetobacter pasteurianus Species 0.000 description 1
- QTXZASLUYMRUAN-QLQASOTGSA-N Acetyl coenzyme A (Acetyl-CoA) Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1.O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 QTXZASLUYMRUAN-QLQASOTGSA-N 0.000 description 1
- 241000726121 Acidianus Species 0.000 description 1
- 241000605272 Acidithiobacillus thiooxidans Species 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000447456 Alkalibacter Species 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 241001485848 Anagnostidinema amphibium Species 0.000 description 1
- 241000192698 Aphanocapsa Species 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241001468229 Bifidobacterium thermophilum Species 0.000 description 1
- 241000193417 Brevibacillus laterosporus Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- XTPSTMAIWOCSGU-UJPDDDSFSA-N CC(O)=O.OC[C@@H](O)[C@H](O)[C@@H](O)C=O Chemical compound CC(O)=O.OC[C@@H](O)[C@H](O)[C@@H](O)C=O XTPSTMAIWOCSGU-UJPDDDSFSA-N 0.000 description 1
- 241000887245 Caldicellulosiruptor acetigenus Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 244000068645 Carya illinoensis Species 0.000 description 1
- 235000009025 Carya illinoensis Nutrition 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000192020 Clostridium ventriculi Species 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 241000206584 Cyanidium caldarium Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- FNZLKVNUWIIPSJ-RFZPGFLSSA-N D-xylulose 5-phosphate Chemical compound OCC(=O)[C@@H](O)[C@H](O)COP(O)(O)=O FNZLKVNUWIIPSJ-RFZPGFLSSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000186541 Desulfotomaculum Species 0.000 description 1
- 241000186538 Desulfotomaculum nigrificans Species 0.000 description 1
- 241000205236 Desulfurococcus Species 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000168430 Fervidobacterium gondwanense Species 0.000 description 1
- 241000605896 Fibrobacter succinogenes Species 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000605108 Flavobacterium johnsoniae Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150053193 GND1 gene Proteins 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 241000271811 Hydrogenimonas thermophila Species 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 241000580733 Kamptonema okenii Species 0.000 description 1
- IFQSXNOEEPCSLW-DKWTVANSSA-N L-cysteine hydrochloride Chemical compound Cl.SC[C@H](N)C(O)=O IFQSXNOEEPCSLW-DKWTVANSSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UCORVYFPSA-N L-ribulose Chemical compound OC[C@H](O)[C@H](O)C(=O)CO ZAQJHHRNXZUBTE-UCORVYFPSA-N 0.000 description 1
- FNZLKVNUWIIPSJ-CRCLSJGQSA-N L-ribulose 5-phosphate Chemical compound OCC(=O)[C@@H](O)[C@@H](O)COP(O)(O)=O FNZLKVNUWIIPSJ-CRCLSJGQSA-N 0.000 description 1
- 241001503905 Laceyella sacchari Species 0.000 description 1
- 102000000428 Lactate Dehydrogenases Human genes 0.000 description 1
- 108010080864 Lactate Dehydrogenases Proteins 0.000 description 1
- 244000199885 Lactobacillus bulgaricus Species 0.000 description 1
- 235000013960 Lactobacillus bulgaricus Nutrition 0.000 description 1
- 241000186866 Lactobacillus thermophilus Species 0.000 description 1
- 108010021101 Lamin Type B Proteins 0.000 description 1
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241001647400 Mastigocladus laminosus Species 0.000 description 1
- 241000589496 Meiothermus ruber Species 0.000 description 1
- 241000202974 Methanobacterium Species 0.000 description 1
- 241000204675 Methanopyrus Species 0.000 description 1
- 241000178985 Moorella Species 0.000 description 1
- 241000193459 Moorella thermoacetica Species 0.000 description 1
- 241000058854 Oscillatoria terebriformis Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000178960 Paenibacillus macerans Species 0.000 description 1
- 241000250930 Penicillata Species 0.000 description 1
- DYUQAZSOFZSPHD-UHFFFAOYSA-N Phenylpropanol Chemical compound CCC(O)C1=CC=CC=C1 DYUQAZSOFZSPHD-UHFFFAOYSA-N 0.000 description 1
- 241001453201 Phormidium laminosum Species 0.000 description 1
- 241000131460 Plectranthus Species 0.000 description 1
- 241000208465 Proteaceae Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 241000502430 Protocyclidium citrullus Species 0.000 description 1
- 241001495182 Pseudobacteroides cellulosolvens Species 0.000 description 1
- 241000187602 Pseudonocardia thermophila Species 0.000 description 1
- 241000205226 Pyrobaculum Species 0.000 description 1
- 241001223147 Pyrobaculum neutrophilum Species 0.000 description 1
- 241000205160 Pyrococcus Species 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 241000204671 Pyrodictium Species 0.000 description 1
- 241000531165 Pyrodictium abyssi Species 0.000 description 1
- 241001494984 Pyrodictium brockii Species 0.000 description 1
- 241000204670 Pyrodictium occultum Species 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 101710181816 Pyruvate-formate-lyase deactivase Proteins 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108050006523 Radical SAM Proteins 0.000 description 1
- 102000016812 Radical SAM Human genes 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 241001148570 Rhodothermus marinus Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 241000125139 Saccharomonospora azurea Species 0.000 description 1
- 101100103120 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) XKS1 gene Proteins 0.000 description 1
- 241001670248 Saccharophagus degradans Species 0.000 description 1
- 241001134661 Saccharopolyspora rectivirgula Species 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 241000589970 Spirochaetales Species 0.000 description 1
- 241000205219 Staphylothermus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 235000014897 Streptococcus lactis Nutrition 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000205101 Sulfolobus Species 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241001512067 Symploca Species 0.000 description 1
- 241001453296 Synechococcus elongatus Species 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 241000203770 Thermoactinomyces vulgaris Species 0.000 description 1
- 241000207200 Thermoanaerobacter acetoethylicus Species 0.000 description 1
- 241001147775 Thermoanaerobacter brockii Species 0.000 description 1
- 241000310480 Thermoanaerobacterium saccharolyticum DSM 7060 Species 0.000 description 1
- 241000203600 Thermobispora bispora Species 0.000 description 1
- 241000205188 Thermococcus Species 0.000 description 1
- 241000205180 Thermococcus litoralis Species 0.000 description 1
- 241000605782 Thermodesulfobacterium thermophilum Species 0.000 description 1
- 241000531244 Thermodiscus Species 0.000 description 1
- 241000205174 Thermofilum Species 0.000 description 1
- 241000531149 Thermofilum librum Species 0.000 description 1
- 241000589017 Thermomicrobium roseum Species 0.000 description 1
- 241000203640 Thermomonospora Species 0.000 description 1
- 241000203783 Thermomonospora curvata Species 0.000 description 1
- 241000204667 Thermoplasma Species 0.000 description 1
- 241000204673 Thermoplasma acidophilum Species 0.000 description 1
- 241000205204 Thermoproteus Species 0.000 description 1
- 241000204315 Thermosipho <sea snail> Species 0.000 description 1
- 241001495113 Thermostaphylospora chromogena Species 0.000 description 1
- 241000229716 Thermothrix thiopara Species 0.000 description 1
- 241000589500 Thermus aquaticus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- FZWLAAWBMGSTSO-UHFFFAOYSA-N Thiazole Chemical group C1=CSC=N1 FZWLAAWBMGSTSO-UHFFFAOYSA-N 0.000 description 1
- 241000190807 Thiothrix Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- 241001362380 Verruconis gallopava Species 0.000 description 1
- 101150100773 XKS1 gene Proteins 0.000 description 1
- 101150095212 XYL2 gene Proteins 0.000 description 1
- 241000317522 Youngiibacter multivorans Species 0.000 description 1
- 101150085516 ZWF1 gene Proteins 0.000 description 1
- 241001464780 Zymobacter palmae Species 0.000 description 1
- 241001147803 [Clostridium] aldrichii Species 0.000 description 1
- 241000229117 [Clostridium] hungatei Species 0.000 description 1
- 241001147802 [Clostridium] stercorarium subsp. thermolacticum Species 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 241001148470 aerobic bacillus Species 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 238000005267 amalgamation Methods 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 230000009604 anaerobic growth Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000002567 autonomic effect Effects 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- DLRVVLDZNNYCBX-ZZFZYMBESA-N beta-melibiose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)O1 DLRVVLDZNNYCBX-ZZFZYMBESA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- CDQSJQSWAWPGKG-UHFFFAOYSA-N butane-1,1-diol Chemical compound CCCC(O)O CDQSJQSWAWPGKG-UHFFFAOYSA-N 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 230000025938 carbohydrate utilization Effects 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 210000002318 cardia Anatomy 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 230000005757 colony formation Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000009837 dry grinding Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000023266 generation of precursor metabolites and energy Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 239000006456 gs medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000000852 hydrogen donor Substances 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 229940004208 lactobacillus bulgaricus Drugs 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000037323 metabolic rate Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical group 0.000 description 1
- 230000000972 organotrophic effect Effects 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 239000006041 probiotic Substances 0.000 description 1
- 235000018291 probiotics Nutrition 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000004537 pulping Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000001523 saccharolytic effect Effects 0.000 description 1
- 239000000932 sedative agent Substances 0.000 description 1
- 230000001624 sedative effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 235000021309 simple sugar Nutrition 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000004152 substrate-level phosphorylation Effects 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 101150065190 term gene Proteins 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001238 wet grinding Methods 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- 101150034227 xyl1 gene Proteins 0.000 description 1
- 150000003741 xylose derivatives Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1217—Phosphotransferases with a carboxyl group as acceptor (2.7.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
- C12N9/92—Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/065—Ethanol, i.e. non-beverage with microorganisms other than yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01002—Alcohol dehydrogenase (NADP+) (1.1.1.2), i.e. aldehyde reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01027—L-Lactate dehydrogenase (1.1.1.27)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/02—Oxidoreductases acting on the CH-OH group of donors (1.1) with a cytochrome as acceptor (1.1.2)
- C12Y101/02003—L-Lactate dehydrogenase (cytochrome) (1.1.2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01008—Phosphate acetyltransferase (2.3.1.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/01017—Xylulokinase (2.7.1.17)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/02—Phosphotransferases with a carboxy group as acceptor (2.7.2)
- C12Y207/02001—Acetate kinase (2.7.2.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/01—Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
- C12Y503/01005—Xylose isomerase (5.3.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P2203/00—Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Virology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명의 한 가지 일면은 유전자 변형된 호열성(thermophilic) 또는 중온성(mesophilic) 미생물에 관한 것인데, 여기서 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유(native) 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절됨으로써 발효 생산물로서 에탄올을 생산하는 상기 호열성 또는 중온성 미생물의 고유 능력을 증가시킨다. 특정 구체예에서, 상기 미생물은 에탄올의 대사적 생산에 관여하는 제 1의 비-고유(non-native) 효소를 엔코딩하는 제 2의 비-고유 유전자를 추가로 포함한다. 본 발명의 또 다른 일면은 리그노셀룰로오스 바이오매스를 유전자 변형된 호열성 또는 중온성 미생물과 접촉시키는 것을 포함하여 리그노셀룰로오스 바이오매스를 에탄올로 전환시키는 방법에 관한 것이다.
Description
관련 출원
본 출원은 2007년 5월 9일에 출원된 미국 가특허출원 일련 번호 60/916,978을 우선권으로 주장하며, 상기 가특허출원은 그 전문이 본원에 참조로 포함된다.
발명의 배경
에너지 전환, 이용 및 접근이 지속가능성, 환경의 질(environmental quality), 안전 및 빈곤과 관련된 난제를 포함하는 현시대의 커다란 난제들 중 다수의 근저에 존재한다. 신흥 기술의 새로운 적용이 이러한 난제들에 대응하기 위해 필요하다. 신흥 기술 중 가장 강력한 기술 중의 하나인 생물공학은 중요한 새로운 에너지 전환 공정을 초래할 수 있다. 식물 바이오매스와 이의 유도체는 에너지를 인류에게 유용한 형태로 생물학적으로 전환시키기 위한 자원이다.
식물 바이오매스의 형태 중에서, 리그노셀룰로오스(lignocellulosic) 바이오매스 ('바이오매스')가 이의 대규모 이용가능성, 낮은 가격 및 환경친화적(environmentally benign) 생산으로 인해 에너지 적용을 위해 특히 적합하다. 특히, 셀룰로오스 바이오매스를 기반으로 하는 많은 에너지 생산 및 이용 사이클은 라이프-사이클(life-cycle)을 기준으로 하여 온실 가스 배출률이 거의 0이다. 바이오매스 공급원료로부터의 보다 광범위한 에너지 생산을 저해하는 주요 장애요인은 이러한 재료가 유용한 연료로 전환되지 않게 하는 특성을 극복하기 위한 저렴한 기술이 대체로 없다는 것이다. 리그노셀룰로오스 바이오매스는 에탄올로 전환될 수 있는 탄수화물 분획 (예를 들어, 셀룰로오스와 헤미셀룰로오스)를 함유한다. 이러한 분획을 전환하기 위해, 셀룰로오스와 헤미셀룰로오스는 궁극적으로 단당류로 전환되거나 가수분해되어야 하는데, 역사적으로 문제가 되는 것으로 판명되어온 것이 바로 가수분해이다.
생물학적으로 매개되는 공정은 에너지 전환을 위해 유망하며, 특히 리그노셀룰로오스 바이오매스를 연료로 전환시키는 데에 있어서 유망하다. 효소 또는 미생물에 의한 가수분해를 포함하는 바이오매스 처리 계획은 일반적으로 다음과 같은 4가지의 생물학적으로 매개되는 변환을 포함한다: (1) 당분해(saccharolytic) 효소 (셀룰라아제 및 헤미셀룰라아제)의 생산; (2) 전처리된 바이오매스에 존재하는 탄수화물 성분의 당(sugar)으로의 가수분해; (3) 헥소오스 당 (예를 들어, 글루코오스, 만노오스 및 갈락토오스)의 발효; 및 (4) 펜토오스 당 (예를 들어, 자일로오스 및 아라비노오스)의 발효. 이러한 4가지 변환은 통합된 생물가공(consolidated bioprocessing, CBP)으로 일컬어지는 공정 구성에서 단일 단계로 일어나는데, 이는 셀룰라아제 및/또는 헤미셀룰라아제 생산을 위한 전용 공정 단계를 포함하지 않는다는 점에서 다른 덜 고도로 집적된 구성과 구별된다.
CBP는 전용 셀룰라아제 생산을 특징으로 하는 공정에 비해 저렴하고 효율이 높다는 잠재력을 제공한다. 상기 이점은 부분적으로는 자본 비용, 기질 및 다른 원료 물질, 및 셀룰라아제 생산과 관련된 설비(utility)가 회피됨에 따른 것이다. 또한, 효소-미생물 상승작용 및 호열성(thermophilic) 생물체 및/또는 복합 셀룰라아제 시스템의 사용을 포함하는 수 가지 요인들이 높은 가수분해율의 실현, 및 이에 따른 CBP의 사용시의 반응기 부피 및 자본 투자의 감소를 지원한다. 더욱이, 셀룰로오스-부착성(cellulose-adherent) 셀룰로오스분해성(cellulolytic) 미생물은 부착되지 않은 미생물, 예를 들어 오염균(contaminant)과 셀룰로오스 가수분해의 생산물에 대해 성공적으로 경합하는 것으로 여겨지며, 이는 미생물에 의한 셀룰로오스 이용을 기반으로 하는 산업적 공정의 안정성을 증가시킬 수 있다. CBP를 가능하게 하는 미생물을 개발하는 데에 있어서 다음의 2가지 전략을 통해 진전이 이루어지고 있다: 천연 셀룰로오스분해성 미생물을 엔지니어링(engineering)하여, 수율 및 역가와 같은 생산물 관련된 특성을 개선시키려는 전략; 및 높은 생산물 수율 및 역가를 나타내는 비-셀룰로오스분해성(non-cellulolytic) 생물체를 엔지니어링하여, 이종성(heterologous) 셀룰로오스 및 헤미셀룰로오스 이용을 가능하게 하는 셀룰라아제 및 헤미셀룰라아제 시스템을 발현하게 하려는 전략.
많은 세균은 단순 헥소오스 당을 해당과정(glycolysis)을 통해 산성 생산물과 pH-중성 생산물의 혼합물로 발효시키는 능력을 지닌다. 해당과정 경로(glycolytic pathway)는 풍부하고, 일련의 효소에 의한 단계들을 포함하는데, 이에 의해 탄소 6개의 글루코오스 분자가 다수의 중간체들을 통해 탄소 3개의 화합물인 피루베이트 2분자로 분해된다. 이러한 공정은 ATP (생물학적 에너지 공급원) 및 환원된 보조인자인 NADH를 궁극적으로 생성시킨다.
피루베이트는 대사의 중요한 중간 화합물이다. 예를 들어, 호기성 조건하에서 피루베이트는 아세틸 조효소 A(아세틸 CoA)로 산화될 수 있는데, 그 다음 이는 트리카르복실산 사이클(TCA)로 들어가고, 이어서 합성 전구체, CO2 및 환원된 보조인자를 생성시킨다. 그 후, 상기 보조인자는 일련의 효소에 의한 단계들을 통해 수소 당량을 산소에게 내줌으로써 산화되어, 물과 ATP를 형성한다. 이러한 에너지 형성 공정은 산화적 인산화로서 공지되어 있다.
혐기성 조건 (산소가 이용가능하지 않음)하에서, 유기 화합물의 분해 생산물이 수소 공여체 및 수용체로서 기능하는 발효가 일어난다. 해당과정으로부터의 과량의 NADH가 유기 기질을 락테이트와 에탄올과 같은 생산물로 환원시키는 것을 포함하는 반응으로 산화된다. 또한, ATP는 기질 수준 인산화로서 공지된 공정으로 아세테이트와 같은 유기산의 생산으로부터 재생된다. 따라서, 해당과정 및 피루베이트 대사의 발효 생산물은 다양한 유기산, 알코올 및 CO2를 포함한다.
대다수의 통성 혐기성 세균은 호기성 또는 혐기성 조건하에서 에탄올을 고수율로 생산하지 않는다. 대부분의 통성 혐기성생물(anaerobe)은 피루베이트 데히드로게나아제(PDH)와 트리카르복실산 사이클(TCA)을 통해 혐기적으로 피루베이트를 대사한다. 혐기성 조건하에서, 피루베이트의 대사를 위한 주요 에너지 경로는 포르메이트와 아세틸-CoA를 제공하는 피루베이트-포르메이트-리아제(pyruvate-formate-lyase, PFL)를 통해 이루어진다. 그 후, 아세틸-CoA는, 포스포트랜스아세틸라아제(PTA) 및 아세테이트 키나아제(ACK)를 통해 아세테이트로 전환되며 ATP를 동시에 생산하거나, 아세트알데히드 데히드로게나아제(AcDH)와 알코올 데히드로게나아제(ADH)를 통해 에탄올로 환원된다. 환원 당량(reducing equivalent)의 균형을 유지하기 위해, 해당과정으로부터 생산된 과량의 NADH는, 피루베이트가 락테이트로 환원되는 동안 락테이트 데히드로게나아제(LDH)에 의해 NAD+로 재산화된다. 또한, NADH는 아세틸-CoA가 에탄올로 환원되는 동안 AcDH와 ADH에 의해 재산화될 수 있지만, 이는 기능성 LDH를 지닌 세포에서는 경미한 반응이다. 따라서, 에탄올의 이론적 수율이 달성되지 않는데, 이는 ATP를 재생시키기 위해 대부분의 아세틸 CoA가 아세테이트로 전환되고, 해당과정 동안 생산된 과량의 NADH가 LDH에 의해 산화되기 때문이다.
또한, 미생물의 대사적 엔지니어링은 락테이트 데히드로게나아제와 같은 효소의 생산을 엔코딩하는 유전자의 표적화된 녹아웃(targeted knockout)의 발생을 초래할 수 있다. 이러한 경우, 유전자의 "녹 아웃(knock out)"은 부분적, 실질적 또는 완전한, 결실, 침묵(silencing), 비활성화 또는 하향조절(down-regulation)을 의미한다. LDH의 작용에 의한 피루베이트의 락테이트 (락트산의 염 형태)로의 전환이 해당과정 경로의 초기 단계에 이용가능하지 않은 경우, 피루베이트는 피루베이트 데히드로게나아제 또는 피루베이트-페레독신 옥시도리덕타아제(oxidoreductase)의 작용에 의해 보다 효율적으로 아세틸 CoA로 전환될 수 있다. 포스포트랜스아세틸라아제와 아세테이트 키나아제에 의한 아세틸 CoA의 아세테이트 (아세트산의 염 형태)로의 추가의 전환이 또한 이용가능하지 않은 경우, 즉, PTA와 ACK의 생산을 엔코딩하는 유전자가 녹아웃된 경우, 아세틸 CoA는 AcDH 및 ADH에 의해 보다 효율적으로 에탄올로 전환될 수 있다. 따라서, 유기산의 생산을 제거하는 그러한 표적화된 유전자 녹아웃을 지닌 유전자 변형된 미생물 균주(strain)는 발효 생산물로서 에탄올을 생산하는 능력이 증가할 것이다.
에탄올생산성(ethanologenic) 생물체, 예를 들어 자이모모나스 모빌리스(Zymomonas mobilis), 자이모박터 팔매(Zymobacter palmae), 아세토박터 파스퇴리아누스(Acetobacter pasteurianus), 또는 사르시나 벤트리큘리(Sarcina ventriculi), 및 일부 효모 (예를 들어, 사카로마이세스 세레비시애(Saccharomyces cerevisiae))는 일반적으로 알코올 발효라고 지칭되는 제2형의 혐기성 발효를 수행할 수 있으며, 여기서 피루베이트가 피루베이트 데카르복실라아제(PDC)에 의해 아세트알데히드와 CO2로 대사된다. 그 후, 아세트알데히드는 ADH에 의해 에탄올로 환원되며 NAD+를 재생시킨다. 알코올 발효는 글루코오스 1분자를 2분자의 에탄올과 2분자의 CO2로 대사시킨다. 상기 상세히 설명된 바와 같이 피루베이트가 요망되지 않는 유기산으로 전환되는 것이 회피될 수 있는 경우, 이러한 유전자 변형된 미생물은 발효 생산물로서 에탄올을 생산하는 능력이 증가할 것이다.
발명의 개요
본 발명의 한 가지 일면은 SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열(complement)을 포함하는 분리된 핵산 분자에 관한 것이다. 본 발명의 또 다른 일면은 SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열과 80% 이상의 동일성을 공유하는 누클레오티드 서열을 포함하는 분리된 핵산 분자에 관한 것이다. 특정 구체예에서, 본 발명은 SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열과 약 95% 이상의 서열 동일성을 공유하는 상기 언급된 핵산 분자에 관한 것이다.
본 발명의 또 다른 일면은 호열성 또는 중온성(mesophilic) 세균에서 발현가능한 프로모터에 작동적으로 결합된 SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나를 포함하는 유전자 구성물(genetic construct)에 관한 것이다. 또한, 본 발명은 상기 언급된 유전자 구성물을 포함하는 재조합 호열성 또는 중온성 세균에 관한 것이다.
또한, 본 발명은 상기 언급된 핵산 분자 중 어느 하나를 포함하는 벡터를 포함한다. 또한, 본 발명은 상기 언급된 핵산 분자 중 어느 하나를 포함하는 숙주 세포를 포함한다. 특정 구체예에서, 본 발명은 호열성 또는 중온성 세균 세포인 상기 언급된 숙주 세포에 관한 것이다.
본 발명의 또 다른 일면은 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유(native) 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절됨으로써, 발효 생산물로서 에탄올을 생산하는 고유 능력이 증가된, 유전자 변형된 호열성 또는 중온성 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 그람-음성 세균 또는 그람-양성 세균인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 써모안에어로박테리움(Thermoanaerobacterium), 써모안에어로박터(Thermoanaerobacter), 클로스트리디움(Clostridium), 게오바실루스(Geobacillus), 사카로코쿠스(Saccharococcus), 패니바실루스(Paenibacillus), 바실루스(Bacillus), 칼디셀룰로시룹터(Caldicellulosiruptor), 안에어로셀룸(Anaerocellum), 또는 안옥시바실루스(Anoxybacillus) 속(genus)의 종(species)인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 써모안에어로박테리움 써모술푸리게네스(Thermoanaerobacterium thermosulfurigenes), 써모안에어로박테리움 아오테아로엔세(Thermoanaerobacterium aotearoense), 써모안에어로박테리움 폴리사카롤리티쿰(Thermoanaerobacterium polysaccharolyticum), 써모안에어로박테리움 제애(Thermoanaerobacterium zeae), 써모안에어로박테리움 자일라노리티쿰(Thermoanaerobacterium xylanolyticum), 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum), 써모안에어로비움 브록키(Thermoanaerobium brockii), 써모안에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum), 써모안에어로박터 써모히드로술푸리쿠스(Thermoanaerobacter thermohydrosulfuricus), 써모안에어로박터 에타놀리쿠스(Thermoanaerobacter ethanolicus), 써모안에어로박터 브록키(Thermo anaerobacter brocki), 클로스트리디움 써모셀룸(Clostridium thermocellum), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 피토페르멘탄스(Clostridium phytofermentans), 클로스트리디움 스트라미노솔벤스(Clostridium straminosolvens), 게오바실루스 써모글루코시다시우스(Geobacillus thermoglucosidasius), 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus), 사카로코쿠스 칼독실로실리티쿠스(Saccharococcus caldoxylosilyticus), 사카로쿠스 써모필루스(Saccharoccus thermophilus), 패니바실루스 캄피나센시스(Paenibacillus campinasensis), 바실루스 플라보써무스(Bacillus flavothermus), 안옥시바실루스 캄차트켄시스(Anoxybacillus kamchatkensis), 안옥시바실루스 고넨시스(Anoxybacillus gonensis), 칼디셀룰로시룹터 아세티게누스(Caldicellulosiruptor acetigenus), 칼디셀룰로시룹터 사카로리티쿠스(Caldicellulosiruptor saccharolyticus), 칼디셀룰로시룹터 크리스티안소니(Caldicellulosiruptor kristjanssonii), 칼디셀룰로시룹터 오웬센시스(Caldicellulosiruptor owensensis), 칼디셀룰로시룹터 락토아세티쿠스(Caldicellulosiruptor lactoaceticus), 및 안에어로셀룸 써모필룸(Anaerocellum thermophilum)로 구성된 군으로부터 선택된 세균인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 써모안에어로박테리움 사카롤리티쿰인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 (a) 헥소오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물; (b) 펜토오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물; 및 (c) 헥소오스 당과 펜토오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 헥소오스 당을 대사하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 클로스트리디움 스트라미니솔벤스(Clostridium straminisolvens)또는 클로스트리디움 써모셀룸인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 헥소오스 당과 펜토오스 당을 대사하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 칼디셀룰로시룹터 크리스티안소니, 또는 클로스트리디움 스테르코라리움 아종 렙토사프라르툼(Clostridium stercorarium subsp. leptosaprartum)인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 펜토오스 당을 대사하는 능력을 부여하는 제 1의 비고유(non-native) 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 펜토오스 당으로부터 발효 생산물로서 에탄올을 생산할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 펜토오스 당을 대사하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 써모안에어로박테리움 사카롤리티쿰, 써모안에어로박테리움 자일라노리티쿰, 써모안에어로박테리움 폴리사카롤리티쿰, 및 써모안에어로박테리움 써모사카롤리티쿰으로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당으로부터 발효 생산물로서 에탄올을 생산할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산 및 아세트산으로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 아세트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 락테이트 데히드로게나아제, 아세테이트 키나아제 및 포스포트랜스아세틸라아제로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 락테이트 데히드로게나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 아세테이트 키나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 포스포트랜스아세틸라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산 또는 이의 염의 대사적 생산에 관여하는 제 2의 고유 효소를 엔코딩하는 제 2의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 제 2의 고유 효소가 아세테이트 키나아제 또는 포스포트랜스아세틸라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 제 2의 고유 효소가 락테이트 데히드로게나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다.
본 발명의 또 다른 일면은 유전자 변형된 호열성 또는 중온성 미생물로서, (a) 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되고, (b) 에탄올의 대사적 생산에 관여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 발효 생산물로서 에탄올을 생산할 수 있게 하는, 유전자 변형된 호열성 또는 중온성 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당을 대사할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 펜토오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 펜토오스 당을 대사할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하고; 펜토오스 당을 대사하는 능력을 부여하는 제 2의 비고유 효소를 엔코딩하는 제 2의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당과 펜토오스 당을 대사할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 아세트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 효소가 피루베이트 데카르복실라아제(PDC) 또는 알코올 데히드로게나아제(ADH)인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 2의 비고유 효소가 자일로오스 이소머라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 SEQ ID NO:6, 10 또는 14에 상응하는 것인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 효소가 자일룰로키나아제(xylulokinase)인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 유전자가 SEQ ID NO:7, 11 또는 15에 상응하는 것인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 효소가 L-아라비노오스 이소머라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 유전자가 SEQ ID NO:8 또는 12에 상응하는 것인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 효소가 L-리불로오스-5-포스페이트 4-에피머라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 비고유 유전자가 SEQ ID NO:9 또는 13에 상응하는 것인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 대사된 바이오매스로부터의 탄소 중 60% 이상을 에탄올로 전환시킬 수 있는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 셀룰로오스를 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (a), 자일란(xylan)을 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (b) 및 셀룰로오스와 자일란을 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (c)로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 셀룰로오스를 가수분해하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 셀룰로오스 및 자일란을 가수분해하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 자일란을 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입되어 있는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 자일란을 가수분해하는 고유 능력을 지니는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입되어 있는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산 및 아세트산으로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 아세트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 락테이트 데히드로게나아제, 아세테이트 키나아제 및 포스포트랜스아세틸라아제로 구성된 군으로부터 선택되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 락테이트 데히드로게나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 아세테이트 키나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 고유 효소가 포스포트랜스아세틸라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산 또는 이의 염의 대사적 생산에 관여하는 제 2의 고유 효소를 엔코딩하는 제 2의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 2의 고유 효소가 아세테이트 키나아제 또는 포스포트랜스아세틸라아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 2의 고유 효소가 락테이트 데히드로게나아제인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 (a) 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되고, (b) 다당류의 가수분해에 관여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 발효 생산물로서 에탄올을 생산할 수 있게 하는, 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 셀룰로오스를 가수분해할 수 있게 하는, 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 자일란을 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 자일란을 가수분해할 수 있게 하는 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 유전자가 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하고; 자일란을 가수분해하는 능력을 부여하는 제 2의 비고유 효소를 엔코딩하는 제 2의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 셀룰로오스와 자일란을 가수분해할 수 있게 하는, 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 락트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 유기산이 아세트산인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 상기 제 1의 비고유 효소가 피루베이트 데카르복실라아제(PDC) 또는 알코올 데히드로게나아제(ADH)인 상기 언급된 유전자 변형된 미생물에 관한 것이다. 특정 구체예에서, 본 발명은 대사된 바이오매스로부터의 탄소 중 60% 이상을 에탄올로 전환시킬 수 있는 상기 언급된 유전자 변형된 미생물에 관한 것이다.
특정 구체예에서, 본 발명은 중온성인 상기 언급된 유전자 변형된 미생물 중의 어느 하나에 관한 것이다. 특정 구체예에서, 본 발명은 호열성인 상기 언급된 유전자 변형된 미생물 중 어느 하나에 관한 것이다.
본 발명의 또 다른 일면은 리그노셀룰로오스 바이오매스를 상기 언급된 유전자 변형된 호열성 또는 중온성 미생물과 접촉시키는 것을 포함하여, 리그노셀룰로오스 바이오매스를 에탄올로 전환시키는 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 그래스(grass), 스위치 그래스(switch grass), 코드 그래스(cord grass), 라이 그래스(rye grass), 리드 카나리 그래스(reed canary grass), 혼합형 프레어리 그래스(mixed prairie grass), 미스캔투스(miscanthus), 설탕-가공 잔존물(sugar-processing residue), 사탕수수 버개스(sugarcane bagasse), 사탕수수짚(sugarcane straw), 농업 폐기물, 볏짚(rice straw), 왕겨(rice hull), 보리짚(barley straw), 옥수수 속대(corn cob), 곡물짚(cereal straw), 밀짚(wheat straw), 카놀라짚(canola straw), 귀리짚(oat straw), 귀리껍질(oat hull), 옥수수 섬유, 스토버(stover), 대두 스토버, 옥수수 스토버, 산림 폐기물(forestry waste), 리사이클링된 목재 펄프 섬유, 종이 슬러지(paper sludge), 톱밥(sawdust), 경질목재(hardwood), 연질목재(softwood), 및 이들의 조합물로 구성된 군으로부터 선택되는 것인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버, 사탕수수 버개스, 스위치그래스 및 포플러 목재(poplar wood)로 구성된 군으로부터 선택되는 것인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 사탕수수 버개스인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 스위치그래스인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 포플러 목재인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 버드나무(willow)인 상기 언급된 방법에 관한 것이다. 특정 구체예에서, 본 발명은 상기 리그노셀룰로오스 바이오매스가 종이 슬러지인 상기 언급된 방법에 관한 것이다.
도면의 간단한 설명
도 1은 해당과정 경로를 도시한다.
도 2는 펜토오스 및 글루쿠로네이트 상호전환을 도시하며, D-자일로오스 → 에탄올 경로에서 자일로오스 이소머라아제 (XI 또는 5.3.1.5) 및 자일룰로키나아제 (XK 또는 2.7.1.17) 효소를 강조하고 있다.
도 3은 펜토오스 및 글루쿠로네이트 상호전환을 도시하며, L-아라비노오스 이용 경로에서 L-아라비노오스 이소머라아제 (5.3.1.4) 및 L-리불로오스-5-포스페이트 4-에피머라아제 (5.1.3.4) 효소를 강조하고 있다.
도 4는 펜토오스 및 글루쿠로네이트 상호전환을 도시하며, 클로스트리디움 셀룰로리티쿰에 자일로오스 이소머라아제, 자일룰로키나아제, L-아라비노오스 이소머라아제 및 L-리불로오스-5-포스페이트 4-에피머라아제에 대한 유전자가 존재함을 보여준다.
도 5는 펜토오스 및 글루쿠로네이트 상호전환을 도시하며, 클로스트리디움 피토페르멘탄스에 자일로오스 이소머라아제 및 자일룰로키나아제는 존재하지만 L-아라비노오스 이소머라아제 및 L-리불로오스-5-포스페이트 4-에피머라아제는 존재하지 않음을 보여준다.
도 6은 클로스트리디움 써모셀룸 (SEQ ID NO: 77), 클로스트리디움 셀룰로리티쿰 (SEQ ID NO: 78), 써모안에어로박테리움 사카롤리티쿰 (SEQ ID NO: 79), 클로스트리디움 스테르코라리움 (SEQ ID NO: 80), 클로스트리디움 스테르코라리움 II(C. stercorarium II) (SEQ ID NO: 81), 칼디셀룰로시룹터 크리스티안소니 (SEQ ID NO: 82), 클로스트리디움 피토페르멘탄스 (SEQ ID NO: 83)을 정렬한 도면이며, 이는 16S rDNA 유전자의 수준에서 약 73 내지 89% 상동성을 나타낸다.
도 7은 플라스미드 pIKM1을 기반으로 하는, 클로스트리디움 써모셀룸에서의 ack 유전자의 비활성화를 위한 이중 크로스오버(crossover) 녹아웃 벡터의 구성을 도시한다.
도 8은 복제성(replicative) 플라스미드 pNW33N을 기반으로 하는, 클로스트리디움 써모셀룸에서의 ack 유전자의 비활성화를 위한 이중 크로스오버 녹아웃 벡터의 구성을 도시한다.
도 9는 플라스미드 pIKMl을 기반으로 하는, 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화를 위한 이중 크로스오버 녹아웃 벡터의 구성을 도시한다.
도 10은 복제성 플라스미드 pNW33N을 기반으로 하는, 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화를 위한 이중 크로스오버 녹아웃 벡터의 구성을 도시한다.
도 11은 플라스미드 pUC19를 기반으로 하는, 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화를 위한 이중 크로스오버 녹아웃 벡터의 구성을 도시한다.
도 12A 및 12B는 각각 셀로비오스(cellobiose) 및 아비셀®(Avicel®)에서 증식된 클로스트리디움 스트라미니솔벤스에 대한 생산물 형성 및 OD600을 도시한다.
도 13A 및 13B는 각각 셀로비오스 및 아비셀®에서 증식된 클로스트리디움 써모셀룸에 대한 생산물 형성 및 OD600을 도시한다.
도 14A 및 14B는 각각 셀로비오스 및 아비셀®에서 증식된 클로스트리디움 셀룰로리티쿰에 대한 생산물 형성 및 OD600을 도시한다.
도 15A 및 15B는 각각 셀로비오스 및 아비셀®에서 증식된 클로스트리디움 스테르코라리움 아종 렙토사파르툼(Clostridium stercorarium subsp. leptosapartum)에 대한 생산물 형성 및 OD600을 도시한다.
도 16A 및 16B는 각각 셀로비오스 및 아비셀®에서 증식된 칼디셀룰로시룹터 크리스티안소니에 대한 생산물 형성 및 OD600을 도시한다.
도 17A 및 17B는 각각 셀로비오스 및 아비셀®에서 증식된 클로스트리디움 피토페르멘탄스에 대한 생산물 형성 및 OD600을 도시한다.
도 18은 2.5 g/L의 자일란 및 2.5 g/L의 셀로비오스의 48시간 발효 후의 전체 대사 부산물을 도시한다.
도 19는 ack 유전자의 맵(map) 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역을 도시한다.
도 20은 ldh 2262 유전자의 맵 및 유전자 붕괴를 위해 PCT에 의해 증폭되는 영역을 도시한다.
도 21은 클로스트리디움 셀룰로리티쿰 ldh (2262) 이중 크로스오버 녹아웃 단편의 예를 도시한다.
도 22는 클로스트리디움 피토페르멘탄스의 ack 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역을 도시한다.
도 23은 클로스트리디움 피토페르멘탄스에서 선별가능 마커로서 mLs 유전자를 지닌 추정 이중 크로스오버 녹아웃 구성물의 예를 도시한다.
도 24는 ldh 1389 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역을 도시한다.
도 25는 선별가능 마커로서 mLs 유전자를 지닌 추정 이중 크로스오버 녹아웃 구성물의 예를 도시한다.
도 26은 pMOD™-2<MCS>의 bp 250-550 (SEQ ID NO: 84)를 나타내는 도면이다.
도 27은 클로스트리디움 스트라미니솔벤스를 사용한 경우 1% 아비셀®에 대한 생산물 농도 프로파일을 도시한다. 에탄올 대 아세테이트 비는 E/A로 표시되고, 에탄올 대 전체 생산물의 비는 E/T로 표시되어 있다.
도 28은 C. cell ACK 유전자 (SEQ ID NO:21)에 삽입되도록 Ll.LtrB 인트론을 리타겟팅(retargeting)하기 위한 벡터의 예를 도시한다.
도 29는 C. cell LDH2744 유전자 (SEQ ID NO:23)에 삽입되도록 Ll.LtrB 인트론을 리타겟팅하기 위한 벡터의 예를 도시한다.
도 30은 16S rDNA 유전자의 수준에서 써모안에어로박터 슈도에타놀리쿠스 39E (SEQ ID NO: 85), 써모안에어로박테리움 종 균주(T. sp strain) 59 (SEQ ID NO: 86), 써모안에어로박테리움 사카롤리티쿰(T. saccharolyticum) B6A-RI (SEQ ID NO: 87), 써모안에어로박테리움 사카롤리티쿰 YS485 (SEQ ID NO: 88) 및 컨센서스(consensus) (SEQ ID NO: 89)를 정렬한 도면이다.
도 31은 pta 유전자의 수준에서 써모안에어로박테리움 종 균주 59 (SEQ ID NO: 36), 써모안에어로박터 슈도에타놀리쿠스 (SEQ ID NO: 35), 써모안에어로박테리움 사카롤리티쿰 B6A-RI (SEQ ID NO: 38), 써모안에어로박테리움 사카롤리티쿰 YS485 (SEQ ID NO: 32) 및 컨센서스 (SEQ ID NO: 90)를 정렬한 도면이다.
도 32는 ack 유전자의 수준에서 써모안에어로박테리움 종 균주 59 (SEQ ID NO: 37), 써모안에어로박터 슈도에타놀리쿠스 (SEQ ID NO: 34), 써모안에어로박테리움 사카롤리티쿰 B6A-RI (SEQ ID NO: 39), 써모안에어로박테리움 사카롤리티쿰 YS485 (SEQ ID NO: 33) 및 컨센서스 (SEQ ID NO: 91)를 정렬한 도면이다.
도 33은 ldh 유전자의 수준에서 써모안에어로박테리움 종 균주 59 (SEQ ID NO: 41), 써모안에어로박터 슈도에타놀리쿠스 (SEQ ID NO: 42), 써모안에어로박테리움 사카롤리티쿰 B6A-RI (SEQ ID NO: 43), 써모안에어로박테리움 사카롤리티쿰 YS485 (SEQ ID NO: 40) 및 컨센서스 (SEQ ID NO: 92)를 정렬한 도면이다.
도 34는 해당과정/발효 경로를 개략적으로 도시한다.
도 35는 pMU340 플라스미드의 예를 도시한다.
도 36은 pMU102 자이모모나스 모빌리스 PDC-ADH 플라스미드의 예를 도시한다.
도 37은 pMU102 자이모박터 팔매 PDC, 자이모모나스 모빌리스 ADH 플라스미드의 예를 도시한다.
도 38은 pMU360의 플라스미드 맵을 도시한다. pMU360의 DNA 서열은 SEQ ID NO:61로 제시된다.
도 39는 티암페니콜-내성 형질전환체(thiamphenicol-resistant transformant)의 9개 콜로니에서의 락테이트 수준을 도시한다.
도 40은 T. sacch. pfl KO 단일 크로스오버 플라스미드 (SEQ ID NO:47)의 예를 도시한다.
도 41은 T. sacch. pfl KO 이중 크로스오버 플라스미드 (SEQ ID NO:48)의 예를 도시한다.
도 42는 C. therm. pfl KO 단일 크로스오버 플라스미드 (SEQ ID NO:49)의 예를 도시한다.
도 43은 C. therm. pfl KO 이중 크로스오버 플라스미드 (SEQ ID NO:50)의 예를 도시한다.
도 44는 C. phyto. pfl KO 단일 크로스오버 플라스미드 (SEQ ID N0:51)의 예를 도시한다.
도 45는 C. phyto. pfl KO 이중 크로스오버 플라스미드 (SEQ ID NO:52)의 예를 도시한다.
도 46은 T. sacch. #59 L-ldh KO 단일 크로스오버 플라스미드 (SEQ ID NO:53)의 예를 도시한다.
도 47은 T. sacch. #59 L-ldh KO 이중 크로스오버 플라스미드 (SEQ ID NO:54)의 예를 도시한다.
도 48은 T. sacch. #59 pta/ack KO 단일 크로스오버 플라스미드 (SEQ ID NO:55)의 예를 도시한다.
도 49는 T. sacch. #59 pta/ack KO 이중 크로스오버 플라스미드 (SEQ ID NO:56)의 예를 도시한다.
도 50은 T. pseudo. L-ldh KO 단일 크로스오버 플라스미드 (SEQ ID NO:57)의 예를 도시한다.
도 51은 T. pseudo. L-ldh KO 이중 크로스오버 플라스미드의 예를 도시한다 (SEQ ID NO:58).
도 52는 T. pseudo. ack KO 단일 크로스오버 플라스미드 (SEQ ID NO:59)의 예를 도시한다.
도 53은 T. pseudo. pta/ack KO 이중 크로스오버 플라스미드 (SEQ ID NO:60)의 예를 도시한다.
표의 간단한 설명
표 1은 대표적인 고도로 셀룰로오스분해성인 생물체들을 요약한 것이다.
표 2는 대표적인 고유한 셀룰로오스분해성 및 자일란분해성(xylanolytic) 생물체들을 요약한 것이다.
표 3은 기질 이용을 기초로 하여 세균 균주를 분류한 것이다.
표 4는 클로스트리디움 셀룰로리티쿰 아세테이트 키나아제에 인트론을 리타겟팅하기 위한 삽입 위치 및 프라이머를 나타낸다.
표 5는 클로스트리디움 셀룰로리티쿰 락테이트 데히드로게나아제에 인트론을 리타겟팅하기 위한 삽입 위치 및 프라이머를 나타낸다.
표 6은 엔지니어링된 써모안에어로박터 및 써모안에어로박테리움 균주의 발효 성능을 나타낸다.
발명의 상세한 설명
본 발명의 일면은 리그노셀룰로오스 바이오매스부터 에탄올을 생산하는 데에 사용되는 호열성 또는 중온성 미생물의 엔지니어링에 관한 것이다. 에탄올 생산을 위해 호열성 세균을 사용하는 것은 중온성 에탄올 생산균을 기반으로 하는 종래의 공정에 비해 많은 이점을 제공한다. 예를 들어, 호열성 생물체를 사용하는 것은 적은 에탄올 분리 비용, 외부 효소 첨가를 위한 요건 감소 및 처리 시간 감소로 인해 종래의 공정에 비해 현저한 경제적 절감효과를 제공한다.
본 발명의 일면은 신규한 처리 구성을 이용함으로써 셀룰로오스 바이오매스 함유 물질로부터 에탄올을 생산하는 비용을 감소시킬 수 있는 공정에 관한 것이다. 특히, 본 발명은 유전자 변형된 미생물에서 에탄올 생산을 증가시키기 위한 다수의 방법을 제공한다.
특정한 다른 구체예에서, 본 발명은 발효 생산물로서 유기산을 생산하는 능력을 미생물에게 부여하는 효소를 엔코딩하는 유전자 또는 특정 폴리누클레오티드 서열이 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절됨으로써, 주요 발효 생산물로서 에탄올을 생산하는 능력이 증가된 유전자 변형된 호열성 또는 중온성 미생물에 관한 것이다. 또한, 통합된 생물가공으로 일반적으로 공지된 처리 단계들의 새로운 통합에 의해, 본 발명의 일면은 셀룰로오스 바이오매스를 함유하는 원료 물질로부터의 에탄올의 보다 효율적인 생산을 제공한다. 유전자 변형된 호열성 또는 중온성 미생물을 상기 물질을 처리하는 데에 포함시키면 발효 단계가 보다 높은 온도에서 수행될 수 있게 하여 공정 경제성을 개선시킨다. 예를 들어, 반응 속도론은 전형적으로 온도에 비례하므로, 높은 온도는 전체 생산율의 증가와 일반적으로 관련된다. 또한, 높은 온도는 브로쓰(broth)로부터 휘발성 생산물이 제거되는 것을 촉진하고, 전처리 후에 냉각시킬 필요성을 감소시킨다.
특정 구체예에서, 본 발명은 발효 생산물로서 에탄올을 생산하는 능력을 부여하는 효소를 생산하는 능력이 증가된 유전자 변형 또는 재조합 호열성 또는 중온성 미생물에 관한 것이며, 상기 효소(들)의 존재는 주요 발효 생산물로서 에탄올을 생산하도록 리그노셀룰로오스 바이오매스 물질을 대사하는 공정을 변화시킨다. 본 발명의 한 가지 일면에서, 하나 이상의 비고유 유전자가 유전자 변형된 호열성 또는 중온성 미생물내로 삽입되며, 여기서 상기 비고유 유전자는 에탄올의 대사적 생산에 관여하는 효소를 엔코딩하는데, 예를 들어 이러한 효소는 펜토오스 당 및/또는 헥소오스 당을 대사하는 능력을 부여할 수 있다. 예를 들어, 한 가지 구체예에서, 상기 효소는 D-자일로오스 또는 L-아라비노오스 경로에 관여함으로써, 미생물이 펜토오스 당, 즉, D-자일로오스 또는 L-아라비노오스를 대사하게 할 수 있다. D-자일로오스 또는 L-아라비노오스의 대사 또는 이용에 관여하는 효소를 엔코딩하는 비고유 유전자를 삽입 (예를 들어, 도입 또는 첨가)함으로써, 상기 미생물은 고유의 생물체에 비해 에탄올을 생산하는 능력이 증가한다.
또한, 본 발명은 본 발명의 미생물내로 통합될 수 있는 신규한 조성물을 제공한다. 한 가지 구체예에서, 본 발명의 분리된 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열의 상보서열인 핵산 분자를 포함한다. 또 다른 구체예에서, 본 발명의 분리된 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열 또는 이러한 누클레오티드 서열 중 어느 하나의 일부의 상보서열인 핵산 분자를 포함한다. SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열 또는 이의 코딩 영역에 상보적인 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열 또는 이의 코딩 영역에 충분히 상보적인 핵산 분자이어서, SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열 또는 이의 코딩 영역에 하이브리드화함으로써 안정한 듀플렉스(duplex)를 형성할 수 있다.
또 다른 바람직한 구체예에서, 본 발명의 분리된 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나에 제시된 누클레오티드 서열 (누클레오티드 서열의 전장) 또는 이러한 누클레오티드 서열 중 어느 하나의 일부에 대해 적어도 약 50%, 54%, 55%, 60%, 62%, 65%, 70%, 75%, 78%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 이를 초과하는 비율로 상동성인 누클레오티드 서열을 포함한다.
더욱이, 본 발명의 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나의 핵산 서열 또는 이의 코딩 영역의 일부만을 포함할 수 있는데, 예를 들어 이러한 핵산 분자는 프로브 또는 프라이머로서 사용될 수 있는 단편 또는 단백질의 생물학적으로 활성인 부분을 엔코딩하는 단편일 수 있다. 또 다른 구체예에서, 본 발명의 핵산 분자는 SEQ ID NO: 1-76 중 어느 하나의 적어도 약 12개 또는 15개, 바람직하게는 20개 또는 25개, 더욱 바람직하게는 약 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 또는 75개의 연속 누클레오티드를 포함할 수 있다.
정의
"이종성 폴리누클레오티드 세그먼트"란 용어는 하나 이상의 폴리펩티드 또는 폴리펩티드의 일부 또는 단편을 엔코딩하는 폴리누클레오티드 세그먼트를 포함하도록 의도된다. 이종성 폴리누클레오티드 세그먼트는 임의의 공급원, 예를 들어 진핵생물, 원핵생물, 바이러스 또는 합성 폴리누클레오티드 단편으로부터 유래될 수 있다.
"프로모터" 또는 "대용(surrogate) 프로모터"라는 용어는 자연 상태에서는 전사적으로 제어하지 못하는 관심있는 유전자(gene-of-interest)를 전사적으로 제어할 수 있는 폴리누클레오티드 세그먼트를 포함하도록 의도된다. 특정 구체예에서, 대용 프로모터의 전사적 제어는 관심있는 유전자의 발현을 증가시킨다. 특정 구체예에서, 대용 프로모터는 관심있는 유전자의 5'에 위치한다. 대용 프로모터는 천연 프로모터를 치환하기 위해 사용되거나 천연 프로모터에 더하여 사용될 수 있다. 대용 프로모터는 이것이 사용되는 숙주 세포에 대해 내생성(endogenous)인 것일 수 있거나, 숙주 세포내로 도입되는 이종성 폴리누클레오티드 서열, 예를 들어 이것이 사용되는 숙주 세포에 대해 외생적(exogenous)인 것일 수 있다.
"유전자(들)" 또는 "폴리누클레오티드 세그먼트" 또는 "폴리누클레오티드 서열(들)"은 폴리펩티드를 엔코딩하는 오픈 리딩 프레임을 포함하고 추가로 비코딩(non-coding) 조절 서열 및 인트론을 포함할 수 있는 핵산 분자, 예를 들어 폴리누클레오티드를 포함하도록 의도된다. 또한, 상기 용어는 기능적 유전자좌(locus)에 대해 맵핑되는 하나 이상의 유전자를 포함하도록 의도된다. 또한, 상기 용어는 선택된 목적을 위해 특정 유전자를 포함하도록 의도된다. 유전자는 숙주 세포에 대해 내생성일 수 있거나, 숙주 세포내로 재조합적으로 도입될 수 있는데 예를 들어 에피솜으로 유지되는 플라스미드로서 또는 게놈내로 안정하게 통합되는 플라스미드 (또는 이의 단편)로서 도입될 수 있다. 유전자는 플라스미드 형태 뿐만 아니라 예를 들어 선형 DNA의 형태로 존재할 수 있다. 특정 구체예에서, 폴리누클레오티드 세그먼트의 유전자는 탄수화물을 에탄올로 생물전환(bioconversion)하는 데에 있어서 적어도 하나의 단계에 관여한다. 따라서, 상기 용어는 폴리펩티드, 예를 들어 효소인 아세테이트 키나아제 (ACK), 포스포트랜스아세틸라아제 (PTA), 및/또는 락테이트 데히드로게나아제 (LDH), D-자일로오스 경로의 효소, 예를 들어 자일로오스 이소머라아제 및 자일룰로키나아제, L-아라비노오스 경로의 효소, 예를 들어 L-아라비노오스 이소머라아제 및 L-리불로오스-5-포스페이트 4-에피머라아제를 엔코딩하는 임의의 유전자를 포함하도록 의도된다. 또한, 유전자라는 용어는 특정 유전자의 모든 카피(copy), 예를 들어 특정 유전자 생산물을 엔코딩하는 세포내의 모든 DNA 서열을 포함하도록 의도된다.
"전사 제어"라는 용어는 전사 수준에서 유전자 발현을 조절하는 능력을 포함하도록 의도된다. 특정 구체예에서, 전사 및 이에 따른 발현은 관심있는 유전자의 코딩 영역의 5' 단부 근처에서 대용 프로모터로 치환하거나 이러한 프로모터를 첨가하여 변경된 유전자 발현을 일으킴으로써 조절된다. 특정 구체예에서, 하나 이상의 유전자의 전사 제어는 그러한 유전자들의 최적 발현, 예를 들어 요망되는 비를 생성시키도록 엔지니어링된다. 또한, 상기 용어는 당 분야에서 인정되는 유도성 전사 제어를 포함한다.
"발현"이란 용어는 적어도 mRNA 생산의 수준에서의 유전자의 발현을 포함하도록 의도된다.
"발현 생산물"이란 용어는 발현된 유전자의 결과로서 생긴 생산물, 예를 들어 폴리펩티드를 포함하도록 의도된다.
"발현 증가"란 용어는 적어도 증가된 mRNA 생산의 수준, 바람직하게는 폴리펩티드 발현의 수준에서의 유전자 발현의 변화를 포함하도록 의도된다. "생산 증가"란 용어는 폴리펩티드의 효소적 활성의 수준 또는 이들이 조합된 수준에서의 발현된 폴리펩티드의 양의 증가를 포함하도록 의도된다.
"활성", "활성들", "효소적 활성" 및 "효소적 활성들"이란 용어는 상호교환적으로 사용되며, 유리한 조건하에서 생산되는 경우에 선택된 폴리펩티드에 정상적으로 기인하는 임의의 기능적 활성을 포함하는 것으로 의도된다. 전형적으로, 선택된 폴리펩티드의 활성은 생산된 폴리펩티드과 관련된 전체 효소적 활성을 포함한다. 숙주 세포에 의해 생산되고 효소적 활성을 지니는 폴리펩티드는 세포의 세포내 공간에 위치하거나, 세포와 결합되어 있거나, 세포외 환경내로 분비되거나, 이들 모두가 조합된 경우일 수 있다. 분비된 활성과 비교하여 전체 활성을 결정하기 위한 기술은 본원에 기재되어 있으며, 당 분야에 공지되어 있다.
"자일란분해 활성"이란 용어는 올리고펜토오스 및 폴리펜토오스에서 글리코시드 연결을 가수분해하는 능력을 포함하도록 의도된다.
"셀룰로오스분해 활성"이란 용어는 올리고헥소오스 및 폴리헥소오스에서 글리코시드 연결을 가수분해하는 능력을 포함하도록 의도된다. 또한, 셀룰로오스분해 활성은 셀룰로오스 및 헤미셀룰로오스를 탈중합(depolymerize)시키거나 가지제거(debranch)하는 능력을 포함할 수 있다.
본원에 사용된 용어 "락테이트 데히드로게나아제" 또는 "LDH"는 피루베이트를 락테이트로 전환시킬 수 있는 효소를 포함하도록 의도된다. LDH는 히드록시부티레이트의 산화을 또한 촉매작용할 수 있는 것으로 이해된다.
본원에 사용된 용어 "알코올 데히드로게나아제" 또는 "ADH"는 아세트알데히드를 알코올, 유리하게는 에탄올로 전환시킬 수 있는 효소를 포함하도록 의도된다.
"피루베이트 데카르복실라아제 활성"이란 용어는 피루베이트를 아세트알데히드로 효소에 의해 전환시키는 폴리펩티드의 능력을 포함하는 것으로 의도된다 (예를 들어, "피루베이트 데카르복실라에제" 또는 "PDC"). 전형적으로, 선택된 폴리펩티드의 활성은, 예를 들어 효소의 우수한 기질 친화성, 열안정성, 다양한 pH에서의 안정성 또는 이들 특성의 조합을 포함하는, 생산된 폴리펩티드와 관련된 전체 효소적 활성을 포함한다.
"에탄올생산성"이란 용어는 발효 생산물로서 탄수화물로부터 에탄올을 생산하는 미생물의 능력을 포함하도록 의도된다. 이러한 용어는 비제한적으로 천연 에탄올생산성 생물체, 자연 발생적 돌연변이 또는 유도된 돌연변이를 지닌 에탄올생산성 생물체 및 유전자 변형된 에탄올생산성 생물체를 포함하도록 의도된다.
"발효시키는" 및 "발효"라는 용어는 탄수화물로부터 에탄올이, 특히 발효의 생산물로서, 생산되게 하는 효소적 공정 (예를 들어, 세포성 또는 무세포성이고, 예를 들어 용해물(lysate) 또는 정제된 폴리펩티드 혼합물임)을 포함하도록 의도된다.
"분비된"이란 용어는 폴리펩티드가 주변세포질 공간 또는 세포외 환경으로 이동하는 것을 포함하도록 의도된다. "분비 증가"라는 용어는 주어진 폴리펩티드가 증가된 수준으로 (즉, "천연 분비량" 보다 과량으로) 분비되는 경우를 포함하도록 의도된다. 특정 구체예에서, "분비 증가"라는 용어는 천연 분비 수준과 비교하여 적어도 약 10% 또는 적어도 약 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 이를 초과하는 비율로 주어진 폴리펩티드의 분비가 증가함을 지칭한다.
"분비성 폴리펩티드"라는 용어는 또 다른 폴리펩티드를 세포의 세포내 공간으로부터 세포외 환경으로 수송하는 것을 촉진하는 임의의 폴리펩티드(들)을 단독으로 또는 다른 폴리펩티드와 함께 포함하도록 의도된다. 특정 구체예에서, 분비성 폴리펩티드(들)은 분비 활성을 그람-음성 또는 그람-양성 숙주 세포에게 부여하기에 충분한 모든 필요한 분비성 폴리펩티드를 포함한다. 전형적으로, 분비성 단백질은 하나의 숙주 세포로부터 분리되어 유전 공학을 이용하여 또 다른 숙주 세포로 전달될 수 있는 단일 영역 또는 유전자좌에 엔코딩되어 있다. 특정 구체예에서, 분비성 폴리펩티드(들)은 분비 활성을 지닌 임의의 세균 세포로부터 유래된다. 특정 구체예에서, 분비성 폴리펩티드(들)은 타입 II 분비 활성을 지닌 숙주 세포로부터 유래된다. 특정 구체예에서, 숙주 세포는 호열성 세균 세포이다.
"로부터 유래된"이란 용어는 지시된 공급원으로부터 폴리누클레오티드 세그먼트를 (전체적으로 또는 부분적으로) 분리하거나 지시된 공급원으로부터 폴리펩티드를 정제하는 것을 포함하도록 의도된다. 상기 용어는, 예를 들어 지시된 폴리누클레오티드 공급원과 관련된 서열로부터 또는 이러한 서열을 기초로 하여 직접 클로닝하거나, PCR 증폭시키거나 인공적으로 합성하는 것을 포함하도록 의도된다.
"호열성"이란 약 45℃ 또는 이 보다 높은 온도에서 잘 증식하는 생물체를 의미한다.
"중온성"이란 약 20 내지 45℃의 온도에서 잘 증식하는 생물체를 의미한다.
"유기산"이란 용어는 당 분야에 인지되어 있다. "락트산"이란 용어는 유리 산(free acid) 또는 염 형태의 유기산인 2-히드록시프로피온산을 지칭한다. 락트산의 염 형태는 중화제, 즉, 탄산칼슘 또는 수산화암모늄과 무관하게 "락테이트"로 지칭된다. "아세트산"이란 용어는 유리산 또는 염 형태의 에탄산(ethanoic acid)으로도 공지되어 있는 유기산인 메탄카르복실산을 지칭한다. 아세트산의 염 형태는 "아세테이트"로 지칭된다.
본 발명의 특정 구체예는 호열성 또는 중온성 미생물내에서의 소정의 유전자 또는 특정 폴리누클레오티드 서열의 "삽입" (예를 들어, 첨가, 통합, 혼입 또는 도입)을 제공하며, 유전자 또는 특정 폴리누클레오티드 서열의 이러한 삽입은, 결과로서 생긴 상기 호열성 또는 중온성 미생물의 균주가 "유전자 변형"되거나 "형질전환"된 것으로 이해될 수 있도록 "유전자 변형(들)" 또는 "형질전환(들)"을 포함하는 것으로 이해될 수 있다. 특정 구체예에서, 균주는 세균, 진균 또는 효모 기원일 수 있다.
본 발명의 특정 구체예는 호열성 또는 중온성 미생물내에서의 소정의 유전자 또는 특정 폴리누클레오티드 서열의 "비활성화" 또는 "결실"을 제공하며, 유전자 또는 특정 폴리누클레오티드 서열의 이러한 "비활성화" 또는 "결실"은, 결과로서 생긴 상기 호열성 또는 중온성 미생물의 균주가 "유전자 변형"되거나 "형질전환"된 것으로 이해될 수 있도록 "유전자 변형(들)" 또는 "형질전환(들)"을 포함하는 것으로 이해될 수 있다. 특정 구체예에서, 균주는 세균, 진균 또는 효모 기원일 수 있다.
"CBP 생물체"라는 용어는 본 발명의 미생물, 예를 들어 CBP에 적합한 특성을 지니는 미생물을 포함하도록 의도된다.
본 발명의 한 가지 일면에서, 유전자 또는 특정 폴리누클레오티드 서열은 이에 의해 엔코딩되는 활성, 예를 들어 효소의 발현을 활성화시키도록 삽입된다. 특정 구체예에서, 에탄올의 대사적 생산에 관여하는 효소, 예를 들어 펜토오스 및/또는 헥소오스 당을 대사하는 효소를 엔코딩하는 유전자가 중온성 또는 호열성 생물체에 첨가될 수 있다. 본 발명의 특정 구체예에서, 효소는 펜토오스 당을 대사하는 능력을 부여할 수 있고, 예를 들어 D-자일로오스 경로 및/또는 L-아라비노오스 경로에 관여할 수 있다.
본 발명의 한 가지 일면에서, 유전자 또는 특정 폴리누클레오티드 서열은 이에 의해 엔코딩되는 활성, 예를 들어 효소의 발현을 비활성화시키도록 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절된다. 결실은 최대 안정성을 제공하는데, 이는 복귀 돌연변이로 하여금 기능을 복구하게 할 기회가 없기 때문이다. 또한, 유전자의 기능 및/또는 발현을 붕괴시키는 핵산 서열의 삽입에 의해 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절될 수 있다 (예를 들어, P1 형질도입 또는 당 분야에 공지된 다른 방법). "제거한다", "제거" 및 "녹아웃"이란 용어는 "결실"이라는 용어와 상호교환적으로 사용된다. 특정 구체예에서, 유기산의 생산을 녹아웃시키기 위해 관심있는 호열성 또는 중온성 미생물의 균주가 부위 지정(site directed) 상동 재조합에 의해 엔지니어링될 수 있다. 다른 구체예에서, 관심있는 특정 유전자를 부분적으로, 실질적으로 또는 완전히 침묵시키거나 비활성화시키거나 하향조절하기 위해 RNAi 또는 안티센스 DNA(asDNA)가 사용될 수 있다.
특정 구체예에서, 본원에 기재된 바와 같은 결실 또는 비활성화를 위해 표적화된 유전자는 미생물의 고유한 균주에 내생성일 수 있고, 이에 따라 "고유 유전자(들)" 또는 "내생성 유전자(들)"로 지칭되는 것으로 이해될 수 있다. 생물체가 이러한 생물체의 유전자 및/또는 표현형 구성을 의도적으로 변화시키는 방식으로 유전공학처리되거나 다른 방식으로 인위적으로 조작된 것이 아니라면 그러한 생물체는 "고유한 상태(native state)"로 존재하는 것이다. 예를 들어, 야생형 생물체는 고유한 상태로 존재하는 것으로 간주될 수 있다. 다른 구체예에서, 결실 또는 비활성화를 위해 표적화된 유전자(들)은 생물체에 대해 비고유한 것일 수 있다.
바이오매스
"리그노셀룰로오스 물질", "리그노셀룰로오스 기질" 및 "셀룰로오스 바이오매스"라는 용어는 셀룰로오스, 헤미셀룰로오스, 리그닌 또는 이들의 조합물을 포함하는 임의의 유형의 바이오매스, 예를 들어 비제한적으로 목재 바이오매스(woody biomass), 먹이풀(forage grass), 초본 에너지 작물(herbaceous energy crop), 비목본식물 바이오매스(non-woody-plant biomass), 농업 폐기물 및/또는 농업 잔존물, 산림 잔존물 및/또는 산림 폐기물, 종이-생산 슬러지 및/또는 폐지 슬러지, 폐수-처리 슬러지, 도시 고형 폐기물(municipal solid waste), 습식 및 건식 제분 옥수수 에탄올 플랜트로부터의 옥수수 섬유, 및 설탕-가공 잔존물을 의미한다.
비제한적 예에서, 리그노셀룰로오스 물질은 비제한적으로 목재 바이오매스, 예를 들어 리사이클링된 목재 펄프 섬유, 톱밥, 경질목재, 연질목재, 및 이들의 조합물; 그래스, 예를 들어, 스위치 그래스, 코드 그래스, 라이 그래스, 리드 카나리 그래스, 미스캔투스, 또는 이들의 조합물; 설탕-가공 잔존물, 예를 들어 비제한적으로 사탕수수 버개스; 농업 폐기물, 예를 들어 비제한적으로 볏짚, 왕겨, 보리짚, 옥수수 속대, 곡물짚, 밀짚, 카놀라짚, 귀리짚, 귀리껍질, 및 옥수수섬유; 스토버, 예를 들어 비제한적으로 대두 스토버, 옥수수 스토버; 산림 폐기물, 예를 들어 비제한적으로 리사이클링된 목재 펄프 섬유, 톱밥, 경질목재 (예를 들어, 포플러, 오크(oak), 단풍나무(maple), 자작나무(birch), 버드나무), 연질목재, 또는 이들의 임의의 조합물을 포함할 수 있다. 리그노셀룰로오스 물질은 하나의 섬유 종(species)을 포함할 수 있고; 대안적으로 리그노셀룰로오스 물질은 다양한 리그노셀룰로오스 물질로부터 유래된 섬유들의 혼합물을 포함할 수 있다. 특히 유리한 리그노셀룰로오스 물질은 농업 폐기물, 예를 들어 밀짚, 보리짚, 카놀라짚 및 귀리짚을 포함하는 곡물짚; 옥수수 섬유; 스토버, 예를 들어 옥수수 스토버 및 대두 스토버; 그래스, 예를 들어 스위치 그래스, 리드 카나리 그래스, 코드 그래스, 및 미스칸투스; 또는 이들의 조합물이다.
또한, 종이 슬러지는 에탄올 생산을 위한 실용적인 공급원료이다. 종이 슬러지는 펄프화 및 제지 과정으로부터 발생하는 고형 잔존물이고, 이는 전형적으로 1차 정화기에서 공정 폐수로부터 분리된다. 처분 비용이 습윤 톤(wet ton) 당 $30인 경우, 슬러지 처분 비용은 판매용으로 생산되는 종이 톤 당 $5와 동일하다. 습윤 슬러지를 처분하는 비용은 에탄올로 전환시키는 것과 같이 물질을 다른 용도로 전환시키는 것에 대한 중요한 유인(incentive)이다. 본 발명에 의해 제공되는 공정은 광범위하게 적용가능하다. 더욱이, 에탄올 또는 고부가가치 화학물질, 예를 들어 유기산, 방향족물질, 에스테르, 아세톤 및 고분자 중간체(polymer intermediate)를 생산하기 위해 당화(saccharification) 및/또는 발효 생산물이 사용될 수 있다.
피루베이트 포르메이트 리아제 (PFL)
피루베이트 포르메이트 리아제 (PFL)는 혐기적 글루코오스 대사를 조절하는 것을 보조하는 중요한 효소이다 (이는 대장균 및 다른 생물체에서 발견됨). 라디칼 화학을 이용하는 경우, 상기 효소는 피루베이트 및 조효소-A를 포르메이트 및 에탄올의 전구체인 아세틸-CoA로 가역적으로 전환시키는 것을 촉매작용한다. 피루베이트 포르메이트 리아제는 85 kDa의 759-잔기 서브유닛으로 이루어진 동형이량체(homodimer)이다. 상기 효소는 10-가닥 베타/알파 배럴 모티프(10-stranded beta/alpha barrel motif)를 지니며, 이러한 모티프내로 주요 촉매 잔기를 함유하는 베타 핑거(beta finger)가 삽입되어 있다. x선 결정학에 의해 밝혀진 상기 효소의 활성 부위는 촉매작용을 수행하는 3개의 필수 아미노산 (Gly734, Cys418, 및 Cys419), 기질인 피루베이트를 바로 곁에 보유하는 3개의 주요 잔기 (Arg435, Argl76, 및 Ala272), 및 2개의 플랭킹(flanking) 소수성 잔기 (Trp333 및 Phe432)를 보유한다.
피루베이트 포르메이트 리아제의 활성 부위와 클래스 I 및 클래스 III 리보누클레오티드 리덕타아제 (RNR) 효소의 활성 부위 사이의 구조적 유사성이 연구에 의해 밝혀졌다. 3개의 촉매작용 잔기의 역할은 다음과 같다: Gly734 (글리실 라디칼)은 Cys419를 통해 Cys418로 온 앤드 오프(on and off) 방식으로 라디칼을 전달하고; Cys418 (티일 라디칼(thiyl radical))은 피루베이트 카르보닐의 탄소 원자상에서 아실화 화학을 수행하고; Cys419 (티일 라디칼)은 수소-원자 전달을 수행한다.
피루베이트 포르메이트 리아제에 대한 제안된 메커니즘은 Cys419를 통해 Gly734로부터 Cys418로 라디칼을 전달하는 것으로 시작한다. Cys418 티일 라디칼은 피루베이트의 C2 (2번 탄소 원자)에 공유적으로 부가되어, 아세틸-효소 중간체 (이는 이제 라디칼을 함유함)를 생성시킨다. 이러한 아세틸-효소 중간체는 Cys419에 의해 수소-원자를 전달받게 되는 포르밀 라디칼을 방출한다. 이는 포르메이트 및 Cys419 라디칼을 생성시킨다. 조효소-A는 Cys419 라디칼에 의해 수소-원자를 전달받아서 조효소-A 라디칼을 생성시킨다. 그 후, 조효소-A 라디칼은 Cys418로부터 아세틸기를 취하여 아세틸-CoA를 생성시킴으로써, Cys418 라디칼이 남게 한다. 그 후, 피루베이트 포르메이트 리아제는 라디칼을 전달받아서 그 라디칼을 Gly734상에 되돌려 놓을 수 있다. 또한, 상기 언급된 단계들은 모두 가역적이다.
2개의 추가 효소인 PFL 활성화효소(activase) (AE) 및 PFL 비활성화효소(deactivase) (DA)는 혐기적 글루코오스 대사를 조절하기 위해 피루베이트 포르메이트 리아제의 "온(on)" 및 "오프(off)" 상태를 조절한다. 활성화된 피루베이트 포르메이트 리아제는, 피루베이트가 이용가능한 경우, 에너지 생산에서 중요한 작은 분자인 아세틸-CoA의 형성을 가능하게 한다. 비활성화된 피루베이트 포르메이트 리아제는 기질이 존재하는 경우에도 반응을 촉매작용하지 않는다. PFL 활성화효소는 라디칼 SAM (S-아데노실메티오닌) 수퍼패밀리(superfamily)의 일부이다.
따라서, PFL 활성화효소 (AE)는 Gly734 (G-H)를 Gly734 라디칼 (G*)로 전환시킴으로써 피루베이트 포르메이트 리아제를 "온(on)" 상태가 되게 한다. PFL 비활성화효소 (DA)는 Gly734 라디칼을 켄칭(quenching)시킴으로써 피루베이트 포르메이트 리아제를 "오프(off)" 상태가 되게 한다. 또한, 피루베이트 포르메이트 리아제는 분자 산소 (O2)에 민감한데, 이러한 분자 산소가 존재하면 상기 효소는 셧오프(shut off)된다.
자일로오스 대사
자일로오스는 다양한 생물체에 의해 유용한 생산물로 대사될 수 있는 탄소 5개의 단당류이다. 2개의 주요 자일로오스 대사 경로가 존재하며, 각각의 경로는 사용되는 특징적 효소가 독특하다. 한 가지 경로는 "자일로오스 리덕타아제-자일리톨 데히드로게나아제" 또는 XR-XDH 경로라고 일컬어진다. 자일로오스 리덕타아제 (XR) 및 자일리톨 데히드로게나아제 (XDH)는 이러한 자일로오스 분해 방법에서 사용되는 2개의 주된 효소이다. XYL1 유전자에 의해 엔코딩되는 XR은 자일로오스를 자일리톨로 환원시키는 것을 담당하고, 보조인자인 NADH 또는 NADPH에 의해 보조를 받는다. 그 후, 자일리톨은 XYL2 유전자를 통해 발현되는 XDH에 의해 자일룰로오스로 산화되고, 이는 오로지 보조인자 NAD+에 의해서만 달성된다. 이러한 경로에 필요한 다양한 보조인자 및 그러한 보조인자가 사용을 위해 이용가능한 정도로 인해, 불균형은 자일리톨 부산물의 과다생산 및 바람직한 에탄올의 비효율적 생산을 초래할 수 있다. 자일로오스 대사 경로의 효율을 최적화하기 위해 XR 및 XDH 효소 수준의 발현을 변화시키는 것이 실험실에서 시험되었다.
자일로오스 대사를 위한 나머지 경로는 "자일로오스 이소머라아제" (XI) 경로라고 일컬어진다. 효소 XI는 자일로오스를 자일룰로오스로 직접 전환시키는 것을 담당하며, 자일리톨 중간체를 거치지 않는다. 둘 모두의 경로는 자일룰오스를 생성시키지만, 사용되는 효소는 상이하다. 자일룰로오스의 생산 후, XR-XDH 및 XI 경로는 둘 모두 XKS1 유전자상에서 엔코딩되는 자일룰로키나아제 (XK) 효소를 통해 진행하여 자일룰로오스를 자일룰로오스-5-P로 추가로 변화시키며, 이어서 자일룰로오스-5-P는 추가의 이화(catabolism)를 위한 펜토오스 포스페이트 경로에 진입한다.
자일로오스 대사 동안 펜토오스 포스페이트 경로를 통한 플럭스(flux)에 관한 연구는 이러한 단계의 속도를 제한하는 것이 에탄올 발효 효율에 유리할 수 있음을 밝혀냈다. 에탄올 생산을 개선시킬 수 있는 이러한 플럭스에 대한 변화는 a) 포스포글루코오스 이소머라아제 활성을 낮추고, b) GND1 유전자를 결실시키고, c) ZWF1 유전자를 결실시키는 것을 포함한다 (Jeppsson et al., 2002). 펜토오스 포스페이트 경로가 대사 동안 추가의 NADPH를 생산하므로, 이러한 단계를 제한하는 것은 NAD(P)H 와 NAD+ 보조인자 사이의 이미 분명한 불균형을 바로잡고 자일리톨 부산물을 감소시키는 것을 도와줄 것이다. 2개의 자일로오스 대사 경로를 비교하는 또 다른 실험은 XI 경로가 최대 에탄올 수율을 수득하도록 자일로오스를 가장 잘 대사할 수 있었으며 XR-XDH 경로는 훨씬 빠른 에탄올 생산 속도에 도달하였음을 밝혀내었다 (Karhumaa et al., 2007).
미생물
본 발명은 CBP에 필요한 기질-이용 및 생산물-형성 특성을 겸비한 미생물을 개발하기 위한 다수의 전략을 포함한다. "고유 셀룰로오스분해 전략(native cellulolytic strategy)"은 천연 셀룰로오스분해성 미생물을 수율 및 역가와 같은 생산물 관련된 특성을 개선시키도록 엔지니어링하는 것을 포함한다. "재조합 셀룰로오스분해 전략(recombinant cellulolytic strategy)"은 높은 생산물 수율 및 역가를 나타내는 고유하게 비-셀룰로오스분해성인 생물체를 셀룰로오스 이용 또는 헤미셀룰로오스 이용 또는 둘 모두를 가능하게 하는 이종성 셀룰라아제 시스템을 발현하도록 엔지니어링하는 것을 포함한다.
셀룰로오스분해성 미생물
셀룰로오스분해성이거나 셀룰로오스분해 활성을 지니는 것으로 문헌에 보고된 수 가지 미생물은 미세결정 셀룰로오스 뿐만 아니라 다양한 다른 당에서 증식하는 능력을 포함하는 다양한 수단에 의해 특징화되었다. 또한, 그러한 생물체들은 비제한적으로 셀룰로오스 및 헤미셀룰로오스를 탈중합시키거나 가지제거하는 능력을 포함하는 다른 수단에 의해 특징화될 수 있다. 관심있는 생물체를 벤치마킹(benchmarking)하기 위해 클로스트리디움 써모셀룸 (DSMZ 1237 균주)이 사용되었다. 본원에 사용된 바와 같이, 클로스트리디움 써모셀룸은 비제한적으로 DSMZ 1237, DSMZ 1313, DSMZ 2360, DSMZ 4150, DSMZ 7072, 및 ATCC 31924를 포함하는 다양한 균주를 포함할 수 있다. 본 발명의 특정 구체예에서, 클로스트리디움 써모셀룸은 비제한적으로 DSMZ 1313 또는 DSMZ 1237을 포함할 수 있다. 또 다른 구체예에서, 본 발명에 사용되는 특히 적합한 관심있는 생물체는 클로스트리디움 써모셀룸과 70% 이상의 16S rDNA 상동성을 지닌 셀룰로오스분해성 미생물을 포함한다. 클로스트리디움 써모셀룸, 클로스트리디움 셀룰로리티쿰, 써모안에어로박테리움 사카롤리티쿰, 클로스트리디움 스테르코라리움, 클로스트리디움 스테르코라리움 II, 칼디셀룰로시룹터 크리스티안소니, 클로스트리디움 피토페르멘탄스가 정렬되면 16S rDNA 유전자의 수준에서 73 내지 85% 상동성을 나타낸다 (도 6).
클로스트리디움 스트라미니솔벤스는 아비셀®에서 거의 클로스트리디움 써모셀룸 만큼 잘 증식하는 것으로 결정되었다. 표 1에는 특정한 고도로 셀룰로오스분해성인 생물체가 요약되어 있다.
표 1
균주 | DSMZ 번호 | T 최적; 또는 범위 | pH 최적; 또는 범위 | 그람 염색 | 내기성(Aero-tolerent) | 이용물질 | 생산물 |
클로스트리디움 써모셀룸 | 1313 | 55-60 | 7 | 양성 | 아니오 | 셀로비오스, 셀룰로오스 | 아세트산, 락트산, 에탄올, H2, CO2 |
클로스트리디움 스트라미니솔벤스 | 16021 | 50-55; 45-60 | 6.5-6.8; 6.0-8.5 | 양성 | 예 | 셀로비오스, 셀룰로오스 | 아세트산, 락트산, 에탄올, H2, CO2 |
생물체들을 20 g/L의 셀로비오스 또는 20 g/L의 아비셀®에서 증식시켰다. 클로스트리디움 써모셀룸을 60℃에서 증식시키고, 클로스트리디움 스트라미니솔벤스를 55℃에서 증식시켰다. 둘 모두를 50mM MOPS가 함유된 M122에서 -80℃ 냉동기 스톡(freezer stock) (DSMZ 유래)으로부터 예비배양하였다. 중기 내지 말기 대수증식기 동안, 예비배양물을 사용하여 100 mL 혈청 병(serum bottle) 중의 뱃치(batch) 배양물에 50 mL의 작업 부피로 접종하였다. 대사 부산물과 당 소비의 HPLC 분석을 위해 주기적으로 액체 샘플을 분리하였다. OD600을 이러한 시점 각각에서 수득하였다. 도 12A 및 12B는 각각 셀로비오스 및 아비셀®에서의 클로스트리디움 스트라미니솔벤스에 대한 생산물 형성 및 OD600을 도시한다. 48시간내에 상당한 셀로비오스 (37%)가 소비된 후 OD가 떨어지고 생산물 형성이 일정해졌다. 도 13A 및 13B는 각각 셀로비오스 및 아비셀®에서의 클로스트리디움 써모셀룸에 대한 생산물 형성 및 OD600을 도시한다. 클로스트리디움 써모셀룸은 48시간내에 셀로비오스의 ~60%를 소비하였고, 이 시점에서 생산물 형성이 일정해졌다. 유기산의 형성으로 인한 억제는 기질의 불완전한 이용을 야기하였다.
예를 들어 클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스를 포함하는 특정 미생물은 펜토오스 당, 예를 들어 D-자일로오스 또는 L-아라비노오스를 대사할 수 없지만, 헥소오스 당은 대사할 수 있다. D-자일로오스 및 L-아라비노오스 둘 모두는 바이오매스에 풍부하게 존재하는 당인데, D-자일로오스는 연질 및 경질 목재의 경우 약 16 내지 20%를 차지하고 L-아라비노오스는 옥수수 섬유의 경우 약 25%를 차지한다. 따라서, 본 발명의 한 가지 목적은 D-자일로오스와 L-아라비노오스와 같은 펜토오스 당을 대사하는 능력을 지닌 유전자 변형된 셀룰로오스분해성 미생물을 제공함으로써 바이오매스→에탄올 산업에서 발효를 위한 생물촉매(biocatalyst)로서의 이의 용도를 증진시키는 데에 있다.
셀룰로오스분해성 및 자일란분해성 미생물
셀룰로오스분해성이면서 자일란분해성인 것으로 문헌으로부터 결정된 수 가지 미생물은 미세결정 셀룰로오스 및 자작나무(birchwood) 자일란 뿐만 아니라 다양한 다른 당에서 증식하는 능력에 의해 특징화되었다. 관심있는 생물체를 벤치마킹하기 위해 클로스트리디움 써모셀룸이 사용되었다. 특징화를 위해 선택된 균주 중에서 클로스트리디움 셀룰로리티쿰, 클로스트리디움 스테르코라리움 아종 렙토사파르툼, 칼디셀룰로시룹터 크리스티안소니 및 클로스트리디움 피토페르멘탄스가 아비셀®에서는 약하게 증식하였고, 자작나무 자일란에서는 잘 증식하였다. 표 2에는 고유하게 셀룰로오스분해성 및 자일란분해성인 생물체의 일부가 요약되어 있다.
표 2
균주 | 공급원/번호 | T 최적; 또는 범위 | pH 최적; 또는 범위 | 그람 염색 | 내기성 | 이용물질 | 생산물 |
클로스트리디움 셀룰로리티쿰 | DSM 5812 | 34 | 7.2 | 음성 | 아니오 | 셀룰로오스, 자일란, 아라비노오스, 만노오스, 갈락토오스, 자일로오스, 글루코오스, 셀로비오스 | 아세트산, 락트산, 에탄올, H2, CO2 |
클로스트리디움 스테르코라리움 아종 렙토사파르툼 | DSM 9219 | 60-65 | 7.0-7.5 | 음성 | 아니오 | 셀룰로오스, 셀로비오스, 락토오스, 자일로오스, 멜리비오스, 라피노오스, 리보오스,프룩토오스, 수크로오스 | 아세트산, 락트산, 에탄올, H2, CO2 |
칼디셀룰로시룹터 크리스티안소니 | DSM 12137 | 78; 45-82 | 7; 5.8-8.0 | 음성 | 아니오 | 셀로비오스, 글루코오스, 자일로오스, 갈락토오스, 만노오스, 셀룰로오스 | 아세트산, CO2, 락트산, 에탄올, 포르메이트 |
클로스트리디움 피토페르멘탄스 | ATCC 700394 | 37; 5-45 | 8.5; 6-9 | 음성 (그람 타입 양성) | 아니오 | 셀룰로오스, 자일란, 셀로비오스, 프룩토오스, 갈락토오스, 글루코오스, 락토오스, 말토오스, 만노오스, 리보오소, 자일로오스 | 아세트산, H2, CO2, 락트산, 에탄올, 포르메이트 |
생물체들을 20 g/L의 셀로비오스, 20 g/L의 아비셀® 또는 5 g/L의 자작나무 자일란에서 증식시켰다. 클로스트리디움 써모셀룸을 37℃에서 증식시키고, 클로스트리디움 스테르코라리움 아종 렙토사파르툼을 60℃에서 증식시키고, 칼디셀룰로시룹터 크리스티안소니를 75℃에서 증식시키고, 클로스트리디움 피토페르멘탄스를 37℃에서 증식시켰다. 모든 생물체들을 50mM MOPS가 보충된 M122c에서 -80℃ 냉동기 스톡으로부터 예비배양하였다. 중기 내지 말기 대수증식기 동안, 예비배양물을 사용하여 100 mL 혈청 병 중의 뱃치 배양물에 50 mL의 작업 부피로 접종하였다. 대사 부산물과 당 소비의 HPLC 분석을 위해 주기적으로 액체 샘플을 분리하였다. OD600을 이러한 시점 각각에서 수득하였다. 도 14A 내지 17B는 셀로비오스 및 아비셀®에서의 생산물 형성 및 OD600을 도시한다.
별도의 실험에서, 생물체들을 셀로비오스, 글루코오스, 자일로오스, 갈락토오스, 아라비노오스, 만노오스 및 락토오스를 포함하는 2.5 g/L의 단일 당(single sugar) 뿐만 아니라 5 g/L의 아비셀®과 자작나무 자일란에서 증식시켰다. 도 18에는 2일 후 셀로비오스 및 자작나무 자일란에서의 생산물 형성이 비교되어 있다. 표 3에는 세균 균주가 이의 기질 이용을 기초로 하여 어떻게 분류될 수 있는 지가 요약되어 있다.
표 3
셀로비오스 | 글루코오스 | 자일로오스 | 갈락토오스 | 아라비노오스 | 만노오스 | 락토오스 | |
클로스트리디움 셀룰로리티쿰 | x | x | x | x | x | ||
클로스트리디움 스테르코라리움 아종 렙토사파르툼 | x | x | x | x | x | x | |
칼디셀룰로시룹터 크리스티안소니 | x | x | x | x | x | ||
클로스트리디움 피토페르멘탄스 | x | x | x | x | x |
미생물의 트랜스제닉(Transgenic) 전환
본 발명은 특정 미생물의 트랜스제닉 전환을 위한 조성물 및 방법을 제공하다. 예를 들어 D-자일로오스 및/또는 L-아라비노오스를 포함하는 에탄올의 대사 경로에 관여하는 효소를 엔코딩하는 유전자가 이러한 유전자 중 하나 이상이 결여된 세균 균주, 예를 들어 클로스트리디움 써모셀룸 또는 클로스트리디움 스트라미니솔벤스내로 도입되는 경우, D-자일로오스에서 증식하거나 L-아라비노오스에서 증식하는 것에 대해 형질전환된 균주를 선별할 수 있다. 다른 클로스트리디알(Clostridial) 종으로부터의 유전자가 클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스에서 발현될 수 있는 것으로 예상된다. 표적 유전자 공여체는 헥소오스 및 펜토오스 당을 대사하는 능력을 부여하는 미생물, 예를 들어 클로스트리디움 셀룰로리티쿰, 칼디셀룰로시룹터 크리스티안소니, 클로스트리디움 피토페르멘탄스, 클로스트리디움 스테르코라리움, 및 써모안에어로박테리움 사카롤리티쿰을 포함할 수 있다.
써모안에어로박테리움 사카롤리티쿰, 클로스트리디움 셀룰로리티쿰 및 클로스트리디움 피토페르멘탄스의 게놈은 이용가능하다. 따라서, 본 발명은 상기 제시된 3개의 숙주 각각에 존재하는 자일로오스 이소머라아제 및 자일룰로키나아제에 상응하는 서열을 제공한다. 특히, 써모안에어로박테리움 사카롤리티쿰으로부터의 자일로오스 이소머라아제 (SEQ ID NO:6), 자일룰로키나아제 (SEQ ID NO:7), L-아라비노오스 이소머라아제 (SEQ ID NO:8), 및 L-리불로오스-5-포스페이트 4-에피머라아제 (SEQ ID NO: 9)에 상응하는 서열이 본원에 제시된다. 유사하게는, 클로스트리디움 셀룰로리티쿰으로부터의 자일로오스 이소머라아제 (SEQ ID NO:10), 자일룰로키나아제 (SEQ ID NO:11), L-아라비노오스 이소머라아제 (SEQ ID NO:12), 및 L-리불로오스-5-포스페이트 4-에피머라아제 (SEQ ID NO: 13)에 상응하는 서열이 본원에 제공된다. 클로스트리디움 피토페르멘탄스는 D-자일로오스 경로를 이용하며 L-아라비노오스를 이용하지 않는다. 따라서, 클로스트리디움 피토페르멘탄스로부터의 자일로오스 이소머라아제 (SEQ ID NO:14) 및 자일룰로키나아제 (SEQ ID NO:15)에 상응하는 서열이 본원에 제시된다.
칼디셀룰로시룹터 크리스티안소니는 자일로오스를 분명히 대사한다. 이를 위해, 칼디셀룰로시룹터 크리스티안소니의 자일로오스 이소머라아제 (SEQ ID NO:71) 및 자일룰로키나아제 (SEQ ID NO:70) 유전자가 시퀀싱되어 본원에 제공된다. 클로스트리디움 스트라미니솔벤스는 자일로오스에서 증식하는 것으로 밝혀지지 않았지만, 이는 탄소원으로서의 자일로오스에서 적응한 후 기능적일 수 있는 자일로오스 이소머라아제 (SEQ ID NO:73) 및 자일룰로키나아제 (SEQ ID NO:72) 유전자를 분명히 함유한다.
클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스는 D-자일로오스→에탄올 경로 및/또는 L-아라비노오스 이용 경로에 관여하는 하나 이상의 공지된 유전자 또는 효소를 결여할 수 있다. 도 2 및 3은 클로스트리디움 써모셀룸의 이들 경로 각각에 존재하지 않는 2개의 핵심 효소를 도시한다. 클로스트리디움 스트라미솔벤스는 자일로오스 이소머라아제 및 자일룰로키나아제를 지니지만, 이들 효소의 기능성은 알려져 있지 않다. 게놈 시퀀싱은 클로스트리디움 스트라미노솔벤스에서 L-아라비노오스 이소머라아제 또는 L-리불로오스-5-포스페이트 4-에피머라아제의 카피를 밝혀내지 못했다.
클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스는 자일룰로오스를 대사할 수 없는데, 이는 D-자일로오스를 D-자일룰로오스로 전환시키는 자일로오스 이소머라아제 (도 2에서 "XI" 또는 5.3.1.5로 지칭됨) 및 D-자일룰로오스를 D-자일룰로오스-5-포스페이트로 전환시키는 자일룰로키나아제 (도 2에서 "XK" 또는 2.7.1.1로도 지칭됨)에 대한 유전자가 없음 (클로스트리디움 써모셀룸) 또는 이러한 유전자의 활성 및/또는 발현의 결여 (클로스트리디움 스트라미니솔벤스)를 반영할 수 있다. 또한, 자일로오스의 수송은 클로스트리디움 스트라미니솔벤스에 대한 제한일 수 있다. 이러한 잠재적 제한은 써모안에어로박테리움 사카롤리티쿰 및 칼디셀룰로시룹터 크리스티안소니와 같은 자일로오스 이용 생물체로부터 당 수송 유전자를 발현시킴으로써 극복될 수 있다.
클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스는 L-아라비노오스를 또한 대사할 수 없는데, 이는 L-아라비노오스 이소머라아제 (도 3에서 5.3.1.4로도 지칭됨) 및 L-리불로오스-5-포스페이트 4-에피머라아제 (도 3에서 5.1.3.4로도 지칭됨)에 대한 유전자가 없음을 반영할 수 있다.
상기 기재된 4개의 유전자, 예를 들어 자일로오스 이소머라아제, 자일룰로키나아제, L-아라비노오스 이소머라아제 및 L-리불로오스-5-포스페이트 4-에피머라아제는 비제한적으로 클로스트리디움 셀룰로리티쿰 (도 4 참조), 써모안에어로박테리움 사카롤리티쿰, 클로스트리디움 스테르코라리움, 칼디셀룰로시룹터 크리스티안소니, 및 클로스트리디움 피토페르멘탄스를 포함하는 수 가지 클로스트리디알 종과 써모안에어로박테리움 사카롤리티쿰 종에 존재하며, 이러한 균주는 그러한 당의 양호한 이용균주이다. 상기 세균 균주가 본원에 기재된 유전자의 공여체로서 사용될 수 있는 것으로 인식될 것이다.
클로스트리디움 피토페르멘탄스는 상기 기재된 2개의 자일로오스 경로 유전자 (자일로오스 이소머라아제 및 자일룰로키나아제)를 발현하지만, 상기 기재된 아라비노오스 경로 유전자 (L-아라비노오스 이소머라아제 및 L-리불로오스-5-포스페이트 4-에피머라아제)를 결여하거나 발현하지 않는다 (도 5 참조).
따라서, 본 발명의 목적은, 예를 들어 바이오매스에서 유래된 펜토오스, 예를 들어 D-자일로오스 또는 L-아라비노오스 대사로부터 에탄올을 생산하기 위해 필요한 하나 이상의 효소에 대한 유전자를 도입시킴으로서, 당 이용 능력을 최적화하도록 상기 기재된 세균 균주의 일부를 변화시키는 데에 있다. 트리오스 포스페이트 이소머라아제 (TPI), GAPDH 및 LDH와 같은 클로스트리디움 써모셀룸 또는 클로스트리디움 스트라미니솔벤스의 고유 프로모터를 포함하는 프로모터가 상기 유전자를 발현시키기 위해 사용될 수 있다. 클로스트리디움 써모셀룸의 고유 프로모터에 상응하는 서열은 (TPI) (SEQ ID NO:16), GAPDH (SEQ ID NO:17) 및 LDH (SEQ ID NO:18)를 포함한다. 유전자가 클로닝된 경우, 발현 전에 코돈 최적화가 수행될 수 있다. 그 후, 클로스트리디움 써모셀룸 또는 클로스트리디움 스트라미니솔벤스를 형질전환시키고 유일한 탄수화물원으로서 D-자일로오스 또는 L-아라비노오스를 함유하는 배지에서 D-자일로오스 및 L-아라비노오스 증식에 대해 선별하기 위해, 예를 들어 고유 프로모터, 자일란분해 유전자 또는 아리비노오스분해 유전자, 및 선별가능 마커를 함유하는 카세트가 사용될 수 있다.
트랜스포손(Transposon)
숙주로 들어온 외래 DNA를 선별하기 위해, 그러한 DNA는 관심있는 생물체에서 안정하게 유지되는 것이 바람직하다. 플라스미드와 관련하여, 이를 일어나게 할 수 있는 2가지 방법이 존재한다. 한 가지 방법은 복제성 플라스미드를 사용하는 것을 통해 이루어진다. 이러한 플라스미드는, 숙주에 의해 인식되어 플라스미드가 딸세포로의 세포 분열 동안 분할되는(partitioned) 안정하고 자율적인 염색체외 엘리먼트로서 복제될 수 있도록 하는, 복제 원점을 지닌다. 두 번째 방법은 플라스미드를 염색체상으로 통합시킴으로써 이루어진다. 이는 주로 상동 재조합에 의해 일어나며, 전체 플라스미드 또는 플라스미드의 부분을 숙주 염색체내로 삽입시킨다. 따라서, 플라스미드 및 선별가능 마커(들)은 염색체의 일체부로서 복제되어 딸세포내로 분리된다. 따라서, 플라스미드 DNA가 선별가능 마커의 사용을 통해 형질전환 사건 동안 세포로 들어가는 지를 확인하기 위해서는 복제성 플라스미드 또는 플라스미드를 염색체상으로 재조합시키는 능력을 사용할 필요가 있다. 이러한 식별자(qualifier)는 항상 충족될 수 있는 것이 아니며, 일련의 유전학적 도구를 지니지 않는 생물체를 취급하는 경우에 특히 그러하다.
플라스미드 관련된 마커에 관한 문제를 회피하는 한 가지 방법은 트랜스포손의 사용을 통해 이루어진다. 트랜스포손은 트랜스포사제(transposase)로서 지칭되는 효소적 기구(enzymatic machinery)에 의해 인식되는 모자이크 DNA 서열에 의해 규정되는 이동가능한 DNA 엘리먼트이다. 트랜스포사제의 기능은 트랜스포손 DNA를 숙주 또는 표적 DNA내로 무작위적으로 삽입하는 것이다. 선별가능 마커는 표준 유전공학에 의해 트랜스포손상으로 클로닝될 수 있다. 생성된 DNA 단편은 시험관내 반응으로 트랜스포사제 기구에 커플링될 수 있고, 복합체는 일렉트로포레이션(electroporation)에 의해 표적 세포내로 도입될 수 있다. 염색체상으로의 마커의 안정한 삽입은 단지 트랜스포사제 기구의 기능을 필요로 하고, 상동 재조합 또는 복제성 플라스미드의 필요성을 완화시킨다.
트랜스포손의 통합과 관련된 무작위성은 돌연변이유발의 형태로서 작용하는 추가적 이점을 지닌다. 트랜스포손 돌연변이체의 병합물(amalgamation)을 포함하는 라이브러리가 생성될 수 있다. 이러한 라이브러리는 요망되는 표현형을 지닌 돌연변이체를 생산하기 위해 스크린(screen) 또는 선별 과정에서 사용될 수 있다. 예를 들어, CBP 생물체의 트랜스포손 라이브러리는 더 많은 에탄올을 생산하거나 더 적은 락트산 및/또는 더 적은 아세테이트를 생산하는 능력에 대해 스크리닝될 수 있다.
고유 셀룰로오스분해 전략
천연 셀룰로오스분해성 미생물이 고유 전략을 통한 CBP 생물체 개발을 위한 출발점이다. 혐기성미생물 및 통성 혐기성미생물이 특히 관심을 끈다. 주요 목적은 산업적 공정의 요건을 만족시키도록 생산물 수율 및 에탄올 역가를 엔지니어링하는 데에 있다. 이러한 목적과 관련된 혼합-산(mixed-acid) 발효의 대사 엔지니어링은 중온성이고 비셀룰로오스분해성인 장내 세균의 경우에 성공적이었다. 적절한 유전자-전달 기술의 최근 개발은 이러한 유형의 작업이 셀룰로오스분해성 세균을 사용하여 수행될 수 있게 한다.
재조합 셀룰로오스분해 전략
요망되는 생산물-형성 특성 (예를 들어, 높은 에탄올 수율 및 역가)을 지닌 비셀룰로오스분해 미생물이 재조합 셀룰로오스분해 전략에 의한 CBP 생물체 개발을 위한 출발점이다. 이러한 개발의 주요 목적은 전처리된 리그노셀룰로오스에서의 증식 및 발효를 가능하게 하는 이종성 셀룰라아제 시스템을 엔지니어링하는 데에 있다. 셀룰라아제의 이종성 생산(heterologous production)은 높은 수율로 에탄올을 생산하는 세균 숙주 (대장균, 클레브시엘라 옥시토카(Klebsiella oxytoca) 및 자이모모나스 모빌리스의 엔지니어링된 균주)와 효모인 사카로마이세스 세레비시애를 주로 사용하여 추구되어 왔다. 클레브시엘라 옥시토카의 균주에서의 셀룰라아제 발현은 미세결정 셀룰로오스에 대해 가수분해 수율을 증가시켰지만 첨가된 셀룰라아제없이 증식을 초래하지 않았고, 비정질 셀룰로오스에서의 혐기성 증식을 초래하였다. 수 십개의 당분해 효소가 사카로마이세스 세레비시애에서 기능적으로 발현되었지만, 그러한 발현의 결과로써의 셀룰로오스에서의 혐기성 증식은 명확히 입증된 바 없다.
본 발명의 일면들은 고유 셀룰로오스분해 전략을 통해 변화되는 숙주로서 호열성 또는 중온성 미생물을 사용하는 것에 관한 것이다. 생물공학의 공정 응용에서 상기 미생물의 잠재력은 비교적 높은 온도에서 증식하는 능력과 이에 따른 높은 대사율, 물리적으로 그리고 화학적으로 안정한 효소의 생산 및 최종 생산물의 상승된 수율로부터 유래된다. 호열성 세균의 주요 군은 진정세균(eubacteria) 및 고세균(archaebacteria)을 포함한다. 호열성 진정세균은, 광합성(phototropic) 세균, 예를 들어 시아노박테리아, 퍼플 박테리아(purple bacteria), 및 그린 박테리아(green bacteria); 그람-양성 세균, 예를 들어 바실루스(Bacillus), 클로스트리디움(Clostridium), 락트산 세균, 및 액티노마이세스(Actinomyces); 및 다른 진정세균, 예를 들어 티오바실루스(Thiobacillus), 스피로체트(Spirochete), 데술포토마쿨룸(Desulfotomaculum), 그람-음성 호기성세균, 그람-음성 혐기성세균, 및 써모토가(Thermotoga)를 포함한다. 메타노겐(Methanogen), 고도 호열성세균(extreme thermophile) (당 분야에서 인지되는 용어), 및 써모플라스마(Thermoplasma)가 고세균에 속하는 것으로 간주된다. 특정 구체예에서, 본 발명은 써무스(Thermus) 속의 그람-음성 유기영양 호열성세균, 그람-양성 진정세균, 예를 들어 클로스트리디움 속, 그리고 또한 구균(rod) 및 간균(coccus) 둘 모두를 포함하는 것들, 진정세균군의 속, 예를 들어 써모시포(Thermosipho) 및 써모토가(Thermotoga), 고세균의 속, 예를 들어 써모코쿠스(Thermococcus), 써모프로테우스(Thermoproteus) (막대 모양(rod-shaped)), 써모필룸(Thermofilum) (막대 모양), 피로딕티움(Pyrodictium), 액시디아누스(Acidianus), 술폴로부스(Sulfolobus), 피로바쿨룸(Pyrobaculum), 피로코쿠스(Pyrococcus), 써모디스쿠스(Thermodiscus), 스태필로써무스(Staphylothermus), 데술푸로코쿠스(Desulfurococcus), 아르캐오글로부스(Archaeoglobus), 및 메타노피루스(Methanopyrus)에 관한 것이다. 본 발명에 적합할 수 있는 호열성 또는 중온성 생물체의 일부 예 (세균, 원핵 미생물, 및 진균을 포함함)는 비제한적으로 클로스트리디움 써모술푸로게네스(Clostridium thermosulfurogenes), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 써모셀룸(Clostridium thermocellum), 클로스트리디움 써모히드로술푸리쿰(Clostridium thermohydrosulfuricum), 클로스트리디움 써모아세티쿰(Clostridium thermoaceticum), 클로스트리디움 써모사카롤리티쿰(Clostridium thermosaccharolyticum), 클로스트리디움 타르타리보룸(Clostridium tartarivorum), 클로스트리디움 써모셀룰라세움(Clostridium thermocellulaseum), 클로스트리디움 피토페르멘탄스(Clostridium phytofermentans), 클로스트리디움 스트라미노솔벤스(Clostridium straminosolvens), 써모안에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccarolyticum), 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum), 써모박테로이즈 아세토에틸리쿠스(Thermobacteroides acetoethylicus), 써모안에어로비움 브록키(Thermoanaerobium brockii), 메타노박테리움 써모오토트로피쿰(Methanobacterium thermoautotrophicum), 안에어로셀룸 써모필리움(Anaerocellum thermophilium), 피로딕티움 오쿨툼(Pyrodictium occultum), 써모프로테우스 뉴트로필루스(Thermoproteus neutrophilus), 써모피룸 리브룸(Thermofilum librum), 써모트릭스 티오파루스(Thermothrix thioparus), 데술포비브리오 써모필루스(Desulfovibrio thermophilus), 써모플라스마 액시도필룸(Thermoplasma acidophilum), 히드로게노모나스 써모필루스(Hydrogenomonas thermophilus), 써모마이크로비움 로세움(Thermomicrobium roseum), 써무스 플라바스(Thermus flavas), 써무스 루베르(Thermus ruber), 피로코쿠스 푸리오수스(Pyrococcus furiosus), 써무스 아쿠아티쿠스(Thermus aquaticus), 써무스 써모필루스(Thermus thermophilus), 클로로플렉수스 아우란티아쿠스(Chloroflexus aurantiacus), 써모코쿠스 리토랄리스(Thermococcus litoralis), 피로딕티움 아비시(Pyrodictium abyssi), 바실루스 스테아로써모필루스(Bacillus stearothermophilus), 시아니디움 칼다리움(Cyanidium caldarium), 마스티고클라두스 라미노수스(Mastigocladus laminosus), 클라미도트릭스 칼리디시마(Chlamydothrix calidissima), 클라미도트릭스 페니실라타(Chlamydothrix penicillata), 티오트릭스 카르네아(Thiothrix carnea), 포르미디움 테누이시뭄(Phormidium tenuissimum), 포르미디움 게이세리콜라(Phormidium geysericola), 포르미디움 서브테라네움(Phormidium subterraneum), 포르미디움 비야헨시(Phormidium bijahensi), 오실라토리아 필리포르미스(Oscillatoria filiformis), 시네코코쿠스 리비두스(Synechococcus lividus), 클로로플렉수스 아루란티아쿠스(Chloroflexus aurantiacus), 피로딕티움 브록키(Pyrodictium brockii), 티오바실루스 티오옥시단스(Thiobacillus thiooxidans), 술폴로부스 액시도칼다리우스(Sulfolobus acidocaldarius), 티오바실루스 써모필리카(Thiobacillus thermophilica), 바실루스 스테아로써모필루스(Bacillus stearothermophilus), 세르코술시페르 하마텐시스(Cercosulcifer hamathensis), 바흘캄프피아 레이치(Vahlkampfia reichi), 시클리디움 시트룰루스(Cyclidium citrullus), 닥틸라리아 갤로파바(Dactylaria gallopava), 시네코코쿠스 리비두스(Synechococcus lividus), 시네코코쿠스 엘롱가투스(Synechococcus elongatus), 시네코코쿠스 미네르배(Synechococcus minervae), 시네코시스티스 아쿠아틸루스(Synechocystis aquatilus), 아파노캅사 써말리스(Aphanocapsa thermalis), 오실라토리아 테레브리포르미스(Oscillatoria terebriformis), 오실라토리아 앰피비아(Oscillatoria amphibia), 오실라토리아 게르미나타(Oscillatoria germinata), 오실라토리아 오케니(Oscillatoria okenii), 포르미디움 라미노숨(Phormidium laminosum), 포르미디움 파르파라시엔스(Phormidium parparasiens), 심플로카 써말리스(Symploca thermalis), 바실루스 액시도칼다리아스(Bacillus acidocaldarias), 바실루스 코귤란스(Bacillus coagulans), 바실루스 써모카테날라투스(Bacillus thermocatenalatus), 바실루스 리체니포르미스(Bacillus licheniformis), 바실루스 팔밀라스(Bacillus pamilas), 바실루스 마세란스(Bacillus macerans), 바실루스 씨르쿨란스(Bacillus circulans), 바실루스 라테로스포루스(Bacillus laterosporus), 바실루스 브레비스(Bacillus brevis), 바실루스 서브틸리스(Bacillus subtilis), 바실루스 스파에리쿠스(Bacillus sphaericus), 데술포토마쿨룸 니그리피칸스(Desulfotomaculum nigrificans), 스트렙토코쿠스 써모필루스(Streptococcus thermophilus), 락토바실루스 써모필루스(Lactobacillus thermophilus), 락토바실루스 불가리쿠스(Lactobacillus bulgaricus), 비피도박테리움 써모필룸(Bifidobacterium thermophilum), 스트렙토마이새스 프래그멘토스포루스(Streptomyces fragmentosporus), 스트렙토마이세스 써모니트리피칸스(Streptomyces thermonitrificans), 스트렙토마이세스 써모불가리스(Streptomyces thermovulgaris), 슈도노카르디아 써모필리아(Pseudonocardia thermophila), 써모액티노마이세스 불가리스(Thermoactinomyces vulgaris), 써모액티모마이세스 사카리(Thermoactinomyces sacchari), 써모액티노마이세스 칸디다스(Thermoactinomyces Candidas), 써모모노스포라 쿠르바타(Thermomonospora curvata), 써모모노스포라 비리디스(Thermomonospora viridis), 써모모노스포라 시트리나(Thermomonospora citrina), 마이크로비스포라 써모디아스타티카(Microbispora thermodiastatica), 마이크로비스포라 아에라타(Microbispora aerata), 마이크로비스포라 비스포라(Microbispora bispora), 액티노비피다 디코토미카(Actinobifida dichotomica), 액티노비피다 크로모게나(Actinobifida chromogena), 마이크로폴리스포라 카에시아(Micropolyspora caesia), 마이크로폴리스포라 피에니(Micropolyspora faeni), 마이크로폴리스포라 섹티부기다(Micropolyspora cectivugida), 마이크로폴리스포라 카브로브루네아(Micropolyspora cabrobrunea), 마이크로폴리스포라 써모비리다(Micropolyspora thermovirida), 마이크로폴리스포라 비리디니그라(Micropolyspora viridinigra), 메타노박테리움 써모오토트로피쿰(Methanobacterium thermoautothropicum), 칼디셀룰로시룹터 아세티게누스(Caldicellulosiruptor acetigenus), 칼디셀룰로시룹터 사카롤리티쿠스(Caldicellulosiruptor saccharolyticus), 칼디셀룰로시룹터 크리스티안소니(Caldicellulosiruptor kristjanssonii), 칼디셀룰로시룹터 오웬센시스(Caldicellulosiruptor owensensis), 칼디셀룰로시룹터 락토아세티쿠스(Caldicellulosiruptor lactoaceticus), 이들의 변이체(variant), 및/또는 이들의 프로제니(progeny)를 포함한다.
특정 구체예에서, 본 발명은 페르비도박테리움 곤드와넨세( Fervidobacterium gondwanense), 클로스트리디움 써모락티쿰(Clostridium thermolacticum), 무렐라 종(Moorella sp.), 및 로도써무스 마리누스(Rhodothermus marinus)로 구성된 군으로부터 선택된 호열성 세균에 관한 것이다.
특정 구체예에서, 본 발명은 써모안에어로박테리움 또는 써모안에어로박터 속의 호열성 세균에 관한 것이며, 이러한 세균은 비제한적으로 써모안에어로박테리움 써모술푸리게네스(Thermoanaerobacterium thermosulfurigenes), 써모안에어로박테리움 아오테아로엔세(Thermoanaerobacterium aotearoense), 써모안에어로박테리움 폴리사카롤리티쿰(Thermoanaerobacterium polysaccharolyticum), 써모안에어로박테리움 제애(Thermoanaerobacterium zeae), 써모안에어로박테리움 자일라노리티쿰(Thermoanaerobacterium xylanolyticum), 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum), 써모안에어로비움 브록키(Thermoanaerobium brockii), 써모안에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum), 써모안에어로박터 써모히드로술푸리쿠스(Thermoanaerobacter thermohydrosulfuricus), 써모안에어로박터 에타놀리쿠스(Thermoanaerobacter ethanolicus), 써모안에어로박터 브록키(Thermo anaerobacter brocki), 이들의 변이체, 및 이들의 프로제니로 구성된 군으로부터 선택된 종을 포함한다.
특정 구체예에서, 본 발명은 게오바실루스, 사카로코쿠스, 패니바실루스, 바실루스, 및 안옥시바실루스 속의 미생물에 관한 것이며, 이러한 미생물은 비제한적으로 게오바실루스 써모글루코시다시우스(Geobacillus thermoglucosidasius), 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus), 사카로코쿠스 칼독실로실리티쿠스(Saccharococcus caldoxylosilyticus), 사카로쿠스 써모필루스(Saccharoccus thermophilus), 패니바실루스 캄피나센시스(Paenibacillus campinasensis), 바실루스 플라보써무스(Bacillus flavothermus), 안옥시바실루스 캄차트켄시스(Anoxybacillus kamchatkensis), 안옥시바실루스 고넨시스(Anoxybacillus gonensis), 이들의 변이체, 및 이들의 프로제니로 구성된 군으로부터 선택된 종을 포함한다.
특정 구체예에서, 본 발명은 사카로파구스 데그라단스(Saccharophagus degradans); 플라보박테리움 존소니애(Flavobacterium johnsoniae); 피브로박터 숙시노게네스(Fibrobacter succinogenes); 클로스트리디움 훈가테이(Clostridium hungatei); 클로스트리디움 피토페르멘탄스(Clostridium phytofermentans); 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum); 클로스트리디움 알드리치(Clostridium aldrichii); 클로스트리디움 테르미티디디스(Clostridium termitididis); 아세티비브리오 셀룰로리티쿠스(Acetivibrio cellulolyticus); 아세티비브리오 에타놀기그넨스(Acetivibrio ethanolgignens); 아세티비브리오 멀티보란스(Acetivibrio multivorans); 박테리로이즈 셀룰로솔벤스(Bacteroides cellulosolvens); 및 알칼리박터 사카로포멘탄스(Alkalibacter saccharofomentans), 이들의 변이체 및 이들의 프로제니로 구성된 군으로부터 선택된 중온성 세균에 관한 것이다.
본 발명의 방법
해당과정 동안, 세포는 글루코오스와 같은 단순 당을 피루브산으로 전환시키며 ATP와 NADH를 궁극적으로 생산한다. 산화적 인산화를 위한 기능적 전자 수송 시스템이 없는 경우, 지속적 해당과정 및 ATP 생산을 위한 필수 요건인 NAD+를 재생하는 짧은 경로에서 피루브산의 적어도 95%가 소비된다. 이러한 NAD+ 재생 시스템의 폐생산물(waste product)은 일반적으로 발효 생산물로 지칭된다.
미생물은 다양한 일련의 발효 생산물을 생산하며, 그러한 발효 생산물은 유기산, 예를 들어 락테이트 (락트산의 염 형태), 아세테이트 (아세트산의 염 형태), 숙시네이트, 및 부티레이트, 및 중성 생산물(neutral product), 예를 들어 에탄올, 부탄올, 아세톤, 및 부탄디올을 포함한다. 최종 발효 생산물은 다음과 같은 것들을 포함하는 수 가지 기본적인 특징을 다양한 정도로 공유한다: 그러한 생산물은 이들이 최초로 생산되는 조건하에서 비교적 비독성이지만 축적시에 보다 독성으로 되고; 그리고 그러한 생산물은 피루베이트 보다 더 감소하는데, 이는 해당과정 동안 이들의 직접적 전구체가 최종 전자 수용체로서 작용했기 때문이다. 본 발명의 일면들은 리그노셀룰로오스 바이오매스 기질로부터 에탄올을 생산하는 데에 유용한 신규한 미생물을 제공하기 위해 유전자 녹아웃 기술을 사용하는 것에 관한 것이다. 형질전환된 생물체는 본원에 기재된 유기산으로의 비제한 경로(non-limiting pathway)와 같은 경합 경로를 엔코딩하는 하나 이상의 유전자를 결실 또는 비활성화시킴으로써 제조되거나, 상기와 같이 결실 또는 비활성화시키는 것에 이어 임의로 발효 생산물로서 에탄올을 생산하는 데에 있어서 개선된 성능을 지닌 돌연변이체를 증식을 기초로 선별함으로써 제조된다.
특정 구체예에서, 고유한 상태에서 발효 생산물로서 락트산을 생산하는 능력을 부여하는 하나 이상의 유전자를 함유하는 호열성 또는 중온성 미생물은 상기 하나 이상의 유전자의 발현을 감소시키거나 제거하도록 형질전환된다. 발효 생산물로서 락트산을 생산하는 능력을 상기 미생물에게 부여하는 유전자는 락테이트 데히드로게나아제의 발현을 코딩할 수 있다. LDH의 발현을 엔코딩하는 유전자(들) 또는 특정 폴리누클레오티드 서열(들)이 결실되거나 억제되면 피루베이트가 락트산으로 전환되게 하는 전체 해당과정 경로에서의 반응 구성(reaction scheme)을 축소시키거나 제거하며, 해당과정의 이러한 초기 단계들로부터의 피루베이트의 결과적인 상대 존재비(relative abundance)는 에탄올의 생산 증가를 가능하게 할 수 있다.
특정 구체예에서, 고유한 상태에서 발효 생산물로서 아세트산을 생산하는 능력을 부여하는 하나 이상의 유전자를 함유하는 호열성 또는 중온성 미생물은 상기 하나 이상의 유전자의 발현을 제거하도록 형질전환된다. 발효 생산물로서 아세트산을 생산하는 능력을 상기 미생물에게 부여하는 유전자는 아세테이트 키나아제 및/또는 포스포트랜스아세틸라아제의 발현을 코딩할 수 있다. ACK 및/또는 PTA의 발현을 엔코딩하는 유전자(들) 또는 특정 폴리누클레오티드 서열(들)이 결실되거나 억제되면 아세틸 CoA가 아세트산으로 전환되게 하는 전체 해당과정 경로에서의 반응 구성을 축소시키거나 제거하며 (도 1), 해당과정의 이러한 나중 단계들로부터의 아세틸 CoA의 결과적인 상대 존재비는 에탄올의 생산 증가를 가능하게 할 수 있다.
특정 구체예에서, 상기 상세히 설명된 유전자 녹아웃 계획들은 개별적으로 또는 동시에 적용될 수 있다. 락테이트의 생산을 위한 메커니즘이 제거되면 (즉, LDH의 발현을 엔코딩하는 유전자 또는 특정 폴리누클레오티드 서열이 녹아웃되면) 더 많은 아세틸 CoA를 생성시키며, 이에 따라 아세테이트의 생산을 위한 메커니즘이 또한 제거되는 경우 (즉, ACK 및/또는 PTA의 발현을 엔코딩하는 유전자 또는 특정 폴리누클레오티드 서열이 녹아웃되는 경우), 아세틸 CoA의 존재비가 추가로 향상될 것이고, 이는 에탄올의 생산 증가를 초래할 수 있다.
특정 구체예에서, 호열성 또는 중온성 미생물은 고유의 또는 내생성 PDC 및/또는 ADH를 지닐 필요가 없다. 특정 구체예에서, PDC 및/또는 ADH를 엔코딩하는 유전자는 본 발명의 유전자 변형된 미생물에서 재조합적으로 발현될 수 있다. 특정 구체예에서, 본 발명의 유전자 녹아웃 기술은 재조합 미생물에 적용될 수 있는데, 이러한 재조합 미생물은 PDC 및/또는 ADH를 코딩하는 이종성 유전자를 포함할 수 있으며, 여기서 상기 이종성 유전자는 발효 생산물로서 에탄올을 생산하는 상기 재조합 미생물 (호열성일 수 있음)의 능력을 증가시키거나 발효 생산물로서 에탄올을 생산하는 능력을 상기 재조합 미생물 (호열성일 수 있음)에게 부여하기에 충분한 수준으로 발현된다.
특정 구체예에서, 본 발명의 일면들은 셀룰로오스 함량 또는 헤미셀룰로오스 함량 또는 둘 모두의 함량을 기준으로 하여 이론적 수율의 70% 이상인 농도로 에탄올을 생산하도록 리그노셀룰로오스 기질을 발효시키는 것에 관한 것이다.
특정 구체예에서, 본 발명의 일면들은 셀룰로오스 함량 또는 헤미셀룰로오스 함량 또는 둘 모두의 함량을 기준으로 하여 이론적 수율의 80% 이상인 농도로 에탄올을 생산하도록 리그노셀룰로오스 기질을 발효시키는 것에 관한 것이다.
특정 구체예에서, 본 발명의 일면들은 셀룰로오스 함량 또는 헤미셀룰로오스 함량 또는 둘 모두의 함량을 기준으로 하여 이론적 수율의 90% 이상인 농도로 에탄올을 생산하도록 리그노셀룰로오스 기질을 발효시키는 것에 관한 것이다.
특정 구체예에서, 고유한 상태의 미생물로부터 유기산 생산의 실질적 또는 완전한 제거는 하나 이상의 부위-지정 DNA 상동 재조합 사건을 이용하여 달성될 수 있다.
동시 당화 공동-발효(simultaneous saccharification and co-fermentation, SSCF) 또는 CBP 공정을 호열성 온도에서 작업하는 것은 30 내지 37℃의 통상적인 중온성 발효 온도에 비해 수 가지 중요한 이점을 제공한다. 특히, 셀룰라아제 생산에 대한 전용 공정 단계을 위한 비용이 호열성 SSCF의 경우 상당히 감소되고 (예를 들어, 2배 또는 그 초과), CBP의 경우에는 제거된다. 발효기 냉각과 관련된 비용 그리고 또한 발효 전후의 열교환은 호열성 SSCF 및 CBP 둘 모두의 경우에 감소될 것으로 예상된다. 최종적으로, 호열성 생물촉매를 특징으로 하는 공정은 통상적인 중온성 생물촉매를 특징으로 하는 공정에 비해 미생물에 덜 오염될 수 있다.
탄소 흐름에 대한 변화에 의해 전자 흐름의 방향을 바꾸는 능력은 광범위한 관련성을 지닌다. 예를 들어, 이러한 방법은 써모안에어로박테리움 사카롤리티쿰 이외의 균주에서 높은 에탄올 수율을 생산하고/하거나 에탄올 이외의 용매, 예를 들어 고급 알코올 (즉, 부탄올)을 생산하기 위해 이용될 수 있다.
안티센스 올리고누클레오티드 (asRNA) 전략을 통한 대사 엔지니어링
효모 및 혐기성 세균과 같은 발효 미생물은 당을 에탄올 및 그 밖의 환원된 유기 최종 생산물로 발효시킨다. 이론적으로, 락테이트 및 아세테이트와 같은 경합 최종-생산물의 형성이 억제될 수 있는 경우 탄소 흐름이 에탄올 생산쪽으로 유도될 수 있다. 본 발명은 본 발명의 CBP 생물체에서 이러한 경합 경로를 제거하도록 설계된 수 가지 유전공학 방법을 제공한다. 이러한 방법들의 대부분은 녹-아웃 구성물 (단일 크로스오브 재조합의 경우) 또는 대립유전자-교환(allele-exchange) 구성물 (이중 크로스오버 재조합의 경우)을 이용하고, ack 및 ldh에 대한 유전자좌를 표적화한다. 이러한 도구는 "입증된(tried and true)" 균주 개발 기술을 이용하지만, 진전을 저지할 수 있는 다음과 같은 수 가지 잠재적 문제가 존재한다: (i) 상기 도구는 모든 경우에 CBP 생물체에 대해 알려져 있지 않은 숙주 재조합 효율에 의존하고; (ii) 상기 도구는 한 번에 단지 하나의 경로를 녹아웃시키도록 사용될 수 있고, 이로써 연속적인 유전자 변화는 수 개의 선별가능 마커 또는 리사이클가능(recyclable) 마커를 필요로 하고; (iii) 표적 유전자의 결실은 유해할 수 있거나 다운스트림 유전자 발현에 대해 극성 효과(polar effect)를 지닐 수 있다.
본 발명은 숙주 재조합 효율에 좌우되지 않는 유전공학을 향한 추가의 방법을 제공한다. 이러한 대안적 도구들 중 하나는 안티센스 RNA (asRNA)라 일컬어진다. 안티센스 올리고누클레오티드가 시험관내 및 생체내 둘 모두에서 유전자 발현 수준을 억제하기 위해 25년에 걸쳐 사용되어 왔지만, mRNA 구조 예측에서의 최근 진보는 asRNA 분자의 보다 세련된 설계를 촉진시켰다. 이러한 진보는 다수의 집단으로 하여금 세균의 대사 엔지니어링에서 asRNA의 유용성을 입증하게 하였다.
asRNA를 사용한 경우 녹-아웃 및 대립유전자-교환 기술에 비해 다음과 같은 수 많은 이점이 존재한다: (i) 다수의 선별가능 마커에 대한 필요성이 완화되는데, 이는 다수의 경로가 단일 asRNA 구성물에 의해 표적화될 수 있기 때문이고; (ii) 표적 mRNA의 약화 수준(attenuation level)이 asRNA 사이의 회합율(association rate)을 증가시키거나 감소시킴으로써 조정될 수 있고; (iii) asRNA 전사체가 조건적 프로모터(conditional promoter)에 의해 유도되는 경우 경로 비활성화가 조건적일 수 있다. 최근에는, 이러한 기술이 그람 양성 중온성세균인 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)에서 용매생성(solventogenesis)을 증가시키기 위해 사용되어 왔다 (Tummala et al. (2003)). asRNA가 어떻게 유전자 발현을 약화시키는 지와 관련된 정확한 분자 메커니즘은 불명확하지만, 유망한 메커니즘은 asRNA가 표적 mRNA에 하이브리드화된 경우에 촉발된다. 메커니즘은 하기 중 하나 이상을 포함할 수 있다: (i) 리보솜 결합 부위가 리보솜과 적절히 상호작용하는 것을 차단함으로써 mRNA가 단백질로 번역되는 것을 억제하고, (ii) 듀플렉스 RNA를 신속히 분해하는 RNase H와 같은 dsRNA-의존성 RNase를 통해 mRNA의 반감기를 감소시키고, (iii) mRNA의 초기 전사 종결로 인해 전사를 억제한다.
안티센스 서열의 설계
as RNA는 전형적으로 길이가 18개 내지 25개의 누클레오티드이다. asRNA 서열을 선택하기 위해 사용될 수 있는 RNA-표적화 핵산의 합리적 설계를 위해 이용가능한 수 개의 계산 도구(computation tool)가 존재한다 (Sfold, Integrated DNA Technologies, STZ Nucleic Acid Design). 예를 들어, 클로스트리디움 써모셀룸 ack (아세테이트 키나아제)에 대한 유전자 서열이 합리적 설계 서버(server)에 적용될 수 있고, 수 개의 asRNA 서열이 추려질 수 있다. 요약하면, 설계 파라미터는 예측된 2차 구조를 함유하지 않는 mRNA 표적 서열을 선별해낸다.
전달 벡터의 설계
asRNA 코딩 서열을 표적 생물체에 전달하기 위해 복제성 플라스미드가 사용될 것이다. 비제한적으로 pNW33N, pJIR418, pJIR751, 및 pCTCl와 같은 벡터는 asRNA 코딩 서열을 숙주 세포 내부로 전달하기 위한 asRNA 구성물의 백본(backbone)을 형성할 것이다. 염색체외 (플라스미드 기반) 발현 이외에, asRNA는 asRNA의 안정한 발현을 획득하기 위해 이종성 유전자좌에서 미생물의 게놈내로 안정하게 삽입될 수 있다. 특정 구체예에서, 관심을 끄는 호열성 또는 중온성 미생물의 균주는 유기산의 생산을 녹아웃시키기 위해 부위 지정 상동 재조합에 의해 엔지니어링될 수 있고, 관심을 끄는 다른 유전자는 asRNA에 의해 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절될 수 있다.
프로모터 선택
asRNA 전사체의 발현을 보장하기 위해, 주어진 숙주에 대해 적합한 프로모터가 asRNA 코딩 서열에 융합될 것이다. 프로모터-asRNA 카세트(cassette)는 단일 PCR 단계로 구성된다. 프로모터 영역을 증폭시키도록 설계된 센스 및 안티센스 프라이머는, asRNA 서열 (합리적 설계 방법으로부터 추려진 것)이 안티센스 프라이머의 5' 단부에 부착되도록 변형될 것이다. 또한, 최종 PCR 앰플리콘(amplicon)이 제한 효소에 의해 직접 분해될 수 있고 통상적인 클로닝 기술을 통해 벡터 백본내로 삽입될 수 있도록, EcoRI 또는 BamHI와 같은 제한 부위가 각각의 프라이머의 말단부에 첨가될 것이다.
본원에 기재된 바와 같은 펜토오스 당을 대사하는 능력을 지니지 않지만 헥소오스 당을 대사할 수 있는 미생물과 관련하여, 예를 들어 클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스의 ack 및 ldh 유전자가 본원에 기재된 방법에 따라 안티센스 RNA를 사용하여 비활성화를 위해 표적화될 수 있는 것으로 인식될 것이다.
본원에 기재된 바와 같은 펜토오스 및 헥소오스 당을 대사하는 능력을 부여하는 미생물과 관련하여, 예를 들어 클로스트리디움 셀룰로리티쿰, 클로스트리디움 피토페르멘탄스 및 칼디셀룰로시룹터 크리스티안소니의 ack 및 ldh 유전자가 본원에 기재된 방법에 따라 안티센스를 사용하여 비활성화를 위해 표적화될 수 있는 것으로 인식될 것이다.
asRNA 전달 벡터를 발현하는 균주에 대한 항생제 선별 이외에, 그러한 균주는 소듐 플루오로아세테이트(SFA), 브로모아세트산(BAA), 클로로아세트산(CAA), 5-플루오로오로트산(5-FOA) 및 클로로락트산과 같은 수 가지 독성 대사물 중 어느 것을 함유하는 조건적 배지(conditional media)에서 선별될 수 있다. 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절된 하나 또는 그 초과의 유전자를 지닌 균주를 생성시키기 위해, 에탄 메틸 설포네이트(EMS)를 포함하지만 이것에 국한되지 않는 화학적 돌연변이원을 사용하는 것이 안티센스 올리고누클레오티드(asRNA)를 발현시키는 것과 병용하여 이용될 수 있다.
예증
본 발명은 지금까지 일반적으로 설명되었고, 하기 실시예들을 참조로 하여 보다 용이하게 이해될 것인데, 이러한 실시예들은 단지 본 발명의 특정 일면 및 구체예를 예시하기 위해 포함되며 본 발명을 제한하고자 하는 것이 아니다.
실시예 1
중온성 및 호열성인 셀룰로오스분해성, 자일란분해성 생물체를 위한 맞춤형 트랜스포손(custom transposon)의 생성
본 발명은 셀룰로오스분해성 및/또는 자일란분해성 및/또는 호열성 생물체를 위한 맞춤형 트랜스포손을 생성시키는 방법을 제공한다. 이렇게 하기 위해, 숙주 생물체로부터의 고유 프로모터가 이러한 생물체에서 작용하는 것으로 결정된 선별가능 마커에 융합된다. 이러한 단편은 벡터 pMOD™-2<MCS> (Epicenter®Biotechnologies)상에 함유된 EZ-Tn5™ 트랜스포손내로 클로닝된다. 예를 들어, 클로스트리디움 써모셀룸의 gapDH 프로모터가 mLs 약물 마커 뿐만 아니라 cat 유전자에 융합된 후, 벡터 pMOD™-2<MCS>내로 서브클로닝된다.
시판용 트랜스포손은 셀룰로오스분해성 및/또는 자일란분해성 및/또는 호열성 생물체의 고유 프로모터 및 열안정성 약물 마커를 결여하고 있다. mLs 및 cat 마커는 호열성 세균에서 기능하여 왔고, gapDH 프로모터는 핵심 해당과정 효소를 조절하며 항시적으로 발현될 수 있다. 상기 약물 마커와 gapDH 프로모터가 병용되면 기능적 트랜스포손을 생성시킬 가능성을 크게 향상시킨다. 이러한 방법은 다른 셀룰로오스분해 및/또는 자일란분해성 및/또는 호열성 생물체에 대해 적용될 수 있다.
실험 설계
도 26은 본원에 참조로 포함된 에피센터®바이오테크놀로지스(Epicenter®Biotechnologies) 사용자 매뉴얼로부터 수득된 도면으로서, pMOD™-2<MCS>의 bp 250-550을 나타낸다. 상부 부분에서, ME로 표지된 검은색 화살촉은 트랜스포손을 규정하는 19 bp 모자이크 단부를 나타낸다. EcoRl 및 HindIII 부위는 다중-클로닝 부위를 규정하며, 이는 MCS로 표지된 검은색 박스에 의해 표시된다. 하부 부분에는, MCS와 관련된 제한 효소 및 DNA 서열이 도시되어 있다.
pMQ87-gapDH-cat 및 pMQ87-gapDH-mls로부터의 프로모터 융합 단편을 증폭시키기 위해 하기 프라이머가 사용된다: GGCGgaattc CTT GGT CTG ACA ATC GAT GC (SEQ ID NO: 19); GGCGgaattc TATCAGTTATTACCCACTTTTCG (SEQ ID NO:20). 소문자는 엔지니어링된 EcoBI 제한 부위를 나타낸다. 생성된 앰플리콘의 크기는 ~1.9 kb이다. 표준 분자적 방법은 앰플리콘이 EcoRI로 분해되어 pMOD™-2<MCS>의 독특한 EcoRI 부위내로 클로닝될 수 있게 한다. 제조업자에 의해 설명된 바와 같이 트랜스포손 그리고 후속하여 트랜스포소솜(transpososome)이 생성되어 숙주 생물체내로 도입된다.
실시예 2
셀룰로오스분해성 및 자일란분해성 균주를 엔지니어링하기 위한 구성물
본 발명은 탄소 흐름을 에탄올쪽이 아닌 다른 방향으로 전환시키는 대사 경로의 핵심 효소를 엔코딩하는 유전자를 돌연변이시킴으로써 CBP를 위해 관심있는 생물체를 유전공학처리하기 위한 조성물 및 방법을 제공한다. 외래 DNA의 거대한 단편을 관심있는 유전자내로 삽입시켜서 이러한 유전자를 부분적으로, 실질적으로 또는 완전히 결실시키거나 침묵시키거나 비활성화시키거나 하향조절하도록, 단일 크로스오버 녹아웃 구성물이 설계된다. 염색체로부터 관심있는 유전자를 부분적으로, 실질적으로 또는 완전히 결실시키거나 침묵시키거나 비활성화시키거나 하향조절하도록, 또는 염색체상의 관심있는 유전자를 항생제 내성 카세트에 의해 간섭된 유전자의 형태와 같은 그러한 유전자의 돌연변이된 카피로 치환하도록, 이중 크로스오버 녹아웃 구성물이 설계된다.
단일 크로스오버 녹아웃 벡터의 설계는 관심있는 유전자의 내부 단편을 플라스미드 기반 시스템내로 클로닝하는 것을 필요로 한다. 이상적으로는, 이러한 벡터는 숙주 균주에서 발현되지만 숙주 균주에서 복제되지 않는 선별가능 마커를 함유한다. 따라서, 숙주 균주내로 도입시에, 플라스미드는 복제되지 않는다. 세포가 플라스미드상에 함유된 마커를 선별해내는 조건적 배지내에 위치하는 경우, 플라스미드를 유지시키는 방법을 찾아낸 세포만이 증식한다. 플라스미드가 자율적 DNA 엘리먼트로서 복제할 수 없기 때문에, 플라스미드가 유지되는 가장 유망한 방법은 재조합을 통해 숙주 염색체상으로 통합되는 것이다. 재조합이 일어나는 가장 유망한 위치는 플라스미드와 숙주 염색체 사이의 상동성 영역에 존재한다.
또한, 복제성 플라스미드는 단일 크로스오버 간섭을 생성시키기 위해 사용될 수 있다. 녹아웃 벡터를 흡수한 세포는 조건적 배지에서 선별될 수 있고, 그 후 선별없이 계대될 수 있다. 조건적 배지에 의해 제공되는 양성 선별이 없다면, 많은 생물체는 플라스미드를 상실한다. 플라스미드가 숙주 염색체상으로 삽입되는 경우, 그러한 플라스미드는 선별없이는 상실되지 않는다. 그 후, 세포는 조건적 배지로 복귀될 수 있고, 염색체 통합을 통해 마커를 보유하는 세포만이 증식한다. 염색체상에 위치한 마커를 함유하는 생물체를 스크리닝하도록 PCR 기반 방법이 고안된다.
이중 크로스오버 녹아웃 벡터의 설계는 관심있는 유전자를 플랭킹하는 DNA (~ 1 kb)를 플라스미드내로 클로닝하는 것을 적어도 필요로 하고, 일부 경우에는 관심있는 유전자를 클로닝하는 것을 포함할 수 있다. 선별가능 마커는 플랭킹 DNA 사이에 위치할 수 있거나, 관심있는 유전자가 클로닝되는 경우 마커는 그러한 유전자와 관련하여 내부에 위치한다. 이상적으로는 사용되는 플라스미드는 숙주 균주에서 복제될 수 없다. 플라스미드가 숙주내로 도입되고 마커에 대해 조건적인 배지에서 선별시에, 상동 DNA가 염색체상으로 재조합된 세포만이 증식한다. 관심있는 유전자를 선별가능 마커로 치환하기 위해 2회의 재조합 사건이 필요하다.
또한, 이중 크로스오버 유전자 치환을 생성시키기 위해 복제성 플라스미드가 사용될 수 있다. 녹아웃 벡터를 흡수한 세포는 조건적 배지에서 선별될 수 있고, 그 후 선별없이 계대될 수 있다. 조건적 배지에 의해 제공되는 양성 선별이 없다면, 많은 생물체는 플라스미드를 상실한다. 약물 마커가 숙주 염색체상으로 삽입되는 경우, 그러한 약물 마커는 선별없이는 상실되지 않는다. 그 후, 세포는 조건적 배지로 복귀될 수 있고, 염색체 통합을 통해 마커를 보유하는 세포만이 증식한다. 염색체상에 위치한 마커를 함유하는 생물체를 스크리닝하도록 PCR 기반 방법이 고안될 수 있다.
항생제 선별 계획 이외에, 소듐 플루오로아세테이트(SFA), 브로모아세트산(BAA), 클로로아세트산(CAA), 5-플루오로오로트산(5-FOA) 및 클로로락트산과 같은 수 가지 독성 대사물 유사체가 상동 재조합 또는 트랜스포손-기반 전략으로부터 발생하는 돌연변이체를 선별하기 위해 사용될 수 있다. 에탄 메틸 설포네이트(EMS)를 포함하지만 이것에 국한되지 않는 화학적 돌연변이원을 사용하는 것이 상동 재조합 또는 트랜스포손-기반 전략을 이용하는 지정 돌연변이유발 계획과 병용하여 이용될 수 있다.
C. 셀룰로리티쿰 녹아웃 구성물
아세테이트 키나아제 (클로스트리디움 셀룰로리티쿰 공개 게놈으로부터의 유전자 131)
단일 크로스오버
클로스트리디움 셀룰로리티쿰의 아세테이트 키나아제 유전자는 길이가 1,110 bp이다. 누클레오티드 91-752에 걸쳐있는 662 bp 내부 단편 (SEQ ID NO:21)을 PCT에 의해 증폭시키고, 다양한 선별가능 마커를 지니는 복제성 벡터 및 자살 벡터(suicide vector)내로 클로닝하였다. 선별가능 마커는 에리트로마이신 및 클로람페니콜 내성을 제공하는 것들을 포함할 수 있다. 이러한 플라스미드는 ack 유전자를 붕괴시키기 위해 사용된다. ack 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역은 도 19에 도시되어 있다. 하기 제시된 SEQ ID NO:21의 밑줄그어진 부분은 녹아웃 단편을 플랭킹하는 EcoBI 부위인 부위에 상응한다.
이러한 부위는 "ack KO 프라이머"의 설계 동안 엔지니어링되었고, 다수의 벡터내로의 단편의 후속 클로닝을 가능하게 한다.
이중 크로스오버
클로스트리디움 셀룰로리티쿰의 ack 유전자에 대한 이중 크로스오버 벡터를 구성하기 위해, ack 유전자의 각 측면을 플랭킹하는 ~1 kb의 DNA가 클로닝된다. 선별가능 마커는 플랭킹 DNA 사이에 삽입된다. 선별가능 마커는 에리트로마이신 및 클로람페니콜 내성을 제공하는 것들을 포함할 수 있다. ack 유전자의 3' 플랭킹 영역은 이용가능한 드래프트 게놈(draft genome)에서 이용가능하지 않다. 이러한 DNA를 획득하기 위해, 클론테크(Clontech)로부터의 게놈 워커(Genome Walker)와 같은 키트가 사용된다.
락테이트 데히드로게나아제 (클로스트리디움 셀룰로리티쿰 공개 게놈의 유전자 2262 및 2744):
단일 크로스오버
클로스트리디움 셀룰로리티쿰의 ldh 유전자는 길이가 951 bp (유전자 2262의 경우) (SEQ ID NO:22) 및 932 bp (유전자 2744의 경우) (SEQ ID NO:23)이다. 각각의 유전자의 5' 단부 근처의 ~500 bp 내부 단편이 PCR에 의해 증폭되고, 다양한 선별가능 마커를 지니는 복제성 벡터 및 자살 벡터내로 클로닝된다. 선별가능 마커는 에리트로마이신 및 클로람페니콜과 같은 약물 내성을 제공하는 것들을 포함할 수 있다. 이러한 플라스미드는 ldh 2262 및 ldh 2744 유전자를 붕괴시키기 위해 사용된다. 예로서, ldh 2262 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역은 도 20에 도시되어 있다.
이중 크로스오버
클로스트리디움 셀룰로리티쿰의 ldh 유전자(들)에 대한 이중 크로스오버 벡터를 구성하기 위해, ldh 유전자(들)의 각 측면을 플랭킹하는 ~1 kb의 DNA가 클로닝된다. 선별가능 마커는 플랭킹 DNA 사이에 삽입된다. 선별가능 마커는 에리트로마이신 및 클로람페니콜과 같은 약물 내성을 제공하는 것들을 포함할 수 있다. 도 21은 클로스트리디움 셀룰로리티쿰 ldh (2262) 이중 크로스오버 녹아웃 단편의 예를 제공한다.
하기 제시된 서열 (SEQ ID NO:24)에서, mLs 유전자 (선별가능 마커)가 밑줄그어져 있고, 플랭킹 DNA는 나머지 서열이다. 프라이머 설계 동안, 상기 단편이 다수의 복제성 및 비복제성 벡터내로 클로닝될 수 있도록 제한 부위들이 엔지니어링되고 그러한 단편의 5' 및 3' 단부가 엔지니어링된다. 동일한 전략이 ldh 2744를 결실시키기 위한 벡터를 생성시키기 위해 사용된다.
C. 클로스트리디움 피토페르멘탄스 녹아웃 구성물
아세테이트 키나아제 (클로스트리디움 피토페르멘탄스 공개 게놈으로부터의 유전자 327)의 경우:
단일 크로스오버
클로스트리디움 피토페르멘탄스의 아세테이트 키나아제 유전자는 길이가 1,244 bp이다. 누클레오티드 55-626에 걸쳐있는 572 bp 내부 단편이 PCR에 의해 증폭되고, 다양한 선별가능 마커를 지니는 복제성 벡터 및 자살 벡터내로 클로닝된다. 선별가능 마커는 클로스트리디움 피토페르멘탄스에 약물 내성을 제공하는 것들을 포함한다. 이러한 플라스미드는 ack 유전자를 붕괴시키기 위해 사용된다. ack 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역은 도 22에 도시되어 있다. "ack KO 프라이머"의 설계 동안 제한 부위가 엔지니어링되고, 이는 단편이 다수의 벡터내로 후속 클로닝될 수 있게 한다. 상기 기재된 녹아웃 단편의 서열은 SEQ ID NO:25로서 제시된다.
이중 크로스오버
클로스트리디움 피토페르멘탄스의 ack 유전자에 대한 이중 크로스오버 녹아웃 벡터를 구성하기 위해, ack 유전자의 각 측면을 플랭킹하는 ~1 kb의 DNA가 클로닝된다. 선별가능 마커는 플랭킹 DNA 사이에 삽입된다. 사용하려는 선별가능 마커는 이러한 균주에 약물 내성을 제공하는 것들을 포함한다. 추정 선별가능 마커로서 mLs 유전자를 지니는 추정 이중 크로스오버 녹아웃 구성물의 예는 도 23에 도시되어 있다.
도 23에 도시된 단편에 상응하는 서열 (SEQ ID NO:26)이 하기 제시되어 있다. mLs 유전자 (추정 선별가능 마커)가 밑줄그어져 있고, 서열의 나머지는 플랭킹 DNA에 상응한다. 프라이머 설계 동안, 상기 단편이 다수의 복제성 및 비복제성 벡터내로 클로닝될 수 있도록 제한 부위들이 엔지니어링되고 그러한 단편의 5' 및 3' 단부가 엔지니어링된다.
락테이트 데히드로게나아제 (클로스트리디움 피토페르멘탄스 공개 게놈의 유전자 1389 및 2971)의 경우
단일 크로스오버
클로스트리디움 피토페르멘탄스의 ldh 유전자는 길이가 978 bp (유전자 1389의 경우) (SEQ ID NO:27) 및 960 bp (유전자 2971의 경우) (SEQ ID NO:28)이다. 각각의 유전자의 5' 단부 근처의 ~500 bp 내부 단편이 PCR에 의해 증폭되고, 다양한 선별가능 마커를 지니는 복제성 벡터 및 자살 벡터내로 클로닝된다. 사용하려는 선별가능 마커는 약물 내성을 제공하는 것들을 포함한다. 이러한 플라스미드는 ldh 1389 및 ldh 2971 유전자를 붕괴시키기 위해 사용된다. 예로서, ldh 1389 유전자의 맵 및 유전자 붕괴를 위해 PCR에 의해 증폭되는 영역은 도 24에 도시되어 있다.
이중 크로스오버
클로스트리디움 피토페르멘탄스의 ldh 유전자(들)에 대한 이중 크로스오버 벡터를 구성하기 위해, ldh 유전자(들)의 각 측면을 플랭킹하는 ~1 kb의 DNA가 클로닝된다. 선별가능 마커는 플랭킹 DNA 사이에 삽입된다. 선별가능 마커는 이러한 균주에 약물 내성을 제공하는 것들을 포함한다. 추정 선별가능 마커로서 mLs 유전자를 지니는 추정 이중 크로스오버 녹아웃 구성물의 예는 도 25에 도시되어 있다.
도 25에 도시된 단편에 상응하는 서열이 SEQ ID NO:29로서 하기 제시되어 있다. mLs 유전자 (선별가능 마커)가 밑줄그어져 있고, 서열의 나머지 부분은 플랭킹 DNA에 상응한다. 프라이머 설계 동안, 상기 단편이 다수의 복제성 및 비복제성 벡터내로 클로닝될 수 있도록 제한 부위들이 엔지니어링되고 그러한 단편의 5' 및 3' 단부가 엔지니어링된다. 동일한 전략이 ldh 2971을 결실시키기 위한 벡터를 생성시키기 위해 사용된다.
칼디셀룰로시룹터 크리스티안소니 및 클로스트리디움 스테르코라리움 아종 렙토사파르툼
본 발명자들이 알고 있는 바로는, 상기 생물체들의 게놈 시퀀싱은 이루어진 바 없으며, 게놈 시퀀싱이 이루어졌다고 하더라도 공중에게 이용가능하지 않았다. 본 발명자들의 실험 결과에 기초해 볼 때, 이러한 생물체들은 셀룰로오스분해성이고 자일란분해성이다. 이러한 생물체들을 유전공학처리하고 탄소 흐름을 에탄올쪽으로 전환시키기 위해 핵심 대사 효소를 엔코딩하는 유전자의 DNA 서열이 이러한 생물체들로부터 필요하다. 이러한 생물체들은 아세테이트 키나아제 및 락테이트 데히드로게나아제와 같은 효소를 포함한다. 이러한 유전자들의 서열을 수득하기 위해, 이러한 생물체들의 게놈이 시퀀싱된다.
게놈 서열이 이용가능해진 경우, 엔코딩 유전자와 플랭킹 DNA를 찾아내기 위해 상기 효소들의 보존된 특성이 사용될 수 있다. 이러한 서열들은 단일 및 이중 크로스오버 전략 둘 모두를 이용하는 표적화된 돌연변이유발을 위한 구성물을 설계하기 위해 사용된다. 이러한 전략들은 상기 기재된 것들과 동일하다. 또한, 본 발명자들은 이러한 생물체들에서 어떤 항생제가 선별가능 마커로서 사용될 수 있고 어떤 형질전환용 프로토콜이 가장 잘 기능하는 지를 결정할 것이다.
실시예 3
클로스트리디움 셀룰로리티쿰의 형질전환
세포를 4g/l의 셀로비오스를 지닌 50 mL의 GS 배지중에서 혐기성 조건에서 0.8의 OD로 증식시키고, 34℃에서 인큐베이션하였다. 수거한 후, 상기 세포를 50OmM 수크로오스 및 5mM MOPS를 함유하는 세척 완충액을 사용하여 동일한 부피로 3회 세척하고, pH를 7로 조정하였다. 최종 세척 후, 세포 펠릿(pellet)을 동일한 부피의 세척 완충액중에 재현탁시키고, 세포 현탁액의 lOul 분취액을 lmm 전극 간격으로 표준 일렉트로포레이션 큐벳(cuvette)에 넣었다. 1ul 플라스미드 DNA를 첨가하였다. 1:1 내지 10:1의 플라스미드 대 세포의 몰비를 보장하도록 플라스미드 DNA의 농도를 조정하였다. 7kV/cm의 장세기(field strength) (측정치)를 사용하여 샘플을 가로질러 5ms 펄스를 가하였다. 맞춤형 펄스 발생기를 사용하였다. 최초 배양에서 사용된 동일한 배지를 사용하여 샘플을 1000:1로 즉시 희석시키고, 증식이 재개될 때까지 회복시키고, OD의 증가를 통해 결정하였다 (24시간 내지 48시간). 회복된 샘플을 50:1로 희석시키고, 15ug/mL의 에리트로마이신 또는 15ug/mL의 클로람페니콜을 지닌 선별 배지에 넣고, 5일 내지 6일간 증식시켰다. 선별 배지에서 증식을 나타내는 샘플이 실제로 클로스트리디움 셀룰로리티쿰이며 플라스미드를 지니는 지를 확인하는 시험을 하였다.
실시예 4
셀룰로오스분해성 균주를 엔지니어링하기 위한 구성물
셀룰로오스는 바이오매스의 주요 성분들 중 하나이며, 이는 클로스트리디움 써모셀룸에 의한 발효에 의해 연료 에탄올을 생성시키기 위한 기질로서 잠재적으로 사용될 수 있다. 그러나, 이러한 과정에서, 부산물인 아세테이트와 락테이트를 형성하기 위해 많은 에너지와 탄소원이 사용된다. 락테이트와 아세테이트 생산을 최소화하고 에탄올 형성에 유리한 탄소 흐름 및 에너지를 만들어내기 위해 클로스트리디움 써모셀룸에서 셀룰로오스 이용의 대사 경로를 엔지니어링할 필요가 있다.
아세테이트 키나아제는 클로스트리디움 써모셀룸에서 아세테이트를 형성하기 위한 셀룰로오스 이용의 대사 경로에서 중요한 효소이며, 이는 ack 유전자에 의해 엔코딩된다. ack 유전자의 비활성화는 아세테이트 키나아제를 간섭할 수 있고, 이는 아세테이트의 감소 또는 제거를 초래한다.
락테이트 데히드로게나아제는 클로스트리디움 써모셀룸에서 락테이트를 형성하기 위한 셀룰로오스 이용의 대사 경로에서 중요한 효소이며, 이는 ldh 유전자에 의해 엔코딩된다. ldh 유전자의 비활성화는 락테이트 데히드로게나아제를 간섭할 수 있고, 이는 락테이트 생성의 감소 또는 제거를 초래한다.
플라스미드 pIKMl를 기반으로 하는 클로스트리디움 써모셀룸에서의 ack 유전자의 비활성화
ack 유전자를 녹아웃시키기 위해, 플라스미드 pIKMl의 다중 클로닝 부위(MCS)를 기초로 하여 벡터가 구성되는데, 여기서 클로람페니콜 아세틸트랜스퍼라아제를 엔코딩하는 cat 유전자가 3055 bp의 DNA 단편내로 삽입되며, 이러한 DNA 단편은 ack 및 pta 유전자 (포스포트랜스아세틸라아제를 엔코딩함)를 포함하고, ack 유전자의 476 bp 및 pta 유전자의 399 bp의 녹아웃을 초래하고, mLs 유전자의 양쪽 측면상에 각각 1025 bp 및 1048 bp의 플랭킹 영역을 형성한다 (도 7). pNW33N은, 바실루스 코귤란스 및 스태필로코쿠스 아우레우스(Staphylococcus aureus)로부터 분리된 pBCl 레플리콘(replicon)을 함유하고, 이는 클로스트리디움 써모셀룸을 포함하는 그람 양성 세균 균주에서 안정하게 복제되는 것으로 예견된다. 플라스미드 pIKM1을 기초로 하여 구성된 ack 녹아웃 벡터의 서열이 SEQ ID NO:1로서 제시된다.
복제성 플라스미드 pNW33N을 기반으로 하는 클로스트리디움 써모셀룸에서의 ack 유전자의 비활성화
ack 유전자를 녹아웃시키기 위해, 복제성 플라스미드 pNW33N의 다중 클로닝 부위(MCS)를 기초로 하여 벡터가 구성되는데, 여기서 마크롤리드(macrolide), 링코사미드(lincosamide) 및 스트렙토그라민 B(streptogramin B) (MLSB) 내성 유전자 mLs가 3345 bp의 DNA 단편내로 삽입되며, 이러한 DNA 단편은 ack 유전자, pta 유전자 (포스포트랜스아세틸라아제를 엔코딩함) 및 미지의(unknown) 업스트림 유전자를 포함하고, ack 유전자의 855 bp의 녹아웃을 초래하고, mLs 유전자의 각각의 측면상에 1195 bp 및 1301 bp의 플랭킹 영역을 형성한다 (도 8). pNW33N은, 바실루스 코귤란스 및 스태필로코쿠스 아우레우스로부터 분리된 pBCl 레플리콘을 함유하고, 이는 클로스트리디움 써모셀룸을 포함하는 그람 양성 세균 균주에서 안정하게 복제되는 것으로 예견된다. 플라스미드 pNW33N을 기초로 하여 구성된 ack 녹아웃 벡터의 서열이 SEQ ID NO:2로서 제시된다.
플라스미드 pIKMl를 기반으로 하는 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화
ldh 유전자를 녹아웃시키기 위해, 플라스미드 pIKMl의 다중 클로닝 부위(MCS)를 기초로 하여 벡터가 구성되는데, 여기서 클로람페니콜 아세틸트랜스퍼라아제를 엔코딩하는 cat 유전자가 3188 bp의 DNA 단편내로 삽입되며, 이러한 DNA 단편은 ldh 및 mdh 유전자 (말레이트 데히드로게나아제를 엔코딩함)를 포함하고, ldh 유전자의 1171 bp의 DNA 단편의 녹아웃을 초래하고, ldh 및 mdh 유전자의 일부를 포함하고, mLs 유전자의 양쪽 측면상에 각각 894 bp 및 1123 bp의 플랭킹 영역을 형성한다 (도 9). 플라스미드 pIKM1을 기초로 하여 구성된 ldh 녹아웃 벡터의 서열이 SEQ ID NO:3으로서 제시된다.
플라스미드 pNW33N을 기반으로 하는 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화
ldh 유전자를 녹아웃시키기 위해, 복제성 플라스미드 pNW33N의 다중 클로닝 부위(MCS)를 기초로 하여 벡터가 구성되는데, 여기서 마크롤리드, 링코사미드 및 스트렙토그라민 B (MLSB) 내성 유전자 mLs가 2523 bp의 DNA 단편내로 삽입되며, 이러한 DNA 단편은 ldh 유전자 및 mdh 유전자 (말레이트 데히드로게나아제를 엔코딩함)를 포함하고, ldh 유전자의 489 bp의 단편의 녹아웃을 초래하고, mLs 유전자의 각각의 측면상에 1034 bp 및 1000 bp의 플랭킹 영역을 형성한다 (도 10). pNW33N은, 바실루스 코귤란스 및 스태필로코쿠스 아우레우스로부터 분리된 pBCl 레플리콘을 함유하고, 이는 클로스트리디움 써모셀룸을 포함하는 다른 그람 양성 세균 균주에서 안정하게 복제되는 것으로 예견된다. 플라스미드 pNW33N을 기초로 하여 구성된 ldh 녹아웃 벡터의 서열이 SEQ ID NO:4로서 제시된다.
플라스미드 pUC19를 기반으로 하는 클로스트리디움 써모셀룸에서의 ldh 유전자의 비활성화
ldh 유전자를 녹아웃시키기 위해, pUC19 플라스미드의 다중 클로닝 부위(MCS)를 기초로 하여 벡터가 구성되는데, 여기서 클로람페니콜 아세틸트랜스퍼라아제를 엔코딩하는 cat 유전자가 717 bp의 ldh 유전자 단편내로 삽입되며, 이러한 DNA 단편은 cat 유전자의 각각의 측면상에 245 bp 및 255 bp의 플랭킹 영역을 초래한다 (도 11). pUC19는 pMB1 원점(origin)을 함유하는 대장균 플라스미드 벡터이며, 이는 클로스트리디움 써모셀룸을 포함하는 그람 양성 세균 균주에서 증폭될 수 없다. mLs 유전자가 ldh 유전자 단편에 의해 플랭킹되어 있는 유사한 벡터가 구성될 수 있다. 플라스미드 pUC19를 기초로 하여 구성된 ldh 녹아웃 벡터의 서열이 SEQ ID NO:5로서 제시된다.
클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스에서의 자일로오스 이소머라아제 및 자일룰로오스 키나아제의 발현 (예언적 실시예(prophetic example))
클로스트리디움 써모셀룸에서 자일로오스 이소머라아제 및 자일룰로오스 키나아제를 발현하기 위해, 자일로오스 이소머라아제 및 자일룰로오스 키나아제 유전자를 써모안에어로박테리움 사카롤리티쿰으로부터 클로닝하고, 클로스트리디움 써모셀룸 gapDH 프로모터의 조절을 받게 하였다. 이러한 카세트를 pNW33N 백본을 기초로 하는 클로스트리디움 써모셀룸 복제성 플라스미드에 함유시켜서, pMU340 (도 35) SEQ ID NO:74를 생성시킨다. 클로스트리디움 써모셀룸내로 전달되는 경우, 생성된 형질전환이 자일로오스에서 증식하는 능력에 대해 검정될 수 있다. 유사한 구성물이 칼디셀룰로시룹터 크리스티안소니 자일로오스 이소머라아제 및 자일룰로오스 키나아제 유전자를 사용하여 생성될 수 있다. 이들 구성물은 클로스트리디움 스트라미니솔벤스에서의 기능성에 대해 또한 시험될 수 있다.
클로스트리디움 써모셀룸 및 클로스트리디움 스트라미니솔벤스에서의 피루베이트 데카르복실라아제 및 알코올 데히드로게나아제의 발현 (예언적 실시예)
클로스트리디움 써모셀룸에서 피루베이트 데카르복실라아제 및 알코올 데히드로게나아제를 발현하기 위해, 피루베이트 데카르복실라아제 유전자를 공급원인 자이모모나스 모빌리스 및 자이모박터 팔매로부터 클로닝하고, 알코올 데히드로게나아제 유전자를 공급원인 자이모모나스 모빌리스로부터 클로닝한다. 이러한 유전자들 (pdc 및 adh)은 클로스트리디움 써모셀룸 pta-ack 프로모터로부터 오페론(operon)으로서 발현된다. 이러한 카세트를 SEQ ID NOS:75 및 76인 pNW33N 백본을 기초로 하는 클로스트리디움 써모셀룸 복제성 플라스미드 (도 36 및 37)에 함유시킨다. 클로스트리디움 써모셀룸내로 전달되는 경우, 생성된 형질전환은 발현된 효소의 기능성을 측정하기 위해 향상된 에탄올 생산 및/또는 알데히드 생산에 대해 스크리닝될 수 있다. 이들 구성물은 클로스트리디움 스트라미니솔벤스에서의 기능성에 대해 또한 시험된다.
실시예 5
클로스트리디움 스트라미니솔벤스를 사용하는 아비셀®의 발효
클로스트리디움 스트라미니솔벤스를 사용하여 CTFUD 매질을 함유하는 혈청 병에서 1% 아비셀®을 발효시켰다. 생산물 농도 프로파일 및 비는 도 27에 도시되어 있다. 약 2 g/L의 전체 생산물이 3일내에 생성되었는데, 에탄올은 전체 생산물의 약 50%를 구성한다. 도 27은 클로스트리디움 스트라미니솔벤스를 사용하는 경우 1% 아비셀®에 대한 생산물 농도 프로파일을 도시한다. 에탄올 대 아세테이트 비는 E/A로서 표시되고, 에탄올 대 전체 생산물의 비는 E/T로서 표시되어 있다.
실시예 6
중온성 및 호열성 셀룰로오스분해성, 자일란분해성 생물체에 대한 엔지니어링된 그룹(Group) II 인트론
많은 세균 게놈에서 발견되는 이동성(mobile) 그룹 II 인트론은 촉매성 RNA이면서 레트로트랜스포서블(retrotransposable) 엘리먼트이다. 이러한 인트론은 레트로트랜스포지션(retrotransposition)으로서 알려진 이동 메커니즘(mobility mechanism)을 이용하는데, 상기 레트로트랜스포지션에서 절제된 인트론 RNA는 DNA 표적 부위내로 직접 역스플라이싱(reverse splice)된 후 인트론-엔코딩된 단백질에 의해 역전사된다. 이동성 락토코쿠스 락티스(Lactococcus lactis) L1.LtrB 그룹 II 인트론이 타게트론™(Targetron™) 벡터로서 공지된 유전학 도구로 개발되었고, 이러한 벡터는 시그마 알드리치(Sigma Aldritch)에 의해 시판되고 있다 (Catalog # TAOlOO). 이러한 제품 및 이의 용도가 인젝스, 엘엘씨.(InGex, LLC.)에 의해 관리되는 미국 특허 번호 5,698,421, 5,804,418, 5,869,634, 6,027,895, 6,001,608, 및 6,306,596 및/또는 다른 계류중인 미국 및 외국 특허 출원의 주제이다.
레트로-트랜스포지션을 위해 필요한 모든 서열을 함유하는 타게트론 카세트 (도 28 및 29)는 중온성 또는 호열성 셀룰로오스분해성 생물체에서 복제될 수 있는 벡터내로 서브클로닝될 수 잇다. 타게트론 카세트는 lac 프로모터를 임의의 숙주-특이적 또는 종-특이적 항시성 또는 유도성 프로모터로 치환함으로써 변형될 수 있다. 그룹 II 인트론이 관심있는 유전자내로 삽입되도록 리타겟팅되어 유전자 녹아웃을 생성시키게 되도록, 고유 인식 서열의 부위-지정 돌연변이유발을 통해 상기 카세트가 추가로 변형될 수 있다. 예를 들어, 그룹 II 인트론은 임의의 중온성 또는 호열성 셀룰로오스분해성 생물체에서 락테이트 데히드로게나아제 또는 아세테이트 키나아제를 녹아웃시키도록 재설계될 수 있다. 표 4는 인트론을 클로스트리디움 셀룰로리티쿰 아세테이트 키나아제 (SEQ ID NO:21)로 리타겟팅하기 위한 프라이머 및 삽입 위치의 예를 도시한다. 표 5는 인트론을 클로스트리디움 셀룰로리티쿰 락테이트 데히드로게나아제 (SEQ ID NO:21)로 리타겟팅하기 위한 프라이머 및 삽입 위치의 예를 도시한다.
클로스트리디움 셀룰로리티쿰 ack 유전자 (SEQ ID NO:21)에 삽입되도록 Ll.Ltrb 인트론을 리타겟팅하기 위한 벡터의 예는 도 28에 도시되어 있다. pMU367 (클로스트리디움 셀룰로리티쿰 아세테이트 키나아제 KO 벡터)의 벡터 서열은 SEQ ID NO:30이다.
클로스트리디움 셀룰로리티쿰 LDH2744 유전자 (SEQ ID NO:23)에 삽입되도록 Ll.Ltrb 인트론을 리타겟팅하기 위한 벡터의 예는 도 29에 도시되어 있다. pMU367 (클로스트리디움 셀룰로리티쿰 락테이트 데히드로게나아제 KO 벡터)의 벡터 서열은 SEQ ID NO:31로서 제시된다.
표 4
표 5
실시예 7
써모안에어로박터 및 써모안에어로박테리움 균주의 형질전환 (
예언적 실시예
)
써모안에어로박터 슈도에타놀리쿠스(Thermoanaerobacter pseudoethanolicus) 39E, 써모안에어로박테리움 사카롤리티쿰 JW/SL-YS485, 써모안에어로박테리움 사카롤리티쿰 B6A-RI, 및 써모안에어로박터 종 균주 59은 하기 프로토콜에 의해 형질전환된다. 세포를 다음과 같이 변경된 40 mL의 DSMZ M122 배지 http://www.dsmz. de/microorganisms/media_list.php) 중에서 55℃에서 광학 밀도가 0.6 내지 0.8이 될 때까지 증식시킨다: 셀롤로오스 대신 5 g/L의 셀로비오스, 1.8 g/L의 K2HPO4, 글루타티온 비함유, 및 0.5 g/L의 L-시스테인-HCl. 그 후, 세포를 수거하고, 실온에서 40 mL의 0.2 M 셀로비오스를 사용하여 2회 세척한다. 세포를 100 uL의 분취액 중의 0.2 M 셀로비오스에 재현탁시키고, 0.1 내지 1 ug의 플라스미드 DNA를 1 mm 갭-폭(gap-width) 일렉트로포레이션 큐벳 중의 샘플에 첨가한다. 1.8 kV, 25 μF, 200Ω, ~ 3-6 ms의 지수형 펄스(exponential pulse) (Bio-Rad Instruments)를 큐벳에 가하고, 세포를 새로운 M122 중에서 100 내지 200배 희석하고, 55℃에서 12 내지 16시간 동안 인큐베이션한다. 그 후, 회복된 세포를 200 μg/mL의 카나마이신과 같은 선별제를 함유하는 새로운 한천-함유 배지를 지닌 페트리-플레이트에서 25 내지 100배 희석한다. 배지가 고화된 경우, 콜로니 형성을 위해 플레이트를 55℃에서 24 내지 72시간 동안 인큐베이션한다. 콜로니는 부위-특이적 재조합의 입증을 위해 PCR에 의해 시험될 수 있다.
실시예 8
엔지니어링된 써모안에어로박터 및 써모안에어로박테리움 균주의 발효 성능
표 6은 엔지니어링된 써모안에어로박터 및 써모안에어로박테리움 균주의 발효 성능을 나타낸다. 배양물을 진탕시키지 않으며 55℃에서 M122 중에서 24시간 동안 증식시켰다. 하기 약어가 표 6에서 사용된다: 셀로비오스 (CB), 글루코오스 (G), 락트산 (LA), 아세트산 (AA), 및 에탄올 (Etoh). 수치는 리터 당 그램으로 표현된 것이다. YS485 - 써모안에어로박테리움 사카롤리티쿰 JW/SL-YS485, B6A-RI - 써모안에어로박테리움 사카롤리티쿰 B6A-RI, 39E - 써모안에어로박터 슈도에타놀리쿠스 39E.
표 6
실시예 9
셀룰로오스분해성 및 자일란분해성 균주를 엔지니어링하기 위한 구성물 - 안티센스 RNA 기술 실시예
락테이트 데히드로게나아제를 코딩하는 클로스트리디움 써모셀룸 유전자 (Cthe_1053)를 표적화하는 안티센스 RNA 카세트를 함유하는 복제성 플라스미드 (도 38)을 일렉트로포레이션 및 티암페니콜 선별에 의해 클로스트리디움 써모셀룸 1313에 전달하였다. 이러한 플라스미드에 대해 관찰된 형질전환 효율은 모벡터(parent vector)인 pMU102의 효율과 동일하였다. 상기 플라스미드의 서열은 SEQ ID NO:61로 제시된다. asRNA 카세트는 도 38에 도시되어 있고, 다음과 같이 조직되어 있다: (i) 전체 1827 bp 카세트가 도 38에 도시된 배향으로 pMU102의 다중클로닝 부위내로 클로닝되어 있고, (ii) 고유 프로모터 영역은 카세트의 최초 600 bp내에 함유되어 있고, (iii) ldh 오픈 리딩 프레임의 최초 877 bp은 안티센스 배향으로 고유 프로모터에 융합되어 있고, (iv) 약 300개의 추가 bp가 asRNA ldh 영역의 다운스트림에 포함되어 있다.
도 39에 도시된 바와 같이, 6 ug/mL의 티암페니콜의 존재하에서 (플라스미드를 유지시키기 위한 것임) M122C 배지에서 정치 배양물(standing culture)을 증식시킴으로써 변화된 최종 생산물 형성에 대해, 생성된 티암페니콜 내성 콜로니를 스크리닝하였다. 9개의 무작위 선택된 티암페니콜-내성 형질전환체의 예비 스크리닝은 4개의 배양물이 야생형에 비해 낮은 락테이트 생산 수준을 나타내었음을 보여주었다. 또한, 둘 모두의 ldh 유전자를 동시에 부분적으로, 실질적으로 또는 완전히 결실시키거나 침묵시키거나 비활성화시키거나 하향조절하기 위해, 둘 모두의 ldh 유전자에 대해 유도된 안티센스 RNA를 함유하는 구성물이 구성될 수 있다.
실시예 10
SEQ ID NO:44, 45, 및 46은 써모안에어로박테리움 사카롤리티쿰 YS485, 클로스트리디움 써모셀룸 ATCC 27405, 및 클로스트리디움 피토페르멘탄스로부터의 피루베이트-포르메이트-리아제 (aka 포르메이트 아세틸트랜스퍼라아제, EC. 2.3.1.54, pfl) 유전자이다. Pf1은 피루베이트를 아세틸-CoA 및 포르메이트로 전환시키는 것을 촉매작용한다 (도 34). pf1의 결실은 포르메이트 생산의 제거를 초래하고, 이는 일부 호열성 균주에서 아세트산 수율의 감소를 초래할 수 있으며, 그 결과 에탄올 수율이 증가할 수 있다.
도 40 내지 45에 도시된 SEQ ID NO:47 내지 52는 pf1 녹아웃 플라스미드를 도시하는데, 상기 기재된 3개의 생물체 각각에 대해 2개를 도시한다. 각각의 생물체는 pf1 효소를 부분적으로, 실질적으로 또는 완전히 결실시키거나 침묵시키거나 비활성화시키거나 하향조절하도록 설계된 단일 크로스오버 및 이중 크로스오버 플라스미드를 지닌다. 단일 크로스오버 플라스미드는 pfl 유전자의 내부 섹션(internal section)과 상동인 단일 DNA 서열 (400 bp 내지 1000 bp)을 지니도록 설계되고, 이중 크로스오버 플라스미드는 pfl 유전자의 업스트림 (5') 및 다운스트림 (3')에 있는 영역에 상동인 2개의 DNA 서열 (400 내지 1000 bp)을 지니도록 설계된다. 모든 플라스미드는 주어진 생물체에서의 선별을 위해 최상으로 이용가능한 항생제 마커를 사용하도록 설계된다. 플라스미드는 대장균에서 유지될 수 있고, 코돈 디바이시스(Codon Devices) 또는 DNA 2.0과 같은 DNA 합성 계약 회사(contract company)를 통해 구성될 수 있다.
참조에 의한 포함
본원에 인용된 모든 미국 특허 및 미국 공개 특허 출원은 본원에 참조로 포함된다.
균등물
당업자는 본원에 기재된 발명의 특정 구체예에 대한 많은 균등물을 인식하거나 단지 정례적 실험을 이용하여 그러한 균등물을 확인할 수 있을 것이다. 이러한 균등물은 하기 청구의 범위에 포함되는 것으로 의도된다.
SEQUENCE LISTING
<110> MASCOMA CORPORATION
<120> GENE KNOCKOUT MESOPHILIC AND THERMOPHILIC
ORGANISMS, AND METHODS OF USE THEREOF
<130> MCX-011.25
<140> PCT/US08/63237
<141> 2008-05-09
<150> 60/916,978
<151> 2007-05-09
<160> 92
<170> PatentIn version 3.3
<210> 1
<211> 9000
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 1
agctttggct aacacacacg ccattccaac caatagtttt ctcggcataa agccatgctc 60
tgacgcttaa atgcactaat gccttaaaaa aacattaaag tctaacacac tagacttatt 120
tacttcgtaa ttaagtcgtt aaaccgtgtg ctctacgacc aaaagtataa aacctttaag 180
aactttcttt tttcttgtaa aaaaagaaac tagataaatc tctcatatct tttattcaat 240
aatcgcatca gattgcagta taaatttaac gatcactcat catgttcata tttatcagag 300
ctcgtgctat aattatacta attttataag gaggaaaaaa taaagagggt tataatgaac 360
gagaaaaata taaaacacag tcaaaacttt attacttcaa aacataatat agataaaata 420
atgacaaata taagattaaa tgaacatgat aatatctttg aaatcggctc aggaaaaggg 480
cattttaccc ttgaattagt acagaggtgt aatttcgtaa ctgccattga aatagaccat 540
aaattatgca aaactacaga aaataaactt gttgatcacg ataatttcca agttttaaac 600
aaggatatat tgcagtttaa atttcctaaa aaccaatcct ataaaatatt tggtaatata 660
ccttataaca taagtacgga tataatacgc aaaattgttt ttgatagtat agctgatgag 720
atttatttaa tcgtggaata cgggtttgct aaaagattat taaatacaaa acgctcattg 780
gcattatttt taatggcaga agttgatatt tctatattaa gtatggttcc aagagaatat 840
tttcatccta aacctaaagt gaatagctca cttatcagat taaatagaaa aaaatcaaga 900
atatcacaca aagataaaca gaagtataat tatttcgtta tgaaatgggt taacaaagaa 960
tacaagaaaa tatttacaaa aaatcaattt aacaattcct taaaacatgc aggaattgac 1020
gatttaaaca atattagctt tgaacaattc ttatctcttt tcaatagcta taaattattt 1080
aataagtaag ttaagggatg cataaactgc atcccttaac ttgtttttcg tgtacctatt 1140
ttttgtgaat cgattatgtc ttttgcgcat tcacttcttt tctatataaa tatgagcgaa 1200
gcgaataagc gtcggaaaag cagcaaaaag tttccttttt gctgttggag catgggggtt 1260
cagggggtgc agtatctgac gtcaatgccg agcgaaagcg agccgaaggg tagcatttac 1320
gttagataac cccctgatat gctccgacgc tttatataga aaagaagatt caactaggta 1380
aaatcttaat ataggttgag atgataaggt ttataaggaa tttgtttgtt ctaatttttc 1440
actcattttg ttctaatttc ttttaacaaa tgttcttttt tttttagaac agttatgata 1500
tagttagaat agtttaaaat aaggagtgag aaaaagatga aagaaagata tggaacagtc 1560
tataaaggct ctcagaggct catagacgaa gaaagtggag aagtcataga ggtagacaag 1620
ttataccgta aacaaacgtc tggtaacttc gtaaaggcat atatagtgca attaataagt 1680
atgttagata tgattggcgg aaaaaaactt aaaatcgtta actatatcct agataatgtc 1740
cacttaagta acaatacaat gatagctaca acaagagaaa tagcaaaagc tacaggaaca 1800
agtctacaaa cagtaataac aacacttaaa atcttagaag aaggaaatat tataaaaaga 1860
aaaactggag tattaatgtt aaaccctgaa ctactaatga gaggcgacga ccaaaaacaa 1920
aaatacctct tactcgaatt tgggaacttt gagcaagagg caaatgaaat agattgacct 1980
cccaataaca ccacgtagtt attgggaggt caatctatga aatgcgatta agcttggctg 2040
caggtcgata aacccagcga accatttgag gtgataggta agattatacc gaggtatgaa 2100
aacgagaatt ggacctttac agaattactc tatgaagcgc catatttaaa aagctaccaa 2160
gacgaagagg atgaagagga tgaggaggca gattgccttg aatatattga caatactgat 2220
aagataatat atcttttata tagaagatat cgccgtatgt aaggatttca gggggcaagg 2280
cataggcagc gcgcttatca atatatctat agaatgggca aagcataaaa acttgcatgg 2340
actaatgctt gaaacccagg acaataacct tatagcttgt aaattctatc ataattgtgg 2400
tttcaaaatc ggctccgtcg atactatgtt atacgccaac tttcaaaaca actttgaaaa 2460
agctgttttc tggtatttaa ggttttagaa tgcaaggaac agtgaattgg agttcgtctt 2520
gttataatta gcttcttggg gtatctttaa atactgtaga aaagaggaag gaaataataa 2580
atggctaaaa tgagaatatc accggaattg aaaaaactga tcgaaaaata ccgctgcgta 2640
aaagatacgg aaggaatgtc tcctgctaag gtatataagc tggtgggaga aaatgaaaac 2700
ctatatttaa aaatgacgga cagccggtat aaagggacca cctatgatgt ggaacgggaa 2760
aaggacatga tgctatggct ggaaggaaag ctgcctgttc caaaggtcct gcactttgaa 2820
cggcatgatg gctggagcaa tctgctcatg agtgaggccg atggcgtcct ttgctcggaa 2880
gagtatgaag atgaacaaag ccctgaaaag attatcgagc tgtatgcgga gtgcatcagg 2940
ctctttcact ccatcgacat atcggattgt ccctatacga atagcttaga cagccgctta 3000
gccgaattgg attacttact gaataacgat ctggccgatg tggattgcga aaactgggaa 3060
gaagacactc catttaaaga tccgcgcgag ctgtatgatt ttttaaagac ggaaaagccc 3120
gaagaggaac ttgtcttttc ccacggcgac ctgggagaca gcaacatctt tgtgaaagat 3180
ggcaaagtaa gtggctttat tgatcttggg agaagcggca gggcggacaa gtggtatgac 3240
attgccttct gcgtccggtc gatcagggag gatatcgggg aagaacagta tgtcgagcta 3300
ttttttgact tactggggat caagcctgat tgggagaaaa taaaatatta tattttactg 3360
gatgaattgt tttagtacct agatttagat gtctaaaaag ctttttagac atctaatctt 3420
ttctgaagta catccgcaac tgtccatact ctgatgtttt atatcttttc taaaagttcg 3480
ctagataggg gtcccgagcg cctacgagga atttgtatcg actctagagg atccctcagc 3540
gaagctccac tatgtttcaa aatgtcagat atatcaattt tcatcaaagt cacctcttaa 3600
aaccgacaag gactattata ctaactaata accctcatgt caagaattat atgacagatt 3660
ggcttaaata acaaaaataa ttttgtttag ttaaattcgg aatttcttct taatattatt 3720
aacatattcc acatattaat acaagaaaaa acccggcaaa aaaataaaaa aattttataa 3780
gcccgtttcc taaaaaaaca ggcttgtaaa attataacgc atcttttata agttttttac 3840
aagtcttaaa gtctcccttg caatctcaag ctcctcattt gtcgggataa ccaaagtctt 3900
tactttcgca tcgggagcac tgatatccgc ttctttgcct ttcacttcat ttttatccaa 3960
atctatttta attccgaaaa agtccatatc cttcaaaact tctcttctta tataagcatt 4020
gttttcgccg atacctgcag tgaataccac cgcatcaacg ccgttcagca ctgcaatata 4080
ttttccaata tatttcctaa caccatagca gaaaatatcc aatgccagct gcgccctgtc 4140
atctcccttt tctgcggcat cctgaacatc tctgaaatca ctgcttacac ctgaaattcc 4200
aagcacacct gatttcttgt taaggaaatt gtttatatcg ttaatattca ttttttcctt 4260
ttccatcaaa taagttataa ccgcagggtc aacattgccg cttctggtac ccatgcacaa 4320
cccctgcaga ggagtaaatc ccattgaggt gtcaacggat tttccgcctt ttaccgcaca 4380
aatacttgct ccgtttccaa gatggcaggt tatcagcttc aggctctcaa taggtttgcc 4440
cagcatctga gccgccctgt gggccacata tttgtgggaa gttccgtgga atccgtattt 4500
tctcaattta tacttctcat atatctcata agggagggca taaatatatg catgctagtt 4560
caacaaacgg gattgacttt taaaaaagga ttgattctaa tgaagaaagc agacaagtaa 4620
gcctcctaaa ttcactttag ataaaaattt aggaggcata tcaaatgaac tttaataaaa 4680
ttgatttaga caattggaag agaaaagaga tatttaatca ttatttgaac caacaaacga 4740
cttttagtat aaccacagaa attgatatta gtgttttata ccgaaacata aaacaagaag 4800
gatataaatt ttaccctgca tttattttct tagtgacaag ggtgataaac tcaaatacag 4860
cttttagaac tggttacaat agcgacggag agttaggtta ttgggataag ttagagccac 4920
tttatacaat ttttgatggt gtatctaaaa cattctctgg tatttggact cctgtaaaga 4980
atgacttcaa agagttttat gatttatacc tttctgatgt agagaaatat aatggttcgg 5040
ggaaattgtt tcccaaaaca cctatacctg aaaatgcttt ttctctttct attattccat 5100
ggacttcatt tactgggttt aacttaaata tcaataataa tagtaattac cttctaccca 5160
ttattacagc aggaaaattc attaataaag gtaattcaat atatttaccg ctatctttac 5220
aggtacatca ttctgtttgt gatggttatc atgcaggatt gtttatgaac tctattcagg 5280
aattgtcaga taggcctaat gactggcttt tataacctga ggttttgctc caaccagcat 5340
ctcaaaagat ttggatgcag atattgcaat ttcagaaagc tggtctgcat ccggattttc 5400
caccaagccg caatcggcat atacaaaggt tccgttatga ccatattcac agttgggtac 5460
aaccataaca aaaaaggatg atacgagttt tgtccccggg gccgtcttta atatctgcaa 5520
agccggtctc aaagtatttg cagtggaatt gacagcaccc gccaccatac catccgcttc 5580
accttttttt accatcataa ctccataata aagagggtct ttgatcgttt cccttgcggc 5640
ttctatagtc atacccttcg attttctaag ctcatacagt gtatttgcat aatcctccaa 5700
tttttcggaa tttaaggaat cctctatcat cactccttca agatcaatat cccccgccag 5760
actcttaatc tccttttcat tgcctatcag tacaaccttt gcaattccct ttttcattat 5820
catggatgcg gctttaataa ccctcagatc cgtactttcc ggcaaaacta tggtttttac 5880
gtctgatttc gccctttcaa ttatttgttc caaaaaactc ataaattctt ctcctttcat 5940
aatcccaaaa ctgttatcat aaaaactgta tttgtaatac ttataactat atattatcac 6000
caggtaataa tacctactca ctataaacag ctattttact gggttccaag caactctaat 6060
tatatacaaa atgttttttg tatacaacac cctccttatc tttttttcgg ctttagccat 6120
aaataacggc aagtaactcc aaaatacagg atatttcatg cttttagaaa ctttttatta 6180
gtcttcttaa ttattcagat tttgtggcaa ttaaactttg cagctcctcc aaatagttgt 6240
ccagctcctc ttctttaaga ttgctgagat atgacaatct gtaattttta gcctttttgg 6300
ccatctctag cgcactctcc gtcattccca aatctttcaa aacacagcta tagttatagt 6360
atgcgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 6420
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 6480
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt 6540
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 6600
tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 6660
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 6720
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 6780
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 6840
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 6900
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 6960
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 7020
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 7080
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 7140
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 7200
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 7260
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 7320
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 7380
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 7440
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 7500
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 7560
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 7620
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 7680
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 7740
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 7800
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 7860
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 7920
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 7980
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 8040
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 8100
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 8160
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 8220
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 8280
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 8340
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 8400
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 8460
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 8520
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 8580
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 8640
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 8700
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 8760
cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 8820
gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga 8880
gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt 8940
gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca 9000
<210> 2
<211> 7582
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 2
aattctgttc tggctttaga ccatttacgc tttgggtttg ccatgcatca cacctcctcg 60
tcaccataca acaaaccttg tgtataaata aaatcttgta cacatggaag gtactcgatt 120
ttgtttttac ttaaaacaaa gctacactaa ttgtctgtaa aaaagttttt gaaaacttcc 180
agccgcggat ctatatcctc atttacgcat ttgcactcat cgttgttaag atccgctcca 240
cacttcgggc aatatccctt gcaggcctcg tcacaaacct gctttgccgg aagattcagt 300
atgatattgt ctatcattac cttttccagc tcgaggaact taccatggta cgtataatat 360
tcctcgtcgg ttttgttact gccctcttct acaaagtttt cctttacatc aatatgcatc 420
tttgattcaa tatccttgag gcaccttgag cattttgccc tgtaatccgc ccagagttca 480
ccgtcaagtt ttataatccc tccggcattt accaaagtgc ccttaaaagt taccggtttc 540
gcaaagtcaa aatcctcagc tataaaatca ttaattttaa ttgactcact aaagtccagt 600
ctcagcgaag ctccactatg tttcaaaatg tcagatatat caattttcat caaagtcacc 660
tcttaaaacc gacaaggact attatactaa ctaataaccc tcatgtcaag aattatatga 720
cagattggct taaataacaa aaataatttt gtttagttaa attcggaatt tcttcttaat 780
attattaaca tattccacat attaatacaa gaaaaaaccc ggcaaaaaaa taaaaaaatt 840
ttataagccc gtttcctaaa aaaacaggct tgtaaaatta taacgcatct tttataagtt 900
ttttacaagt cttaaagtct cccttgcaat ctcaagctcc tcatttgtcg ggataaccaa 960
agtctttact ttcgcatcgg gagcactgat atccgcttct ttgcctttca cttcattttt 1020
atccaaatct attttaattc cgaaaaagtc catatccttc aaaacttctc ttcttatata 1080
agcattgttt tcgccgatac ctgcagtgaa taccaccgca tcaacgccgt tcagcactgc 1140
aatatatttt ccaatatatt tcctaacacc atagcagaaa atatccaatg ccagctgctg 1200
cagtaatcgc atcagattgc agtataaatt taacgatcac tcatcatgtt catatttatc 1260
agagctcgtg ctataattat actaatttta taaggaggaa aaaataaaga gggttataat 1320
gaacgagaaa aatataaaac acagtcaaaa ctttattact tcaaaacata atatagataa 1380
aataatgaca aatataagat taaatgaaca tgataatatc tttgaaatcg gctcaggaaa 1440
agggcatttt acccttgaat tagtacagag gtgtaatttc gtaactgcca ttgaaataga 1500
ccataaatta tgcaaaacta cagaaaataa acttgttgat cacgataatt tccaagtttt 1560
aaacaaggat atattgcagt ttaaatttcc taaaaaccaa tcctataaaa tatttggtaa 1620
tataccttat aacataagta cggatataat acgcaaaatt gtttttgata gtatagctga 1680
tgagatttat ttaatcgtgg aatacgggtt tgctaaaaga ttattaaata caaaacgctc 1740
attggcatta tttttaatgg cagaagttga tatttctata ttaagtatgg ttccaagaga 1800
atattttcat cctaaaccta aagtgaatag ctcacttatc agattaaata gaaaaaaatc 1860
aagaatatca cacaaagata aacagaagta taattatttc gttatgaaat gggttaacaa 1920
agaatacaag aaaatattta caaaaaatca atttaacaat tccttaaaac atgcaggaat 1980
tgacgattta aacaatatta gctttgaaca attcttatct cttttcaata gctataaatt 2040
atttaataag taagttaagg gatgcataaa ctgcatccct tacagctgat actttagtga 2100
tgagcttccg gtattaataa ccaaaatatt catttcaaaa actcactccc gtcttgtttt 2160
ttttaatttt cctattccta aacttcgata aacagatgtt tttattaaac gctgcgcaac 2220
accttcttca atgtccggtt ttaacagaat ttatgccttg acatattgag cctgaaccgc 2280
agtaattgcc gcaaccccga ctatatcctc ggcactgcag cctcgtgaca gatcatttac 2340
cggtcttgcc aaaccttgtg ttatcgggcc gtaagcttca gcttttgcca atctctgtgt 2400
aagcttgtat gcaatatttc cggcatcaag atccgggaaa ataagaacat tggcctttcc 2460
tgcaacactg cttccctttg ccttcgattt tgccacttcc ggaacaatgg cggcatccac 2520
ctgaagttct ccgtcaattg caaggtgggg agctttttcc tttgcaagct gtgttgcctt 2580
gattaccttt tcggtcagct cacttttggc actgccgtaa gaagaataag aaagcattgc 2640
cacctgaggt tttgctccaa ccagcatctc aaaagatttg gatgcagata ttgcaatttc 2700
agaaagctgg tctgcatccg gattttccac caagccgcaa tcggcatata caaaggttcc 2760
gttatgacca tattcacagt tgggtacaac cataacaaaa aaggatgata cgagttttgt 2820
ccccggggcc gtctttaata tctgcaaagc cggtctcaaa gtatttgcag tggaattgac 2880
agcacccgcc accataccat ccgcttcacc tttttttacc atcataactc cataataaag 2940
agggtctttg atcgtttccc ttgcggcttc tatagtcata cccttcgatt ttctaagctc 3000
atacagtgta tttgcataat cctccaattt ttcggaattt aaggaatcct ctatcatcac 3060
tccttcaaga tcaatatccc ccgccagact cttaatctcc ttttcattgc ctatcagtac 3120
aacctttgca attccctttt tcattatcat ggatgcggct ttaataaccc tcagatccgt 3180
actttccggc aaaactatgg tttttacgtc tgatttcgcc ctttcaatta tttgttccaa 3240
aaaactcata aattcttctc ctttcataat cccaaaactg ttatcataaa aactgtattt 3300
gtaatactta taactatata ttatcaccag gtaataatac ctactcacta taaacagcta 3360
ttttactggg ttccaagcaa ctctaggatc ctctagagtc gacctgcagg catgcaagct 3420
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 3480
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 3540
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 3600
ccttcaaact tcccaaaggc gagccctagt gacattagaa aaccgactgt aaaaagtaca 3660
gtcggcatta tctcatatta taaaagccag tcattaggcc tatctgacaa ttcctgaata 3720
gagttcataa acaatcctgc atgataacca tcacaaacag aatgatgtac ctgtaaagat 3780
agcggtaaat atattgaatt acctttatta atgaattttc ctgctgtaat aatgggtaga 3840
aggtaattac tattattatt gatatttaag ttaaacccag taaatgaagt ccatggaata 3900
atagaaagag aaaaagcatt ttcaggtata ggtgttttgg gaaacaattt ccccgaacca 3960
ttatatttct ctacatcaga aaggtataaa tcataaaact ctttgaagtc attctttaca 4020
ggagtccaaa taccagagaa tgttttagat acaccatcaa aaattgtata aagtggctct 4080
aacttatccc aataacctaa ctctccgtcg ctattgtaac cagttctaaa agctgtattt 4140
gagtttatca cccttgtcac taagaaaata aatgcagggt aaaatttata tccttcttgt 4200
tttatgtttc ggtataaaac actaatatca atttctgtgg ttatactaaa agtcgtttgt 4260
tggttcaaat aatgattaaa tatctctttt ctcttccaat tgtctaaatc aattttatta 4320
aagttcattt gatatgcctc ctaaattttt atctaaagtg aatttaggag gcttacttgt 4380
ctgctttctt cattagaatc aatccttttt taaaagtcaa tcccgtttgt tgaactactc 4440
tttaataaaa taatttttcc gttcccaatt ccacattgca ataatagaaa atccatcttc 4500
atcggctttt tcgtcatcat ctgtatgaat caaatcgcct tcttctgtgt catcaaggtt 4560
taatttttta tgtatttctt ttaacaaacc accataggag attaaccttt tacggtgtaa 4620
accttcctcc aaatcagaca aacgtttcaa attcttttct tcatcatcgg tcataaaatc 4680
cgtatccttt acaggatatt ttgcagtttc gtcaattgcc gattgtatat ccgatttata 4740
tttatttttc ggtcgaatca tttgaacttt tacatttgga tcatagtcta atttcattgc 4800
ctttttccaa aattgaatcc attgtttttg attcacgtag ttttctgtat tcttaaaata 4860
agttggttcc acacatacca atacatgcat gtgctgatta taagaattat ctttattatt 4920
tattgtcact tccgttgcac gcataaaacc aacaagattt ttattaattt ttttatattg 4980
catcattcgg cgaaatcctt gagccatatc tgacaaactc ttatttaatt cttcgccatc 5040
ataaacattt ttaactgtta atgtgagaaa caaccaacga actgttggct tttgtttaat 5100
aacttcagca acaacctttt gtgactgaat gccatgtttc attgctctcc tccagttgca 5160
cattggacaa agcctggatt tacaaaacca cactcgatac aactttcttt cgcctgtttc 5220
acgattttgt ttatactcta atatttcagc acaatctttt actctttcag cctttttaaa 5280
ttcaagaata tgcagaagtt caaagtaatc aacattagcg attttctttt ctctccatgg 5340
tctcactttt ccactttttg tcttgtccac taaaaccctt gatttttcat ctgaataaat 5400
gctactatta ggacacataa tattaaaaga aacccccatc tatttagtta tttgtttggt 5460
cacttataac tttaacagat ggggtttttc tgtgcaacca attttaaggg ttttcaatac 5520
tttaaaacac atacatacca acacttcaac gcacctttca gcaactaaaa taaaaatgac 5580
gttatttcta tatgtatcaa gaatagaaag aactcgtttt tcgctacgct caaaacgcaa 5640
aaaaagcact cattcgagtg ctttttctta tcgctccaaa tcatgcgatt ttttcctctt 5700
tgcttttctt tgctcacgaa gttctcgatc acgctgcaaa acatcttgaa gcgaaaaagt 5760
attcttcttt tcttccgatc gctcatgctg acgcacgaaa agccctctag gcgcatagga 5820
acaactccta aatgcatgtg aggggttttc tcgtccatgt gaacagtcgc atacgcaata 5880
ttttgtttcc catactgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 5940
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 6000
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 6060
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 6120
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 6180
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 6240
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 6300
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 6360
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 6420
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 6480
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 6540
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 6600
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 6660
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 6720
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 6780
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 6840
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 6900
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 6960
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 7020
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccc 7080
gatatgggaa acaaaatatt gcgtatgcga ctgttcacat ggacgagaaa acccctcaca 7140
tgcatttagg agttgttcct atgcgcctag agggcttttc gtgcgtcagc atgagcgatc 7200
ggaagaaaag aagaatactt tttcgcttca agatgttttg cagcgtgatc gagaacttcg 7260
tgagcaaaga aaagcaaaga ggaaaaaatc gcatgatttg gagcgataag aaaaagcact 7320
cgaatgagtg ctttttttgc gttttgagcg tagcgaaaaa cgagttcttt ctattcttga 7380
tacatataga aataacgtca tttttatttt agttgctgaa aggtgcgttg aagtgttggt 7440
atgtatgtga ttcaataatt tcttttactc gctcgttata gtcgatcggt tcatcattca 7500
ccaaatcata attttcatgt gaccgttctt tatcaatatc gggattcgtt ttactttccc 7560
gttctctctg attgtgaaat tg 7582
<210> 3
<211> 8927
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 3
agctttggct aacacacacg ccattccaac caatagtttt ctcggcataa agccatgctc 60
tgacgcttaa atgcactaat gccttaaaaa aacattaaag tctaacacac tagacttatt 120
tacttcgtaa ttaagtcgtt aaaccgtgtg ctctacgacc aaaagtataa aacctttaag 180
aactttcttt tttcttgtaa aaaaagaaac tagataaatc tctcatatct tttattcaat 240
aatcgcatca gattgcagta taaatttaac gatcactcat catgttcata tttatcagag 300
ctcgtgctat aattatacta attttataag gaggaaaaaa taaagagggt tataatgaac 360
gagaaaaata taaaacacag tcaaaacttt attacttcaa aacataatat agataaaata 420
atgacaaata taagattaaa tgaacatgat aatatctttg aaatcggctc aggaaaaggg 480
cattttaccc ttgaattagt acagaggtgt aatttcgtaa ctgccattga aatagaccat 540
aaattatgca aaactacaga aaataaactt gttgatcacg ataatttcca agttttaaac 600
aaggatatat tgcagtttaa atttcctaaa aaccaatcct ataaaatatt tggtaatata 660
ccttataaca taagtacgga tataatacgc aaaattgttt ttgatagtat agctgatgag 720
atttatttaa tcgtggaata cgggtttgct aaaagattat taaatacaaa acgctcattg 780
gcattatttt taatggcaga agttgatatt tctatattaa gtatggttcc aagagaatat 840
tttcatccta aacctaaagt gaatagctca cttatcagat taaatagaaa aaaatcaaga 900
atatcacaca aagataaaca gaagtataat tatttcgtta tgaaatgggt taacaaagaa 960
tacaagaaaa tatttacaaa aaatcaattt aacaattcct taaaacatgc aggaattgac 1020
gatttaaaca atattagctt tgaacaattc ttatctcttt tcaatagcta taaattattt 1080
aataagtaag ttaagggatg cataaactgc atcccttaac ttgtttttcg tgtacctatt 1140
ttttgtgaat cgattatgtc ttttgcgcat tcacttcttt tctatataaa tatgagcgaa 1200
gcgaataagc gtcggaaaag cagcaaaaag tttccttttt gctgttggag catgggggtt 1260
cagggggtgc agtatctgac gtcaatgccg agcgaaagcg agccgaaggg tagcatttac 1320
gttagataac cccctgatat gctccgacgc tttatataga aaagaagatt caactaggta 1380
aaatcttaat ataggttgag atgataaggt ttataaggaa tttgtttgtt ctaatttttc 1440
actcattttg ttctaatttc ttttaacaaa tgttcttttt tttttagaac agttatgata 1500
tagttagaat agtttaaaat aaggagtgag aaaaagatga aagaaagata tggaacagtc 1560
tataaaggct ctcagaggct catagacgaa gaaagtggag aagtcataga ggtagacaag 1620
ttataccgta aacaaacgtc tggtaacttc gtaaaggcat atatagtgca attaataagt 1680
atgttagata tgattggcgg aaaaaaactt aaaatcgtta actatatcct agataatgtc 1740
cacttaagta acaatacaat gatagctaca acaagagaaa tagcaaaagc tacaggaaca 1800
agtctacaaa cagtaataac aacacttaaa atcttagaag aaggaaatat tataaaaaga 1860
aaaactggag tattaatgtt aaaccctgaa ctactaatga gaggcgacga ccaaaaacaa 1920
aaatacctct tactcgaatt tgggaacttt gagcaagagg caaatgaaat agattgacct 1980
cccaataaca ccacgtagtt attgggaggt caatctatga aatgcgatta agcttggctg 2040
caggtcgata aacccagcga accatttgag gtgataggta agattatacc gaggtatgaa 2100
aacgagaatt ggacctttac agaattactc tatgaagcgc catatttaaa aagctaccaa 2160
gacgaagagg atgaagagga tgaggaggca gattgccttg aatatattga caatactgat 2220
aagataatat atcttttata tagaagatat cgccgtatgt aaggatttca gggggcaagg 2280
cataggcagc gcgcttatca atatatctat agaatgggca aagcataaaa acttgcatgg 2340
actaatgctt gaaacccagg acaataacct tatagcttgt aaattctatc ataattgtgg 2400
tttcaaaatc ggctccgtcg atactatgtt atacgccaac tttcaaaaca actttgaaaa 2460
agctgttttc tggtatttaa ggttttagaa tgcaaggaac agtgaattgg agttcgtctt 2520
gttataatta gcttcttggg gtatctttaa atactgtaga aaagaggaag gaaataataa 2580
atggctaaaa tgagaatatc accggaattg aaaaaactga tcgaaaaata ccgctgcgta 2640
aaagatacgg aaggaatgtc tcctgctaag gtatataagc tggtgggaga aaatgaaaac 2700
ctatatttaa aaatgacgga cagccggtat aaagggacca cctatgatgt ggaacgggaa 2760
aaggacatga tgctatggct ggaaggaaag ctgcctgttc caaaggtcct gcactttgaa 2820
cggcatgatg gctggagcaa tctgctcatg agtgaggccg atggcgtcct ttgctcggaa 2880
gagtatgaag atgaacaaag ccctgaaaag attatcgagc tgtatgcgga gtgcatcagg 2940
ctctttcact ccatcgacat atcggattgt ccctatacga atagcttaga cagccgctta 3000
gccgaattgg attacttact gaataacgat ctggccgatg tggattgcga aaactgggaa 3060
gaagacactc catttaaaga tccgcgcgag ctgtatgatt ttttaaagac ggaaaagccc 3120
gaagaggaac ttgtcttttc ccacggcgac ctgggagaca gcaacatctt tgtgaaagat 3180
ggcaaagtaa gtggctttat tgatcttggg agaagcggca gggcggacaa gtggtatgac 3240
attgccttct gcgtccggtc gatcagggag gatatcgggg aagaacagta tgtcgagcta 3300
ttttttgact tactggggat caagcctgat tgggagaaaa taaaatatta tattttactg 3360
gatgaattgt tttagtacct agatttagat gtctaaaaag ctttttagac atctaatctt 3420
ttctgaagta catccgcaac tgtccatact ctgatgtttt atatcttttc taaaagttcg 3480
ctagataggg gtcccgagag ccccatactc atgagcagtc ttgttacagc tatgccggca 3540
gcacctgaac cgtttacaac aacttctata tcctcgattt tcttgttgac aagctttaat 3600
gcattgatca ttgctgcaac agtaacaacg gctgtaccgt gctggtcatc atggaatatt 3660
ggaatgtcac attcctcttt gagtcttctt tctatttcaa agcatctcgg agcggatata 3720
tcttcgaggt ttataccgcc aaagcttccg gagatgagct tgattgtctt tacaatttca 3780
tctacgtctt ttgatttgat acagagcgga aatgcgtcca catcaccaaa cttcttgaag 3840
agtacgcatt taccttccat aacaggcatt ccggcttcag gtcctatgtc tccgagccct 3900
aaaaccgccg taccgtcggt aataaccgct accaggttcc aacgtcttgt atattcataa 3960
gaaagattaa catctttctg aattgcaaga catggttctg caacacccgg tgtataagca 4020
agcgacaact cttccttggt tgaaacaggt accttgtgta taacctcaat tttacccttc 4080
cactcaccgt gaagccttag tgattctttt ctgtaatcca tttgattcta cctccaaatt 4140
atattattaa atatctgcga tattaatgca caattataaa ttcttaactt cgttcaatac 4200
ttttttaacc tgctccgctg agaatcttaa agcttcttct tcttcaggag tcagattaaa 4260
ttggagaact tcctgaacac cttcggaatt tacgatggat ggaaggctta ttgcaacatc 4320
ttctattcca tacatgccgt ttataacggt tcctacggtt cttattgtat tctgattctt 4380
aaggagtgtt tcaactattg tgttgattga aactgcaata ccatagtatg ttgcaccttt 4440
gttcttgata atggttgcac ccgcagtttt aacatcttca gcgatttttt tcttgtcttc 4500
ttctgtgaaa ttgcatttcg gatcatcgat atattcgttg atatttttac cggcgatatg 4560
tgtgcagctc cacaacggaa gctgtgaatc accgtgttcg cctattatgt agccgtgtac 4620
atagttcaac aaacgggatt gacttttaaa aaaggattga ttctaatgaa gaaagcagac 4680
aagtaagcct cctaaattca ctttagataa aaatttagga ggcatatcaa atgaacttta 4740
ataaaattga tttagacaat tggaagagaa aagagatatt taatcattat ttgaaccaac 4800
aaacgacttt tagtataacc acagaaattg atattagtgt tttataccga aacataaaac 4860
aagaaggata taaattttac cctgcattta ttttcttagt gacaagggtg ataaactcaa 4920
atacagcttt tagaactggt tacaatagcg acggagagtt aggttattgg gataagttag 4980
agccacttta tacaattttt gatggtgtat ctaaaacatt ctctggtatt tggactcctg 5040
taaagaatga cttcaaagag ttttatgatt tatacctttc tgatgtagag aaatataatg 5100
gttcggggaa attgtttccc aaaacaccta tacctgaaaa tgctttttct ctttctatta 5160
ttccatggac ttcatttact gggtttaact taaatatcaa taataatagt aattaccttc 5220
tacccattat tacagcagga aaattcatta ataaaggtaa ttcaatatat ttaccgctat 5280
ctttacaggt acatcattct gtttgtgatg gttatcatgc aggattgttt atgaactcta 5340
ttcaggaatt gtcagatagg cctaatgact ggcttttata atgtacattt attggtaaca 5400
ttgtcttttg ggtttttctt tcttatatcc gttcttgccg ccgcggtttc ggaaaaattt 5460
gaaatattgc ttgtttccct tcttttgttg gtacttttga taccttatat tgcccattat 5520
tacaaactgg agaacggagt tcagaggctt tatgagcttt ataacaaaat tgatgaaaaa 5580
tgtgtaagga aaaacaagac cgcctgagtt ctcacccaga cggtcggtat tggcagtttc 5640
actttcgtta gtcgatgttt ttcatgccgg caaagaaatt attttcttgc aagaaccttt 5700
ttcagttttg caaatcttgg aagaccatct tcgataggag gtcttgattc tccctgaatt 5760
aacggaagag catacttaat aaagtcttct gtaaggcctg ctccgtcagg tttaatccat 5820
tccaacggaa ctttcttctc agtatttgca acttcactga ggttcagaag cttgatattg 5880
cacttgtatt caggaccttc cgctctttca aaagcaacca tgtagtctgt tttcccttca 5940
acggcatatt gtacggctgc ctgtcctgca agataagctt catttacgtc ggtaagagaa 6000
gctacgtgag ctgcgcatct ttggagaagg ctgaattcaa tgccgcgaac ctttgcgccg 6060
gtcttctctt taacaatgtt agccagtgtt gaagcaagac cgcccaactg tgcatgtcca 6120
aaggagtctt ttgttttcgc aaggtctgaa ccgtattcgg aaatatattt tccgtttttg 6180
tctttgatac cttcagatac ggctacaata acctttccgt tttctttgta gattcttgtc 6240
acatcttcaa caaatttgtc tatgtcaaag gaaagctcgg gtaccgagct cgaattcact 6300
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 6360
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 6420
ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg atgcggtatt ttctccttac 6480
gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc 6540
cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg 6600
tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca 6660
gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt 6720
tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca cttttcgggg 6780
aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct 6840
catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat 6900
tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc 6960
tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg 7020
ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg 7080
ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga 7140
cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta 7200
ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc 7260
tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc 7320
gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg 7380
ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc 7440
aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca 7500
acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct 7560
tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat 7620
cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg 7680
gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat 7740
taagcattgg taactgtcag accaagttta ctcatatata ctttagattg atttaaaact 7800
tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat 7860
cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 7920
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 7980
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 8040
cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 8100
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 8160
tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 8220
taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 8280
gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga 8340
agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 8400
ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 8460
acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 8520
caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 8580
tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 8640
tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc 8700
aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag 8760
gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt agctcactca 8820
ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg gaattgtgag 8880
cggataacaa tttcacacag gaaacagcta tgaccatgat tacgcca 8927
<210> 4
<211> 7114
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 4
aattcagccc catactcatg agcagtcttg ttacagctat gccggcagca cctgaaccgt 60
ttacaacaac ttctatatcc tcgattttct tgttgacaag ctttaatgca ttgatcattg 120
ctgcaacagt aacaacggct gtaccgtgct ggtcatcatg gaatattgga atgtcacatt 180
cctctttgag tcttctttct atttcaaagc atctcggagc ggatatatct tcgaggttta 240
taccgccaaa gcttccggag atgagcttga ttgtctttac aatttcatct acgtcttttg 300
atttgataca gagcggaaat gcgtccacat caccaaactt cttgaagagt acgcatttac 360
cttccataac aggcattccg gcttcaggtc ctatgtctcc gagccctaaa accgccgtac 420
cgtcggtaat aaccgctacc aggttccaac gtcttgtata ttcataagaa agattaacat 480
ctttctgaat tgcaagacat ggttctgcaa cacccggtgt ataagcaagc gacaactctt 540
ccttggttga aacaggtacc ttgtgtataa cctcaatttt acccttccac tcaccgtgaa 600
gccttagtga ttcttttctg taatccattt gattctacct ccaaattata ttattaaata 660
tctgcgatat taatgcacaa ttataaattc ttaacttcgt tcaatacttt tttaacctgc 720
tccgctgaga atcttaaagc ttcttcttct tcaggagtca gattaaattg gagaacttcc 780
tgaacacctt cggaatttac gatggatgga aggcttattg caacatcttc tattccatac 840
atgccgttta taacggttcc tacggttctt attgtattct gattcttaag gagtgtttca 900
actattgtgt tgattgaaac tgcaatacca tagtatgttg cacctttgtt cttgataatg 960
gttgcacccg cagttttaac atcttcagcg atttttttct tgtcttcttc tgtgaaattg 1020
catttcggat catcgattaa tcgcatcaga ttgcagtata aatttaacga tcactcatca 1080
tgttcatatt tatcagagct cgtgctataa ttatactaat tttataagga ggaaaaaata 1140
aagagggtta taatgaacga gaaaaatata aaacacagtc aaaactttat tacttcaaaa 1200
cataatatag ataaaataat gacaaatata agattaaatg aacatgataa tatctttgaa 1260
atcggctcag gaaaagggca ttttaccctt gaattagtac agaggtgtaa tttcgtaact 1320
gccattgaaa tagaccataa attatgcaaa actacagaaa ataaacttgt tgatcacgat 1380
aatttccaag ttttaaacaa ggatatattg cagtttaaat ttcctaaaaa ccaatcctat 1440
aaaatatttg gtaatatacc ttataacata agtacggata taatacgcaa aattgttttt 1500
gatagtatag ctgatgagat ttatttaatc gtggaatacg ggtttgctaa aagattatta 1560
aatacaaaac gctcattggc attattttta atggcagaag ttgatatttc tatattaagt 1620
atggttccaa gagaatattt tcatcctaaa cctaaagtga atagctcact tatcagatta 1680
aatagaaaaa aatcaagaat atcacacaaa gataaacaga agtataatta tttcgttatg 1740
aaatgggtta acaaagaata caagaaaata tttacaaaaa atcaatttaa caattcctta 1800
aaacatgcag gaattgacga tttaaacaat attagctttg aacaattctt atctcttttc 1860
aatagctata aattatttaa taagtaagtt aagggatgca taaactgcat cccttaatcg 1920
atgagaacaa gttcatttgc ggtttgccgc aaagccattg tgaaggctgc agacgcacct 1980
acaaaaccag caccaatgat tgcaactttt gacctacttt ttaccatttc cataccattc 2040
ctttcaatta cccagtatat ttaacggtta gttcgtttat aaatttgaga ttaattcttt 2100
aaattttaac tgtgaacccg gttcacaggt attatcatta atttcagtat atgtgtttaa 2160
taaaaattag tgaaaatttg caactgcaag catttaaaat tgtaaacgat aaataaatcc 2220
aggcaacaaa tttcccccat tttaaatagc ccagttaaac acattgataa cattttaaca 2280
ttattttata tctgcgtcca taactgaaaa agggaaatcc attactttat gaaatcaaat 2340
tttgaagtta tcaagaaatt atgacgattt tctccgtggc atgcaagatt tcgcgatatt 2400
tcattcgttt atattaattt tttatgaaaa ctgcggtttg ggctgacaat tgcgatggaa 2460
gtttcaatta gactttttgt caaatattat gtataataat attatctata ataatgtatg 2520
aaaaaattgt cctaagatgg aagacggggg tggtttcata tatggttaaa tatctgaaga 2580
ggcaggaaga gttggtagaa gaagctctct caaaggataa ctgttctgac tgggaaagtt 2640
tgagaaatta tcataagtcc caaattgaat ttttgcagca tgagagactt gtacatttat 2700
tggtaacatt gtcttttggg tttttctttc ttatatccgt tcttgccgcc gcggtttcgg 2760
aaaaatttga aatattgctt gtttcccttc ttttgttggt acttttgata ccttatattg 2820
cccattatta caaactggag aacggagttc agaggcttta tgagctttat aacaaaattg 2880
atgaaaaatg tgtaaggaaa aacaagaccg cctgagtgga tcctctagag tcgacctgca 2940
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 3000
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 3060
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 3120
tgtcgtgcca gcccttcaaa cttcccaaag gcgagcccta gtgacattag aaaaccgact 3180
gtaaaaagta cagtcggcat tatctcatat tataaaagcc agtcattagg cctatctgac 3240
aattcctgaa tagagttcat aaacaatcct gcatgataac catcacaaac agaatgatgt 3300
acctgtaaag atagcggtaa atatattgaa ttacctttat taatgaattt tcctgctgta 3360
ataatgggta gaaggtaatt actattatta ttgatattta agttaaaccc agtaaatgaa 3420
gtccatggaa taatagaaag agaaaaagca ttttcaggta taggtgtttt gggaaacaat 3480
ttccccgaac cattatattt ctctacatca gaaaggtata aatcataaaa ctctttgaag 3540
tcattcttta caggagtcca aataccagag aatgttttag atacaccatc aaaaattgta 3600
taaagtggct ctaacttatc ccaataacct aactctccgt cgctattgta accagttcta 3660
aaagctgtat ttgagtttat cacccttgtc actaagaaaa taaatgcagg gtaaaattta 3720
tatccttctt gttttatgtt tcggtataaa acactaatat caatttctgt ggttatacta 3780
aaagtcgttt gttggttcaa ataatgatta aatatctctt ttctcttcca attgtctaaa 3840
tcaattttat taaagttcat ttgatatgcc tcctaaattt ttatctaaag tgaatttagg 3900
aggcttactt gtctgctttc ttcattagaa tcaatccttt tttaaaagtc aatcccgttt 3960
gttgaactac tctttaataa aataattttt ccgttcccaa ttccacattg caataataga 4020
aaatccatct tcatcggctt tttcgtcatc atctgtatga atcaaatcgc cttcttctgt 4080
gtcatcaagg tttaattttt tatgtatttc ttttaacaaa ccaccatagg agattaacct 4140
tttacggtgt aaaccttcct ccaaatcaga caaacgtttc aaattctttt cttcatcatc 4200
ggtcataaaa tccgtatcct ttacaggata ttttgcagtt tcgtcaattg ccgattgtat 4260
atccgattta tatttatttt tcggtcgaat catttgaact tttacatttg gatcatagtc 4320
taatttcatt gcctttttcc aaaattgaat ccattgtttt tgattcacgt agttttctgt 4380
attcttaaaa taagttggtt ccacacatac caatacatgc atgtgctgat tataagaatt 4440
atctttatta tttattgtca cttccgttgc acgcataaaa ccaacaagat ttttattaat 4500
ttttttatat tgcatcattc ggcgaaatcc ttgagccata tctgacaaac tcttatttaa 4560
ttcttcgcca tcataaacat ttttaactgt taatgtgaga aacaaccaac gaactgttgg 4620
cttttgttta ataacttcag caacaacctt ttgtgactga atgccatgtt tcattgctct 4680
cctccagttg cacattggac aaagcctgga tttacaaaac cacactcgat acaactttct 4740
ttcgcctgtt tcacgatttt gtttatactc taatatttca gcacaatctt ttactctttc 4800
agccttttta aattcaagaa tatgcagaag ttcaaagtaa tcaacattag cgattttctt 4860
ttctctccat ggtctcactt ttccactttt tgtcttgtcc actaaaaccc ttgatttttc 4920
atctgaataa atgctactat taggacacat aatattaaaa gaaaccccca tctatttagt 4980
tatttgtttg gtcacttata actttaacag atggggtttt tctgtgcaac caattttaag 5040
ggttttcaat actttaaaac acatacatac caacacttca acgcaccttt cagcaactaa 5100
aataaaaatg acgttatttc tatatgtatc aagaatagaa agaactcgtt tttcgctacg 5160
ctcaaaacgc aaaaaaagca ctcattcgag tgctttttct tatcgctcca aatcatgcga 5220
ttttttcctc tttgcttttc tttgctcacg aagttctcga tcacgctgca aaacatcttg 5280
aagcgaaaaa gtattcttct tttcttccga tcgctcatgc tgacgcacga aaagccctct 5340
aggcgcatag gaacaactcc taaatgcatg tgaggggttt tctcgtccat gtgaacagtc 5400
gcatacgcaa tattttgttt cccatactgc attaatgaat cggccaacgc gcggggagag 5460
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5520
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5580
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5640
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5700
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5760
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5820
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 5880
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 5940
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 6000
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 6060
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 6120
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6180
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6240
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6300
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6360
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6420
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6480
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6540
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6600
accagccagc ccgatatggg aaacaaaata ttgcgtatgc gactgttcac atggacgaga 6660
aaacccctca catgcattta ggagttgttc ctatgcgcct agagggcttt tcgtgcgtca 6720
gcatgagcga tcggaagaaa agaagaatac tttttcgctt caagatgttt tgcagcgtga 6780
tcgagaactt cgtgagcaaa gaaaagcaaa gaggaaaaaa tcgcatgatt tggagcgata 6840
agaaaaagca ctcgaatgag tgcttttttt gcgttttgag cgtagcgaaa aacgagttct 6900
ttctattctt gatacatata gaaataacgt catttttatt ttagttgctg aaaggtgcgt 6960
tgaagtgttg gtatgtatgt gattcaataa tttcttttac tcgctcgtta tagtcgatcg 7020
gttcatcatt caccaaatca taattttcat gtgaccgttc tttatcaata tcgggattcg 7080
ttttactttc ccgttctctc tgattgtgaa attg 7114
<210> 5
<211> 3932
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 5
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgccaagctt gtagttggtg caggctttgt aggttccacc acagcttata 2280
cattgatgct cagcggactt atatctgaaa ttgtactgat agacataaat gcaaaaaaag 2340
ccgacggaga agtcatggac ttaaatcacg gcatgccttt tgtaaggccc gttgaaattt 2400
atcgtggtga ctacaaagac tgtgccggat ccgacatagt aatcattacc gccggtgcca 2460
accaaaaaga aggcgaaacg agaatagatc ttagttcaac aaacgggatt gacttttaaa 2520
aaaggattga ttctaatgaa gaaagcagac aagtaagcct cctaaattca ctttagataa 2580
aaatttagga ggcatatcaa atgaacttta ataaaattga tttagacaat tggaagagaa 2640
aagagatatt taatcattat ttgaaccaac aaacgacttt tagtataacc acagaaattg 2700
atattagtgt tttataccga aacataaaac aagaaggata taaattttac cctgcattta 2760
ttttcttagt gacaagggtg ataaactcaa atacagcttt tagaactggt tacaatagcg 2820
acggagagtt aggttattgg gataagttag agccacttta tacaattttt gatggtgtat 2880
ctaaaacatt ctctggtatt tggactcctg taaagaatga cttcaaagag ttttatgatt 2940
tatacctttc tgatgtagag aaatataatg gttcggggaa attgtttccc aaaacaccta 3000
tacctgaaaa tgctttttct ctttctatta ttccatggac ttcatttact gggtttaact 3060
taaatatcaa taataatagt aattaccttc tacccattat tacagcagga aaattcatta 3120
ataaaggtaa ttcaatatat ttaccgctat ctttacaggt acatcattct gtttgtgatg 3180
gttatcatgc aggattgttt atgaactcta ttcaggaatt gtcagatagg cctaatgact 3240
ggcttttata atgtacatgc ttatattatt ggcgaacacg gtgacaccga agttgcggcc 3300
tggagtcttg caaatattgc gggaattccc atggatcgct actgtgacga atgccatcag 3360
tgcgaggagc agatttcccg gaataaaata tatgaaagtg ttaaaaatgc agcttatgaa 3420
atcatcagga acaaaggtgc aacctattat gccgtagccc ttgccgtaag aagaatcgtt 3480
gaagccattg tactgcaggt cgactctaga ggatccccgg gtaccgagct cgaattcact 3540
ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 3600
tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 3660
ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg atgcggtatt ttctccttac 3720
gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc 3780
cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg 3840
tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca 3900
gaggttttca ccgtcatcac cgaaacgcgc ga 3932
<210> 6
<211> 1320
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 6
atgaataaat attttgagaa cgtatctaaa ataaaatatg aaggaccaaa atcaaataat 60
ccttattcct ttaaatttta caatccagag gaagtaatcg atggcaagac gatggaggag 120
catctccgct tttctatagc ttattggcac acttttactg ctgatggaac agatcaattt 180
ggcaaggcta ctatgcaaag accatggaac cactacacag atcctatgga tatagcgaaa 240
cgaagggtag aagcagcatt tgagtttttt gataagataa atgcaccttt cttctgcttc 300
catgataggg atattgcccc tgaaggagat actcttagag agacaaacaa aaacttagat 360
acaatagttg ctatgataaa ggattactta aagaccagca agacaaaagt tttgtggggt 420
accgcaaatc ttttctccaa tccgagattt gtacatggtg catcaacatc ctgcaatgct 480
gacgtttttg catattctgc agcgcaagtc aaaaaagccc ttgagattac taaggagctt 540
ggccgcgaaa actacgtatt ttggggtgga agagaagggt acgagacgct tctcaataca 600
gatatggagt tagagcttga taactttgca agatttttgc acatggctgt tgactatgca 660
aaggaaatcg gctttgaagg tcagttcttg attgagccga agccaaagga gcctacaaaa 720
catcaatacg actttgacgt ggcaaatgta ttggcattct tgagaaaata cgaccttgac 780
aaatatttca aagtaaatat cgaagcaaac catgcgacat tggcattcca cgacttccaa 840
catgagctaa gatacgccag aataaacggt gtattaggat caattgacgc aaatacaggc 900
gacatgcttt tgggatggga tacggaccag ttccctacag atatacgcat gacaacgctt 960
gctatgtatg aagtcataaa gatgggtgga tttgacaaag gtggccttaa ctttgatgca 1020
aaagtaagac gtgcttcatt tgagccagaa gatcttttct taggtcacat agcaggaatg 1080
gatgcttttg caaaaggctt taaagttgct tacaagcttg tgaaagatgg cgtatttgac 1140
aagttcatcg aagaaagata cgcaagctac aaagaaggca ttggcgctga tattgtaagc 1200
ggtaaagctg acttcaagag ccttgaaaag tatgcattag agcacagcca gattgtaaac 1260
aaatcaggca gacaagagct attagaatca atcctaaatc agtatttgtt tgcagaataa 1320
<210> 7
<211> 1566
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 7
atgagggcgg cttcatgctt cattaaagct gccctcaaca aaaatcatgg aggtaaatgt 60
atgtattttt tagggataga tttagggaca tcatcagtta agataatact gatgaatgaa 120
agcggcaatg tggtatcaag cgtttcaaaa gaatatcctg tgtactatcc agagccaggc 180
tgggctgagc aaaatccaga agattggtgg aatggcacaa gggatggaat aagagagatt 240
attgcgaaaa gcggcgtaaa tggcgatgaa ataaagggtg ttggcttaag cgggcagatg 300
catggactgg tgcttttaga caaagacaat aacgttttaa cgccagccat actttggtgt 360
gaccagagga cacaggaaga atgcgactac atcacagaga aaataggaaa agaaggcctt 420
ttgaagtaca cagggaataa agcattgaca ggttttactg caccaaagat attatgggta 480
aagaagcacc ttaaagacgt atatgaaaga atcgctcata tccttttgcc aaaagattat 540
ataaggttta aattgacagg tgagtacgct acagaagttt cagatgcatc aggtacactt 600
cttttcgatg tggaaaatag aagatggtca aaggaaatga tagacatatt tgaaataccg 660
gaaaaagccc ttcctaagtg ctacgaatca acagatgtca cagggtatgt caccaaagag 720
gcagcagatt tgacagggct tcatgaaggg actattgtcg taggcggtgg tggtgaccaa 780
gccagcggcg ctgtaggcac tggcacggtg aaaagcggca tagtgtccat cgcattagga 840
acttcaggcg tcgtatttgc atcacaggac aagtacgcag cagatgatga gcttaggctt 900
cactcattct gccatgcaaa cggcaaatgg catgtgatgg gtgtcatgct ttcggctgca 960
tcatgtctta aatggtgggt agatgatgta aataattaca agaccgatgt tatgacattt 1020
gatggactct tagaagaagc agagaaggtg aagccaggca gtgatggatt gatattcttg 1080
ccatacctga tgggtgaaag gaccccttac agcgatcctt atgcgagagg cagctttgta 1140
ggtttaacaa ttacacacaa tagaagccac atgacaagat ctatattaga aggcgtcgca 1200
tttggactta gggattcgct ggagcttata aaggctttaa atatacctgt aaatgaagcc 1260
agggtaagtg gtggtggtgc taaaagcagg ctttggaggc aaatacttgc cgatgtattc 1320
aatgtaagga tagacatgat aaatgctaca gaaggacctt catttggtgc agcaataatg 1380
gcgtctgtgg gatatggcct ttacaaaaat gtagatgatg catgcaatag tttaataaaa 1440
gttacagaca gcgtatatcc aatcaaagaa aacgtcgaaa agtacaacaa actgtatcca 1500
atctacgtga gcttgtattc aaggcttaaa ggcgcctttg aagaaattgg gaagttggat 1560
ttgtaa 1566
<210> 8
<211> 1407
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 8
atgattattg tgtacaaaga tgaaaagccc aggataggtt ttttgggtat tatgcaggag 60
ttatacgatg atatgttgcc tggtattact gaaaggcaag agatgtatgc acaacaggtt 120
ataggtagat taggtgatgt tgctgatttt tatttcccag gtgctgcaaa aaacagaaat 180
gatatagaaa ggatagttaa ggaattcaac gataaagatc ttgacggaat aatgatcgtg 240
atgctgacat acggaccagc cacaaatctt gtgaatgctt taagaaacaa taggcttccg 300
attatgctgg cgaatataca gccagaaagc actgtgacag acgattggga tatgggggac 360
ttgacctaca accaaggtgt tcatggtgca caggatactt caaatattat tctgagaatg 420
ggcataactt gtcctgttat aacagaagat tggcattctg atgaatttaa agattttgtg 480
aatgattggg caaaaactgt aaagacagta aaagctttga ggaatatgaa gatagcacaa 540
tttggaagaa tgcatggtat gtatgacata atgggtgatg atgcagcttt tacaagaaaa 600
ttggggccgc aaataaacca ggagtacatt ggccaagttt ttagatatat ggaagaagct 660
acaaatgaag aaattgacaa agtgatagag gaaaacaaga agaactttta tatagatcct 720
aaattaagtg atgagagcca cagatatgct gcaaggcttc aaataggatt taagaaattg 780
cttgaggaga aagggtactc tggctttagt gctcactttg atgtgtttaa aggcgatgga 840
agatttaagc agatacacat gatggcagca tcaaacttga tggcagaagg atatggctat 900
gcggcagagg gcgatgtagt tacggcaagc ctggtggcag caggtcatgt tttgataggc 960
aatgcacact ttaccgagat gtatgcgatg gattttaaga gagattcaat tttgatgagc 1020
cacatgggag agggcaattg gaagatagcc agaaaagata gacctataaa attagtcgat 1080
cgagagcttg gcataggaaa gcttgataat cctccaacag tggtgtttat ggctcaacca 1140
ggcattgcga cattggcatc attagtgtct ttagaaggcg aaaaatatag acttgttgtt 1200
tcaaagggag aaattttaga tacagaagaa gcgaaaaata tagagatgcc gtatttccat 1260
tttagacctg aaaacggagt tagggcttgt ctaaatggct ggcttaaaaa tggtggtaca 1320
catcatcagt gcttgacatt aggtgatgct actaaaagat ggaagctttt atgcgaatta 1380
ttagatatcg agtatgttga agtgtaa 1407
<210> 9
<211> 642
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 9
atgttagaga acctaaaaca acgtgtatat aaaatgaaca tgatgcttcc taaaaacaat 60
ttagtcacaa tgacaagcgg caatgtcagc ggaagagatc ctgagacaaa tcttgtagtc 120
ataaagccca gcggagtttt gtacgatgaa atgacgccag atgatatggt agtcgtggat 180
ttggatggca atgtggttga gggtaagcta aaaccatctg tcgatactgc tacacatctt 240
tacgtctaca ggcatagaaa tgatgtaaac ggcattgtcc atacacactc accgtatgct 300
acaagttttg ccgcacttgg ccggtcaatt ccggtctatc ttacagctat tgcagacgag 360
tttggatgcg caattcctgt agggccttat gccaaaattg gcggggaaga gataggaaaa 420
gccatcgtag attatatagg tgagagtcct gcaatactta tgaaaaatca cggcgttttt 480
accattggca attcacctga agcagcctta aaagctgctg ttatggtaga agatacagct 540
aagacggtgc acttatcact gcttttaggc acacctgatg taataccaga tgaagaagta 600
aaaagagccc atgaaagata tcttacaaaa tacggtcaat ga 642
<210> 10
<211> 1320
<212> DNA
<213> Clostridium cellulolyticum
<400> 10
atgtcagaag tatttagcgg tatttcaaac attaaatttg aaggaagcgg gtcagataat 60
ccattagctt ttaagtacta tgaccctaag gcagttatcg gcggaaagac aatggaagaa 120
catctgagat tcgcagttgc ctactggcat acttttgcag caccaggtgc tgacatgttc 180
ggtgcaggat catatgtaag accttggaat acaatgtccg atcctctgga aattgcaaaa 240
tacaaagttg aagcaaactt tgaattcatt gaaaagctgg gagcaccttt cttcgctttc 300
catgacaggg atattgctcc tgaaggcgac acactcgctg aaacaaataa aaaccttgat 360
acaatagttt cagtaattaa agatagaatg aaatccagtc cggtaaagtt attatgggga 420
actacaaatg ctttcggaaa cccaagattt atgcatggtg catcaacttc gccaaacgct 480
gacatatttg cgtatgcagc agctcaggtt aaaaaggcaa tggaaatcac aaaggaatta 540
ggcggagaaa actatgtatt ctggggtggt agagaaggtt atgaaactct cttgaataca 600
gacatgaagc tggaacttga taatttagca agattcttga agatggctgt tgactatgct 660
aaggaaatcg gttttgacgg acaattccta atcgaaccaa agccaaaaga accaactaag 720
caccaatatg attttgatac agctacagtt atcggcttcc tgaagacata tggattagac 780
ccatacttca agatgaatat cgaagctaac catgctacat tagcaggaca cacattccaa 840
catgagcttg ctatgtgcag aatcaacgac atgcttggaa gtattgatgc taaccaaggt 900
gatgtaatgc tcggatggga tacagaccaa ttcccaacga acctatatga tgcaacacta 960
gcaatggtgg aagtattaaa ggccggcgga ttgaaaaagg gaggtttgaa cttcgactca 1020
aaagttagaa gaggatcatt cgaaccatca gacttgttct atggacatat tgcaggtatg 1080
gatacttttg caaagggtct tatcatagca aataagatcg ttgaggacgg taagtttgat 1140
gcatttgttg ctgacagata ctcaagctac acaaatggta tcggaaaaga tattgttgaa 1200
ggaaaagttg gctttaagga attggagcaa tatgcactta ctgcaaagat tcagaacaag 1260
tctggacgtc aggaaatgct ggaagctttg ttaaaccagt atatcctcga aacaaaataa 1320
<210> 11
<211> 1608
<212> DNA
<213> Clostridium cellulolyticum
<400> 11
atgaagcatg aactaaatga cgggagaaat gctattctaa atggaaagac agcaattggg 60
attgaactcg gatcaactag aataaaaacg gtattgatag gtgcagacaa tgcacctatc 120
gcatccggta gtcatgactg ggaaaacagc tatatcaata atatttggac ttacagcttg 180
gaagatatct ggaaaggcgt acagagcagc tatcaggaaa tggttaaaga tgttagggac 240
aaattcggag taagtctaaa gacaaccgga gcaataggtt ttagcggaat gatgcacggt 300
tatatggttt ttgataagga aggtaatctt ctgactcatt tcagaacatg gcgtaacact 360
ataactgcac aggcttccga ggaactaacc aagttgttta attatcctat tcctcaaagg 420
tggagcattg cccatcttta ccaagccata ctgaacaatg aagagcatgt atccaatatc 480
gattttatga ctacattggc cggatttata cactggaagt tgacaggaga aaaagttctt 540
ggtgtcggag aggcatcagg tgttttccca atagatttag atactaagga ttttaattca 600
agtatgatta atcagtttaa tgaggctacc accaatcgaa atttttcatg gaagcttcaa 660
aatattcttc caaaagtttt ggtttcgggt actgaagcag gtaggctgac agaagaaggt 720
gcaaagcttc ttgatgttac cggggagctt caggcgggta ttcctttttg tccccctgag 780
ggagatgcgg gaaccggtat ggttgcaact aacagcgttg ctgtccgtac aggcaatgtg 840
tctgccggga cttctgtttt tgctatggtt gttctcgaaa aggaattatc caaagtgtat 900
tcggaaattg acctggtgac tacacctgac gcaaatcttg tggctatggt tcattcaaat 960
aattgtacat cggactatga cgcatggatg ggtatatttg ctgaggcagt taagaccttg 1020
ggctttgacg tgaaaaaacc acagctatat gataccctgc tgggagccgc acttcaaggt 1080
gaccctgatt gcggagggtt gcttgcgtac ggttatattt caggtgagca tattacccat 1140
tttgaagaag gtcgcccgat ggttgttcgt tcatcaaaca gcaaattcaa cctggccaac 1200
tttatcaggg tcaatttgtt tacatctctt ggagccttga agaccggttt ggatattctt 1260
tttcaaaagg aagctgttaa agtggacggt attaccggac acggcggttt ctttaagacg 1320
aaggaagtag gacagaagat tatggcggct gcctttaatg tccctgtatc tgttatgaag 1380
actgcgggtg aaggcggtgc atggggtatt gccctacttg cttcgtatat gattaatagg 1440
gaaagctcac agtccttgga ggattttctt aaacaaaatg tgtttgggga aagccaaggt 1500
gagactgtac agccagattc gaaggatgtt gacggtttca acgagtttat gaaaaggtac 1560
acaaagggac tgggtattga aagggctgcg ataaacttct tgaactga 1608
<210> 12
<211> 1380
<212> DNA
<213> Clostridium cellulolyticum
<400> 12
atgataacca aacaaaaacc aagaatcgga tttttgggcc taatgcaggg attgtatgac 60
gaatcacagc cggaactgcc gaaaatgcag gaggcatttg ccagagaagt ggttgaacaa 120
ttaaaagatg tggcagatat tgattttccc ggtccagcaa aagaaagaga agatatagaa 180
agatatgtaa aatatttcaa tgataaagag tacgatggaa taatgatagt aaatctgttg 240
tacagtccgg gaaatcgttt aatacaggct atgaagaata ataatctgcc aatattgctg 300
gctaatattc aaccacttcc cgatgttaca tcaaactggg attggatttt gtgcacaact 360
aatcagggaa ttcatggaat acaggataca agtaatgttc tcatgcgttg tggtattaaa 420
ccggctatta taacagatga ttggaaggct gaatccttta aagcctactt tgaagattgg 480
gcattggctg ccaacacgca taacagacta aaaaagacaa aggttgcgat tttcggccgt 540
atgcacaata tgggtgacat acttggtgat gatgcggcat tgtgcagaaa atttggtgta 600
gaggcaaacc atgtaacaat cggtccggtt tattacaaca tggaaggatt gtcagataaa 660
gaagtagatg cccagattga ggaagataaa aagaatttta aaattgatcc taatcttcct 720
gaagaaagtc atcggtatgc tgcacgtatg caattagcct ttgaaaaatt ccttaatgat 780
aacggttatg aaggtttttc acagttcttc aacatataca aggaagacgg caggttcaaa 840
caaataccga tattggcagg ctccagtctc cttgcaaaag gttatggtta ttcggcggaa 900
ggtgatacaa atgtacttct catgactgtg atcggtcaca tgatgatagg ggatcctcat 960
tttactgaga tgtactccct ggactttggt aaggattcag caatgctaag ccatatggga 1020
gaaggcaact ggaaggttgc aaggaaggat cgcggagtga cactgattga caggcctctt 1080
gatattggtg gtcttggtaa tcctccgaca ccaaagttca acgtagaacc aggaacagct 1140
acccttgttt ccctcgttgc agtagaagga gaaaaatacc aactaattgt atcaaagggt 1200
actatccttg atactgagga cttgccagat gttcctatga accatgcttt tttcagaccg 1260
gattccggca tcaaaaaggc tatggacgaa tggttagcta atggtggtac acatcacgaa 1320
gtactattcc tgggtgattt tagaagacgt tttgaattat tatgtaaatt cttgacataa 1380
<210> 13
<211> 690
<212> DNA
<213> Clostridium cellulolyticum
<400> 13
atgttggaac aactaaaaca agcggtgttg gaagccaatc tagagctgcc tgaaaaagga 60
cttgtaacat atacatgggg aaatgtaagc ggtatcgaca gagaaagcag acttattgca 120
attaaaccca gtggtgttga gtataatgtt atgacagctg atgatattgt attaatcgac 180
cttacaggta aagtggtgga aggaaaattg aagccgtctt ctgatgcacc aacacatgta 240
gctctgtata atgcatttcc tgatatagga ggtgtaacac acacccattc caggtgggca 300
actgcttttg cacaggctgg tatggggatt cctgcttacg ggactactca tgcggattac 360
ttttatggtg aaatcccatg tactcgggaa atgacaaagg atgagattga gtccgattat 420
gaagcaaata ccggaacggt gataatagag acttttaaag atttaaatcc taactatatc 480
cctgccgtac ttgtaaaaaa tcatgcacct tttacatggg gaaaaagtgc agcggaatcg 540
gttcataatt ctgttgtttt agaagaagta gctatgatgg ctattcagtg cagacaactg 600
aacccaaatg taactcccat gccgcaggtg ctgctagaca agcattttat gaggaagcac 660
ggcccgaaag cttattacgg acaaaaataa 690
<210> 14
<211> 1317
<212> DNA
<213> Clostridium phytofermentans
<400> 14
atgaaaaatt actttccaaa tgttccagaa gtaaaatacg aaggcccaaa ttcaacgaat 60
ccatttgctt ttaaatatta tgacgcaaat aaagttgtag cgggtaaaac aatgaaagag 120
cactgtcgtt ttgcattatc ttggtggcat actctttgtg caggtggtgc tgatccattc 180
ggtgtaacaa ctatggatag aacctacgga aatatcacag atccaatgga acttgctaag 240
gcaaaagttg acgctggttt cgaattaatg actaaattag gaattgaatt cttctgtttc 300
catgacgcag atattgctcc agaaggtgat acttttgaag agtcaaagaa gaatcttttt 360
gaaatcgttg attacatcaa agagaagatg gatcagactg gtatcaagtt attatggggt 420
actgctaata actttagtca tccaagattt atgcatggtg cttccacatc ttgcaacgca 480
gacgtatttg catatgctgc tgctaagatt aagaatgcat tagatgcaac aattaaatta 540
ggcggtaaag gttatgtatt ctggggtggt cgtgaaggtt atgaaacact tcttaataca 600
gatttaggac ttgagcttga taatatggct agacttatga agatggctgt agagtatggc 660
cgtgcaaatg gttttgatgg cgacttctat attgagccaa agccaaagga accaaccaag 720
catcaatatg attttgatac agcaaccgta cttgctttcc ttcgcaaata tggcttagaa 780
aaagatttca agatgaacat tgaagcaaac catgctactc ttgcaggtca tacctttgaa 840
catgaacttg caatggctag agttaatggt gcatttggtt ctgtagatgc aaaccagggt 900
gatccaaacc ttggatggga tacggatcaa ttcccaactg atgttcatag tgcaactctt 960
gcaatgcttg aagtacttaa ggctggtgga ttcactaacg gcggacttaa ctttgatgca 1020
aaggtaagac gtggttcctt cgaatttgat gatattgcat acggttatat tgcaggaatg 1080
gatacttttg cacttggttt aattaaggct gctgagatta tcgacgatgg tagaatcgca 1140
aaatttgtag atgatcgtta tgcaagctat aaaacaggaa ttggtaaagc aattgtggat 1200
ggaactacat ctcttgaaga attagagcag tatgttttaa cacatagtga accagtaatg 1260
cagagtggtc gtcaggaagt tcttgaaaca atcgtaaata atattttatt tagataa 1317
<210> 15
<211> 1599
<212> DNA
<213> Clostridium phytofermentans
<400> 15
atgggcatgg agcattttaa agatgcgatt cttacgggta aaacaacact tggaattgag 60
cttggttcca ctagaataaa agctgtttta gtaaatgaag aaaacgaacc aattgcgtca 120
ggaagccatg attgggaaaa tcaatatatt gataatgtat ggacttacaa tctggatgat 180
atctggaggg gcgttcagaa tagttatgga caaatgacaa gtgatgttaa gaataagtac 240
ggagtagaac ttacaacaat tggagccatt ggttttagtg gaatgatgca tggctatatg 300
gcttttgacg aaagtggaga gttacttgta ccatttcgta cctggagaaa tacaataaca 360
ggaccagcat ccgagcagtt gaccaatgta tttcagtatc aaattccaca acgttggagt 420
attgcccatc tatatcaagc tatcttaaat ggggaatccc acgtgaaaaa tattagattc 480
ctgacaacat tggcaggata tattcactgg aagctaacag gagaaaaagt attaggagtc 540
ggagaagcat ctggaatgtt tccaatcgat ataaatacga aagattttaa taaatcaatg 600
ttagctcagt ttaatgaact ggttgcttcg aatgactatt catggaaaat agaagatatt 660
ctaccgaaag tactagttgc aggagagtct gctggagtat taaccgaaga aggagtaaaa 720
cttcttgatg tttcaggtaa attaaaagca ggaattcctc tttgtccgcc ggaaggagat 780
gctggaactg gtatggtagc aaccaacagc gtagcaaaga gaactggtaa tgtatctgct 840
ggtacttctg tatttgcaat ggctgtatta gaaaaagagc tttcaaaagt ttacgaagaa 900
attgaccttg tgacgactcc aagcggagat cttgtggcta tggtgcactg caataactgt 960
acttctgatt tgaatgcgtg ggtttctatc tttaaagaat ttgcttcggc aatgggcatg 1020
gaagctgata tgtcaaagat attctcaacg ctatacaata aggcgttaga aggcaatgca 1080
gagtgtggag gcttactcgc atacaattat ttttccggtg aacatataac acactttgaa 1140
gaaggccgcc cattgtttgt aagaactcca gagagtaagt ttaaccttgc gaatttcatg 1200
agagttcatc tattcacagc acttggtgct ttaaagatag gtcttgatat cctattaaaa 1260
caagaatcag tacaattgga tgagattttt ggtcatggtg gattatttaa gacgaaagat 1320
gtcggacaaa aaattatggc tggtgcaatc aatgttcctg tttctgtgat ggagactgcc 1380
ggagaaggcg gagcatgggg aatcgcaatc ttggcttctt atatgatttc taaggaagaa 1440
ggtcagtcct tagatgagta tctttctaaa catgtattcc aaggaaagac aggtagcaag 1500
atgcagccgg atccaaggga tgtagaaggt tttgaacagt ttatcaaacg atatattgac 1560
ggacttgaaa ttgagcgtaa agcagtggag atattataa 1599
<210> 16
<211> 240
<212> DNA
<213> Clostridium thermocellum
<400> 16
actttgccaa cggtacaagg gaagttgcaa gagcggttgc cgagtccgga gcaatttcaa 60
taatcggagg cggagattct gccgcagcta tagaacagct tggttttgcc gataagatta 120
cccacatttc aaccggaggc ggcgcgtctt tggagtttct tgaaggaaaa gtattgccgg 180
gaattgatgt attaatggat aaataaggag agaagaggtc atgagtagaa aagttattgc 240
<210> 17
<211> 420
<212> DNA
<213> Clostridium thermocellum
<400> 17
aattactgta tctctctggc attgccaggt tttaataaag attaaaatta ttgactagaa 60
ataaaaaaat tgtccataat attaatggac aaaaaaacaa agaattacat caaaggaaga 120
taaaaatact ttgttaaaaa attaattatt ttttatctaa actattgaaa atgaaaataa 180
aataatataa aatgaatcat agtgcaagag atacttgcca gaggatgaat attttactgc 240
attcatgctt tatggcagct aatagaggca ttaaattaaa ttttaattta caataggagg 300
cgatattaat ggcagtaaaa attggtatca acggttttgg acgtatcggt cgtcttgtgt 360
tcagggccag tctcaacaac ccgaacgttg aggttgtagg tataaacgac ccatttattg 420
<210> 18
<211> 300
<212> DNA
<213> Clostridium thermocellum
<400> 18
ctgccccatt aaaagctcgg ttccaaccgc taatatctcc gcattcatat tgaaagaccc 60
cttaaattta aactttttgt aacttattat atcaattagt gttataaaat aaaagggaaa 120
aagaattaaa atcaaaggtt tcaagagcag ccgtatcacc cgtaaaagtt tcagccgatt 180
caaccttttt acacataaaa ctttcaaaaa ttgatgactt acaattatca agtaggatat 240
aatattacta atgctaaaca gttattgata aaggaggaag gaatatgaac aataacaaag 300
<210> 19
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 19
ggcggaattc cttggtctga caatcgatgc 30
<210> 20
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 20
ggcggaattc tatcagttat tacccacttt tcg 33
<210> 21
<211> 674
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 21
gaattctgcg acagaatagg gattgacaat tcctttataa agcaatcaag gggttcagaa 60
gaggctgtta ttttgaataa agagctaaag aatcacaaag atgcaataga ggctgttatt 120
tctgcactga ctgacgataa tatgggcgtt ataaaaaaca tgtccgaaat atcagcagtg 180
ggacacagaa tagtacacgg cggtgaaaaa ttcaacagtt ctgtagttat agatgaaaac 240
gttatgaatg cagtaagaga gtgtatagac gttgcaccgc ttcataatcc gccgaatatt 300
ataggtatag aggcttgcca gcagattatg cccaatatac ctatggtagc tgtatttgat 360
accactttcc acagctccat gcctgattat gcataccttt acgcattgcc atatgaactt 420
tatgaaaagt acggtataag aaaatatggt ttccacggaa catcacacaa atatgttgca 480
gaaagagctt ctgcaatgct tgataagtct ttgaacgaat taaagataat tacatgccat 540
cttgggaacg gttcaagtat ttgtgctgtt aacaagggta aatcaattga tacttccatg 600
ggctttacac ctttgcaggg acttgcaatg ggtacaagaa gcggtacaat agaccctgaa 660
gttgttacga attc 674
<210> 22
<211> 951
<212> DNA
<213> Clostridium thermocellum
<400> 22
atgaaaaata aatctataaa taaaatagta attgtaggta cgggttttgt cggttcaaca 60
actgcctata ctttaatggt cagcggacta gtttccgaga ttgtacttat tgaccgtaac 120
acaagcaaag ccgaaggaga ggcaatggat atgaatcacg gtatgccctt tgtaagacct 180
gtcagaatat acaaaggtga ttatcctgat tgcaaaggtg ctgatattgt tgtaataaca 240
ggtggagcaa accagaagcc cggtgaaacc agaattgacc ttgtaaataa aaatactgaa 300
gtttttaaag acattgttgg aaatatcatt aaatacaata cagactgtat tttacttgtt 360
gttacaaacc cggttgatat cttaacctat gtaacataca aattatccgg atttcccaaa 420
aacagagtta taggctccgg aacagttctt gatactgcac gtttcaaata tatgcttggt 480
gaacacatgg gagttgaccc aagaaacgtt catgcttata taatcggtga acatggagat 540
acagaggtac ctacatggag tctggcatcc atagccggga taccgatgga tgcttattgc 600
aaggaatgta aatcctgtga tgctgaaaac tttaagagtg aaacttttga caaagtaaaa 660
aatgcagctt atgaaattat tgatagaaaa aatgcaacct actacgccgt tgctcttgca 720
gtaagaagaa ttgtagaggc tatcgttcgt aatgaaaact ccatattgac ggtatcaagc 780
ctattcgaag gagaatacgg cctcaatgac atatgtctca gtattcccag ccaggtaaat 840
tcggagggtg tttcaaggat tttgaatatt cctctgagca gtgaggaaac aggtttactt 900
aataaatctg cccaggcctt gaaacaggtt atcagtgggc tgaatttata a 951
<210> 23
<211> 933
<212> DNA
<213> Clostridium thermocellum
<400> 23
atgggtttta aagttgcgat cataggagca ggatttgttg gagcatcagc tgcgtatgcg 60
atgtctataa acaacttggt ttctgaattg gtattaattg atgtaaataa agagaaggct 120
tatggtgaag cacttgatat cagccatggc ttatcattct caggaaatat gacagtttat 180
tccggcgact attctgatgt taaggattgt gatgttatag ttgtaactgc aggggcagca 240
agaaaaccgg gagaaactcg tttggacctt gctaaaaaga atactatgat catgaagagc 300
atagttactg atataatgaa gtactacaat aagggtgtta ttgtaagtgt atcaaatcct 360
gttgatgtat tggcatatat gacacaaaag tggtcaggat tgcctgcaaa taaagttata 420
ggatcaggaa cagttcttga cagtgcaaga ctgagaactc atatcagtca ggcattggat 480
gtagacattg ctaacgttca cggttatatt gttggtgaac atggtgattc tcagttgcca 540
ttatggagtg caacacatat agcaggagta caatttgacg actatgtaaa agctactggc 600
ttaaatgttg ataaggaagc tcttttcaat gaagttaagg tagcaggtgc aactattatt 660
aagaacaagg gagcaactta ctacggtata gctctttcaa ttaacagaat agttgaatca 720
atcctgaagg acttcaatac tattatgcct gttggtacag ttcttgacgg acagtacgga 780
ttaaaggatg ttttattaaa cgttcctacg atagttggcg gaaacggagc tgaaaaagtt 840
cttgaagtga acattacaga tgcagaatta caacttttga agcattcagc tgaacaggtt 900
agggcagtta ttaacgaagt taaagacata taa 933
<210> 24
<211> 2830
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 24
gacgcataca ggttgtaaca cccatttccc ttagcttttc gggagatgaa taaaacaaac 60
tttccgggtc ctttaccaca ccgcccacat aaagagctat gccgcatgaa agaaacgata 120
tgttatcatt tttttcgtaa actgttattt ccgaacccgg ataaagcttt accatattat 180
taactgctgc cgtccctgca tgtgtacacc ctataaccac tattttcata tacatcctcc 240
tttgtttgct tgtaaatata tcccatatat accacctaaa tatattttat aaacaaattc 300
ggtatatcat tcttttggta aataaaaagt acatccgata ttagaatgta cctaaaaaaa 360
attattattt tattgtatat gctttatctg ttttcattat atggtttgct atccattcta 420
cggtaaaatc aagtaattcc attaagtact gatcctgatc cttgtctatc ctgctataat 480
ccgtattact gattttctca ataaaatcat ggtgttcaac tttgtgggag agaagcttgc 540
gatatcctat gctatgcatg tattcttctt cataggtaaa atgaaagaca gtgtaatctt 600
ttagttccgt aattagccgt acaatttcat catatttgtc tgtaataagc tgatttttcg 660
tggcctcata aatttccgaa gcaatctgga atagtttctt atgctgttcg tcgattttct 720
caattccaag aataaattcg tctctccatt ctatcatatg gaccctccta aattgtaatg 780
tataccaaga ttatacatac ttcctagaat ataaacaata caaggataaa attttaatat 840
cgtataccta cataaatgac taacttaaag ctctctaaaa cttctttttt attatttcta 900
tactactaaa atcaaaaata ttctctaaag tatttctaca aatgttgttt ttgcaacaaa 960
gtagtatact tttgcaccca gaatgttttg ttataactta caaattaggg gtatatttat 1020
agtaaatact aaatggaaga gtaggatatt gattatgaac gagaaaaata taaaacacag 1080
tcaaaacttt attacttcaa aacataatat agataaaata atgacaaata taagattaaa 1140
tgaacatgat aatatctttg aaatcggctc aggaaaaggg cattttaccc ttgaattagt 1200
acagaggtgt aatttcgtaa ctgccattga aatagaccat aaattatgca aaactacaga 1260
aaataaactt gttgatcacg ataatttcca agttttaaac aaggatatat tgcagtttaa 1320
atttcctaaa aaccaatcct ataaaatatt tggtaatata ccttataaca taagtacgga 1380
tataatacgc aaaattgttt ttgatagtat agctgatgag atttatttaa tcgtggaata 1440
cgggtttgct aaaagattat taaatacaaa acgctcattg gcattatttt taatggcaga 1500
agttgatatt tctatattaa gtatggttcc aagagaatat tttcatccta aacctaaagt 1560
gaatagctca cttatcagat taaatagaaa aaaatcaaga atatcacaca aagataaaca 1620
gaagtataat tatttcgtta tgaaatgggt taacaaagaa tacaagaaaa tatttacaaa 1680
aaatcaattt aacaattcct taaaacatgc aggaattgac gatttaaaca atattagctt 1740
tgaacaattc ttatctcttt tcaatagcta taaattattt aataagatcc cctttacttc 1800
ggatgcatgc cgcaggcagg catccgaagt agtttctcca ttatacaagt attctcttga 1860
gtacgtcgtc gcttctcagc agctgctttg ctttttccct gttttccggc acatggagat 1920
aagtgtatct gttaggctta atagtgtgtg ccatgtcaat tgccttttcg aagtcatctg 1980
ccttcatttt taaggtttcc acaaaattga taaaacccgt atcagtcaga aattttacta 2040
cccgctgata tctgtgttct tgaaccctgc tcataagata ggttgcaatc ccaacctgaa 2100
ttccatgaag ctgaggtgtc tccagcagct tatctaaagc atgagatatt agatgctcac 2160
taccgctggc tggagcactg ctgtctgcta tctgcatggc aattccgctc attgtcagag 2220
agtctaccat ttcctttaaa aagaagtttt ctgtaacctg tgtgtagggc atccttacaa 2280
tactgtttac tgacttttta gcaatcattg cagcaaaatc gtcaaccttt gccgcattgt 2340
tcctttcttc aaaataccag tcatacacag ccgtaatttt ggatattatg tctccgagac 2400
ctgaataaat aaatttcata ggtgcatttt ttaatacatc taaatccact aatattccaa 2460
atggcatcga ggcatgtacg gaagtacgcc tgccatttat aatcaaagag cagcctgagc 2520
tggaaaaacc atcgtttgag gttgatgtag gtatactgat aaaaggaagc ttgtttaaaa 2580
aagctatata tttggctgca tcaagcacct ttcctcctcc tactccgacc actgcatcgg 2640
ttttggaggg aatagtaaaa gccttgagca taagattttc aagctttatg tcatcatagt 2700
cgtaagtttc aagtactgca agagattttc ttgactttat ggaatccaga atcttttcac 2760
caaataagtc acgtattccc tctccaaaaa gtactacaac attactaatt cctgcccttt 2820
caatatgtgc 2830
<210> 25
<211> 572
<212> DNA
<213> Clostridium thermocellum
<400> 25
ccaaggtgac aaacgataac ttttgagtta tttacatcta agccagcaag cgtggttgct 60
cttttagaaa catagctgtg acttgttccg tggaaaccat atcttcttac cttatattta 120
tcatagtact caaatggaat accataaagg taagcttctt ttggcattgt ctgatggaat 180
gcagtatcaa aaacagctac cattggtaca tttggcataa ttgatttaca agcgttgata 240
ccaataaggt ttgctgggtt gtgtaaaggt gcaagatcat tacactcttc aattgcattt 300
aagacttcat cattgattac tacggaatga gcaaatttct caccaccatg tactactcta 360
tgtccaacag cgttgatttc atctaaggac ttaatcacac cataattttc attcataaga 420
gcagcgatta catttttaat agcaacctca tggtttggaa gtgcatcctc aagaactacc 480
ttctcaccgt cagctgactt gtgagtaaga cggccatcaa taccgattct ttcacaaaga 540
cctactgcta atgcttgctc tgtcacagag tc 572
<210> 26
<211> 2676
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 26
ctgagtgcaa tgtaaaaaag gatgcctcaa gtattcttga aacatcctta tattatacta 60
caaaatcata aagtaaatta ctcagctgta gcaatgatct cttttttgtt gtaagatcca 120
caagctttac aaactctatg aggcatcata agtgcaccac acttgctgca tttcactaag 180
tttggagcag tcatcttcca gtttgcacga cgactatctc ttctagcttt ggaatgttta 240
ttctttggac aaatagctcc cattgattac acctccttaa acttgttaaa aatatctcgg 300
atagcagaca ttcttgggtc tagttctgta cggtcacacc cgcactctcc ttcatttagg 360
ttagcaccgc agaccttgca gattccttta cagtcttctt tgcacagaac cttcattggg 420
aaaccaatca agacttcttc atagataagt ttatctacgt ctaaatcata tccggaaaca 480
aaatttgttt catctaaatc ctcggtacgc tgttcctctg ttttcgatac atcaatctct 540
gtagccacgt cgatgtcttg ttggatggtt tcttccttca aacaacgatc gcaaggaacg 600
gctaacgcta atttcgtttt tgcttccacc agaatttttc ggccacctag attagttaat 660
ctaagtttaa ccggttcttt ataggtaata gaataaccga caccatttaa ttcgaatata 720
tcaaattcaa tcggtgcagt gtattctttg agaccattag gaacattcat gacttcagac 780
atttgtatca gcataagtaa ctcctgtcta aaaaaacgca taatgtaagc gcccaaaaat 840
tcacactgtt agtattataa acgcttaaaa taggtttgtc aactcctaac tgttaaaaat 900
gtcagaattg tgtaaccata ttttctcttc attatcgttc ttcccttatt aaataattta 960
tagctattga aaagagataa gaattgttca aagctaatat tgtttaaatc gtcaattcct 1020
gcatgtttta aggaattgtt aaattgattt tttgtaaata ttttcttgta ttctttgtta 1080
acccatttca taacgaaata attatacttc tgtttatctt tgtgtgatat tcttgatttt 1140
tttctattta atctgataag tgagctattc actttaggtt taggatgaaa atattctctt 1200
ggaaccatac ttaatataga aatatcaact tctgccatta aaaataatgc caatgagcgt 1260
tttgtattta ataatctttt agcaaacccg tattccacga ttaaataaat ctcatcagct 1320
atactatcaa aaacaatttt gcgtattata tccgtactta tgttataagg tatattacca 1380
aatattttat aggattggtt tttaggaaat ttaaactgca atatatcctt gtttaaaact 1440
tggaaattat cgtgatcaac aagtttattt tctgtagttt tgcataattt atggtctatt 1500
tcaatggcag ttacgaaatt acacctctgt actaattcaa gggtaaaatg cccttttcct 1560
gagccgattt caaagatatt atcatgttca tttaatctta tatttgtcat tattttatct 1620
atattatgtt ttgaagtaat aaagttttga ctgtgtttta tatttttctc gttcattgta 1680
tttctcctta taatgttctt aaattcattt atcacggggc aacttaatat atccgaaata 1740
tagttcttct atatcgttcc cccagtataa tgattattat actatttaat cttcaactta 1800
acaattggag tttccagtta agaaataata atttaatgcc aaagcggata ttcgcaatcc 1860
gcttacgcta cttgctcata acctcaacag gcaatgaagc taagttaatt atttactctg 1920
tgcctgaaca gcagtgattg caacaacacc aacgatatca tcagaagaac aacctcttga 1980
taaatcattt actggagctg caataccctg agttaatggt ccataagctt ctgcctttgc 2040
aagacgctgt gttaacttat atccaatgtt accagcatca aggtctggga agattaatac 2100
gttagctttt ccagcaatat cactaccagg agcttttgaa gcacctacac taggaacgat 2160
tgctgcatct aactggaact cgccgtcgat cttatattct gggtataatt catttgcaat 2220
cttagttgct tctacaacct tatcaacatc tgcatgcttt gcgcttccct ttgttgaatg 2280
agaaagcata gctacgatag gttcagagcc aactaattgt tcaaaactct tcgctgtgga 2340
accagcgatt gctgctaact cttcagcatt tggattctga tttaaaccag catcagagaa 2400
aaggaaagtt ccatttgcgc ccatatcaca attaggtact accattacga agaaagcaga 2460
aactaactta gtatttggag cagtttttaa aatctgaaga catggtctta aggtatctgc 2520
tgtagagtga caagcaccag atactaaacc atctgcatcg cccatcttaa ccatcattac 2580
accgtatgta atgtagtctg ttgttaaaag ctcttttgct ttttcagggg tcatgccttt 2640
tgcctgtcta agttctacaa gcttgttaat gtaagc 2676
<210> 27
<211> 978
<212> DNA
<213> Clostridium thermocellum
<400> 27
atggcgatta caataaaccg aagtaaagtt attgttgtgg gtgcaggttt agttggtact 60
tcaacggcgt ttagtctaat tacgcaaagt gtttgtgatg aggttatgtt gatagatatc 120
aatcgtgcta aggcgcatgg ggaagtaatg gatttgtgtc atagtatcga gtatttaaat 180
cgaaatgttt tggtaacgga aggagattat acagactgta aggacgctga tattgttgta 240
ataactgcag ggcctccgcc aaaaccagga cagtcgcggc ttgatactct tgggttatcc 300
gcagatattg tgagcacgat tgtggaacct gtcatgaaga gtgggttcaa tggaatattc 360
ttagtcgtga cgaatccggt ggattcgatt gctcaatatg tttatcaatt atcggggctt 420
ccaaagcaac aagttcttgg aactggaaca gcgattgact ctgcaagatt aaaacacttt 480
attggagata ttttacatgt agatcctaga agcatacagg cttatacgat gggagagcat 540
ggagattctc aaatgtgtcc ttggtcgctt gttacggttg gcggtaaaaa tattatggac 600
atcgtacggg ataacaaaga gtattccgat attgacttta atgaaatctt atataaggtt 660
accagggtag gttttgatat tttatcagtg aagggtacta cttgttatgg aatagcgtca 720
gcagctgtgg ggattataaa agcaattctt tatgatgaga attccatcct tccggtctct 780
accttattgg agggggaata tggtgagttt gatgtatatg caggggtacc atgcattcta 840
aatcgtttcg gcgtgaagga tgtagtggaa gtaaatatga cagaagtaga gttaaatcaa 900
ttccgagcct ctgttcacgt tgtgagggaa gctattgaaa acttaaaaga cagagataaa 960
aaggcattat ttttataa 978
<210> 28
<211> 960
<212> DNA
<213> Clostridium thermocellum
<400> 28
ttatgatagc gtcaatgcat actgaaaatt ttctttcatt gttctacaag aagcatcgaa 60
ttttcccttt tcttcaggtg tcaaatttag ctcaatgatt tcttctacac catgaattcc 120
aagtaccgta ggaacagatg catagacatc atgctggcca tactcaccat ttaagagagt 180
agatactggt aataccttct tctcatctga gaaaatggct cgtgtaacct cagctagtga 240
tgcaccaata ccaaattccg ttgagccttt tccagttagg atatgccatc cccctgctct 300
agcttcatca gaaagcttag aaagatcaat ctgcccatat ttttcaggtt tttccttgat 360
tagttccaaa attggttttc cagctataga taccgttgac catgcaacca tctggctttc 420
tccgtgttct ccaagaacaa atccatagat tgatttttga tcaatttcaa cagcatctgc 480
aattgctctt ctaagtctgg cagagtctag taccgtactt gttgaaataa ttttattgga 540
tgagtactga agtaaatgct gtaaataatg tgttattaca tctgctggat ttgaaatgct 600
aacaatcata ccatcaaaac ctgaattttt gatatgccaa gctacctctt taataattag 660
agcagtattc gtaagggtac tcattcttgt ttcaccctta tttttatctg gattggttcc 720
tactgcaatc accatgagat ctgcatcagc tgcatcacta taatcacccg attttacctt 780
aactctgtgt ggtaggtata ctgtagcatc gtagatatcc agtgcttgtg ctttcgcttt 840
ttctctatca atatcaataa agataatttc ttctgcaagc ccctgctctg ccagtgcata 900
tccagcatga gatcctacgt gacctgctcc gataataatg acttttcttg gttttgccat 960
<210> 29
<211> 2732
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 29
tggaatctca ctatgcacca atgtggtact aaattatatc tttatctatg gaaaattagg 60
ttttccgcga atggagatag agggagctgc cattgctact ttaatttgta gaattcttga 120
gagtatttta gttgttattt atatgtataa gggtgagaag gtacttaaga tgagactttc 180
ttatattttt aagagatcta aacagtattt tcgctctttg gctcgttata gtgcgccagt 240
gcttatgagt gaggttaact gggggcttgg gattgctgtt cagtctgcaa tcattgggcg 300
tatgggtgtt agttttctta cagccgccag cttcattaat gtagtacaac agttagccgg 360
aatcattctg attggtattg gtgtgggttc gagcattata atagggaatt tgattggtga 420
gggaaaagag catgaggcga gaatgctagc caataagtta atacgtatca gtatgatact 480
cggaggaatt gttgcttttg cagtaatctt actacgtcca atcgctccta actttattga 540
ggcgtctaag gaaacagcgg atttaattcg tcagatgcta tttgtttcgg cttacctctt 600
attcttccaa gccttatctg tattaactat ggccggaata ttacgtggtg caggggatac 660
cctttactgt gcaacctttg atgttttgac cttatgggta ctaaaacttg gaggaggttt 720
gcttgcaacc atagtacttc atcttccacc tgtatgggtt tactttatct taagtagcga 780
tgagtgtgtt aaagcgctat ttacggtacc gcgggtctta aagggacgtt ggattcatga 840
tacaacactg cattaagatt tcatatgtcc agatattttt gcacagtagc ataattacta 900
gagcttattc ctataatatt cataggtttt gatggtccat tttacgttac gatagcatat 960
attacatcaa aaccaattct atataagatg aggttatagt atgaacgaga aaaatataaa 1020
acacagtcaa aactttatta cttcaaaaca taatatagat aaaataatga caaatataag 1080
attaaatgaa catgataata tctttgaaat cggctcagga aaagggcatt ttacccttga 1140
attagtacag aggtgtaatt tcgtaactgc cattgaaata gaccataaat tatgcaaaac 1200
tacagaaaat aaacttgttg atcacgataa tttccaagtt ttaaacaagg atatattgca 1260
gtttaaattt cctaaaaacc aatcctataa aatatttggt aatatacctt ataacataag 1320
tacggatata atacgcaaaa ttgtttttga tagtatagct gatgagattt atttaatcgt 1380
ggaatacggg tttgctaaaa gattattaaa tacaaaacgc tcattggcat tatttttaat 1440
ggcagaagtt gatatttcta tattaagtat ggttccaaga gaatattttc atcctaaacc 1500
taaagtgaat agctcactta tcagattaaa tagaaaaaaa tcaagaatat cacacaaaga 1560
taaacagaag tataattatt tcgttatgaa atgggttaac aaagaataca agaaaatatt 1620
tacaaaaaat caatttaaca attccttaaa acatgcagga attgacgatt taaacaatat 1680
tagctttgaa caattcttat ctcttttcaa tagctataaa ttatttaata agaagtaata 1740
ggaaataata ctcgaattat tctgcaatct gttctaaaaa ataaaattaa gaaattacta 1800
tagcaagcca ggttaaaatt actagcttgc tatttttgtg catttagtac agttttgatt 1860
attaaagaat aaatttaata actattttgc aataagttat tgactatttc acaagttagt 1920
gttactatac aagtatgaaa taaagataca taaaaaaata aataatatga aacataaatt 1980
catgacatgc ggaatagaat gaaagaatat tatgtcggtt cctaatacta aatggatata 2040
acaatctatt gaaacactta tggggtgtaa gtgtggagag aatttctaaa gcgccaaaag 2100
actctacata tgaaattcta aagcttcaca cgggaataat ctaatttatg tatcttatta 2160
tcataattca ggaaggtagt gtgaaaatat aaaaattagt tttcctgttt cattcaggca 2220
gtagcatttc ttaaacaaat ttgctatgca ttgggtgtta tctgaaaaac aaaaagcaat 2280
tttctcacaa cttatttctg aacaacaatg gtattaaaaa tttggaggag gattttacta 2340
tgaaaaaaac ggtaacatta ctgttggttc tgaccatggt ggtaagctta tttgcagcat 2400
gtggtaagaa aaatggatca agcgaaaccg gcacaaaaga tcctgtggca acaagcggtg 2460
caaaagaacc tgacaaacaa gatccaggca ataaagagcc tgaaaaacaa gaccctgtta 2520
aaatcaagat ttattactct gataatgcaa ccttaccatt taaagaagat tggttagtta 2580
taaaggaagc tgagaagaga tttaatgttg atttcgattt cgaagtaatt ccaattgcag 2640
attatcaaac aaaagtttct ttaacattaa atacaggaaa taacgctcca gatgtcatcc 2700
tttatcagtc aacgcaggga gagaatgcat ct 2732
<210> 30
<211> 10665
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (1522)..(1522)
<223> a, c, g or t
<400> 30
gaattcgagc tcggtacccg gggatcctct agagtcgacc tgcaggcatg caagcttggc 60
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 120
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgcgta 180
gaggatcgag atctcgatcc cgcgaaatta atacgactca ctatagggga attgtgagcg 240
gataacaatt cccctctagg ctcataactt cacgctcctg tatatatttt tatttattta 300
aaaatgagtc aaaatttagg aaatgattgc aatatgtata atatccaaat ttccattcaa 360
ataaccaaag taattttacc tctttttatg agctatttca atactttgtt agtaaattaa 420
catatatgag ctgtatatgg tttaatgaaa aaagttattt tgaagggata ttgtaaaaaa 480
cataatatat tatatggata aattttacat ttgacttatc atatgttaat atatgtaata 540
tgaatagcta atctaagcag gctactgcct agaaaaaagc ttataattat ccttaatttc 600
ctactacgtg cgcccagata gggtgttaag tcaagtagtt taaggtacta ctctgtaaga 660
taacacagaa aacagccaac ctaaccgaaa agcgaaagct gatacgggaa cagagcacgg 720
ttggaaagcg atgagttacc taaagacaat cgggtacgac tgagtcgcaa tgttaatcag 780
atataaggta taagttgtgt ttactgaacg caagtttcta atttcggttg aaatccgata 840
gaggaaagtg tctgaaacct ctagtacaaa gaaaggtaag ttacagtagt agacttatct 900
gttatcacca catttgtaca atctgtagga gaacctatgg gaacgaaacg aaagcgatgc 960
cgagaatctg aatttaccaa gacttaacac taactgggga taccctaaac aagaatgcct 1020
aatagaaagg aggaaaaagg ctatagcact agagcttgaa aatcttgcaa gggtacggag 1080
tactcgtagt agtctgagaa gggtaacgcc ctttacatgg caaaggggta cagttattgt 1140
gtactaaaat taaaaattga ttagggagga aaacctcaaa atgaaaccaa caatggcaat 1200
tttagaaaga atcagtaaaa attcacaaga aaatatagac gaagttttta caagacttta 1260
tcgttatctt ttacgtccag atatttatta cgtggcgacg cgttgggaaa tggcaatgat 1320
agcgaaacaa cgtaaaactc ttgttgtatg ctttcattgt catcgtcacg tgattcataa 1380
acacaagtga atgtcgacag tgaattttta cgaacgaaca ataacagagc cgtatactcc 1440
gagaggggta cgtacggttc ccgaagaggg tggtgcaaac cagtcacagt aatgtgaaca 1500
aggcggtacc tccctacttc ancatatcat tttctgcagc cccctagaaa taattttgtt 1560
taactttaag aaggagatat acatatatgg ctagatcgtc cattccgaca gcatcgccag 1620
tcactatggc gtgctgctag cgctatatgc gttgatgcaa tttctatgca ctcgtagtag 1680
tctgagaagg gtaacgccct ttacatggca aaggggtaca gttattgtgt actaaaatta 1740
aaaattgatt agggaggaaa acctcaaaat gaaaccaaca atggcaattt tagaaagaat 1800
cagtaaaaat tcacaagaaa atatagacga agtttttaca agactttatc gttatctttt 1860
acgtccagat atttattacg tggcgtatca aaatttatat tccaataaag gagcttccac 1920
aaaaggaata ttagatgata cagcggatgg ctttagtgaa gaaaaaataa aaaagattat 1980
tcaatcttta aaagacggaa cttactatcc tcaacctgta cgaagaatgt atattgcaaa 2040
aaagaattct aaaaagatga gacctttagg aattccaact ttcacagata aattgatcca 2100
agaagctgtg agaataattc ttgaatctat ctatgaaccg gtattcgaag atgtgtctca 2160
cggttttaga cctcaacgaa gctgtcacac agctttgaaa acaatcaaaa gagagtttgg 2220
cggcgcaaga tggtttgtgg agggagatat aaaaggctgc ttcgataata tagaccacgt 2280
tacactcatt ggactcatca atcttaaaat caaagatatg aaaatgagcc aattgattta 2340
taaatttcta aaagcaggtt atctggaaaa ctggcagtat cacaaaactt acagcggaac 2400
acctcaaggt ggaattctat ctcctctttt ggccaacatc tatcttcatg aattggataa 2460
gtttgtttta caactcaaaa tgaagtttga ccgagaaagt ccagaaagaa taacacctga 2520
atatcgggag ctccacaatg agataaaaag aatttctcac cgtctcaaga agttggaggg 2580
tgaagaaaaa gctaaagttc ttttagaata tcaagaaaaa cgtaaaagat tacccacact 2640
cccctgtacc tcacagacaa ataaagtatt gaaatacgtc cggtatgcgg acgacttcat 2700
tatctctgtt aaaggaagca aagaggactg tcaatggata aaagaacaat taaaactttt 2760
tattcataac aagctaaaaa tggaattgag tgaagaaaaa acactcatca cacatagcag 2820
tcaacccgct cgttttctgg gatatgatat acgagtaagg agatctggaa cgataaaacg 2880
atctggtaaa gtcaaaaaga gaacactcaa tgggagtgta gaactcctta ttcctcttca 2940
agacaaaatt cgtcaattta tttttgacaa gaaaatagct atccaaaaga aagatagctc 3000
atggtttcca gttcacagga aatatcttat tcgttcaaca gacttagaaa tcatcacaat 3060
ttataattct gaactccgcg ggatttgtaa ttactacggt ctagcaagta attttaacca 3120
gctcaattat tttgcttatc ttatggaata cagctgtcta aaaacgatag cctccaaaca 3180
taagggaaca ctttcaaaaa ccatttccat gtttaaagat ggaagtggtt cgtgggggat 3240
cccgtatgag ataaagcaag gtaagcagcg ccgttatttt gcaaatttta gtgaatgtaa 3300
atccccttat caatttacgg atgagataag tcaagctcct gtattgtatg gctatgcccg 3360
gaatactctt gaaaacaggt taaaagctaa atgttgtgaa ttatgtggga cgtctgatga 3420
aaatacttcc tatgaaattc accatgtcaa taaggtcaaa aatcttaaag gcaaagaaaa 3480
atgggaaatg gcaatgatag cgaaacaacg taaaactctt gttgtatgct ttcattgtca 3540
tcgtcacgtg attcataaac acaagtgaga tatctcgagc acccgttctc ggagcactgt 3600
ccgaccgctt tggccgccgc ccagtcctgc tcgcttcgct acttggagcc actatcgact 3660
acgcgatcat ggcgaccaca cccgtcctgt ggatcgccaa gctcgccgat ggtagtgtgg 3720
ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg 3780
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca 3840
aatccgccgg gagcggattt gaacgttgcg aagcaacggc ccggagggtg gcgggcagga 3900
cgcccgccat aaactgccag gcatcaaatt aagcagaagg ccatcctgac ggatggcctt 3960
tttgcgtttc tacaaactct tcctgtcgtc atatctacaa gccatcccgc ccttcccaac 4020
agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt acgcatctgt 4080
gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt 4140
taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 4200
cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 4260
caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg 4320
ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc 4380
gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 4440
aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 4500
tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 4560
aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 4620
aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 4680
tgatgagcac ttttaaatta aaaatgaagt tttaaaactt catttttaat ttaaattaaa 4740
aatgaagttt tatcaaaaaa atttccaata atcccactct aagccacaaa cacgccctat 4800
aaaatcccgc tttaatccca ctttgagaca catgtaatat tactttacgc cctagtatag 4860
tgataatttt ttacattcaa tgccacgcaa aaaaataaag gggcactata ataaaagttc 4920
cttcggaact aactaaagta aaaaattatc tttacaacct ccccaaaaaa aagaacaggt 4980
acaaagtacc ctataataca agcgtaaaaa aatgagggta aaaataaaaa aataaaaaaa 5040
taaaaaaata aaaaaataaa aaaaataaaa aaataaaaaa ataaaaaaat aaaaaaataa 5100
aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa aaaaatataa aaataaaaaa 5160
atataaaaat aaaaaaatat aaaaataaaa aaataaaaaa atataaaaat aaaaaaataa 5220
aaaaatataa aaatattttt tatttaaagt ttgaaaaaaa tttttttata ttatataatc 5280
tttgaagaaa agaatataaa aaatgagcct ttataaaagc ccattttttt tcatatacgt 5340
aatatgacgt tctaatgttt ttattggtac ttctaacatt agagtaattt ctttattttt 5400
aaagcctttt tctttaaggg cttttatttt ttttcttaat acatttaatt cctctttttt 5460
tgttgctttt cctttagctt ttaattgctc ttgataattt tttttacctc taatattttc 5520
tcttctctta tattcctttt tagaaattat tattgtcata tatttttgtt cttcttctgt 5580
aatttctaat aactctataa gagtttcatt cttatactta tattgcttat ttttatctaa 5640
ataacatctt tcagcacttc tagttgctct tataacttct ctttcactta aatgttgtct 5700
aaacatacta ttaagttcta aaacatcatt taatgccttc tcaatgtctt ctgtaaagct 5760
acaaagataa tatctatata aaaataatat aagctctctg tgtcctttta aatcatattc 5820
tcttagttca caaagtttta ttatgtcttg tattcttcca taatataaac ttctttctct 5880
ataaatataa tttattttgc ttggtctacc ctttttcctt tcatatggtt ttaattcagg 5940
taaaaatcca ttttgtattt ctcttaagtc ataaatatat tcgtactcat ctaatatatt 6000
gactactgtt tttgatttag agtttatact tcctggaact cttaatattc tggttgcatc 6060
taaggcttgt ctatctgctc caaagtattt taattgatta tataaatatt cttgaaccgc 6120
tttccataat ggtaatgctt tactaggtac tgcatttatt atccatatta aatacattcc 6180
tcttccacta tctattacat agtttggtat aggaatactt tgattaaaat aattcttttc 6240
taagtccatt aatacctggt ctttagtttt gccagtttta taataatcca agtctataaa 6300
cagtgtattt aactctttta tattttctaa tcgcctacac ggcttataaa aggtatttag 6360
agttatatag atattttcat cactcatatc taaatctttt aattcagcgt atttatagtg 6420
ccattggcta tatccttttt tatctataac gctcctggtt atccaccctt tacttctact 6480
atgaatatta tctatatagt tctttttatt cagctttaat gcgtttctca cttattcacc 6540
tccccttctg taaaactaag aaaattatat catattttca ataattatta actattctta 6600
aactcttaat aaaaaataga gtaagtcccc aattgaaact taatctattt tttatgtttt 6660
aatttattat ttttattaaa atattttaaa ctaaattaaa tgattctttt taatttttta 6720
ctatttcatt ccataatata ttactataat tatttacaaa taatatttct tcatttgtaa 6780
tatttagatg atttactaat tttagttttt atatattaaa taattaatgt ataatttata 6840
taaaaaatca aaggagctta taaattatga ttatttccaa agatactaaa gatttaattt 6900
tttcaatttt aacaatactt tttgtaatat tatgtttaaa tttaattgta tttttttcat 6960
ataataaagc cgttgaagta aaccaatcca ttttccttat gatgttatta ttaaatttaa 7020
gttttataat aatatcttta ttatatttat tgtttttaaa aaaactagtg aaatttccgg 7080
ctttattaaa cttattttta ggaattttat tttcattttc atctttacag gatttgatta 7140
tatctttaaa tatgttttat caaatattat ctttttctaa atttatatat atttttatta 7200
tatttattat tatatatatt ttatttttaa gtttctttct aacagctatt aaaaagaaac 7260
ttaaaaataa aaacacgtac tctaaaccaa taaataaaac tatttttatt attgctgcct 7320
tgattggaat agtttttagt aaaattaatt tcaatattcc acaatattat attataagct 7380
agctttgcat tgtacttttc aatcgcttca cgaatgcggt tatctccgaa agataaagtc 7440
ttttcatctt ccttgatgaa gataagattt tctccgtctc cgccggcaga attgaagcgg 7500
ggtactacgg tatcgtctgc gtcatcttcc gttgtctgat agatgatagt cataggctca 7560
ttttcttccg tttcggtaaa ggggataggt tcgccctttg agagcagggc ggcgatggaa 7620
agcattaact tgcttttccc atcgcccgga tctccctgca atagcgtaac tttgccaaac 7680
ggaatatacg gataccacag ccactttact tctttcggct cgatttcact tgccttgatg 7740
atttcaagag gtacgctgaa attcatttcg ttttcattta gtttcatttt ttcttgttct 7800
ccttttctct gaaaatataa aaaccacaga ttgatactaa aaccttggtt gtgttgcttt 7860
tcggggctta aatcaaggaa aaatccttgt tttaagcctt tcaaaaagaa acacaaggtc 7920
tttgtactaa cctgtggtta tgtataaaat tgtagatttt agggtaacaa aaaacaccgt 7980
atttctacga tgtttttgct taaatacttg tttttagtta cagacaaacc tgaagttgaa 8040
ttcatattta ttaaattaag cgtatatact attgaaaatg tttttgaaat attataaaat 8100
taactttggt ttaggaaaag taaccagttc ttttgtcgat aagcattaat ttgcttgact 8160
aattaataaa aaacttagga ggtaacacta atggtattcg agaaaattga caagaacagt 8220
tggaacagaa aagaatactt tgatcactat tttgctagtg taccttgcac atacagtatg 8280
actgtaaagg ttgatataac acagattaaa gagaagggaa tgaaattgta ccctgcaatg 8340
ctttattaca tagcaatgat agtaaacaga catagtgaat ttaggaccgc tatcaatcag 8400
gatggtgaac ttggaattta tgatgaaatg attccatcat atactatatt ccataatgac 8460
accgagacat tctcaagtct ttggactgaa tgcaagtcag attttaagtc atttcttgca 8520
gattatgaat ctgatactca aagatacggt aataatcacc gtatggaagg aaaacctaat 8580
gcacctgaga atattttcaa tgtttccatg ataccttggt caacatttga cggatttaat 8640
ctgaatctgc aaaaaggcta cgattactta atccctatct ttacaatggg caagtattat 8700
aaggaagaca ataaaatcat ccttcccctt gcaatccagg tacatcatgc agtatgtgat 8760
ggatttcata tttgtcgttt tgtaaatgaa ctgcaagaat taataaattc ctaactcgag 8820
ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa acgataaaac 8880
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 8940
tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag 9000
ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc 9060
tgacggatgg ccttttttat tgtaaattcc ggtaaccctt gtagcttagt gggaatttgt 9120
accccttatc gatacaaatt ccccgtaggc gctagggaca ctttttcact cgttaaaaag 9180
ttttgagaat attttatatt tttgttcatg taatcactcc ttcttaatta caaattttta 9240
gcatctaatt taacttcaat tcctattata caaaatttta agatactgca ctatcaacac 9300
actcttaagt ttgcttctaa gtcttatttc cataacttct tttacgtttc cgggtacaat 9360
tcgtaatcat gtcatagctg tttcctgtgt gaaattctta tccgctcaca attccacaca 9420
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 9480
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagaaaa 9540
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 9600
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 9660
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 9720
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 9780
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 9840
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 9900
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 9960
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 10020
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 10080
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 10140
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 10200
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 10260
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 10320
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 10380
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 10440
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 10500
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 10560
cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 10620
agcggataac aatttcacac aggaaacagc tatgaccatg attac 10665
<210> 31
<211> 10665
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (1522)..(1522)
<223> a, c, g or t
<400> 31
gaattcgagc tcggtacccg gggatcctct agagtcgacc tgcaggcatg caagcttggc 60
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 120
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgcgta 180
gaggatcgag atctcgatcc cgcgaaatta atacgactca ctatagggga attgtgagcg 240
gataacaatt cccctctagg ctcataactt cacgctcctg tatatatttt tatttattta 300
aaaatgagtc aaaatttagg aaatgattgc aatatgtata atatccaaat ttccattcaa 360
ataaccaaag taattttacc tctttttatg agctatttca atactttgtt agtaaattaa 420
catatatgag ctgtatatgg tttaatgaaa aaagttattt tgaagggata ttgtaaaaaa 480
cataatatat tatatggata aattttacat ttgacttatc atatgttaat atatgtaata 540
tgaatagcta atctaagcag gctactgcct agaaaaaagc ttataattat ccttagctct 600
cttcaatgtg cgcccagata gggtgttaag tcaagtagtt taaggtacta ctctgtaaga 660
taacacagaa aacagccaac ctaaccgaaa agcgaaagct gatacgggaa cagagcacgg 720
ttggaaagcg atgagttacc taaagacaat cgggtacgac tgagtcgcaa tgttaatcag 780
atataaggta taagttgtgt ttactgaacg caagtttcta atttcgatta gagctcgata 840
gaggaaagtg tctgaaacct ctagtacaaa gaaaggtaag ttatcattga agacttatct 900
gttatcacca catttgtaca atctgtagga gaacctatgg gaacgaaacg aaagcgatgc 960
cgagaatctg aatttaccaa gacttaacac taactgggga taccctaaac aagaatgcct 1020
aatagaaagg aggaaaaagg ctatagcact agagcttgaa aatcttgcaa gggtacggag 1080
tactcgtagt agtctgagaa gggtaacgcc ctttacatgg caaaggggta cagttattgt 1140
gtactaaaat taaaaattga ttagggagga aaacctcaaa atgaaaccaa caatggcaat 1200
tttagaaaga atcagtaaaa attcacaaga aaatatagac gaagttttta caagacttta 1260
tcgttatctt ttacgtccag atatttatta cgtggcgacg cgttgggaaa tggcaatgat 1320
agcgaaacaa cgtaaaactc ttgttgtatg ctttcattgt catcgtcacg tgattcataa 1380
acacaagtga atgtcgacag tgaattttta cgaacgaaca ataacagagc cgtatactcc 1440
gagaggggta cgtacggttc ccgaagaggg tggtgcaaac cagtcacagt aatgtgaaca 1500
aggcggtacc tccctacttc ancatatcat tttctgcagc cccctagaaa taattttgtt 1560
taactttaag aaggagatat acatatatgg ctagatcgtc cattccgaca gcatcgccag 1620
tcactatggc gtgctgctag cgctatatgc gttgatgcaa tttctatgca ctcgtagtag 1680
tctgagaagg gtaacgccct ttacatggca aaggggtaca gttattgtgt actaaaatta 1740
aaaattgatt agggaggaaa acctcaaaat gaaaccaaca atggcaattt tagaaagaat 1800
cagtaaaaat tcacaagaaa atatagacga agtttttaca agactttatc gttatctttt 1860
acgtccagat atttattacg tggcgtatca aaatttatat tccaataaag gagcttccac 1920
aaaaggaata ttagatgata cagcggatgg ctttagtgaa gaaaaaataa aaaagattat 1980
tcaatcttta aaagacggaa cttactatcc tcaacctgta cgaagaatgt atattgcaaa 2040
aaagaattct aaaaagatga gacctttagg aattccaact ttcacagata aattgatcca 2100
agaagctgtg agaataattc ttgaatctat ctatgaaccg gtattcgaag atgtgtctca 2160
cggttttaga cctcaacgaa gctgtcacac agctttgaaa acaatcaaaa gagagtttgg 2220
cggcgcaaga tggtttgtgg agggagatat aaaaggctgc ttcgataata tagaccacgt 2280
tacactcatt ggactcatca atcttaaaat caaagatatg aaaatgagcc aattgattta 2340
taaatttcta aaagcaggtt atctggaaaa ctggcagtat cacaaaactt acagcggaac 2400
acctcaaggt ggaattctat ctcctctttt ggccaacatc tatcttcatg aattggataa 2460
gtttgtttta caactcaaaa tgaagtttga ccgagaaagt ccagaaagaa taacacctga 2520
atatcgggag ctccacaatg agataaaaag aatttctcac cgtctcaaga agttggaggg 2580
tgaagaaaaa gctaaagttc ttttagaata tcaagaaaaa cgtaaaagat tacccacact 2640
cccctgtacc tcacagacaa ataaagtatt gaaatacgtc cggtatgcgg acgacttcat 2700
tatctctgtt aaaggaagca aagaggactg tcaatggata aaagaacaat taaaactttt 2760
tattcataac aagctaaaaa tggaattgag tgaagaaaaa acactcatca cacatagcag 2820
tcaacccgct cgttttctgg gatatgatat acgagtaagg agatctggaa cgataaaacg 2880
atctggtaaa gtcaaaaaga gaacactcaa tgggagtgta gaactcctta ttcctcttca 2940
agacaaaatt cgtcaattta tttttgacaa gaaaatagct atccaaaaga aagatagctc 3000
atggtttcca gttcacagga aatatcttat tcgttcaaca gacttagaaa tcatcacaat 3060
ttataattct gaactccgcg ggatttgtaa ttactacggt ctagcaagta attttaacca 3120
gctcaattat tttgcttatc ttatggaata cagctgtcta aaaacgatag cctccaaaca 3180
taagggaaca ctttcaaaaa ccatttccat gtttaaagat ggaagtggtt cgtgggggat 3240
cccgtatgag ataaagcaag gtaagcagcg ccgttatttt gcaaatttta gtgaatgtaa 3300
atccccttat caatttacgg atgagataag tcaagctcct gtattgtatg gctatgcccg 3360
gaatactctt gaaaacaggt taaaagctaa atgttgtgaa ttatgtggga cgtctgatga 3420
aaatacttcc tatgaaattc accatgtcaa taaggtcaaa aatcttaaag gcaaagaaaa 3480
atgggaaatg gcaatgatag cgaaacaacg taaaactctt gttgtatgct ttcattgtca 3540
tcgtcacgtg attcataaac acaagtgaga tatctcgagc acccgttctc ggagcactgt 3600
ccgaccgctt tggccgccgc ccagtcctgc tcgcttcgct acttggagcc actatcgact 3660
acgcgatcat ggcgaccaca cccgtcctgt ggatcgccaa gctcgccgat ggtagtgtgg 3720
ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg 3780
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca 3840
aatccgccgg gagcggattt gaacgttgcg aagcaacggc ccggagggtg gcgggcagga 3900
cgcccgccat aaactgccag gcatcaaatt aagcagaagg ccatcctgac ggatggcctt 3960
tttgcgtttc tacaaactct tcctgtcgtc atatctacaa gccatcccgc ccttcccaac 4020
agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt acgcatctgt 4080
gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt 4140
taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 4200
cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 4260
caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg 4320
ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc 4380
gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 4440
aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 4500
tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 4560
aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 4620
aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 4680
tgatgagcac ttttaaatta aaaatgaagt tttaaaactt catttttaat ttaaattaaa 4740
aatgaagttt tatcaaaaaa atttccaata atcccactct aagccacaaa cacgccctat 4800
aaaatcccgc tttaatccca ctttgagaca catgtaatat tactttacgc cctagtatag 4860
tgataatttt ttacattcaa tgccacgcaa aaaaataaag gggcactata ataaaagttc 4920
cttcggaact aactaaagta aaaaattatc tttacaacct ccccaaaaaa aagaacaggt 4980
acaaagtacc ctataataca agcgtaaaaa aatgagggta aaaataaaaa aataaaaaaa 5040
taaaaaaata aaaaaataaa aaaaataaaa aaataaaaaa ataaaaaaat aaaaaaataa 5100
aaaaataaaa aaataaaaaa ataaaaaaat ataaaaataa aaaaatataa aaataaaaaa 5160
atataaaaat aaaaaaatat aaaaataaaa aaataaaaaa atataaaaat aaaaaaataa 5220
aaaaatataa aaatattttt tatttaaagt ttgaaaaaaa tttttttata ttatataatc 5280
tttgaagaaa agaatataaa aaatgagcct ttataaaagc ccattttttt tcatatacgt 5340
aatatgacgt tctaatgttt ttattggtac ttctaacatt agagtaattt ctttattttt 5400
aaagcctttt tctttaaggg cttttatttt ttttcttaat acatttaatt cctctttttt 5460
tgttgctttt cctttagctt ttaattgctc ttgataattt tttttacctc taatattttc 5520
tcttctctta tattcctttt tagaaattat tattgtcata tatttttgtt cttcttctgt 5580
aatttctaat aactctataa gagtttcatt cttatactta tattgcttat ttttatctaa 5640
ataacatctt tcagcacttc tagttgctct tataacttct ctttcactta aatgttgtct 5700
aaacatacta ttaagttcta aaacatcatt taatgccttc tcaatgtctt ctgtaaagct 5760
acaaagataa tatctatata aaaataatat aagctctctg tgtcctttta aatcatattc 5820
tcttagttca caaagtttta ttatgtcttg tattcttcca taatataaac ttctttctct 5880
ataaatataa tttattttgc ttggtctacc ctttttcctt tcatatggtt ttaattcagg 5940
taaaaatcca ttttgtattt ctcttaagtc ataaatatat tcgtactcat ctaatatatt 6000
gactactgtt tttgatttag agtttatact tcctggaact cttaatattc tggttgcatc 6060
taaggcttgt ctatctgctc caaagtattt taattgatta tataaatatt cttgaaccgc 6120
tttccataat ggtaatgctt tactaggtac tgcatttatt atccatatta aatacattcc 6180
tcttccacta tctattacat agtttggtat aggaatactt tgattaaaat aattcttttc 6240
taagtccatt aatacctggt ctttagtttt gccagtttta taataatcca agtctataaa 6300
cagtgtattt aactctttta tattttctaa tcgcctacac ggcttataaa aggtatttag 6360
agttatatag atattttcat cactcatatc taaatctttt aattcagcgt atttatagtg 6420
ccattggcta tatccttttt tatctataac gctcctggtt atccaccctt tacttctact 6480
atgaatatta tctatatagt tctttttatt cagctttaat gcgtttctca cttattcacc 6540
tccccttctg taaaactaag aaaattatat catattttca ataattatta actattctta 6600
aactcttaat aaaaaataga gtaagtcccc aattgaaact taatctattt tttatgtttt 6660
aatttattat ttttattaaa atattttaaa ctaaattaaa tgattctttt taatttttta 6720
ctatttcatt ccataatata ttactataat tatttacaaa taatatttct tcatttgtaa 6780
tatttagatg atttactaat tttagttttt atatattaaa taattaatgt ataatttata 6840
taaaaaatca aaggagctta taaattatga ttatttccaa agatactaaa gatttaattt 6900
tttcaatttt aacaatactt tttgtaatat tatgtttaaa tttaattgta tttttttcat 6960
ataataaagc cgttgaagta aaccaatcca ttttccttat gatgttatta ttaaatttaa 7020
gttttataat aatatcttta ttatatttat tgtttttaaa aaaactagtg aaatttccgg 7080
ctttattaaa cttattttta ggaattttat tttcattttc atctttacag gatttgatta 7140
tatctttaaa tatgttttat caaatattat ctttttctaa atttatatat atttttatta 7200
tatttattat tatatatatt ttatttttaa gtttctttct aacagctatt aaaaagaaac 7260
ttaaaaataa aaacacgtac tctaaaccaa taaataaaac tatttttatt attgctgcct 7320
tgattggaat agtttttagt aaaattaatt tcaatattcc acaatattat attataagct 7380
agctttgcat tgtacttttc aatcgcttca cgaatgcggt tatctccgaa agataaagtc 7440
ttttcatctt ccttgatgaa gataagattt tctccgtctc cgccggcaga attgaagcgg 7500
ggtactacgg tatcgtctgc gtcatcttcc gttgtctgat agatgatagt cataggctca 7560
ttttcttccg tttcggtaaa ggggataggt tcgccctttg agagcagggc ggcgatggaa 7620
agcattaact tgcttttccc atcgcccgga tctccctgca atagcgtaac tttgccaaac 7680
ggaatatacg gataccacag ccactttact tctttcggct cgatttcact tgccttgatg 7740
atttcaagag gtacgctgaa attcatttcg ttttcattta gtttcatttt ttcttgttct 7800
ccttttctct gaaaatataa aaaccacaga ttgatactaa aaccttggtt gtgttgcttt 7860
tcggggctta aatcaaggaa aaatccttgt tttaagcctt tcaaaaagaa acacaaggtc 7920
tttgtactaa cctgtggtta tgtataaaat tgtagatttt agggtaacaa aaaacaccgt 7980
atttctacga tgtttttgct taaatacttg tttttagtta cagacaaacc tgaagttgaa 8040
ttcatattta ttaaattaag cgtatatact attgaaaatg tttttgaaat attataaaat 8100
taactttggt ttaggaaaag taaccagttc ttttgtcgat aagcattaat ttgcttgact 8160
aattaataaa aaacttagga ggtaacacta atggtattcg agaaaattga caagaacagt 8220
tggaacagaa aagaatactt tgatcactat tttgctagtg taccttgcac atacagtatg 8280
actgtaaagg ttgatataac acagattaaa gagaagggaa tgaaattgta ccctgcaatg 8340
ctttattaca tagcaatgat agtaaacaga catagtgaat ttaggaccgc tatcaatcag 8400
gatggtgaac ttggaattta tgatgaaatg attccatcat atactatatt ccataatgac 8460
accgagacat tctcaagtct ttggactgaa tgcaagtcag attttaagtc atttcttgca 8520
gattatgaat ctgatactca aagatacggt aataatcacc gtatggaagg aaaacctaat 8580
gcacctgaga atattttcaa tgtttccatg ataccttggt caacatttga cggatttaat 8640
ctgaatctgc aaaaaggcta cgattactta atccctatct ttacaatggg caagtattat 8700
aaggaagaca ataaaatcat ccttcccctt gcaatccagg tacatcatgc agtatgtgat 8760
ggatttcata tttgtcgttt tgtaaatgaa ctgcaagaat taataaattc ctaactcgag 8820
ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa acgataaaac 8880
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 8940
tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag 9000
ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc 9060
tgacggatgg ccttttttat tgtaaattcc ggtaaccctt gtagcttagt gggaatttgt 9120
accccttatc gatacaaatt ccccgtaggc gctagggaca ctttttcact cgttaaaaag 9180
ttttgagaat attttatatt tttgttcatg taatcactcc ttcttaatta caaattttta 9240
gcatctaatt taacttcaat tcctattata caaaatttta agatactgca ctatcaacac 9300
actcttaagt ttgcttctaa gtcttatttc cataacttct tttacgtttc cgggtacaat 9360
tcgtaatcat gtcatagctg tttcctgtgt gaaattctta tccgctcaca attccacaca 9420
acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca 9480
cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagaaaa 9540
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 9600
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 9660
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 9720
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 9780
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 9840
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 9900
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 9960
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 10020
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 10080
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 10140
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 10200
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 10260
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 10320
cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 10380
gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 10440
ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 10500
aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 10560
cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 10620
agcggataac aatttcacac aggaaacagc tatgaccatg attac 10665
<210> 32
<211> 1056
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 32
gtgtatacaa tatatttctt cttagtaaga ggaatgtata aaaataaata ttttaaagga 60
agggacgatc ttatgagcat tattcaaaac atcattgaaa aagctaaaag cgataaaaag 120
aaaattgttc tgccagaagg tgcagaaccc aggacattaa aagctgctga aatagtttta 180
aaagaaggga ttgcagattt agtgcttctt ggaaatgaag atgagataag aaatgctgca 240
aaagacttgg acatatccaa agctgaaatc attgaccctg taaagtctga aatgtttgat 300
aggtatgcta atgatttcta tgagttaagg aagaacaaag gaatcacgtt ggaaaaagcc 360
agagaaacaa tcaaggataa tatctatttt ggatgtatga tggttaaaga aggttatgct 420
gatggattgg tatctggcgc tattcatgct actgcagatt tattaagacc tgcatttcag 480
ataattaaaa cggctccagg agcaaagata gtatcaagct tttttataat ggaagtgcct 540
aattgtgaat atggtgaaaa tggtgtattc ttgtttgctg attgtgcggt caacccatcg 600
cctaatgcag aagaacttgc ttctattgcc gtacaatctg ctaatactgc aaagaatttg 660
ttgggctttg aaccaaaagt tgccatgcta tcattttcta caaaaggtag tgcatcacat 720
gaattagtag ataaagtaag aaaagcgaca gagatagcaa aagaattgat gccagatgtt 780
gctatcgacg gtgaattgca attggatgct gctcttgtta aagaagttgc agagctaaaa 840
gcgccgggaa gcaaagttgc gggatgtgca aatgtgctta tattccctga tttacaagct 900
ggtaatatag gatataagct tgtacagagg ttagctaagg caaatgcaat tggacctata 960
acacaaggaa tgggtgcacc ggttaatgat ttatcaagag gatgcagcta tagagatatt 1020
gttgacgtaa tagcaacaac agctgtgcag gctcaa 1056
<210> 33
<211> 1209
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 33
atgaaaatta tgaaaatact ggttattaat tgcggaagtt cttcgctaaa atatcaactg 60
attgaatcaa ctgatggaaa tgtgttggca aaaggccttg ctgaaagaat cggcataaat 120
gattccatgt tgacacataa tgctaacgga gaaaaaatca agataaaaaa agacatgaaa 180
gatcacaaag acgcaataaa attggtttta gatgctttgg taaacagtga ctacggcgtt 240
ataaaagata tgtctgagat agatgctgta ggacatagag ttgttcacgg aggagaatct 300
tttacatcat cagttctcat aaatgatgaa gtgttaaaag cgataacaga ttgcatagaa 360
ttagctccac tgcacaatcc tgctaatata gaaggaatta aagcttgcca gcaaatcatg 420
ccaaacgttc caatggtggc ggtatttgat acagcctttc atcagacaat gcctgattat 480
gcatatcttt atccaatacc ttatgaatac tacacaaagt acaggattag aagatatgga 540
tttcatggca catcgcataa atatgtttca aatagggctg cagagatttt gaataaacct 600
attgaagatt tgaaaatcat aacttgtcat cttggaaatg gctccagcat tgctgctgtc 660
aaatatggta aatcaattga cacaagcatg ggatttacac cattagaagg tttggctatg 720
ggtacacgat ctggaagcat agacccatcc atcatttcgt atcttatgga aaaagaaaat 780
ataagcgctg aagaagtagt aaatatatta aataaaaaat ctggtgttta cggtatttca 840
ggaataagca gcgattttag agacttagaa gatgccgcct ttaaaaatgg agatgaaaga 900
gctcagttgg ctttaaatgt gtttgcatat cgagtaaaga agacgattgg cgcttatgca 960
gcagctatgg gaggcgtcga tgtcattgta tttacagcag gtgttggtga aaatggtcct 1020
gagatacgag aatttatact tgatggatta gagtttttag ggttcagctt ggataaagaa 1080
aaaaataaag tcagaggaaa agaaactatt atatctacgc cgaattcaaa agttagcgtg 1140
atggttgtgc ctactaatga agaatacatg attgctaaag atactgaaaa gattgtaaag 1200
agtataaaa 1209
<210> 34
<211> 1358
<212> DNA
<213> Thermoanaerobacter pseudoethanolicus
<400> 34
gctaatgcta tcggaccaat ttctcaaggt cttgcaaaac ctatcaatga cttgtcaaga 60
ggttgtagtg tagaagatat tgttaatgtt atagcaataa cttgtgtaca agctcaaggg 120
gtgcaaaaat aactttgagg aggcagcgat tatgaaaatt ttagtcatga actgtggaag 180
ctcgtcatta aaagtatcaa ttgttagata tggataatgg gaaagtgcta gcgaaaggat 240
tggcggaaag gataggtatc aatgattctc ttttaactca tcaagtagag ggcaaagata 300
aaataaaaat acaaaaagat atgaaaaatc ataaagaagc tatacaaatt gttttagagg 360
ctttagtaga taaagaaatc ggaatattaa aagatatgaa agaaatagat gcagtaggac 420
atagagttgt gcacggggga gagtttttta ctgattccgt attgattgac gatgaggtaa 480
tcaaaaaatt agaagcatgt attgaccttg cacctttgca caatcctgct aatattgagg 540
gaataaaagc ttgtcggcag ataatgccag gggtgccaat ggtagcagtt tttgatacgg 600
ctttccatca aacaatgcca gattatgcgt atatttatcc cattccttat gaatactacg 660
aaaaatatag aataagaaga tatggattcc atgggacttc tcataaatat gtatctttaa 720
gagctgctga aatattaaag aggcctattg aagagttaaa aattattact tgccatttag 780
ggaatgggtc tagtattgct gcggttaaag gcggtaagtc gatagataca agtatgggat 840
ttactccatt agaagggctg gctatgggta caaggtccgg aaatgttgat ccttcaatta 900
taactttctt aatggaaaaa gaaggattga ctgcagaaca ggttatagat atacttaata 960
agaaatcagg tgtatacgga atttcaggaa taagtaatga ctttagagat atagaaaatg 1020
cagcttttaa agaagggcat aaaagggcta tgttggcatt aaaagttttc gcttataggg 1080
tgaaaaagac aataggttct tatacagctg ctatgggtgg ggttgatgta attgtgttta 1140
ctgctggagt tggagaaaat ggaccagaaa tgagagagtt tattttagag gatctagagt 1200
ttttaggctt taaactggac aaagagaaga ataaggtaag aggaaaagag gaaattatat 1260
ctacagaaga ttcaaaagtt aaagttatgg ttattcctac aaatgaagaa tatatgattg 1320
ctaaagatac tgaaaaattg gtaaaaggtt taaagtag 1358
<210> 35
<211> 1196
<212> DNA
<213> Thermoanaerobacter pseudoethanolicus
<400> 35
atggcagtaa tggatagtat catacaaaag gctaaagcta ataaaaaaag gattgtgctt 60
cctgagggaa gtgaagctcg aactttaaaa gctgctgaaa aggttattaa agaaggtatt 120
gctgatgtag ttttattagg gaaggaagaa gaaataaaag aaaaagcaaa gggattggat 180
atctcgaaag cagaaattat agaccctgaa aagtcgcctc ttttacaaaa atatgctgaa 240
gaatattata atttgagaaa aaccaaagga gttacagaag aacaggcata tcaaattatg 300
aaagacccta tgtactatgg gtgcatgatg gtcaaattag acgatgttga tggtatggta 360
tctggggcga ttcacgctac tgctgatgtt ttcagaccgg cttttcaaat tgtaaaaact 420
gctgcaggtg tcaaagtagt atccagcgcc tttataatgg aagtacctaa ttgtacttat 480
ggaagcgatg gagtatttat ttttgctgat tgtgcaataa atcctaatcc taatgaagag 540
gaattagcag caattgccat tgcttctgcc catactgcaa aagtccttgc tggaattgag 600
cctagaattg ctatgctgtc attttctact aaaggaagtg caaaccatga attagtagat 660
aaggtgaaaa atgcgactaa aatcgcaaaa gaattggcgc ctgatttgct aattgatggt 720
gagcttcaat tagatgctgc gattgtcaaa gaagtaggag agttaaaggc tccaggaagt 780
cctgtagcgg ggaatgcaaa tgtgcttatt ttcccagatt tgcaagcggg aaacattgga 840
tataagctag tgcaaagact tgctaaagct aatgctatcg gaccaatttc tcaaggtctt 900
gcaaaaccta tcaatgactt gtcaagaggt tgtagtgtag aagatattgt taatgttata 960
gcaataactt gtgtacaagc tcaaggggtg caaaaataac tttgaggagg cagcgattat 1020
gaaaatttta gtcatgaact gtggaagctc gtcattaaaa gtatcaattg ttagatatgg 1080
ataatgggaa agtgctagcg aaaggattgg cggaaaggat aggtatcaat gattctcttt 1140
taactcatca agtagagggc aaagataaaa taaaaataca aaaagatatg aaaaat 1196
<210> 36
<211> 1053
<212> DNA
<213> Thermoanaerobacter sp.
<400> 36
gtgtatacaa tatatttctt ctttttagta agaggaatgt ataaaaataa atattttaaa 60
ggaagggacg atcttatgag cattattcaa aacatcattg aaaaagctaa aagtgataaa 120
aagaaaattg ttctgccgga aggtgcagaa cccagaacat taaaagctgc tgaaatagtt 180
ttaaaagaag gaattgcaga tttggtgctt cttggaaatg aagatgagat aagaaatgct 240
gcaaaagact tggacatatc taaagctgaa atcattgatc ctgtaaaatc tgaaatgttt 300
gataggtatg ctaatgattt ttatgagtta aggaagagca aaggaatcac gttggaaaaa 360
gccagagaaa caatcaagga taatatctat tttggatgta tgatggttaa agaaggttat 420
gctgatggat tggtatctgg cgctattcat gctactgcag atttattaag acctgcattt 480
cagataatta aaacggctcc aggagcaaag atagtatcaa gcttttttat aatggaagtg 540
cctaattgtg aatatggtga aaatggtgta ttcttgtttg ctgattgcgc ggtcaaccca 600
tcgcctaatg cagaagaact tgcttctatt gctgtacaat ctgctaatac tgcaaagaat 660
ttgttgggct ttgaaccaaa agttgctatg ctatcatttt ccacaaaagg tagtgcatca 720
catgaattag tagataaagt aagaaaagcg acagaaatag caaaagaatt gatgccagat 780
gttgctatcg acggtgaatt gcaattggat gctgctcttg tcaaagaagt tgcagagcta 840
aaagcgccag gaagcaaagt tgcgggatgt gcaaatgtgc ttatattccc tgatttacaa 900
gctggtaata taggatataa gcttgtacag agattagcta gcaaatgcaa ttggacctat 960
aacacaggaa tgggtgcacc ggttaatgat ttatcaagag gatgcagcta tagagatatt 1020
gttgacgtaa tagcacacag ctgtacaggc tca 1053
<210> 37
<211> 1068
<212> DNA
<213> Thermoanaerobacter sp.
<400> 37
atgctaacgg agaaaaatca agataaaaaa agacatgaaa gatcacaaag acgcaataaa 60
attgttttag atgctttggt aagcagtgac tacggcgtta taaaggatat gtctgagata 120
gatgctgtag gacatagagt tgttcacgga ggagaatctt ttacatcatc agttctcata 180
aatgatgatg tgttaaaagc gataacagat tgcatagaat tagctccact gcacaatcct 240
gccaatatag aaggaattaa agcttgccag caaatcatgc caaacgttcc aatggtggcg 300
gtatttgata cagcctttca tcagacaatg cctgattatg catatcttta tccaatacct 360
tatgaatact acacaaagta caggatcaga agatatggat ttcatggcac atcgcataaa 420
tatgtttcaa atagggctgc agagatttta aataaaccta ttgaagattt gaaaatcata 480
acttgtcatc ttggaaatgg ctccagcatt gctgctgtca aatatggtaa atcaattgac 540
acaagcatgg gatttacacc attagaaggt ttggctatgg gtacacgatc tggaagcata 600
gacccatcca ttatttcgta tcttatggaa aaagaaaata taagcgctga agaagtagta 660
aatatattaa ataaaaaatc tggtgtttac ggtatttcag gaataagcag cgattttaga 720
gacttagaag atgccgcctt taaaaatgga gatgaaagag ctcagttggc tttaaatgtg 780
tttgcatatc gagtaaagaa gatgattggc gcttatgcag cagctatggg aggcgtcgat 840
gccattgtat ttacagcagg tgttggtgaa aatggtcctg agatacgaga atttatactt 900
gatggattag agttcttagg gttcagcttg gataaagaaa aaaataaagt cagaggaaaa 960
gaaactatta tatctacgcc gaattcaaaa gttagcgtga tggttgtgcc cactaatgaa 1020
gaatacatga ttgctaaaga tactgaaaag attgtaaaga gtataaaa 1068
<210> 38
<211> 1059
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 38
gtgtatacaa tatatttctt ctttttagta agaggaatgt ataaaaataa atattttaaa 60
ggaagggatg atcttatgag cattattcag aacatcattg aaaaagctaa aagcgataaa 120
aagaaaattg ttctgccaga aggtgcagaa cccaggacat taaaagctgc tgaaatagtt 180
ttaaaagaag gaattgcaga tttggtgctt cttggaaatg aagatgagat aagaaatgca 240
gcaaaagact tggacatatc caaagctgaa ataattgacc ctgtaaaatc tgaaatgttt 300
gataggtatg ctaatgattt ttacgaatta agaaagagca agggaatcac attggaaaaa 360
gccagagaaa caatcaagga taatatctat tttggatgta tgatggttaa agaaggttat 420
gctgatggat tagtatctgg cgctattcat gctactgcag atttattaag acctgcattt 480
cagataatta aaacagctcc aggagcaaag atagtatcaa gcttttttat aatggaagtg 540
cctaattgtg aatatggtga aaatggcgta ttcttgtttg ctgattgtgc ggtcaatcca 600
tcacctaatg cagaagaact tgcttctatt gctgtacaat ctgctaatac tgcaaagaat 660
ttgttgggtt ttgaaccaaa agttgccatg ctatcatttt ccacaaaagg tagtgcatca 720
catgaattag tagacaaggt aagaaaagcg acagagatag caaaggattt gatgccagat 780
gttgctatcg atggtgaatt gcaactggat gctgctattg ttaaagaagt tgcagagcta 840
aaagcaccgg gaagcaaagt tgcgggatgt gcaaatgtgc ttatattccc tgacttacaa 900
gctggtaata taggatataa gcttgtacag agattagcta aggcaaatgc aattggaccg 960
ataacgcaag gaatgggtgc accagttaat gatttatcaa gaggatgcag ctataaagat 1020
attgttgacg taatagcgac aacagctgtg caggctcaa 1059
<210> 39
<211> 1209
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 39
atgaaaacta tgaaaattct ggttattaat tgtggaagtt cttcactaaa atatcaattg 60
attgaatcaa ttgatggaaa tgtgctggca aaaggccttg ctgaaagaat cggcataaat 120
gattccctgt tgacgcataa tgctaacgga gaaaaaatca agataaaaaa agacatgaaa 180
gatcacaaag acgcaataaa attggtttta gatgctttgg taagtagcga ctacggcgtt 240
ataaaggata tgtctgagat agatgctgta ggacatagag ttgttcatgg aggagagtct 300
tttacatcat cagttcttat aaatgatgaa gtgttaaagg caataacaga ttgtatagaa 360
ttagctccac tgcataatcc tgctaatata gaaggaatta aagcttgcca gcaaatcatg 420
ccaaacgttc caatggtggc ggtatttgat acagcctttc atcaaacaat gcctgattat 480
gcatatcttt atccaatacc ttatgagtac tacacaaagt acaggatcag aagatatgga 540
tttcatggca cgtcgcataa atatgtttca agtagggctg cagagatttt gaataaacct 600
attgaagatt tgaaaatcat aacttgtcat cttggaaatg gctccagtat tgctgccgtc 660
aaatatggta aatcaattga cacaagcatg ggatttacac cattagaagg tttggctatg 720
ggtacacgat ctggaagtat agacccatcc atcatttctt atcttatgga aaaagaaaat 780
ataagtgctg aagaggtagt aaatatatta aataaaaaat ctggtgttta cggtatttcg 840
ggaataagca gcgattttag agatttagaa gatgctgcct ttaaaaatgg agatgaaaga 900
gctcagttgg ccttaaatgt gtttgcatat cgagtaaaga agacgattgg agcttatgca 960
gcagctatgg gaggcgttga tgtcattgta tttacggcag gtgttggtga aaatgggcct 1020
gagataagag aatttatact tgatggattg gagttcttag ggttcagctt ggataaagaa 1080
aaaaataaag tcagaggaaa ggaaactatt atatctacgc caaattcaaa aattagcgtg 1140
atggttgtgc cgactaatga agaatatatg attgctaaag atactgaaaa gattgtaaag 1200
agtataaaa 1209
<210> 40
<211> 933
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 40
atgagcaagg tagcaataat aggatctggt tttgtaggtg caacatcggc atttacgctg 60
gcattaagtg ggactgtgac agatatcgtg ctggtggatt taaacaagga caaggctata 120
ggcgatgcac tggacataag ccatggcata ccgctaatac agcctgtaaa tgtgtatgca 180
ggtgactaca aagatgtgaa aggcgcagat gtaatagttg tgacagcagg tgctgctcaa 240
aagccgggag agacacggct tgaccttgta aagaaaaata cagccatatt taagtccatg 300
atacctgagc ttttaaagta caatgacaag gccatatatt tgattgtgac aaatcccgta 360
gatatactga cgtacgttac atacaagatt tctggacttc catggggcag agtttttggt 420
tctggcaccg ttcttgacag ctcaaggttt agataccttt taagcaagca ctgcaatata 480
gatccgagaa atgtccacgg aaggataatc ggcgagcatg gtgacacaga gtttgcagca 540
tggagcataa caaacatatc gggtatatca tttaatgagt actgcagcat atgcggacgc 600
gtctgcaaca caaatttcag aaaggaagta gaagaagaag tcgtaaatgc tgcttacaag 660
ataatagaca aaaaaggtgc tacatactat gctgtggcag ttgcagtaag aaggattgtg 720
gagtgcatct taagagatga aaattccatc ctcacagtat catctccatt aaatggacag 780
tacggcgtga aagatgtttc attaagcttg ccatctatcg taggcaggaa tggcgttgcc 840
aggattttgg acttgccttt atctgacgaa gaagtggaga agtttaggca ttcagcaagt 900
gtcatggcag atgtcataaa acaattagat ata 933
<210> 41
<211> 933
<212> DNA
<213> Thermoanaerobacter sp.
<400> 41
atgagtaaag tggccataat aggttcagga tttgtaggtg ctacatctgc atttacattg 60
gctctaagtg ggactgtgac agacattgtt ttagtagatt taaacaagga caaggcgata 120
ggcgatgcac tggatattag ccacggtata ccgcttatac agcctgtaaa tgtgtatgct 180
ggcgactaca aggatatcga gggcgcagat gtagtagttg taacagcagg tgcggctcaa 240
aagccaggag agtctaggct ggaccttgta aaaaagaata catctatatt caagtccatg 300
atacctgaac ttttaaaata caatgataaa gctatatacc tgattgtaac aaatcctgtt 360
gatatattaa cgtatgttac atacaaaata gcgaaacttc cgtgggggcg tgtattcggt 420
tcaggtactg tccttgacag ttcccgattt aggtatcttt taagtaaaca ttgcaatatt 480
gatcctagaa atgtacatgg aaggataatt ggagaacacg gcgatacaga atttgcggcg 540
tggagcataa caaatatttc aggaatatca tttaatgagt actgcaattt gtgcggacga 600
gtttgtaata caaatttcag aaaggaagtg gaagatgaag ttgtcaatgc ggcttacaaa 660
attattgata aaaagggtgc cacgtattac gctgtggctg tagcagtaag aagaatagtt 720
gagtgtatca taagggatga aaattcaatt cttacagttt catctccatt aaatggtcaa 780
tacggtgtaa gagatgtatc tttaagcttg ccatcaattg tgggcaaaaa tggtgttgca 840
agggttctgg atttgccttt ggctgatgac gaagttgaga agtttaaaca ttcggcaagc 900
gttatggctg atgttataaa acagttggac ata 933
<210> 42
<211> 936
<212> DNA
<213> Thermoanaerobacter pseudoethanolicus
<400> 42
atgaacaaaa tatctataat aggttctgga tttgtcggtg ctactactgc atacacactg 60
gctttgagtg ggattgccaa aactattgta ttaatagata ttaataaaga caaagcagaa 120
ggcgatgctc ttgatataag ccacggcgta ccgtttatta gtccagttga attgtacgcg 180
ggagattata gtgatgtttc aggttctgac ataataatca ttacagcggg agcagcacaa 240
aaaccgggag aaaccagact tgacttagtg aagagaaata cgatgatttt taaagacata 300
gtggcaaaac ttattaaagt aaatgacaca gcaatatacc ttatagttac aaatccagta 360
gatattctta catacgttac ctataaaata tctggcttgc catacggaag agtattgggg 420
tctggcacag ttctcgacag tgcgagattc agatatcttt taagcaaaca ttgtaacata 480
gatccgagga atatacacgg atatataatt ggggagcatg gcgattctga gcttgcagct 540
tggagcatta cgaacatagc aggcatacca attgataatt actgcaattt atgtggaaaa 600
gcatgtgaaa aagattttag agaggagatt tttaataatg ttgtaagagc tgcctatacg 660
ataatagaaa aaaagggtgc gacatattat gcggttgctc tcgcagtaag aagaatcgta 720
gaagctattt tcagagatga aaattccatt ttgactgtgt catctccgct aaccggccaa 780
tatggtgtta caaatgtggc tttgagcctt ccctccgttg ttggacgaaa tggaatcgta 840
aatatacttg aattaccact ttcacaggaa gaaattgctg cttttagaag atcagccgaa 900
gttatcaaaa gtgtaataca agagcttgat atataa 936
<210> 43
<211> 631
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 43
aggcgatgca ctggacataa gccatggcat accattaata cagcctgtaa atgtgtatgc 60
aggtgactac aaagatgttg aaggcgcgga cgtaatagtt gtgacagcag gggctgctca 120
aaagccaggt gagacgaggc ttgaccttgt gaagaaaaat acagctatat ttaagtccat 180
gatacctgag cttttaaagt acaatgacaa ggctatatat ttgattgtca caaatcctgt 240
agacatactg acgtacgtta catacaagat atctggactt ccatggggca gagttttcgg 300
ttctggcact gttcttgaca gttcaaggtt taggtacctt ttaagcaggc actgcaatat 360
agattccgag aaatgtccac ggaaggataa tcggcgagca tggtgacaca gagtttgcag 420
catggagcat aacaaacata tctggaatat catttaatga gtactgcagc atatgcgggc 480
gcatctgcaa cacaaatttc agaaaggaag tagaagaaga agtcgtaaat gctgcttata 540
agataataga caaaaaaggt gctacatact atgctgtcgc agttgcagta agaaggattg 600
tggagtgcat cttaagagat gaaaattcca t 631
<210> 44
<211> 2229
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 44
atgatcaatg aatggcgcgg gtttcaggag ggcaaatggc aaaagactat tgacgttcaa 60
gattttatcc agaaaaatta cacattatac gaaggcgatg atagtttttt agaagggcct 120
acagaaaaga ctattaagct ttggaacaaa gttcttgagc taatgaagga agaactgaaa 180
aaaggtgtgt tagatattga tacaaaaact gtatcgtcta taacatccca tgatgcgggg 240
tatatagaca aagatcttga ggaaatagtt ggattgcaga cagacaaacc tcttaaaaga 300
gctataatgc cttacggtgg cataagaatg gtcaaaaaag cttgcgaagc ttatggatat 360
aaagtggacc caaaagtaga agagatattt acgaagtaca gaaagaccca caatgatggt 420
gtatttgatg catatactcc agaaataaga gcagcaagac atgccggcat aataacaggt 480
cttccagatg catatggcag aggaagaatc ataggtgatt acagaagagt tgctctttat 540
ggaattgata gactcatcga agaaaaggaa aaagaaaaac ttgagcttga ttacgatgaa 600
tttgatgaag caactattcg cttgagagaa gaattgacag aacagataaa agcattaaac 660
gaaatgaaag agatggcttt aaagtacggt tatgacatat caaagcctgc aaaaaatgca 720
aaagaagctg tgcagtggac ttactttgcc ttccttgctg ctataaagga acaaaatggt 780
gccgctatgt cgctgggcag agtatctact tttttagata tatacattga aagagatctt 840
aaagaaggaa cattgacaga gaaacaagca caagagttaa tggatcactt tgtcatgaag 900
cttagaatgg tgaggttctt aaggactcct gattacaatg aactatttag tggcgatcct 960
gtttgggtga ctgaatcaat tggcggtgta ggcgtagacg gaagacctct tgtcactaaa 1020
aattcattca ggatattaaa tactttatat aacttaggtc ctgcacctga gccaaacttg 1080
acggttttat ggtccaaaaa ccttcctgaa aactttaaaa gattctgtgc caaggtatca 1140
atagatacaa gttctattca atatgaaaat gacgacttaa tgaggccaat atacaatgac 1200
gactatagca tcgcctgctg tgtgtcagct atgaagacgg gagaacagat gcaatttttt 1260
ggagcaaggg caaatctcgc gaaggcgcta ctgtatgcta taaacggcgg tatcgatgaa 1320
aggtataaaa cgcaagtggc accaaaattt aatcctataa cgtctgagta tttagactac 1380
gatgaggtaa tggcagcata tgacaatatg ttagagtggc ttgcaaaagt gtatgttaaa 1440
gctatgaata taatacacta catgcacgat aaatacgctt atgaaagatc ccttatggct 1500
ttgcatgata gagacatcgt aaggacgatg gcttttggaa tcgcaggtct ttctgttgcg 1560
gcagattcgt taagcgccat aaagtatgct aaagtaaaag ccataagaga tgaaaatggc 1620
atagcaatag attatgaagt ggaaggagat ttccctaagt ttggcaatga tgatgacagg 1680
gttgactcaa tagcagttga cattgtagaa agattcatga ataagcttaa aaagcacaag 1740
acttacagaa actctatacc aacactgtct gttttgacaa taacgtcaaa tgtggtgtac 1800
ggcaaaaaga cgggtgctac acctgacgga agaaaagcgg gagaaccttt tgcgccaggc 1860
gcaaatccga tgcacggcag agatacaaaa ggtgccatag catcaatgaa ttcagtatca 1920
aaaatacctt atgacagttc attggatggt atatcataca catttacgat tgtaccaaat 1980
gcgcttggca aggatgacga agataaaatt aataatcttg taggactatt agatggatat 2040
gcatttaatg cggggcacca cataaacatc aatgttttaa acagagatat gttgcttgat 2100
gctatggagc atcctgaaaa atatccgcag cttactataa gggtttcagg gtatgctgtc 2160
aatttcaata aattaacgag agagcaacag ttggaggtta tatcccgcac ttttcacgaa 2220
tctatgtag 2229
<210> 45
<211> 2229
<212> DNA
<213> Clostridium thermocellum
<400> 45
atggatgcat ggcgcggatt taataaaggc aactggtgcc aggaaattga cgttcgtgat 60
tttataatta gaaattatac tccttatgaa ggcgatgaaa gctttcttgt aggacctacg 120
gatagaacgc ggaaactttg ggagaaggtt tccgaactgt taaagaaaga acgggagaac 180
ggcggggtat tggatgttga tacccataca atttcaacga ttacgtctca taaacctgga 240
tatatagata aagaacttga agttattgtc gggcttcaga cggatgagcc tttaaaaaga 300
gccataatgc cgtttggcgg tatacgtatg gtgattaagg gagccgaagc ttatggccac 360
agtgtggacc ctcaggttgt tgaaatattc acaaagtaca gaaagactca taaccaggga 420
gtttatgatg tatatactcc cgaaatgaga aaagccaaaa aagccgggat tattacagga 480
cttcccgacg catacggcag aggaagaata attggcgatt acagaagggt tgcactttat 540
ggcgttgaca ggctgattgc tgaaaaagag aaagaaatgg caagtcttga aagagattac 600
attgactatg agactgttcg agacagagaa gaaataagcg agcagattaa atctttaaaa 660
caacttaaag aaatggcttt aagttacggt tttgacatat cttgtcctgc aaaggatgcc 720
agagaagcct ttcaatggtt gtattttgca tatcttgcag cagtcaagga acagaacggc 780
gcggcaatga gtattggaag aatttcgact ttccttgaca tatacattga aagggatctc 840
aaagaaggaa aactcacgga ggagttggct caggaactgg ttgaccagct ggttataaag 900
ctgagaattg tgagattttt gagaactcct gagtatgaaa agctcttcag cggagacccc 960
acttgggtaa ccgaaagtat cggaggtatg gcgctggatg gaagaacgct ggttacaaaa 1020
tcttcgttca ggtttttgca cactcttttc aacctgggac atgcaccgga gcccaacctt 1080
acagtacttt ggtccgtcaa tcttcccgaa ggctttaaaa agtactgtgc aaaggtatca 1140
attcattcaa gctccatcca gtatgaaagc gacgacataa tgaggaaaca ctggggagac 1200
gattatggaa tagcatgctg tgtttctgct atgagaattg gaaaacagat gcagttcttc 1260
ggtgcaagat gcaatcttgc aaaagctctt ctttacgcta ttaacggcgg aaaggatgaa 1320
atgacgggag aacagattgc tccgatgttt gcaccggtgg aaaccgaata ccttgattac 1380
gaggacgtaa tgaagaggtt tgacatggtg cttgactggg tggcaaggct ttatatgaac 1440
accctcaata taattcacta catgcatgac aaatatgcct atgaggcgct gcagatggca 1500
ttgcatgaca aagacgtgtt caggacgatg gcatgcggaa tagccggttt gtctgtggtg 1560
gcagactccc ttagcgcgat aaaatatgca aaggttaaac cgatacgcaa tgaaaacaac 1620
ctcgttgttg actacgaagt tgagggtgat tatcctaaat tcggaaataa cgacgaacgt 1680
gttgatgaaa ttgcagtgca agtagtaaaa atgttcatga acaagcttag aaagcaaagg 1740
gcttacagaa gtgccactcc gaccctttcc atacttacca taacttcaaa cgtggtatat 1800
ggaaagaaaa ccggaaacac tcctgacggc agaaaagctg gagaaccttt ggcgccggga 1860
gcaaatccga tgcatggaag ggatataaac ggagcattgg ctgtactgaa cagtattgcg 1920
aagcttccct atgaatatgc ccaggacggc atttcatata ctttctccat aattccaaaa 1980
gctctgggaa gagacgagga aaccagaata aacaatctta aatcaatgct tgacggatat 2040
ttcaagcagg gcggccacca cataaatgta aatgtgtttg aaaaagagac actgttagat 2100
gccatggaac atccggaaaa atatccacaa cttaccataa gagtgtccgg gtatgcagtg 2160
aactttataa agcttacacg ggagcaacag ctggatgtta ttaacagaac gattcacgga 2220
aagatttaa 2229
<210> 46
<211> 2061
<212> DNA
<213> Clostridium phytofermentans
<400> 46
atgatgactt cagttatgaa acaggaatgg gaaggtttta aacaaggtag atggatcact 60
tcagtaaatg ttcgagactt catacagaac aattacacaa tgtatgatgg tgatgaatcc 120
tttttagcag gtccaaccga agccaccaat aaactatggg cccaggttat ggagctttca 180
aagcaggaaa gtgagaaagg tggagtcctt gatatggaca ccaagatagt atctactatt 240
gtttctcacg gtcctggtta tttagataaa gatattgaaa caattgttgg ttttcagacc 300
gataagccat ttaagagatc actacaggtc tttggtggta ttcgtatggc acagagtgct 360
tgccatgaat atggatatga ggtagacgaa gaggtagcac gtatttttac agactaccgc 420
aagacacata atcaaggtgt atttgatgca tacactgacg aaatgaagct cgctagaaaa 480
tcagcaatca ttactggttt gcctgatgct tatggtagag gtagaattat tggcgattac 540
cgtcgagtgg cactttacgg tactgattta cttattgaag acaagaaaga acaacttaca 600
acttccttaa agagaatgac tagtgataat attcgcttaa gagaagaatt agcagaacaa 660
attcgtgcat taaaagaatt agcgaagctt ggtgaaatct atggttacga tattacgaag 720
ccagcaataa atgcaaagga agcaattcag tggctttact ttggatatct tgcagcggta 780
aaagagcaaa acggtgctgc aatgagctta ggccgtactt ctacattcct tgatatttat 840
atccagagag atttagataa tggtgttatc acagaaaaag aagcacaaga gtatatcgat 900
cattttatta tgaaacttcg tctagtgaag tttgcaagaa ctccagaata caatgcctta 960
ttctccggtg accctacttg ggtaacagaa agtatcgctg ggattggtac agatggacgc 1020
catatggtaa caaagacatc cttccgttac cttcatacgt tagacaacct tggaactgct 1080
ccagaaccaa acatgacagt tctatggtca actagattac caagattatt taaagagtac 1140
tgtgctaaga tgtcaattaa gtcatcctct attcaatacg aaaatgatga tatcatgcgt 1200
ccaactcatg gtgatgatta tgcaattgct tgttgtgtat cctctatgaa aattggtaaa 1260
gagatgcagt tctttggagc acgtgcaaat cttgctaagt gtcttcttta cgcaatcaat 1320
ggtggtgtag atgaagttct taaaattcag gttggtccaa agtaccgtcc agttgagggt 1380
gaatacctta attatgagga cgtaatgtcg aaatacaaag atatgatgga gtggctagca 1440
gaactttatg tgaatacttt aaatgtaatc cactacatgc atgataaata tagctatgaa 1500
agaattcaaa tggcacttca tgatcgtgaa gtaaaacgtt actttgcaac tggtattgcg 1560
ggtctttctg ttgtagcgga ctctttaagt gcaattaagt atgctaaggt aaaagtaatt 1620
cgtgatgaga atggcgttgt aaccgattac gaaattgaag gtgattatcc aaagtacggc 1680
aacaatgatg atcgtgtaga cgatatcgct gtacagttag tgcatgactt tatgaacatg 1740
attcgcaagc atcatactta tcgtgatgga tacccaacga tgtcaatctt aacgataact 1800
tctaatgtag tttatggaaa gaagacaggt aatactccag acggacgtaa gaagggtgaa 1860
ccattagcac caggtgctaa cccaatgcat cgtcgtgata ctcatggtgc agcagcgtcc 1920
ctagcatcgg tagcaaagct tccattccgt gatgcgcagg atggtatttc taatacgttc 1980
tctattgtac caggagcatt aggtaagaat gatgtgttat ttgctggaga cttagattta 2040
gacgatatgt ctgagaacta a 2061
<210> 47
<211> 5003
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
agagctataa tgccttacgg tggcataaga atggtcaaaa aagcttgcga agcttatgga 60
tataaagtgg acccaaaagt agaagagata tttacgaagt acagaaagac ccacaatgat 120
ggtgtatttg atgcatatac tccagaaata agagcagcaa gacatgccgg cataataaca 180
ggtcttccag atgcatatgg cagaggaaga atcataggtg attacagaag agttgctctt 240
tatggaattg atagactcat cgaagaaaag gaaaaagaaa aacttgagct tgattacgat 300
gaatttgatg aagcaactat tcgcttgaga gaagaattga cagaacagat aaaagcatta 360
aacgaaatga aagagatggc tttaaagtac ggttatgaca tatcaaagcc tgcaaaaaat 420
gcaaaagaag ctgtgcagtg gacttacttt gccttccttg ctgctataaa ggaacaaaat 480
ggtgccgcta tgtcgctggg cagagtatct acttttttag atatatacat tgaaagagat 540
cttaaagaag gaacattgac agagaaacaa gcacaagagt taatggatca ctttgtcatg 600
aagcttagaa tggtgaggtt cttaaggact cctgattaca atgaactatt tagtggcgat 660
cctgtttggg tgactgaatc aattggcggt gtaggcgtag acggaagacc tcttgtcact 720
aaaaattcat tcaggatatt aaatacttta tataacttag gtcctgcacc tgagccaaac 780
ttgacggttt tatggtccaa aaaccttcct gaaggtcaat ctatgaaatg cgattaagct 840
tggctgcagg tcgataaacc cagcgaacca tttgaggtga taggtaagat tataccgagg 900
tatgaaaacg agaattggac ctttacagaa ttactctatg aagcgccata tttaaaaagc 960
taccaagacg aagaggatga agaggatgag gaggcagatt gccttgaata tattgacaat 1020
actgataaga taatatatct tttatataga agatatcgcc gtatgtaagg atttcagggg 1080
gcaaggcata ggcagcgcgc ttatcaatat atctatagaa tgggcaaagc ataaaaactt 1140
gcatggacta atgcttgaaa cccaggacaa taaccttata gcttgtaaat tctatcataa 1200
ttgtggtttc aaaatcggct ccgtcgatac tatgttatac gccaactttc aaaacaactt 1260
tgaaaaagct gttttctggt atttaaggtt ttagaatgca aggaacagtg aattggagtt 1320
cgtcttgtta taattagctt cttggggtat ctttaaatac tgtagaaaag aggaaggaaa 1380
taataaatgg ctaaaatgag aatatcaccg gaattgaaaa aactgatcga aaaataccgc 1440
tgcgtaaaag atacggaagg aatgtctcct gctaaggtat ataagctggt gggagaaaat 1500
gaaaacctat atttaaaaat gacggacagc cggtataaag ggaccaccta tgatgtggaa 1560
cgggaaaagg acatgatgct atggctggaa ggaaagctgc ctgttccaaa ggtcctgcac 1620
tttgaacggc atgatggctg gagcaatctg ctcatgagtg aggccgatgg cgtcctttgc 1680
tcggaagagt atgaagatga acaaagccct gaaaagatta tcgagctgta tgcggagtgc 1740
atcaggctct ttcactccat cgacatatcg gattgtccct atacgaatag cttagacagc 1800
cgcttagccg aattggatta cttactgaat aacgatctgg ccgatgtgga ttgcgaaaac 1860
tgggaagaag acactccatt taaagatccg cgcgagctgt atgatttttt aaagacggaa 1920
aagcccgaag aggaacttgt cttttcccac ggcgacctgg gagacagcaa catctttgtg 1980
aaagatggca aagtaagtgg ctttattgat cttgggagaa gcggcagggc ggacaagtgg 2040
tatgacattg ccttctgcgt ccggtcgatc agggaggata tcggggaaga acagtatgtc 2100
gagctatttt ttgacttact ggggatcaag cctgattggg agaaaataaa atattatatt 2160
ttactggatg aattgtttta gtacctagat ttagatgtct aaaaagcttt ttagacatct 2220
aatcttttct gaagtacatc cgcaactgtc catactctga tgttttatat cttttctaaa 2280
agttcgctag ataggggtcc cgagcgccta cgaggaattt gtatcgactc tagaggatcc 2340
ccgggtaccg agctcgaatt cactggccgc aagcttggcg taatcatggt catagctgtt 2400
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 2460
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 2520
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 2580
ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 2640
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 2700
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 2760
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 2820
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 2880
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 2940
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 3000
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 3060
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 3120
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 3180
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 3240
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 3300
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 3360
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 3420
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 3480
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 3540
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 3600
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 3660
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 3720
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 3780
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 3840
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 3900
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 3960
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 4020
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 4080
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 4140
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 4200
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 4260
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 4320
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 4380
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 4440
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 4500
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 4560
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt 4620
cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 4680
gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 4740
tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc accatatgcg 4800
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc attcgccatt 4860
caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat tacgccagct 4920
ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtc 4980
acgacgttgt aaaacgacgg cca 5003
<210> 48
<211> 6033
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 48
cccattgtgc aatcgatcaa ttgaaatagc tattcaattg atttaagcaa ttttatttct 60
tcttcattta attctcgcca ttccccttct tttaaatttt catctaattt taattggcct 120
attgaaagcc tttttaagta gacgactttt gagcctatcg cttcaaacat tctttttatt 180
tgatgatatt taccttctct gattgagaca tatactttcg atgtactgcc tgaagatatt 240
atttccagtt ttgccggcat agtcttgtaa ccatcgtcta atagtatgcc atctgaaaac 300
aaagatacgt catcttcatc gataaaaccc aaaacttctg catagtattt tttgaaaacg 360
tgtttttttg gcgataagag cttatgagat agttcaccgt catttgtaat taaaagtaat 420
ccctctgtgt ctttatcaag ccttcctgct gggaaaacct ttcttgcctt tatatggtgt 480
ggcaaaagat ctacaacggt tttttctgat ggatcatatg ttgcacagat tacacctttc 540
ggtttattca tcattatata tatgtattct ttgtacgata ttttttcact tctaaacgtg 600
attatatctt tatcaggttg tactgcaaaa ccggggtcgt caatcgtcac attatttatt 660
gcaacaaggc cttcttttat aaaattttta atttcttttc ttgtgccata acccatattt 720
gataaaagct tatctattct catttttgac atcttaaatt cctcctaaac aatatgactg 780
tgcttcttag taaattatat cccaaaaata taaaatttgt agcaaaaatg tgatatatat 840
catatttttt gcgttttcct gatgatacaa ttaagatgat gtttcaagat aataaatttt 900
tctgaagtgt atacagtata ttgactacaa agaacaaaat actgcaggtc gataaaccca 960
gcgaaccatt tgaggtgata ggtaagatta taccgaggta tgaaaacgag aattggacct 1020
ttacagaatt actctatgaa gcgccatatt taaaaagcta ccaagacgaa gaggatgaag 1080
aggatgagga ggcagattgc cttgaatata ttgacaatac tgataagata atatatcttt 1140
tatatagaag atatcgccgt atgtaaggat ttcagggggc aaggcatagg cagcgcgctt 1200
atcaatatat ctatagaatg ggcaaagcat aaaaacttgc atggactaat gcttgaaacc 1260
caggacaata accttatagc ttgtaaattc tatcataatt gtggtttcaa aatcggctcc 1320
gtcgatacta tgttatacgc caactttcaa aacaactttg aaaaagctgt tttctggtat 1380
ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg tcttgttata attagcttct 1440
tggggtatct ttaaatactg tagaaaagag gaaggaaata ataaatggct aaaatgagaa 1500
tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg cgtaaaagat acggaaggaa 1560
tgtctcctgc taaggtatat aagctggtgg gagaaaatga aaacctatat ttaaaaatga 1620
cggacagccg gtataaaggg accacctatg atgtggaacg ggaaaaggac atgatgctat 1680
ggctggaagg aaagctgcct gttccaaagg tcctgcactt tgaacggcat gatggctgga 1740
gcaatctgct catgagtgag gccgatggcg tcctttgctc ggaagagtat gaagatgaac 1800
aaagccctga aaagattatc gagctgtatg cggagtgcat caggctcttt cactccatcg 1860
acatatcgga ttgtccctat acgaatagct tagacagccg cttagccgaa ttggattact 1920
tactgaataa cgatctggcc gatgtggatt gcgaaaactg ggaagaagac actccattta 1980
aagatccgcg cgagctgtat gattttttaa agacggaaaa gcccgaagag gaacttgtct 2040
tttcccacgg cgacctggga gacagcaaca tctttgtgaa agatggcaaa gtaagtggct 2100
ttattgatct tgggagaagc ggcagggcgg acaagtggta tgacattgcc ttctgcgtcc 2160
ggtcgatcag ggaggatatc ggggaagaac agtatgtcga gctatttttt gacttactgg 2220
ggatcaagcc tgattgggag aaaataaaat attatatttt actggatgaa ttgttttagt 2280
acctagattt agatgtctaa aaagcttttt agacatctaa tcttttctga agtacatccg 2340
caactgtcca tactctgatg ttttatatct tttctaaaag ttcgctagat aggggtcccg 2400
agcgcctacg aggaatttgt atcgactcta gaggatcccc gggtaccgaa aaggtgattg 2460
tcatggttat ggggaagata cattcaatag agacatgtgg tactgtagat gggcctggca 2520
taaggtacgt agtctttatg caaggttgtc ctttaaggtg cgcttattgc cataaccctg 2580
acacatggaa ttataacggt ggtaaagaag tatcaacaga tgagatattt aacgatgcaa 2640
aaagatatat accgtacatg aaatcatcag gcggcggcgt gacgctgaca ggtggagagc 2700
ctacattaca gcctgaattt tgcgaagatc tatttaaaaa gcttaaagcg tctggcatac 2760
acactgcatt agacacatcg ggatatgtga atatagataa agtaaaagaa cttgtaaaac 2820
acactgatct ttttttgctt gatataaagc acattgatga tgaaagccat aaaaagctta 2880
caggagtgtc gaatagaaag actttggagt ttgcaagata cctttccgat gaaggcaaga 2940
aaatgtggat aaggcatgtg atagtacctg gaataacgga tgatatggaa gagataagga 3000
aattggctga ttttgtctca tcattgaaaa atgtagatag agttgagata cttccgtatc 3060
ataaaatggg tgtgtataaa tatgaggcac ttgggatacc atatagattg aagggaataa 3120
atcctcctga cacatcaaaa attaaagaga taaaagaaga gtttaggaaa agagatataa 3180
aagtggtcta aaagcctcat gattcgtatc atggggcttt tcctttgaat taatttgata 3240
aagggtgtaa aattatcatg tgatgatgtg attttggagg taatcgcatg aatttaaata 3300
agataaatag aaacacgtac tacatagata atcctacgaa tattggcgtt tatgcctata 3360
aaaataaaaa ttgtctatta gtagatactg gtataaacgc aagcttggcg taatcatggt 3420
catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 3480
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 3540
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 3600
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 3660
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 3720
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 3780
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 3840
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 3900
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 3960
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 4020
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 4080
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4140
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4200
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4260
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 4320
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 4380
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 4440
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 4500
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 4560
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 4620
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 4680
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 4740
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 4800
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 4860
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 4920
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 4980
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 5040
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 5100
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5160
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5220
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5280
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 5340
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 5400
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 5460
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 5520
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 5580
aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 5640
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 5700
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 5760
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 5820
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 5880
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 5940
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 6000
tttcccagtc acgacgttgt aaaacgacgg cca 6033
<210> 49
<211> 4542
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
gtttatgatg tatatactcc cgaaatgaga aaagccaaaa aagccgggat tattacagga 60
cttcccgacg catacggcag aggaagaata attggcgatt acagaagggt tgcactttat 120
ggcgttgaca ggctgattgc tgaaaaagag aaagaaatgg caagtcttga aagagattac 180
attgactatg agactgttcg agacagagaa gaaataagcg agcagattaa atctttaaaa 240
caacttaaag aaatggcttt aagttacggt tttgacatat cttgtcctgc aaaggatgcc 300
agagaagcct ttcaatggtt gtattttgca tatcttgcag cagtcaagga acagaacggc 360
gcggcaatga gtattggaag aatttcgact ttccttgaca tatacattga aagggatctc 420
aaagaaggaa aactcacgga ggagttggct caggaactgg ttgaccagct ggttataaag 480
ctgagaattg tgagattttt gagaactcct gagtatgaaa agctcttcag cggagacccc 540
acttgggtaa ccgaaagtat cggaggtatg gcgctggatg gaagaacgct ggttacaaaa 600
tcttcgttca ggtttttgca cactcttttc aacctgggac atgcaccgga gcccaacctt 660
acagtacttt ggtccgtcaa tcttcccgaa ggctttaaaa agtactgtgc aaaggtatca 720
attcattcaa gctccatcca gtatgaaagc gacgacataa tgaggaaaca ctggggagac 780
gattatggaa tagcagatgg attttctatt attgcaatgt ggaattggga acggaaaaat 840
tattttatta aagagtagtt caacaaacgg gattgacttt taaaaaagga ttgattctaa 900
tgaagaaagc agacaagtaa gcctcctaaa ttcactttag ataaaaattt aggaggcata 960
tcaaatgaac tttaataaaa ttgatttaga caattggaag agaaaagaga tatttaatca 1020
ttatttgaac caacaaacga cttttagtat aaccacagaa attgatatta gtgttttata 1080
ccgaaacata aaacaagaag gatataaatt ttaccctgca tttattttct tagtgacaag 1140
ggtgataaac tcaaatacag cttttagaac tggttacaat agcgacggag agttaggtta 1200
ttgggataag ttagagccac tttatacaat ttttgatggt gtatctaaaa cattctctgg 1260
tatttggact cctgtaaaga atgacttcaa agagttttat gatttatacc tttctgatgt 1320
agagaaatat aatggttcgg ggaaattgtt tcccaaaaca cctatacctg aaaatgcttt 1380
ttctctttct attattccat ggacttcatt tactgggttt aacttaaata tcaataataa 1440
tagtaattac cttctaccca ttattacagc aggaaaattc attaataaag gtaattcaat 1500
atatttaccg ctatctttac aggtacatca ttctgtttgt gatggttatc atgcaggatt 1560
gtttatgaac tctattcagg aattgtcaga taggcctaat gactggcttt tataatatga 1620
gataatgccg actgtacttt ttacagtcgg ttttctaatg tcactagggc tcgcctttgg 1680
gaagtttgaa gggctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg 1740
caattaatgt gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg 1800
ctcgtatgtt gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc 1860
atgattacgc caagcttgca tgcctgcagg tcgactctag aggatccgca agcttggcgt 1920
aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca 1980
tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat 2040
taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt 2100
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 2160
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 2220
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 2280
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 2340
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 2400
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 2460
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 2520
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 2580
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 2640
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 2700
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 2760
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 2820
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 2880
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 2940
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat 3000
caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa 3060
gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 3120
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 3180
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 3240
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 3300
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 3360
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 3420
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 3480
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 3540
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 3600
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 3660
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 3720
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 3780
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 3840
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 3900
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 3960
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 4020
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 4080
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 4140
cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 4200
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 4260
cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac 4320
tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 4380
tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct 4440
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 4500
cgccagggtt ttcccagtca cgacgttgta aaacgacggc ca 4542
<210> 50
<211> 5648
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 50
cccgcaataa tggaagtaaa gagcatgaaa gtgggaatgc tggcttacac cgatatggcg 60
gaaattgtgt acaagggcaa tccgaactac aagtttgcgg ccggagagga caagccgggg 120
gttgcaccaa gacctttgaa atttgacgat tccataaaaa aagacataga agagttacgg 180
agcaaggtgg atattttaat tgtttcactt cactggggag tggaggaaag ctttgaagtt 240
ctgcctgaac agagggaatt tgcccacagt cttatagata acggagtgga tgtaatattg 300
ggacaccatc cccaccagtt ccaaggtata gaaatctaca agggcaaacc tgttttctac 360
agtctgggta attttatttt tgatcagaac gatcccgaaa accaggagtc ctttattgtg 420
acacttgatt acaaaggcag cagactgaca ggaatagagg ctgtacccgt gagaacaatc 480
ggaaaaatac aggtagttcc tcaaaaagga gatgaagcaa aacctatttt ggaaagagag 540
aaaaatttat gtaataggct tgatacaaac tgcattataa aagatgacaa attatatttt 600
gaaattggaa aataatgata atataattaa gttggacgta ttttgacaaa ataaaatcat 660
aaagtggttg catttgtcga gatttgtgat atcattggat agtaaattat attttaggtt 720
aaaaatggaa aaatagtttt ttatttaaac tttattttta aactttattt aaaatatcaa 780
aataattgcc tttgtatttt acttattgta caatatattt gtacaatata ttaaggaaaa 840
aaatactttt gtagcgactt aaaagtcaat tgaatggacc aataaaggac cttttcaaat 900
ttgtcaaggt attttaggac aatttttttt attttggata ttgttcttgt ttattgggta 960
aataagatgg attttctatt attgcaatgt ggaattggga acggaaaaat tattttatta 1020
aagagtagtt caacaaacgg gattgacttt taaaaaagga ttgattctaa tgaagaaagc 1080
agacaagtaa gcctcctaaa ttcactttag ataaaaattt aggaggcata tcaaatgaac 1140
tttaataaaa ttgatttaga caattggaag agaaaagaga tatttaatca ttatttgaac 1200
caacaaacga cttttagtat aaccacagaa attgatatta gtgttttata ccgaaacata 1260
aaacaagaag gatataaatt ttaccctgca tttattttct tagtgacaag ggtgataaac 1320
tcaaatacag cttttagaac tggttacaat agcgacggag agttaggtta ttgggataag 1380
ttagagccac tttatacaat ttttgatggt gtatctaaaa cattctctgg tatttggact 1440
cctgtaaaga atgacttcaa agagttttat gatttatacc tttctgatgt agagaaatat 1500
aatggttcgg ggaaattgtt tcccaaaaca cctatacctg aaaatgcttt ttctctttct 1560
attattccat ggacttcatt tactgggttt aacttaaata tcaataataa tagtaattac 1620
cttctaccca ttattacagc aggaaaattc attaataaag gtaattcaat atatttaccg 1680
ctatctttac aggtacatca ttctgtttgt gatggttatc atgcaggatt gtttatgaac 1740
tctattcagg aattgtcaga taggcctaat gactggcttt tataatatga gataatgccg 1800
actgtacttt ttacagtcgg ttttctaatg tcactagggc tcgcctttgg gaagtttgaa 1860
gggctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 1920
gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 1980
gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 2040
caagcttgca tgcctgcagg tcgactctag aggatcccat taaagggcag gatacactca 2100
tttgaatctt ttgggacact ggacggaccg ggtataagat ttgtggtttt catgcagggc 2160
tgtcccttgc gttgtatata ttgccacaac agggatacct gggatgttaa tgcggggagt 2220
gagtacactc cccggcaagt aattgatgaa atgatgaaat acatagacta tataaaggtc 2280
tccggaggcg gaataactgt taccggcggg gagcctgttc tccaggccga ttttgtggcc 2340
gaggtgttca gacttgcaaa agagcaggga gtgcatacgg cgctggatac caatggattt 2400
gctgacatag agaaggttga aaggcttata aaatacaccg atcttgtatt gctggatata 2460
aagcatgccc gggaggataa acataagata attaccggtg tgtccaacga aaaaatcaag 2520
cgttttgcgc tgtatctttc ggaccaggga gtgcctatct ggataagata tgtccttgtc 2580
cccggatata ccgacgatga agatgacctt aaaatggcgg ctgatttcat aaaaaagctt 2640
aaaacggtgg aaaaaatcga agttcttcct tatcacaaca tgggagcata caaatgggaa 2700
aaacttggtc agaaatacat gcttgaagga gtaaaggggc cgagtgcgca agaggtggaa 2760
aaagcaaaga ggattctgtc aggcaaataa taaaagcttt tttcttttat tatttgcttt 2820
tttctattac caatttgctt tgcttaagtt taggtttggt tttgatgagt tttttaatgt 2880
ttcttttata tttatctttt atatgaacag tgttgtaaac ttccaaatcc agtttgtcaa 2940
atattgattt aaaaatcttt gccgtatact gggcgtcagt taatgcccgg tgaagatttt 3000
cgtctatttc aacgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 3060
ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 3120
tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 3180
gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 3240
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 3300
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 3360
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 3420
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 3480
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 3540
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 3600
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 3660
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 3720
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 3780
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 3840
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 3900
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 3960
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 4020
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 4080
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 4140
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 4200
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 4260
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 4320
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 4380
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 4440
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 4500
tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 4560
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 4620
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 4680
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 4740
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 4800
cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 4860
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 4920
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 4980
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 5040
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 5100
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 5160
cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac 5220
ctataaaaat aggcgtatca cgaggccctt tcgtctcgcg cgtttcggtg atgacggtga 5280
aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag cggatgccgg 5340
gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa 5400
ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca 5460
cagatgcgta aggagaaaat accgcatcag gcgccattcg ccattcaggc tgcgcaactg 5520
ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 5580
tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 5640
gacggcca 5648
<210> 51
<211> 4648
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
tttggtggta ttcgtatggc acagagtgct tgccatgaat atggatatga ggtagacgaa 60
gaggtagcac gtatttttac agactaccgc aagacacata atcaaggtgt atttgatgca 120
tacactgacg aaatgaagct cgctagaaaa tcagcaatca ttactggttt gcctgatgct 180
tatggtagag gtagaattat tggcgattac cgtcgagtgg cactttacgg tactgattta 240
cttattgaag acaagaaaga acaacttaca acttccttaa agagaatgac tagtgataat 300
attcgcttaa gagaagaatt agcagaacaa attcgtgcat taaaagaatt agcgaagctt 360
ggtgaaatct atggttacga tattacgaag ccagcaataa atgcaaagga agcaattcag 420
tggctttact ttggatatct tgcagcggta aaagagcaaa acggtgctgc aatgagctta 480
ggccgtactt ctacattcct tgatatttat atccagagag atttagataa tggtgttatc 540
acagaaaaag aagcacaaga gtatatcgat cattttatta tgaaacttcg tctagtgaag 600
tttgcaagaa ctccagaata caatgcctta ttctccggtg accctacttg ggtaacagaa 660
agtatcgctg ggattggtac agatggacgc catatggtaa caaagacatc cttccgttac 720
cttcatacgt tagacaacct tggaactgct ccagaaccaa acatgacagt tctatggtca 780
actagattac caagattatt taaagagtac tgtgctaaga tgtcaattaa gtcatcctct 840
attcaatacg aaaatgatga tatcatgcgt ccaactcatg gtgatgatta tgcaattgct 900
agatggattt tctattattg caatgtggaa ttgggaacgg aaaaattatt ttattaaaga 960
gtagttcaac aaacgggatt gacttttaaa aaaggattga ttctaatgaa gaaagcagac 1020
aagtaagcct cctaaattca ctttagataa aaatttagga ggcatatcaa atgaacttta 1080
ataaaattga tttagacaat tggaagagaa aagagatatt taatcattat ttgaaccaac 1140
aaacgacttt tagtataacc acagaaattg atattagtgt tttataccga aacataaaac 1200
aagaaggata taaattttac cctgcattta ttttcttagt gacaagggtg ataaactcaa 1260
atacagcttt tagaactggt tacaatagcg acggagagtt aggttattgg gataagttag 1320
agccacttta tacaattttt gatggtgtat ctaaaacatt ctctggtatt tggactcctg 1380
taaagaatga cttcaaagag ttttatgatt tatacctttc tgatgtagag aaatataatg 1440
gttcggggaa attgtttccc aaaacaccta tacctgaaaa tgctttttct ctttctatta 1500
ttccatggac ttcatttact gggtttaact taaatatcaa taataatagt aattaccttc 1560
tacccattat tacagcagga aaattcatta ataaaggtaa ttcaatatat ttaccgctat 1620
ctttacaggt acatcattct gtttgtgatg gttatcatgc aggattgttt atgaactcta 1680
ttcaggaatt gtcagatagg cctaatgact ggcttttata atatgagata atgccgactg 1740
tactttttac agtcggtttt ctaatgtcac tagggctcgc ctttgggaag tttgaagggc 1800
tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt 1860
tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt 1920
ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag 1980
cttgcatgcc tgcaggtcga ctctagagga tccgcaagct tggcgtaatc atggtcatag 2040
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 2100
ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 2160
tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 2220
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 2280
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 2340
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2400
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2460
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2520
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2580
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 2640
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2700
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2760
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 2820
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 2880
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 2940
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3000
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3060
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 3120
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 3180
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 3240
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 3300
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 3360
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 3420
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 3480
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 3540
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 3600
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 3660
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 3720
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 3780
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 3840
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 3900
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 3960
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 4020
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 4080
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 4140
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 4200
attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtctcgcg 4260
cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct 4320
tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc 4380
gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat 4440
atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gcgccattcg 4500
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 4560
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 4620
cagtcacgac gttgtaaaac gacggcca 4648
<210> 52
<211> 5706
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
tcacccagca gcagccatga ttataaacac cggagttccg gagcttagta gcgaagcatc 60
taaaagcgga aagccttata tttacggcgg aacgggaaat ggaccagtct ttattgaacg 120
taccgctgat gtaagaaaag cggtagagga tatcattgca agccgcacct ttgattacgg 180
aatcgtgtct gcggcagaac aatatatggt agtagacagt cttattgcag ctgaagtaaa 240
agctgagatg ttaagaaacg gtgcctactt catgaacgag gaagaggaga aaaagctaat 300
agacctccta aaccttacga gtggaaaggc agatacagaa attatgggaa gaccagccga 360
agaacttgcc aaacgagcag gatttatggt acctaatacc acgactgtgc tggtttccga 420
acagaaatat atttccgaca ggaacccatt tgcaaaagag cttctttgtc ctgtattggc 480
ttactacatc gaaaatgact ggatgcatgc ttgtgagaag tgcatgagtc ttttagtaaa 540
cgaaagccat ggacataccc tggtgattca ttccagggat gaagaagtaa taggccagtt 600
cgccttaaag aaaccagtag gcagagtact tgtaaatacc cccgctaccc tgggtagtat 660
gggtgcaacc acaaacttgt ttccggctat gaccctagga agcattacag caggcgccgg 720
aatcacagcg gacaatgttt ctcctatgaa tttcatatac attcgtaaag taggatatgg 780
agttcgggga gtacaagaat ttcttggttc ggttgagaaa acctcaagcg gatacgcgaa 840
agctcctgaa acaatcagga acaatgccct tgaaacaaac aaggtcaatg cctttgaaac 900
aagcaaaggc atggaagatg ctagagatct tttgaaacag attttacaag ccttgtccaa 960
agaactagat ggattttcta ttattgcaat gtggaattgg gaacggaaaa attattttat 1020
taaagagtag ttcaacaaac gggattgact tttaaaaaag gattgattct aatgaagaaa 1080
gcagacaagt aagcctccta aattcacttt agataaaaat ttaggaggca tatcaaatga 1140
actttaataa aattgattta gacaattgga agagaaaaga gatatttaat cattatttga 1200
accaacaaac gacttttagt ataaccacag aaattgatat tagtgtttta taccgaaaca 1260
taaaacaaga aggatataaa ttttaccctg catttatttt cttagtgaca agggtgataa 1320
actcaaatac agcttttaga actggttaca atagcgacgg agagttaggt tattgggata 1380
agttagagcc actttataca atttttgatg gtgtatctaa aacattctct ggtatttgga 1440
ctcctgtaaa gaatgacttc aaagagtttt atgatttata cctttctgat gtagagaaat 1500
ataatggttc ggggaaattg tttcccaaaa cacctatacc tgaaaatgct ttttctcttt 1560
ctattattcc atggacttca tttactgggt ttaacttaaa tatcaataat aatagtaatt 1620
accttctacc cattattaca gcaggaaaat tcattaataa aggtaattca atatatttac 1680
cgctatcttt acaggtacat cattctgttt gtgatggtta tcatgcagga ttgtttatga 1740
actctattca ggaattgtca gataggccta atgactggct tttataatat gagataatgc 1800
cgactgtact ttttacagtc ggttttctaa tgtcactagg gctcgccttt gggaagtttg 1860
aagggctggc acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat 1920
gtgagttagc tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg 1980
ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac 2040
gccaagcttg catgcctgca ggtcgactct agaggatcca acggagagta atcaaaatgg 2100
accatggaaa atcaggagag attgaacgta aggcgtttat atttaacgtg cagaagtaca 2160
acatgtatga cgggccggga atcagaacct tggtattctt taaaggctgt cctcttcggt 2220
gtaaatggtg ctccaatccg gaaggtctgg aacgaaaatt tcaggtaatg tataagcaaa 2280
gtttttgtac aaactgcggg gcgtgcgctg atgtgtgccc cgtaggaatc cacgtgatgt 2340
cgaacggaac acatgaaatt gttcgggaaa aggaatgcat cggctgcatg aagtgtaaaa 2400
acatctgccc aaagtcggcg cttaccattg caggagaggt aaagaccatt tcagaactgc 2460
ttaagattgt ggaagaggac gctgcttttt atgatatgtc cggaggtggc gtgacccttg 2520
ggggtggtga agtaaccgca caaccagaag cggccttaaa tcttttgatg gcttgtaaac 2580
aggagggaat caacacagca attgaaactt gcggttattc gaatacagag aacattttaa 2640
aaattgcgga atatgtggat cttttcctgt ttgatatcaa acatatggat ccagtacgtc 2700
acaacgagtt aacaggtgtg aacaatgaac agattcttac taaccttgag gaactgcttc 2760
accgccgcta taacgtaaaa gtccgtatgc caatgttaaa aggaattaat gacagcaggg 2820
aagaaattga tgcggttatc aagtttttaa tgccataccg tactgataag aactttaagg 2880
gaattgactt acttccatac cataagctcg gagttaataa atacaatcag cttgataagg 2940
tatatccgat tgacggcgat cctagcttaa gtgctgagga tttagaccga attgaaggtt 3000
ggatgaaaga atacgatttt ccggttaacg tggtaaaaca ctaagaaagg ggaaggacgc 3060
catggaagaa ggcaagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt 3120
atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg 3180
cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg 3240
gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 3300
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 3360
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 3420
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 3480
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 3540
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 3600
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 3660
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 3720
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 3780
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 3840
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 3900
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 3960
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 4020
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 4080
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 4140
aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 4200
aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 4260
gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 4320
gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 4380
caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 4440
ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 4500
attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 4560
ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 4620
gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 4680
ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 4740
tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 4800
gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 4860
cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 4920
gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 4980
tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 5040
ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 5100
gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 5160
tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 5220
catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 5280
ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa 5340
acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga 5400
gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact 5460
atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca 5520
gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt 5580
gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg 5640
ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga 5700
cggcca 5706
<210> 53
<211> 5780
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg caaaagcacc 60
gccggacatc agcgctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 120
tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 180
gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 240
gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 300
acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 360
gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 420
agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 480
tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 540
ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 600
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 660
accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 720
gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 780
ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 840
cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 900
atcagataaa atatttctag atttcagtgc aatttatctc ttcaaatgta gcacctgaag 960
tcagccccat acgatataag ttgtaattct catgtttgac agcttatcat cgataagctt 1020
taatgcggta gtttatcaca gttaaattgc taacgcagtc aggcacctat acatgcattt 1080
acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 1140
gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 1200
ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 1260
cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 1320
ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 1380
ctcttcgcaa tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat 1440
gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc 1500
ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 1560
tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 1620
aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 1680
actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 1740
ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 1800
gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 1860
ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 1920
caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 1980
ctacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt 2040
tcggagatta ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa 2100
aaaaatgatg aattgaattg aaaagctagc ttatcgatgg gtccttttca tcacgtgcta 2160
taaaaataat tataatttaa attttttaat ataaatatat aaattaaaaa tagaaagtaa 2220
aaaaagaaat taaagaaaaa atagtttttg ttttccgaag atgtaaaaga ctctaggggg 2280
atcgccaaca aatactacct tttatcttgc tcttcctgct ctcaggtatt aatgccgaat 2340
tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc ctgtgatttt acattttact 2400
tatcgttaat cgaatgtata tctatttaat ctgcttttct tgtctaataa atatatatgt 2460
aaagtacgct ttttgttgaa attttttaaa cctttgttta tttttttttc ttcattccgt 2520
aactcttcta ccttctttat ttactttcta aaatccaaat acaaaacata aaaataaata 2580
aacacagagt aaattcccaa attattccat cattaaaaga tacgaggcgc gtgtaagtta 2640
caggcaagcg atctctaaga aaccattatt atcatgacat taacctataa aaaaggcctc 2700
tcgagctaga gtcgatcttc gccagcaggg cgaggatcgt ggcatcaccg aaccgcgccg 2760
tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc aggtcgccat 2820
tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt ttgtagccct 2880
ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc ttttcctcaa 2940
tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc ttcctggttg 3000
gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta gccggccagc 3060
ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca gtgaagaagg 3120
aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc cgttggatac 3180
accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg aaaaaggatg 3240
gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg gaaaagcgct 3300
gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc aggaaattac 3360
tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag ctggccgagt 3420
gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt gcgttcctgg 3480
cggtgagggc ggatgtcgat atgcgtaagg agaaaatacc gcatcaggcg catatttgaa 3540
tgtatttaga aaaataaaca aaaagagttt gtagaaacgc aaaaaggcca tccgtcagga 3600
tggccttctg cttaatttga tgcctggcag tttatggcgg gcgtcctgcc cgccaccctc 3660
cgggccgttg cttcgcaacg ttcaaatccg ctcccggcgg atttgtccta ctcaggagag 3720
cgttcaccga caaacaacag ataaaacgaa aggcccagtc tttcgactga gcctttcgtt 3780
ttatttgatg cctggaaacc cagcgaacca tttgaggtga taggtaagat tataccgagg 3840
tatgaaaacg agaattggac ctttacagaa ttactctatg aagcgccata tttaaaaagc 3900
taccaagacg aagaggatga agaggatgag gaggcagatt gccttgaata tattgacaat 3960
actgataaga taatatatct tttatataga agatatcgcc gtatgtaagg atttcagggg 4020
gcaaggcata ggcagcgcgc ttatcaatat atctatagaa tgggcaaagc ataaaaactt 4080
gcatggacta atgcttgaaa cccaggacaa taaccttata gcttgtaaat tctatcataa 4140
ttgtggtttc aaaatcggct ccgtcgatac tatgttatac gccaactttc aaaacaactt 4200
tgaaaaagct gttttctggt atttaaggtt ttagaatgca aggaacagtg aattggagtt 4260
cgtcttgtta taattagctt cttggggtat ctttaaatac tgtagaaaag aggaaggaaa 4320
taataaatgg ctaaaatgag aatatcaccg gaattgaaaa aactgatcga aaaataccgc 4380
tgcgtaaaag atacggaagg aatgtctcct gctaaggtat ataagctggt gggagaaaat 4440
gaaaacctat atttaaaaat gacggacagc cggtataaag ggaccaccta tgatgtggaa 4500
cgggaaaagg acatgatgct atggctggaa ggaaagctgc ctgttccaaa ggtcctgcac 4560
tttgaacggc atgatggctg gagcaatctg ctcatgagtg aggccgatgg cgtcctttgc 4620
tcggaagagt atgaagatga acaaagccct gaaaagatta tcgagctgta tgcggagtgc 4680
atcaggctct ttcactccat cgacatatcg gattgtccct atacgaatag cttagacagc 4740
cgcttagccg aattggatta cttactgaat aacgatctgg ccgatgtgga ttgcgaaaac 4800
tgggaagaag acactccatt taaagatccg cgcgagctgt atgatttttt aaagacggaa 4860
aagcccgaag aggaacttgt cttttcccac ggcgacctgg gagacagcaa catctttgtg 4920
aaagatggca aagtaagtgg ctttattgat cttgggagaa gcggcagggc ggacaagtgg 4980
tatgacattg ccttctgcgt ccggtcgatc agggaggata tcggggaaga acagtatgtc 5040
gagctatttt ttgacttact ggggatcaag cctgattggg agaaaataaa atattatatt 5100
ttactggatg aattgtttta gtacctagat ttagatgtct aaaaagcttt ttagacatct 5160
aatcttttct gaagtacatc cgcaactgtc catactctga tgttttatat cttttctaaa 5220
agttcgctag ataggggtcc cgagcgccta cgaggaattt gtatcgtaca aggatatcga 5280
gggcgcagat gtagtagttg taacagcagg tgcggctcaa aagccaggag agtctaggct 5340
ggaccttgta aaaaagaata catctatatt caagtccatg atacctgaac ttttaaaata 5400
caatgataaa gctatatacc tgattgtaac aaatcctgtt gatatattaa cgtatgttac 5460
atacaaaata gcgaaacttc cgtgggggcg tgtattcggt tcaggtactg tccttgacag 5520
ttcccgattt aggtatcttt taagtaaaca ttgcaatatt gatcctagaa atgtacatgg 5580
aaggataatt ggagaacacg gcgatacaga atttgcggcg tggagcataa caaatatttc 5640
aggaatatca tttaatgagt actgcaattt gtgcggacga gtttgtaata caaatttcag 5700
aaaggaagtg gaagatgaag ttgtcaatgc ggcttacaaa attattgata aaaagggtgc 5760
cacgtattac gctgtggctg 5780
<210> 54
<211> 6539
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (92)..(92)
<223> a, c, g or t
<220>
<221> modified_base
<222> (151)..(151)
<223> a, c, g or t
<220>
<221> modified_base
<222> (153)..(153)
<223> a, c, g or t
<400> 54
gcacatattg atagagaaca tggctggata attactataa ctccaagaaa acgaatagta 60
aaagaatgga ggcgaattaa tgagtaatgt cncaatacaa ttaatagaaa tttgtcggca 120
atatgtaaat aataacttaa acataaatga ntntatcgaa gatttccaag tgctttatga 180
acaaaagcaa gatttattaa cagatgaaga aatgagtttg tttgatgata tttatatggc 240
ttgtgaatat tatgaacagg atgaaaatat aagaaatgaa tatcacttgt atattggaga 300
aaatgaatta agacaaaaag tgcaaaaact tgtaaaaaag ttagcagcat aataaaccgc 360
taaggcatga tagctaaagc ggtattttta tgcaattaaa aggaaaaatg atatctgata 420
aaccgcggaa aagtatttta gaaaacaact ataaagataa tatttcaaag caagaaggat 480
aaaataagat taaactatta gacactttta ttagaaaatg ttataatatt attaagagaa 540
aatttatatt atttaggagg taattttatg agtaaagtgg ccataatagg ttcaggattt 600
gtaggtgcta catctgcatt tacattggct ctaagtggga ctgtgacaga cattgtttta 660
gtagatttaa acaaggacaa ggcgataggc gatgcactgg atattagcca aaacccagcg 720
aaccatttga ggtgataggt aagattatac cgaggtatga aaacgagaat tggaccttta 780
cagaattact ctatgaagcg ccatatttaa aaagctacca agacgaagag gatgaagagg 840
atgaggaggc agattgcctt gaatatattg acaatactga taagataata tatcttttat 900
atagaagata tcgccgtatg taaggatttc agggggcaag gcataggcag cgcgcttatc 960
aatatatcta tagaatgggc aaagcataaa aacttgcatg gactaatgct tgaaacccag 1020
gacaataacc ttatagcttg taaattctat cataattgtg gtttcaaaat cggctccgtc 1080
gatactatgt tatacgccaa ctttcaaaac aactttgaaa aagctgtttt ctggtattta 1140
aggttttaga atgcaaggaa cagtgaattg gagttcgtct tgttataatt agcttcttgg 1200
ggtatcttta aatactgtag aaaagaggaa ggaaataata aatggctaaa atgagaatat 1260
caccggaatt gaaaaaactg atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt 1320
ctcctgctaa ggtatataag ctggtgggag aaaatgaaaa cctatattta aaaatgacgg 1380
acagccggta taaagggacc acctatgatg tggaacggga aaaggacatg atgctatggc 1440
tggaaggaaa gctgcctgtt ccaaaggtcc tgcactttga acggcatgat ggctggagca 1500
atctgctcat gagtgaggcc gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa 1560
gccctgaaaa gattatcgag ctgtatgcgg agtgcatcag gctctttcac tccatcgaca 1620
tatcggattg tccctatacg aatagcttag acagccgctt agccgaattg gattacttac 1680
tgaataacga tctggccgat gtggattgcg aaaactggga agaagacact ccatttaaag 1740
atccgcgcga gctgtatgat tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt 1800
cccacggcga cctgggagac agcaacatct ttgtgaaaga tggcaaagta agtggcttta 1860
ttgatcttgg gagaagcggc agggcggaca agtggtatga cattgccttc tgcgtccggt 1920
cgatcaggga ggatatcggg gaagaacagt atgtcgagct attttttgac ttactgggga 1980
tcaagcctga ttgggagaaa ataaaatatt atattttact ggatgaattg ttttagtacc 2040
tagatttaga tgtctaaaaa gctttttaga catctaatct tttctgaagt acatccgcaa 2100
ctgtccatac tctgatgttt tatatctttt ctaaaagttc gctagatagg ggtcccgagc 2160
gcctacgagg aatttgtatc gacgtattac gctgtggctg tagcagtaag aagaatagtt 2220
gagtgtatca taagggatga aaattcaatt cttacagttt catctccatt aaatggtcaa 2280
tacggtgtaa gagatgtatc tttaagcttg ccatcaattg tgggcaaaaa tggtgttgca 2340
agggttctgg atttgccttt ggctgatgac gaagttgaga agtttaaaca ttcggcaagc 2400
gttatggctg atgttataaa acagttggac atataaaata aatcattgta taaggtttat 2460
aagacggctt ttatcatgta tggtaaaggc cgctttttta tgaatataaa aatacaaagt 2520
ggaaaatcta aataaaggtg atgcaatatg cagaatatga gtcctcaaga aattatatcg 2580
agtgccttta tgaaggcaaa aaaatctgag aatattatac atgctaaggc tatagattat 2640
gggaaaaata tatcagataa ccagatgcaa gcgatattga agcaaataga gataacggct 2700
ttaaaccatg tggacaaaat agtgacagct gagaagacga tgcatctatc agctgtccct 2760
cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 2820
agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 2880
tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 2940
tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 3000
gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 3060
agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 3120
tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 3180
cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt tcggtttacc ggtgtcattc 3240
cgctgttatg gccgcgtttg tctcattcca cgcctgacac tcagttccgg gtaggcagtt 3300
cgctccaagc tggactgtat gcacgaaccc cccgttcagt ccgaccgctg cgccttatcc 3360
ggtaactatc gtcttgagtc caacccggaa agacatgcaa aagcaccact ggcagcagcc 3420
actggtaatt gatttagagg agttagtctt gaagtcatgc gccggttaag gctaaactga 3480
aaggacaagt tttggtgact gcgctcctcc aagccagtta cctcggttca aagagttggt 3540
agctcagaga accttcgaaa aaccgccctg caaggcggtt ttttcgtttt cagagcaaga 3600
gattacgcgc agaccaaaac gatctcaaga agatcatctt attaatcaga taaaatattt 3660
ctagatttca gtgcaattta tctcttcaaa tgtagcacct gaagtcagcc ccatacgata 3720
taagttgtaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat 3780
cacagttaaa ttgctaacgc agtcaggcac ctatacatgc atttacttat aatacagttt 3840
tttagttttg ctggccgcat cttctcaaat atgcttccca gcctgctttt ctgtaacgtt 3900
caccctctac cttagcatcc cttccctttg caaatagtcc tcttccaaca ataataatgt 3960
cagatcctgt agagaccaca tcatccacgg ttctatactg ttgacccaat gcgtctccct 4020
tgtcatctaa acccacaccg ggtgtcataa tcaaccaatc gtaaccttca tctcttccac 4080
ccatgtctct ttgagcaata aagccgataa caaaatcttt gtcgctcttc gcaatgtcaa 4140
cagtaccctt agtatattct ccagtagata gggagccctt gcatgacaat tctgctaaca 4200
tcaaaaggcc tctaggttcc tttgttactt cttctgccgc ctgcttcaaa ccgctaacaa 4260
tacctgggcc caccacaccg tgtgcattcg taatgtctgc ccattctgct attctgtata 4320
cacccgcaga gtactgcaat ttgactgtat taccaatgtc agcaaatttt ctgtcttcga 4380
agagtaaaaa attgtacttg gcggataatg cctttagcgg cttaactgtg ccctccatgg 4440
aaaaatcagt caagatatcc acatgtgttt ttagtaaaca aattttggga cctaatgctt 4500
caactaactc cagtaattcc ttggtggtac gaacatccaa tgaagcacac aagtttgttt 4560
gcttttcgtg catgatatta aatagcttgg cagcaacagg actaggatga gtagcagcac 4620
gttccttata tgtagctttc gacatgattt atcttcgttt cctgcaggtt tttgttctgt 4680
gcagttgggt taagaatact gggcaatttc atgtttcttc aacactacat atgcgtatat 4740
ataccaatct aagtctgtgc tccttccttc gttcttcctt ctgttcggag attaccgaat 4800
caaaaaaatt tcaaagaaac cgaaatcaaa aaaaagaata aaaaaaaaat gatgaattga 4860
attgaaaagc tagcttatcg atgggtcctt ttcatcacgt gctataaaaa taattataat 4920
ttaaattttt taatataaat atataaatta aaaatagaaa gtaaaaaaag aaattaaaga 4980
aaaaatagtt tttgttttcc gaagatgtaa aagactctag ggggatcgcc aacaaatact 5040
accttttatc ttgctcttcc tgctctcagg tattaatgcc gaattgtttc atcttgtctg 5100
tgtagaagac cacacacgaa aatcctgtga ttttacattt tacttatcgt taatcgaatg 5160
tatatctatt taatctgctt ttcttgtcta ataaatatat atgtaaagta cgctttttgt 5220
tgaaattttt taaacctttg tttatttttt tttcttcatt ccgtaactct tctaccttct 5280
ttatttactt tctaaaatcc aaatacaaaa cataaaaata aataaacaca gagtaaattc 5340
ccaaattatt ccatcattaa aagatacgag gcgcgtgtaa gttacaggca agcgatctct 5400
aagaaaccat tattatcatg acattaacct ataaaaaagg cctctcgagc tagagtcgat 5460
cttcgccagc agggcgagga tcgtggcatc accgaaccgc gccgtgcgcg ggtcgtcggt 5520
gagccagagt ttcagcaggc cgcccaggcg gcccaggtcg ccattgatgc gggccagctc 5580
gcggacgtgc tcatagtcca cgacgcccgt gattttgtag ccctggccga cggccagcag 5640
gtaggccgac aggctcatgc cggccgccgc cgccttttcc tcaatcgctc ttcgttcgtc 5700
tggaaggcag tacaccttga taggtgggct gcccttcctg gttggcttgg tttcatcagc 5760
catccgcttg ccctcatctg ttacgccggc ggtagccggc cagcctcgca gagcaggatt 5820
cccgttgagc accgccaggt gcgaataagg gacagtgaag aaggaacacc cgctcgcggg 5880
tgggcctact tcacctatcc tgcccggctg acgccgttgg atacaccaag gaaagtctac 5940
acgaaccctt tggcaaaatc ctgtatatcg tgcgaaaaag gatggatata ccgaaaaaat 6000
cgctataatg accccgaagc agggttatgc agcggaaaag cgctgcttcc ctgctgtttt 6060
gtggaatatc taccgactgg aaacaggcaa atgcaggaaa ttactgaact gaggggacag 6120
gcgagagacg atgccaaaga gctacaccga cgagctggcc gagtgggttg aatcccgcgc 6180
ggccaagaag cgccggcgtg atgaggctgc ggttgcgttc ctggcggtga gggcggatgt 6240
cgatatgcgt aaggagaaaa taccgcatca ggcgcatatt tgaatgtatt tagaaaaata 6300
aacaaaaaga gtttgtagaa acgcaaaaag gccatccgtc aggatggcct tctgcttaat 6360
ttgatgcctg gcagtttatg gcgggcgtcc tgcccgccac cctccgggcc gttgcttcgc 6420
aacgttcaaa tccgctcccg gcggatttgt cctactcagg agagcgttca ccgacaaaca 6480
acagataaaa cgaaaggccc agtctttcga ctgagccttt cgttttattt gatgcctgg 6539
<210> 55
<211> 6086
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 55
tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg caaaagcacc 60
gccggacatc agcgctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 120
tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 180
gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 240
gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 300
acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 360
gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 420
agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 480
tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 540
ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 600
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 660
accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 720
gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 780
ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 840
cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 900
atcagataaa atatttctag atttcagtgc aatttatctc ttcaaatgta gcacctgaag 960
tcagccccat acgatataag ttgtaattct catgtttgac agcttatcat cgataagctt 1020
taatgcggta gtttatcaca gttaaattgc taacgcagtc aggcacctat acatgcattt 1080
acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 1140
gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 1200
ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 1260
cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 1320
ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 1380
ctcttcgcaa tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat 1440
gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc 1500
ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 1560
tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 1620
aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 1680
actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 1740
ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 1800
gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 1860
ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 1920
caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 1980
ctacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt 2040
tcggagatta ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa 2100
aaaaatgatg aattgaattg aaaagctagc ttatcgatgg gtccttttca tcacgtgcta 2160
taaaaataat tataatttaa attttttaat ataaatatat aaattaaaaa tagaaagtaa 2220
aaaaagaaat taaagaaaaa atagtttttg ttttccgaag atgtaaaaga ctctaggggg 2280
atcgccaaca aatactacct tttatcttgc tcttcctgct ctcaggtatt aatgccgaat 2340
tgtttcatct tgtctgtgta gaagaccaca cacgaaaatc ctgtgatttt acattttact 2400
tatcgttaat cgaatgtata tctatttaat ctgcttttct tgtctaataa atatatatgt 2460
aaagtacgct ttttgttgaa attttttaaa cctttgttta tttttttttc ttcattccgt 2520
aactcttcta ccttctttat ttactttcta aaatccaaat acaaaacata aaaataaata 2580
aacacagagt aaattcccaa attattccat cattaaaaga tacgaggcgc gtgtaagtta 2640
caggcaagcg atctctaaga aaccattatt atcatgacat taacctataa aaaaggcctc 2700
tcgagctaga gtcgatcttc gccagcaggg cgaggatcgt ggcatcaccg aaccgcgccg 2760
tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc aggtcgccat 2820
tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt ttgtagccct 2880
ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc ttttcctcaa 2940
tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc ttcctggttg 3000
gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta gccggccagc 3060
ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca gtgaagaagg 3120
aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc cgttggatac 3180
accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg aaaaaggatg 3240
gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg gaaaagcgct 3300
gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc aggaaattac 3360
tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag ctggccgagt 3420
gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt gcgttcctgg 3480
cggtgagggc ggatgtcgat atgcgtaagg agaaaatacc gcatcaggcg catatttgaa 3540
tgtatttaga aaaataaaca aaaagagttt gtagaaacgc aaaaaggcca tccgtcagga 3600
tggccttctg cttaatttga tgcctggcag tttatggcgg gcgtcctgcc cgccaccctc 3660
cgggccgttg cttcgcaacg ttcaaatccg ctcccggcgg atttgtccta ctcaggagag 3720
cgttcaccga caaacaacag ataaaacgaa aggcccagtc tttcgactga gcctttcgtt 3780
ttatttgatg cctggaaacc cagcgaacca tttgaggtga taggtaagat tataccgagg 3840
tatgaaaacg agaattggac ctttacagaa ttactctatg aagcgccata tttaaaaagc 3900
taccaagacg aagaggatga agaggatgag gaggcagatt gccttgaata tattgacaat 3960
actgataaga taatatatct tttatataga agatatcgcc gtatgtaagg atttcagggg 4020
gcaaggcata ggcagcgcgc ttatcaatat atctatagaa tgggcaaagc ataaaaactt 4080
gcatggacta atgcttgaaa cccaggacaa taaccttata gcttgtaaat tctatcataa 4140
ttgtggtttc aaaatcggct ccgtcgatac tatgttatac gccaactttc aaaacaactt 4200
tgaaaaagct gttttctggt atttaaggtt ttagaatgca aggaacagtg aattggagtt 4260
cgtcttgtta taattagctt cttggggtat ctttaaatac tgtagaaaag aggaaggaaa 4320
taataaatgg ctaaaatgag aatatcaccg gaattgaaaa aactgatcga aaaataccgc 4380
tgcgtaaaag atacggaagg aatgtctcct gctaaggtat ataagctggt gggagaaaat 4440
gaaaacctat atttaaaaat gacggacagc cggtataaag ggaccaccta tgatgtggaa 4500
cgggaaaagg acatgatgct atggctggaa ggaaagctgc ctgttccaaa ggtcctgcac 4560
tttgaacggc atgatggctg gagcaatctg ctcatgagtg aggccgatgg cgtcctttgc 4620
tcggaagagt atgaagatga acaaagccct gaaaagatta tcgagctgta tgcggagtgc 4680
atcaggctct ttcactccat cgacatatcg gattgtccct atacgaatag cttagacagc 4740
cgcttagccg aattggatta cttactgaat aacgatctgg ccgatgtgga ttgcgaaaac 4800
tgggaagaag acactccatt taaagatccg cgcgagctgt atgatttttt aaagacggaa 4860
aagcccgaag aggaacttgt cttttcccac ggcgacctgg gagacagcaa catctttgtg 4920
aaagatggca aagtaagtgg ctttattgat cttgggagaa gcggcagggc ggacaagtgg 4980
tatgacattg ccttctgcgt ccggtcgatc agggaggata tcggggaaga acagtatgtc 5040
gagctatttt ttgacttact ggggatcaag cctgattggg agaaaataaa atattatatt 5100
ttactggatg aattgtttta gtacctagat ttagatgtct aaaaagcttt ttagacatct 5160
aatcttttct gaagtacatc cgcaactgtc catactctga tgttttatat cttttctaaa 5220
agttcgctag ataggggtcc cgagcgccta cgaggaattt gtatcggctg tacaatctgc 5280
taatactgca aagaatttgt tgggctttga accaaaagtt gctatgctat cattttccac 5340
aaaaggtagt gcatcacatg aattagtaga taaagtaaga aaagcgacag aaatagcaaa 5400
agaattgatg ccagatgttg ctatcgacgg tgaattgcaa ttggatgctg ctcttgtcaa 5460
agaagttgca gagctaaaag cgccaggaag caaagttgcg ggatgtgcaa atgtgcttat 5520
attccctgat ttacaagctg gtaatatagg atataagctt gtacagagat tagctagcaa 5580
atgcaattgg acctataaca caggaatggg tgcaccggtt aatgatttat caagaggatg 5640
cagctataga gatattgttg acgtaatagc acacagctgt acaggctcat aaatgtaaag 5700
tatggaggat gaaattatga aaatactggt atatgcgaag tctcactaaa tatcactgat 5760
gatcatgatg aaatgtgctg gcaaaggcct tgctgagaga atcggcataa atgatccctg 5820
ttgacacata tgctaacgga gaaaaatcaa gataaaaaaa gacatgaaag atcacaaaga 5880
cgcaataaaa ttgttttaga tgctttggta agcagtgact acggcgttat aaaggatatg 5940
tctgagatag atgctgtagg acatagagtt gttcacggag gagaatcttt tacatcatca 6000
gttctcataa atgatgatgt gttaaaagcg ataacagatt gcatagaatt agctccactg 6060
cacaatcctg ccaatataga aggaat 6086
<210> 56
<211> 7284
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 56
taacagggcc atgaccttct gcaaagcact tttttaaaat ttcaagagaa tattgtggca 60
tatatttttc taatgcagaa tagtttttat catttataac ctttctaaga tatgtagcac 120
ttgcaaaaga ttctactgtt tccagagaat tatatcctgg accaaatctt tttaatgtca 180
aaggcttaat attgctgttt aacttgatta agctttttat gtattcaatt ccaagtatgt 240
tatttggatt tccgataata ttgttaatgg tccttccgaa atattttgat aatgctgctt 300
cacgtgcctt tgcatatgtg atgccgcttt ttaaataggt tttcaaagag ctttataatc 360
ttctggttcg tctaaaagaa attttgatat ttggcataat tcgtcaatag agccatgttc 420
gcttccaaac gatatgtaat caatgacatt taatgaatcc agcagcttta ctgctccata 480
tgcgaaattt tctgcggtag aaactgcata tatagtgggc aattctatta ctaagtcaat 540
acctgatagc aatgcagctt ctgtccttga ccacttgtca ataatagacg gtattcctcg 600
ctgaacaaag ttaccactca taattgcaat gacaaaatct gcacctgttg tttcaattga 660
tttttttata tggtatatgt gtccgttatg gagagggtta tattctacaa ttactcccaa 720
tatactcatt attaaaaacc tttctaaaaa attattaatt gtacttatta ttttataaaa 780
aatatgttaa aatgtaaaat gtgtatacaa tatatttctt ctttttagta agaggaatgt 840
ataaaaataa atattttaaa ggaagggacg atcttatgag cattattcaa aacatcattg 900
aaaaagctaa aagtgataaa aagaaaattg ttctgccgga aggtgcagaa acccagcgaa 960
ccatttgagg tgataggtaa gattataccg aggtatgaaa acgagaattg gacctttaca 1020
gaattactct atgaagcgcc atatttaaaa agctaccaag acgaagagga tgaagaggat 1080
gaggaggcag attgccttga atatattgac aatactgata agataatata tcttttatat 1140
agaagatatc gccgtatgta aggatttcag ggggcaaggc ataggcagcg cgcttatcaa 1200
tatatctata gaatgggcaa agcataaaaa cttgcatgga ctaatgcttg aaacccagga 1260
caataacctt atagcttgta aattctatca taattgtggt ttcaaaatcg gctccgtcga 1320
tactatgtta tacgccaact ttcaaaacaa ctttgaaaaa gctgttttct ggtatttaag 1380
gttttagaat gcaaggaaca gtgaattgga gttcgtcttg ttataattag cttcttgggg 1440
tatctttaaa tactgtagaa aagaggaagg aaataataaa tggctaaaat gagaatatca 1500
ccggaattga aaaaactgat cgaaaaatac cgctgcgtaa aagatacgga aggaatgtct 1560
cctgctaagg tatataagct ggtgggagaa aatgaaaacc tatatttaaa aatgacggac 1620
agccggtata aagggaccac ctatgatgtg gaacgggaaa aggacatgat gctatggctg 1680
gaaggaaagc tgcctgttcc aaaggtcctg cactttgaac ggcatgatgg ctggagcaat 1740
ctgctcatga gtgaggccga tggcgtcctt tgctcggaag agtatgaaga tgaacaaagc 1800
cctgaaaaga ttatcgagct gtatgcggag tgcatcaggc tctttcactc catcgacata 1860
tcggattgtc cctatacgaa tagcttagac agccgcttag ccgaattgga ttacttactg 1920
aataacgatc tggccgatgt ggattgcgaa aactgggaag aagacactcc atttaaagat 1980
ccgcgcgagc tgtatgattt tttaaagacg gaaaagcccg aagaggaact tgtcttttcc 2040
cacggcgacc tgggagacag caacatcttt gtgaaagatg gcaaagtaag tggctttatt 2100
gatcttggga gaagcggcag ggcggacaag tggtatgaca ttgccttctg cgtccggtcg 2160
atcagggagg atatcgggga agaacagtat gtcgagctat tttttgactt actggggatc 2220
aagcctgatt gggagaaaat aaaatattat attttactgg atgaattgtt ttagtaccta 2280
gatttagatg tctaaaaagc tttttagaca tctaatcttt tctgaagtac atccgcaact 2340
gtccatactc tgatgtttta tatcttttct aaaagttcgc tagatagggg tcccgagcgc 2400
ctacgaggaa tttgtatcga aagttagcgt gatggttgtg cccactaatg aagaatacat 2460
gattgctaaa gatactgaaa agattgtaaa gagtataaaa tagcattctt gacaaatgtt 2520
taccccatta gtataattaa ttttggcaat tatattgggg tgagaaaatg aaaattgatt 2580
tatcaaaatt aagggacata ggggccgcag catcgaagtc aactacgtag aaaatctgag 2640
tgttcttgag gcaaatagca atagatacgt agttataaag cctattagcg taactggaag 2700
cataacatac gatagtgaag gaatagtttt aaaacttttg gcacgcgggg ctattaaagt 2760
aacatgcgat aggtgccttg acgaatttga gtatgagttc gtaataccta ttgacgaaat 2820
agtaaacgag tctgatgatg aattttcagg tgaagtggaa gatgaaaagc ttgatttgac 2880
gaaaattgtg attgaaaatg tggaactttc tcttccgatg aagttcattt gctcgaatga 2940
ttgcaagggt ctatgttcta cttgcggtaa aaatcttaat catgaaaaat gcgattgcca 3000
aataaaagaa attgatccac gcctttcagt tttgaataaa ttactgcaga agatgtagga 3060
ggtgtataat atgccagttc caaagcgtag aacatctaag gcaagaagag ataaaagaag 3120
gcatagccat agtttagctg tacctgctta tgttttgtgc ccacaatgtc atgaaccaaa 3180
attgccccac agagtttgtt taagctgtgg ttattacgac ggtaaagagg tattgaaagt 3240
ggaagaaaag taatggagtt ttctctatta cttttctttt ttatttcttg acttttatgt 3300
atggcgtaat ttataattat gagtaagtca taaaaacaac ctatatttgg agctgataat 3360
gtggccacga agcttagtaa aagagataga ttaaaaaagt taaaaattga aatcgaaaaa 3420
tatccatttt acactgatga tgagttagct gatttgtttt cggttagcgt tcagacgata 3480
aggctggatt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc 3540
aaaagcaccg ccggacatca gcgctagcgg agtgtatact ggcttactat gttggcactg 3600
atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa aaggctgcac cggtgcgtca 3660
gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 3720
cgttcgactg cggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 3780
caggaagata cttaacaggg aagtgagagg gccgcggcaa agccgttttt ccataggctc 3840
cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacccgaca 3900
ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct 3960
gcctttcggt ttaccggtgt cattccgctg ttatggccgc gtttgtctca ttccacgcct 4020
gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt 4080
tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca 4140
tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt 4200
catgcgccgg ttaaggctaa actgaaagga caagttttgg tgactgcgct cctccaagcc 4260
agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg 4320
cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc 4380
atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag 4440
cacctgaagt cagccccata cgatataagt tgtaattctc atgtttgaca gcttatcatc 4500
gataagcttt aatgcggtag tttatcacag ttaaattgct aacgcagtca ggcacctata 4560
catgcattta cttataatac agttttttag ttttgctggc cgcatcttct caaatatgct 4620
tcccagcctg cttttctgta acgttcaccc tctaccttag catcccttcc ctttgcaaat 4680
agtcctcttc caacaataat aatgtcagat cctgtagaga ccacatcatc cacggttcta 4740
tactgttgac ccaatgcgtc tcccttgtca tctaaaccca caccgggtgt cataatcaac 4800
caatcgtaac cttcatctct tccacccatg tctctttgag caataaagcc gataacaaaa 4860
tctttgtcgc tcttcgcaat gtcaacagta cccttagtat attctccagt agatagggag 4920
cccttgcatg acaattctgc taacatcaaa aggcctctag gttcctttgt tacttcttct 4980
gccgcctgct tcaaaccgct aacaatacct gggcccacca caccgtgtgc attcgtaatg 5040
tctgcccatt ctgctattct gtatacaccc gcagagtact gcaatttgac tgtattacca 5100
atgtcagcaa attttctgtc ttcgaagagt aaaaaattgt acttggcgga taatgccttt 5160
agcggcttaa ctgtgccctc catggaaaaa tcagtcaaga tatccacatg tgtttttagt 5220
aaacaaattt tgggacctaa tgcttcaact aactccagta attccttggt ggtacgaaca 5280
tccaatgaag cacacaagtt tgtttgcttt tcgtgcatga tattaaatag cttggcagca 5340
acaggactag gatgagtagc agcacgttcc ttatatgtag ctttcgacat gatttatctt 5400
cgtttcctgc aggtttttgt tctgtgcagt tgggttaaga atactgggca atttcatgtt 5460
tcttcaacac tacatatgcg tatatatacc aatctaagtc tgtgctcctt ccttcgttct 5520
tccttctgtt cggagattac cgaatcaaaa aaatttcaaa gaaaccgaaa tcaaaaaaaa 5580
gaataaaaaa aaaatgatga attgaattga aaagctagct tatcgatggg tccttttcat 5640
cacgtgctat aaaaataatt ataatttaaa ttttttaata taaatatata aattaaaaat 5700
agaaagtaaa aaaagaaatt aaagaaaaaa tagtttttgt tttccgaaga tgtaaaagac 5760
tctaggggga tcgccaacaa atactacctt ttatcttgct cttcctgctc tcaggtatta 5820
atgccgaatt gtttcatctt gtctgtgtag aagaccacac acgaaaatcc tgtgatttta 5880
cattttactt atcgttaatc gaatgtatat ctatttaatc tgcttttctt gtctaataaa 5940
tatatatgta aagtacgctt tttgttgaaa ttttttaaac ctttgtttat ttttttttct 6000
tcattccgta actcttctac cttctttatt tactttctaa aatccaaata caaaacataa 6060
aaataaataa acacagagta aattcccaaa ttattccatc attaaaagat acgaggcgcg 6120
tgtaagttac aggcaagcga tctctaagaa accattatta tcatgacatt aacctataaa 6180
aaaggcctct cgagctagag tcgatcttcg ccagcagggc gaggatcgtg gcatcaccga 6240
accgcgccgt gcgcgggtcg tcggtgagcc agagtttcag caggccgccc aggcggccca 6300
ggtcgccatt gatgcgggcc agctcgcgga cgtgctcata gtccacgacg cccgtgattt 6360
tgtagccctg gccgacggcc agcaggtagg ccgacaggct catgccggcc gccgccgcct 6420
tttcctcaat cgctcttcgt tcgtctggaa ggcagtacac cttgataggt gggctgccct 6480
tcctggttgg cttggtttca tcagccatcc gcttgccctc atctgttacg ccggcggtag 6540
ccggccagcc tcgcagagca ggattcccgt tgagcaccgc caggtgcgaa taagggacag 6600
tgaagaagga acacccgctc gcgggtgggc ctacttcacc tatcctgccc ggctgacgcc 6660
gttggataca ccaaggaaag tctacacgaa ccctttggca aaatcctgta tatcgtgcga 6720
aaaaggatgg atataccgaa aaaatcgcta taatgacccc gaagcagggt tatgcagcgg 6780
aaaagcgctg cttccctgct gttttgtgga atatctaccg actggaaaca ggcaaatgca 6840
ggaaattact gaactgaggg gacaggcgag agacgatgcc aaagagctac accgacgagc 6900
tggccgagtg ggttgaatcc cgcgcggcca agaagcgccg gcgtgatgag gctgcggttg 6960
cgttcctggc ggtgagggcg gatgtcgata tgcgtaagga gaaaataccg catcaggcgc 7020
atatttgaat gtatttagaa aaataaacaa aaagagtttg tagaaacgca aaaaggccat 7080
ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg cgtcctgccc 7140
gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga tttgtcctac 7200
tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 7260
cctttcgttt tatttgatgc ctgg 7284
<210> 57
<211> 4621
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
cagcacaaaa accgggagaa accagacttg acttagtgaa gagaaatacg atgattttta 60
aagacatagt ggcaaaactt attaaagtaa atgacacagc aatatacctt atagttacaa 120
atccagtaga tattcttaca tacgttacct ataaaatatc tggcttgcca tacggaagag 180
tattggggtc tggcacagtt ctcgacagtg cgagattcag atatctttta agcaaacatt 240
gtaacataga tccgaggaat atacacggat atataattgg ggagcatggc gattctgagc 300
ttgcagcttg gagcattacg aacatagcag gcataccaat tgataattac tgcaatttat 360
gtggaaaagc atgtgaaaaa gattttagag aggagatttt taataatgtt gtaagagctg 420
cctatacgat aatagaaaaa aagggtgcga catattatgc ggttgctctc gcagtaagaa 480
gaatcgtaga agctattaaa cccagcgaac catttgaggt gataggtaag attataccga 540
ggtatgaaaa cgagaattgg acctttacag aattactcta tgaagcgcca tatttaaaaa 600
gctaccaaga cgaagaggat gaagaggatg aggaggcaga ttgccttgaa tatattgaca 660
atactgataa gataatatat cttttatata gaagatatcg ccgtatgtaa ggatttcagg 720
gggcaaggca taggcagcgc gcttatcaat atatctatag aatgggcaaa gcataaaaac 780
ttgcatggac taatgcttga aacccaggac aataacctta tagcttgtaa attctatcat 840
aattgtggtt tcaaaatcgg ctccgtcgat actatgttat acgccaactt tcaaaacaac 900
tttgaaaaag ctgttttctg gtatttaagg ttttagaatg caaggaacag tgaattggag 960
ttcgtcttgt tataattagc ttcttggggt atctttaaat actgtagaaa agaggaagga 1020
aataataaat ggctaaaatg agaatatcac cggaattgaa aaaactgatc gaaaaatacc 1080
gctgcgtaaa agatacggaa ggaatgtctc ctgctaaggt atataagctg gtgggagaaa 1140
atgaaaacct atatttaaaa atgacggaca gccggtataa agggaccacc tatgatgtgg 1200
aacgggaaaa ggacatgatg ctatggctgg aaggaaagct gcctgttcca aaggtcctgc 1260
actttgaacg gcatgatggc tggagcaatc tgctcatgag tgaggccgat ggcgtccttt 1320
gctcggaaga gtatgaagat gaacaaagcc ctgaaaagat tatcgagctg tatgcggagt 1380
gcatcaggct ctttcactcc atcgacatat cggattgtcc ctatacgaat agcttagaca 1440
gccgcttagc cgaattggat tacttactga ataacgatct ggccgatgtg gattgcgaaa 1500
actgggaaga agacactcca tttaaagatc cgcgcgagct gtatgatttt ttaaagacgg 1560
aaaagcccga agaggaactt gtcttttccc acggcgacct gggagacagc aacatctttg 1620
tgaaagatgg caaagtaagt ggctttattg atcttgggag aagcggcagg gcggacaagt 1680
ggtatgacat tgccttctgc gtccggtcga tcagggagga tatcggggaa gaacagtatg 1740
tcgagctatt ttttgactta ctggggatca agcctgattg ggagaaaata aaatattata 1800
ttttactgga tgaattgttt tagtacctag atttagatgt ctaaaaagct ttttagacat 1860
ctaatctttt ctgaagtaca tccgcaactg tccatactct gatgttttat atcttttcta 1920
aaagttcgct agataggggt cccgagcgcc tacgaggaat ttgtatcgct gcaggcatgc 1980
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 2040
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 2100
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 2160
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 2220
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 2280
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 2340
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 2400
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 2460
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 2520
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 2580
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 2640
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 2700
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 2760
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 2820
taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac 2880
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 2940
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 3000
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 3060
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 3120
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 3180
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 3240
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 3300
agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 3360
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 3420
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 3480
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 3540
aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 3600
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 3660
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 3720
caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 3780
ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 3840
ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 3900
tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 3960
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 4020
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 4080
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 4140
agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg 4200
tatcacgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat 4260
gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg 4320
tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg cggcatcaga 4380
gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 4440
aaaataccgc atcaggcgcc attcgccatt caggctgcgc aactgttggg aagggcgatc 4500
ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 4560
aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt 4620
c 4621
<210> 58
<211> 6130
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 58
aggtttatcg ccgccttgta cagttttaaa ttgcatagaa atcatgagac ccattgcaat 60
aaatacaagt atcaaagata aagtttgcaa tgcctttcct ttcaatttct ccacatcctt 120
tctctatata aaaagacatc ttcgtcttgc ttttggtttc agcttatatg cacttttata 180
aataactatg atactctata aatactataa catggaaaat gttaaaattt attaagaaat 240
tattaagttt ttattacaaa aaagttacaa aacctctgac atttttcata tcagaggttg 300
tcatttttta ttttattttc tatagaattt tttagtgaca atatttcttc taattcttta 360
ttgtatttat ctattttcaa catggtactt ctatataggc gtatatcttc ttcgtttttt 420
tgtatacatt ttttaaggga gttttttaca gtttcaaaaa gcgtatcata agtaatgtaa 480
ttatgcattt caaggtcgga gattggaact gcgattaatt cctccccttc tattttatag 540
tgataaaaaa tgttgtcggg ttttaaaact attttttcat ctatgctttt atcgtaaatt 600
attatacctt ctcctatttc aaaagttttt ccgctataac ttctaagttt tatattttcg 660
actcctatgt atttttttat tgccaaaagt atgtttttta tttctgaaat ggattttaca 720
agcacttctt gcattttttt atttgccatc tctttatctt tttcactttt tatgagttct 780
tccatcaaag actttatttc atgtatatct cccataaaat atcacctctt tcttaatatt 840
ccacagagga atcattttaa acgttgaata ttttaaatta ttagagaaaa aatagacttg 900
actatttttt gaaatttgat agactattat taatagaaaa ttaatattga aaaggagaag 960
atattatgaa caaaatatct ataataggtt ctggatttgt cggaaaccca gcgaaccatt 1020
tgaggtgata ggtaagatta taccgaggta tgaaaacgag aattggacct ttacagaatt 1080
actctatgaa gcgccatatt taaaaagcta ccaagacgaa gaggatgaag aggatgagga 1140
ggcagattgc cttgaatata ttgacaatac tgataagata atatatcttt tatatagaag 1200
atatcgccgt atgtaaggat ttcagggggc aaggcatagg cagcgcgctt atcaatatat 1260
ctatagaatg ggcaaagcat aaaaacttgc atggactaat gcttgaaacc caggacaata 1320
accttatagc ttgtaaattc tatcataatt gtggtttcaa aatcggctcc gtcgatacta 1380
tgttatacgc caactttcaa aacaactttg aaaaagctgt tttctggtat ttaaggtttt 1440
agaatgcaag gaacagtgaa ttggagttcg tcttgttata attagcttct tggggtatct 1500
ttaaatactg tagaaaagag gaaggaaata ataaatggct aaaatgagaa tatcaccgga 1560
attgaaaaaa ctgatcgaaa aataccgctg cgtaaaagat acggaaggaa tgtctcctgc 1620
taaggtatat aagctggtgg gagaaaatga aaacctatat ttaaaaatga cggacagccg 1680
gtataaaggg accacctatg atgtggaacg ggaaaaggac atgatgctat ggctggaagg 1740
aaagctgcct gttccaaagg tcctgcactt tgaacggcat gatggctgga gcaatctgct 1800
catgagtgag gccgatggcg tcctttgctc ggaagagtat gaagatgaac aaagccctga 1860
aaagattatc gagctgtatg cggagtgcat caggctcttt cactccatcg acatatcgga 1920
ttgtccctat acgaatagct tagacagccg cttagccgaa ttggattact tactgaataa 1980
cgatctggcc gatgtggatt gcgaaaactg ggaagaagac actccattta aagatccgcg 2040
cgagctgtat gattttttaa agacggaaaa gcccgaagag gaacttgtct tttcccacgg 2100
cgacctggga gacagcaaca tctttgtgaa agatggcaaa gtaagtggct ttattgatct 2160
tgggagaagc ggcagggcgg acaagtggta tgacattgcc ttctgcgtcc ggtcgatcag 2220
ggaggatatc ggggaagaac agtatgtcga gctatttttt gacttactgg ggatcaagcc 2280
tgattgggag aaaataaaat attatatttt actggatgaa ttgttttagt acctagattt 2340
agatgtctaa aaagcttttt agacatctaa tcttttctga agtacatccg caactgtcca 2400
tactctgatg ttttatatct tttctaaaag ttcgctagat aggggtcccg agcgcctacg 2460
aggaatttgt atcgaagatc agccgaagtt atcaaaagtg taatacaaga gcttgatata 2520
taagagggga aaccctcttt ttttgtatat aaaaagtcac agcgtgaaaa tataataatt 2580
aaaataatga ttttttaggg tgtgatagtc gtgcagaaaa taactcagca ggagattatt 2640
ttaagtgcct ttgttgaagc acaaaattta gaaaagatac tgttggataa agtaagagaa 2700
tatgggaaag aatcagtaga taatcaaata aaagcattgt taaagcaaat tgaaataatg 2760
ataaaaaatc ataaagaaga cataaaaaag gcacaaaaga ctatgcatat taattccctt 2820
gtcaaaaaaa atatgtctca agagccttta gacatgcttc aagatttatt aaaaaattta 2880
gttaatattc aagcctttta taatgaaact gttgtgaata ttactaatcc ttacgttaga 2940
cagttgttta ctcaaatgag ggatgatgtt atgagattta tttctattct tcaaatggag 3000
attgaaagtc tggaatcgaa accttctatt ccaaataaca cagttttaaa tacaccggag 3060
atgagttaat atgaaagtgg ctattattgg tgctggtgtt tcagggctgg ctgcggcaat 3120
tacttttcaa aggtatggca ttacaccaga tatttttgaa aaaaagtgca aaataggtga 3180
attatttaac catgttgcgg ggttattaaa agtgataaat aggcctataa aggatccgct 3240
tcatcatctt aaaaatgttt atggaataga agttaaacca attaacacca ttgacaaaat 3300
agtaatgaag gggccaactg taacagcttc tgttactggg agtaatcttg ggtatatgat 3360
tttaagagga caggacgcaa actctcttga aaatcaattg tataataagt tagaaatacc 3420
agttaatttc aatatagaag ctgattataa gaagttaaaa aataattacg attatgtctg 3480
caggcatgca agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 3540
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 3600
atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 3660
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 3720
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 3780
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 3840
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 3900
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 3960
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 4020
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 4080
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 4140
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 4200
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 4260
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 4320
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 4380
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 4440
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 4500
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 4560
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 4620
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 4680
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 4740
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 4800
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 4860
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 4920
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 4980
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 5040
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 5100
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 5160
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 5220
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 5280
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 5340
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 5400
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 5460
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 5520
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 5580
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 5640
tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 5700
aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 5760
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 5820
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 5880
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 5940
cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga 6000
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 6060
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 6120
cagtgaattc 6130
<210> 59
<211> 4680
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 59
tattgattga cgatgaggta atcaaaaaat tagaagcatg tattgacctt gcacctttgc 60
acaatcctgc taatattgag ggaataaaag cttgtcggca gataatgcca ggggtgccaa 120
tggtagcagt ttttgatacg gctttccatc aaacaatgcc agattatgcg tatatttatc 180
ccattcctta tgaatactac gaaaaatata gaataagaag atatggattc catgggactt 240
ctcataaata tgtatcttta agagctgctg aaatattaaa gaggcctatt gaagagttaa 300
aaattattac ttgccattta gggaatgggt ctagtattgc tgcggttaaa ggcggtaagt 360
cgatagatac aagtatggga tttactccat tagaagggct ggctatgggt acaaggtccg 420
gaaatgttga tccttcaatt ataactttct taatggaaaa agaaggattg actgcagaac 480
aggttataga tatacttaat aagaaatcag gtgtatacgg aatttcagga ataagtaatg 540
actttagaga tatagaaaac ccagcgaacc atttgaggtg ataggtaaga ttataccgag 600
gtatgaaaac gagaattgga cctttacaga attactctat gaagcgccat atttaaaaag 660
ctaccaagac gaagaggatg aagaggatga ggaggcagat tgccttgaat atattgacaa 720
tactgataag ataatatatc ttttatatag aagatatcgc cgtatgtaag gatttcaggg 780
ggcaaggcat aggcagcgcg cttatcaata tatctataga atgggcaaag cataaaaact 840
tgcatggact aatgcttgaa acccaggaca ataaccttat agcttgtaaa ttctatcata 900
attgtggttt caaaatcggc tccgtcgata ctatgttata cgccaacttt caaaacaact 960
ttgaaaaagc tgttttctgg tatttaaggt tttagaatgc aaggaacagt gaattggagt 1020
tcgtcttgtt ataattagct tcttggggta tctttaaata ctgtagaaaa gaggaaggaa 1080
ataataaatg gctaaaatga gaatatcacc ggaattgaaa aaactgatcg aaaaataccg 1140
ctgcgtaaaa gatacggaag gaatgtctcc tgctaaggta tataagctgg tgggagaaaa 1200
tgaaaaccta tatttaaaaa tgacggacag ccggtataaa gggaccacct atgatgtgga 1260
acgggaaaag gacatgatgc tatggctgga aggaaagctg cctgttccaa aggtcctgca 1320
ctttgaacgg catgatggct ggagcaatct gctcatgagt gaggccgatg gcgtcctttg 1380
ctcggaagag tatgaagatg aacaaagccc tgaaaagatt atcgagctgt atgcggagtg 1440
catcaggctc tttcactcca tcgacatatc ggattgtccc tatacgaata gcttagacag 1500
ccgcttagcc gaattggatt acttactgaa taacgatctg gccgatgtgg attgcgaaaa 1560
ctgggaagaa gacactccat ttaaagatcc gcgcgagctg tatgattttt taaagacgga 1620
aaagcccgaa gaggaacttg tcttttccca cggcgacctg ggagacagca acatctttgt 1680
gaaagatggc aaagtaagtg gctttattga tcttgggaga agcggcaggg cggacaagtg 1740
gtatgacatt gccttctgcg tccggtcgat cagggaggat atcggggaag aacagtatgt 1800
cgagctattt tttgacttac tggggatcaa gcctgattgg gagaaaataa aatattatat 1860
tttactggat gaattgtttt agtacctaga tttagatgtc taaaaagctt tttagacatc 1920
taatcttttc tgaagtacat ccgcaactgt ccatactctg atgttttata tcttttctaa 1980
aagttcgcta gataggggtc ccgagcgcct acgaggaatt tgtatcgctg caggcatgca 2040
agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 2100
ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 2160
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 2220
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 2280
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 2340
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 2400
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 2460
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 2520
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 2580
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 2640
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 2700
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 2760
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 2820
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 2880
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 2940
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 3000
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 3060
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 3120
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 3180
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 3240
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 3300
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 3360
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 3420
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 3480
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 3540
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 3600
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 3660
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 3720
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 3780
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 3840
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 3900
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 3960
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 4020
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 4080
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 4140
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 4200
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 4260
atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg 4320
cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt 4380
cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc ggcatcagag 4440
cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 4500
aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 4560
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 4620
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc 4680
<210> 60
<211> 5663
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
gttttataag aagctttgta aattttattt tctaagcctt cagagacatc aaatatgtga 60
ttgagaggaa tgtgatttct caacagataa attaaaatat tagaaaattc ctctaaagat 120
acgggacctt gttttttttc aaaagaactt tgcaaaattt cttttgtaaa gtccgggata 180
tatttttcta agccttctag tcccttttca aaaatatgct ttcttataga agaggcactg 240
gcaaattctc cttttagctc taaagaggtg tacaaagagc cttttctctt tatagtaaaa 300
ggtgtaatag aactacctat tttctttaaa gatttaaggt attctattgc caatatgtta 360
ttggatgttt gtaaaatctt ttctatttca ttattattta taactttttg taatgctaat 420
tcccgtgctt ttgcaaaggt tatgccgctt tttaaatatt cttttaatgc ttttctataa 480
taaattggct cttctaaaag tatttcagca atttttgtga gttcgtttaa atcgcctttt 540
tcactcccaa aggaaaaaca atctactatt tttaaagagt ctaatagttt caccgctcca 600
taagcgaaat tttcagctgt agaggtagca taaactactg gtaactcgat taccaaatct 660
ataccggctt ttaatgccat ttgagttcgt ttccatttgt ctacaattgc tggttctcct 720
ctttgcacga agtttccact cattactgct atagtataat cgcatttggt taattctttt 780
gaagtttgca gatggtaaag gtggccattg tgaaaaggat tatattcgac aataattcct 840
aaaattccca tacaacttct taccctttca aaaaattttt taagatatac ttattatttt 900
acataaaata tgataaaatg taaaagggac atcgtgtata caatattata gtgataaaat 960
taaaaaagga agggagattt taaatggcag taatggatag taaaacccag cgaaccattt 1020
gaggtgatag gtaagattat accgaggtat gaaaacgaga attggacctt tacagaatta 1080
ctctatgaag cgccatattt aaaaagctac caagacgaag aggatgaaga ggatgaggag 1140
gcagattgcc ttgaatatat tgacaatact gataagataa tatatctttt atatagaaga 1200
tatcgccgta tgtaaggatt tcagggggca aggcataggc agcgcgctta tcaatatatc 1260
tatagaatgg gcaaagcata aaaacttgca tggactaatg cttgaaaccc aggacaataa 1320
ccttatagct tgtaaattct atcataattg tggtttcaaa atcggctccg tcgatactat 1380
gttatacgcc aactttcaaa acaactttga aaaagctgtt ttctggtatt taaggtttta 1440
gaatgcaagg aacagtgaat tggagttcgt cttgttataa ttagcttctt ggggtatctt 1500
taaatactgt agaaaagagg aaggaaataa taaatggcta aaatgagaat atcaccggaa 1560
ttgaaaaaac tgatcgaaaa ataccgctgc gtaaaagata cggaaggaat gtctcctgct 1620
aaggtatata agctggtggg agaaaatgaa aacctatatt taaaaatgac ggacagccgg 1680
tataaaggga ccacctatga tgtggaacgg gaaaaggaca tgatgctatg gctggaagga 1740
aagctgcctg ttccaaaggt cctgcacttt gaacggcatg atggctggag caatctgctc 1800
atgagtgagg ccgatggcgt cctttgctcg gaagagtatg aagatgaaca aagccctgaa 1860
aagattatcg agctgtatgc ggagtgcatc aggctctttc actccatcga catatcggat 1920
tgtccctata cgaatagctt agacagccgc ttagccgaat tggattactt actgaataac 1980
gatctggccg atgtggattg cgaaaactgg gaagaagaca ctccatttaa agatccgcgc 2040
gagctgtatg attttttaaa gacggaaaag cccgaagagg aacttgtctt ttcccacggc 2100
gacctgggag acagcaacat ctttgtgaaa gatggcaaag taagtggctt tattgatctt 2160
gggagaagcg gcagggcgga caagtggtat gacattgcct tctgcgtccg gtcgatcagg 2220
gaggatatcg gggaagaaca gtatgtcgag ctattttttg acttactggg gatcaagcct 2280
gattgggaga aaataaaata ttatatttta ctggatgaat tgttttagta cctagattta 2340
gatgtctaaa aagcttttta gacatctaat cttttctgaa gtacatccgc aactgtccat 2400
actctgatgt tttatatctt ttctaaaagt tcgctagata ggggtcccga gcgcctacga 2460
ggaatttgta tcgtgacttt agagatatag aaaatgcagc ttttaaagaa gggcataaaa 2520
gggctatgtt ggcattaaaa gttttcgctt atagggtgaa aaagacaata ggttcttata 2580
cagctgctat gggtggggtt gatgtaattg tgtttactgc tggagttgga gaaaatggac 2640
cagaaatgag agagtttatt ttagaggatc tagagttttt aggctttaaa ctggacaaag 2700
agaagaataa ggtaagagga aaagaggaaa ttatatctac agaagattca aaagttaaag 2760
ttatggttat tcctacaaat gaagaatata tgattgctaa agatactgaa aaattggtaa 2820
aaggtttaaa gtagataatc ttgacaacgg gttgtggggt tagtataata ggtgatgtca 2880
attattttaa ggtgtgagaa gaaaaatgaa aatcgatcta ttaaaaatca aaggacagct 2940
tggccgcagc ataaatatag actatgtaga ggacatagag aacattgaat ttaaagggga 3000
agaatacaaa ctgcaggcat gcaagcttgg cgtaatcatg gtcatagctg tttcctgtgt 3060
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 3120
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 3180
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3240
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 3300
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 3360
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 3420
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 3480
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 3540
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 3600
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 3660
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 3720
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 3780
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 3840
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 3900
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 3960
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 4020
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 4080
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 4140
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 4200
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 4260
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 4320
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 4380
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 4440
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 4500
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 4560
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 4620
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 4680
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 4740
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 4800
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 4860
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 4920
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 4980
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 5040
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 5100
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 5160
ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga 5220
cattaaccta taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg 5280
acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg 5340
atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct 5400
ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa 5460
taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc 5520
gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 5580
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 5640
gtaaaacgac ggccagtgaa ttc 5663
<210> 61
<211> 5395
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
aattcgagct cggtacccgg ggatcctcta gagtcgacct gcaggcatgc aagggaagat 60
atgcctgctt gacattattg tccgtcattt ttcggtttat cctggtaaaa aaagttttaa 120
tcctctcaag gctttcttcg tgtaaaacaa gctttttccc caaaacttcc gcaacagtct 180
cctttgtaag gtcatcctgc gtggggccga gtcctccggt cataataaca aggtcgcacc 240
tttccaaagc tgcaagaaga cattttttca gccgaacgga attgtccccc accacactgt 300
gataatacac attcacacca atgtcattga gccttttgga tatatactgg gcattggtat 360
ttgctatctg ccccattaaa agctcggttc caaccgctaa tatctccgca ttcatattga 420
aagacccctt aaatttaaac tttttgtaac ttattatatc aattagtgtt ataaaataaa 480
agggaaaaag aattaaaatc aaaggtttca agagcagccg tatcacccgt aaaagtttca 540
gccgattcaa cctttttaca cataaaactt tcaaaaattg atgacttaca attatcaagt 600
aggatataat attactaatg ctaaacagtt attgataaag gaggaaggaa tatgaacaat 660
aacaaagtaa ttaaaaaagt aacccggact ttctgagaag ctgaatttct tcatcgttga 720
aaggcacgtt caatatttcc tcaataccgt ttacacccac gattgtcgga acacttaagc 780
atacatcgct aagtccgtac tgtccttcca aaaggcttga aacggtaagg atggagtttt 840
catttcttac aatggcttca acgattcttc ttacggcaag ggctacggca taataggttg 900
cacctttgtt cctgatgatt tcataagctg catttttaac actttcatat attttattcc 960
gggaaatctg ctcctcgcac tgatggcatt cgtcacagta gcgatccatg ggaattcccg 1020
caatatttgc aagactccag gccgcaactt cggtgtcacc gtgttcgcca ataatataag 1080
catgtacatt tcgtgcatcc acttttacat gttcgcttaa aagataacgg aacctggctg 1140
tgtccaaaac cgttccggaa cctattactt tgtttttcgg gaatccggat agtttgtaag 1200
ttacataggt taaaatatcc accggatttg tgactaccag aagaatacaa tcgttgttgt 1260
actttacaat ttcatttatg atatttttga atacttccgt gtttctttta acaagatcta 1320
ttctcgtttc gccttctttt tggttggcac cggcggtaat gattactatg tcggatccgg 1380
cacagtcttt gtagtcacca cgataaattt caacgggcct tacaaaaggc atgccgtgat 1440
ttaagtccat gacttctccg tcggcttttt ttgcatttat gtctatcagt acaatttcag 1500
atataagtcc gctgagcatc aatgtataag ctgtggtgga acctacaaag cctgcaccaa 1560
ctacgaaaca ctctaaaaga aataataaaa acactagata tatgaaagtt ctccttttct 1620
tttatgaaaa ggagaacttt cattattgat aaatatataa actagtatat aattttaata 1680
taaaacctat tttacataat ggaaattatc tatcggggga ggaaatatga acaattcagt 1740
ggaaatttta aataaaatcg tgtcaaatat tgaaaaagtc attgttggaa aaaagaaagc 1800
tatcgagttg atattaatat cacttatttg cgatggacat gttttgattg aagatgtccc 1860
cggtgtcgga aaaaccagta cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 1920
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 1980
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 2040
tcgggaaacc tgtcgtgcca gcccttcaaa cttcccaaag gcgagcccta gtgacattag 2100
aaaaccgact gtaaaaagta cagtcggcat tatctcatat tataaaagcc agtcattagg 2160
cctatctgac aattcctgaa tagagttcat aaacaatcct gcatgataac catcacaaac 2220
agaatgatgt acctgtaaag atagcggtaa atatattgaa ttacctttat taatgaattt 2280
tcctgctgta ataatgggta gaaggtaatt actattatta ttgatattta agttaaaccc 2340
agtaaatgaa gtccatggaa taatagaaag agaaaaagca ttttcaggta taggtgtttt 2400
gggaaacaat ttccccgaac cattatattt ctctacatca gaaaggtata aatcataaaa 2460
ctctttgaag tcattcttta caggagtcca aataccagag aatgttttag atacaccatc 2520
aaaaattgta taaagtggct ctaacttatc ccaataacct aactctccgt cgctattgta 2580
accagttcta aaagctgtat ttgagtttat cacccttgtc actaagaaaa taaatgcagg 2640
gtaaaattta tatccttctt gttttatgtt tcggtataaa acactaatat caatttctgt 2700
ggttatacta aaagtcgttt gttggttcaa ataatgatta aatatctctt ttctcttcca 2760
attgtctaaa tcaattttat taaagttcat ttgatatgcc tcctaaattt ttatctaaag 2820
tgaatttagg aggcttactt gtctgctttc ttcattagaa tcaatccttt tttaaaagtc 2880
aatcccgttt gttgaactac tctttaataa aataattttt ccgttcccaa ttccacattg 2940
caataataga aaatccatct tcatcggctt tttcgtcatc atctgtatga atcaaatcgc 3000
cttcttctgt gtcatcaagg tttaattttt tatgtatttc ttttaacaaa ccaccatagg 3060
agattaacct tttacggtgt aaaccttcct ccaaatcaga caaacgtttc aaattctttt 3120
cttcatcatc ggtcataaaa tccgtatcct ttacaggata ttttgcagtt tcgtcaattg 3180
ccgattgtat atccgattta tatttatttt tcggtcgaat catttgaact tttacatttg 3240
gatcatagtc taatttcatt gcctttttcc aaaattgaat ccattgtttt tgattcacgt 3300
agttttctgt attcttaaaa taagttggtt ccacacatac caatacatgc atgtgctgat 3360
tataagaatt atctttatta tttattgtca cttccgttgc acgcataaaa ccaacaagat 3420
ttttattaat ttttttatat tgcatcattc ggcgaaatcc ttgagccata tctgacaaac 3480
tcttatttaa ttcttcgcca tcataaacat ttttaactgt taatgtgaga aacaaccaac 3540
gaactgttgg cttttgttta ataacttcag caacaacctt ttgtgactga atgccatgtt 3600
tcattgctct cctccagttg cacattggac aaagcctgga tttacaaaac cacactcgat 3660
acaactttct ttcgcctgtt tcacgatttt gtttatactc taatatttca gcacaatctt 3720
ttactctttc agccttttta aattcaagaa tatgcagaag ttcaaagtaa tcaacattag 3780
cgattttctt ttctctccat ggtctcactt ttccactttt tgtcttgtcc actaaaaccc 3840
ttgatttttc atctgaataa atgctactat taggacacat aatattaaaa gaaaccccca 3900
tctatttagt tatttgtttg gtcacttata actttaacag atggggtttt tctgtgcaac 3960
caattttaag ggttttcaat actttaaaac acatacatac caacacttca acgcaccttt 4020
cagcaactaa aataaaaatg acgttatttc tatatgtatc aagaatagaa agaactcgtt 4080
tttcgctacg ctcaaaacgc aaaaaaagca ctcattcgag tgctttttct tatcgctcca 4140
aatcatgcga ttttttcctc tttgcttttc tttgctcacg aagttctcga tcacgctgca 4200
aaacatcttg aagcgaaaaa gtattcttct tttcttccga tcgctcatgc tgacgcacga 4260
aaagccctct aggcgcatag gaacaactcc taaatgcatg tgaggggttt tctcgtccat 4320
gtgaacagtc gcatacgcaa tattttgttt cccatactgc attaatgaat cggccaacgc 4380
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 4440
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 4500
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 4560
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 4620
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 4680
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 4740
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 4800
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 4860
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 4920
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 4980
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta 5040
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 5100
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 5160
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 5220
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 5280
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 5340
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtc 5395
<210> 62
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 62
atttacctgg ctgggaatac tgagacatat gtcattgagg ccgta 45
<210> 63
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 63
aaaaaagctt ataattatcc ttaatttcct actacgtgcg cccagatagg gtg 53
<210> 64
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 64
cagattgtac aaatgtggtg ataacagata agtctactac tgtaacttac ctttctttgt 60
<210> 65
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 65
tgaacgcaag tttctaattt cggttgaaat ccgatagagg aaagtgtct 49
<210> 66
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 66
ttaaatgttg ataaggaagc tcttttcaat gaagttaagg tagca 45
<210> 67
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 67
aaaaaagctt ataattatcc ttagctctct tcaatgtgcg cccagatagg gtg 53
<210> 68
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 68
cagattgtac aaatgtggtg ataacagata agtcttcaat gataacttac ctttctttgt 60
<210> 69
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 69
tgaacgcaag tttctaattt cgattagagc tcgatagagg aaagtgtct 49
<210> 70
<211> 1509
<212> DNA
<213> Caldiscellulosiruptor kristjanssonii
<400> 70
atgtatttta ttggaattga cgttggaaca tctggaacaa agacaatcct gattgactca 60
aaaggtaaga ttctggcttc tgcaaccttt gaatatcctc tttatcagcc tcagattggc 120
tgggctgagc aaaatcccga agactggtgg gatgcaagcg taaaaggaat taaagctgtg 180
cttgaaaagt caaaagtaga ccccaaggaa gttaaggctg tgggacttac cgggcagatg 240
cacgggcttg tgctgcttga caaaaactac aacgttataa gaccatcaat catctggtgt 300
gaccagagaa cggcaaaaga atgtgatgaa ataacagaaa aggttggcaa ggaaaagctt 360
gtggagatta cagcaaaccc tgcactgaca ggttttacag cgtccaagat tctgtgggtg 420
agaaacaacg agccccaaaa ctatgagaag gtctacaaaa ttttgcttcc caaagactat 480
ataaggttta aacttacagg cgagtttgca acagatgtgt cggacgcctc gggtatgcag 540
cttttggaca ttaaaaacag gtgctggtct gatgaggtac ttgaaaagct tgagatagac 600
aaagggcttc ttggaaaagt ctatgagtcg ccagaggtaa cgggaaaagt tagcgggcaa 660
gcaagcgaac ttacaggtct ttgtgaaggt acgcttgttg ttgcaggtgg aggagaccag 720
gcagcaggtg cagttggaaa tggcatagta aagacgggtg tgatttcatc tacaattggt 780
tcgtctggcg ttgtttttgc ccatcttgac gagtttaaga ttgacccaca gggaagggtt 840
cacacatttt gtcatgcagt gccgggaaaa tggcatgtga tgggtgtaac acaaggtgcc 900
ggactttctc tcaagtggtt tagagacaac tttgcacaca tcgaaaaggc tgcgtttgag 960
tttattgaca aagacccata cattttgatg gaccaggagg cagaacttgc aaacccaggc 1020
gcagacggac ttgttttcct gccatatttg atgggggaaa gaacgcccat tttggaccca 1080
tacgccaaag gaatattctt tggaataaca gcaaagcata cacgaagaga gttcattaga 1140
gctgtcatgg aaggtgttgt attttcactt aaaaactgtc ttgatatttt gtatgagatg 1200
ggcatcgagg tgaaggaggt aagagtttca ggcggtggtg caaagagcaa gctctggaga 1260
cagatgcagg cagacatatt tgagatggat gtatggacac tgaattccaa agaaggacct 1320
gcgtttggtg cagctatcct ggcagcagtt ggtgcaggag aatatcagaa ggttgaagaa 1380
gcctgtgata ctatgattca aaaggtagat aactgcagcc caaatgaaaa actatttgaa 1440
atatatagaa aaacttataa actttacaac agtatatatc caagagttaa ggacttattc 1500
aacatgtaa 1509
<210> 71
<211> 1317
<212> DNA
<213> Caldiscellulosiruptor kristjanssonii
<400> 71
atgaaatact tcaaagacat tccagaagta aaatatgaag gaccacagtc agacaatcca 60
tttgctttca agtattacaa tcctgacgag gttattgatg gcaagccttt aaaagaccac 120
cttcgttttg caattgctta ctggcacacg ttctgtgcaa ccggtagcga cccttttgga 180
caacctacaa ttaatcgtcc atgggacagg ttctcaaacc caatggacaa tgcaaaagca 240
agagttgaag ctgcatttga attttttgaa aagctaaatg ttccattttt ctgcttccac 300
gacagagaca tcgcacctga aggagaaaat ttaagagaaa caaacaagaa tttggatgag 360
atagtctcta tgataaaaga atatttaaag acaagcaaaa caagagtttt gtggggaaca 420
gcaaacctat tttcacatcc gcgatatgtt catggtgctg caacatcctg caatgccgat 480
gtttttgcgt atgcagcagc gcaggtgaaa aaggcgttag aggttacaaa agagcttggc 540
ggcgaaaact atgtgttctg gggcggaaga gaaggttatg agacactttt gaacaccgac 600
atggagcttg agcttgacaa cttggcaaga tttttgcaca tggcagttga ctatgcaaaa 660
gagatagggt ttgacggtca gtttttgatt gaaccaaagc caaaagaacc aactaagcat 720
cagtacgatt ttgatgccgc tcatgtttat ggatttttga aaaaatatga ccttgacaag 780
tacttcaagc tcaacataga ggtaaaccat gcgactttgg caggacatga tttccaccat 840
gagttgagat ttgcacgaat aaacaacatg cttggctcaa ttgatgctaa catgggcgac 900
ttgcttttgg gctgggatac agaccagttc ccaacagatg taagacttac cacgcttgct 960
atgtatgagg ttattaaagc tggtggcttt gacaaaggcg ggctcaactt tgacgcaaag 1020
gtaagaagag gttcttttga gcttgaagac ttggtcattg gtcacattgc agggatggac 1080
gcttttgcaa aaggatttaa gatagcatat aagcttgtca aagacggtgt atttgataag 1140
tttattgaag aaaggtatag aagctacaaa gaaggaattg gagctaagat tgtaagtggt 1200
caggcagatt ttaagacgtt agaagaatat gctttgaatc tttcaaagat agaaaacaaa 1260
tctggcaagc aagagcttct tgagatgatt ttgaacaaat atatgttcag tgaataa 1317
<210> 72
<211> 1536
<212> DNA
<213> Clostridium straminisolvens
<400> 72
ttgtcatatt tactgggagt agatataggt acatcaggca cgaaaactgt tttatatgat 60
gaactgggaa ataccgtagc aagcagcctt gaggaatatc cattgtacca gccccatatt 120
gggtgggcag agcaggaacc ggaagactgg tggagggcaa catgcctatc tatcaaacat 180
gttatttcca aaagaggaat tgatgcttcc tctattaagg gaatcggact ttcaggacag 240
atgcacgggg ctgttcttct ggacaaagac ggcaaagtgc taagaaaagc aattatatgg 300
tgtgaccaga gaagttttgc cgagtgcgag cagattactt caattatagg gaaggaaagg 360
ctcgttgaga taactgccaa ccctgcactg acgggattta cagcatcaaa ggttatgtgg 420
gttaaaaata atgaacctga aatttttgag aagatttata agatacttct ccctaaagac 480
tatataagat ataaattaac gggagaattt gctacagagg tatctgatgc cagtggaatg 540
cagtttatgg atataccggg gagaaaatgg agcgacgaag tcataagtaa actcggactt 600
gataaaagca tgctgggaga actctatgag tctcaggaag ttagcgggaa agtgaataag 660
tatgctgctt cattaaccgg acttaaggaa ggaactcctg tcgtgggtgg agcaggagac 720
caggcagcag gagctgtcgg taatggaatt gtgagacccg gggtggtttc atccactata 780
ggaacttcag gagtagtatt tgcattctct gaaaaggtta ctattgatcc aaagggtaga 840
gttcatactt tttgtcatgc ggtaccaaat acctggcaca ttatgggggt tacacaaggg 900
gccgggctgt ctcttaagtg gttccgtgac aatttctgta tagaagaaaa gagaactgca 960
gagctaatga aaatagaccc gtacataatt atggataaag aagctgaaaa agtggctccg 1020
ggctgtaacg gtttaatcta tttaccttat ctgatgggag aaagaacgcc acatcttgac 1080
cctaatgcca agggtgtctt tttcggatta acagcaaagc atgaaaaaca ggatatctta 1140
aggtcgatta tggaaggtgt tgtatatagc cttagagatt gccttgaaat tattgaggaa 1200
atgggtgtta acgtttctga agtaagagct tccggtggag gcggtaaaag tgaattgtgg 1260
agaaaaatgc aggcggatat attcggcact gatattacaa ccgtaaagtc aagtgaggga 1320
ccggcacttg gggtagcact tcttgccgga gtaggaacgg gtgtgtacaa caacattaat 1380
gaagcatgtg aagcagtaat aaaagaaaat acccggcagg cttcggaccc ggagctatat 1440
gtaaaataca cgaagtttta tgatatttat aaacgtctgt ataactcttt gaaaaaggaa 1500
tttgcagacc tttcggctat gctgcaaagt ttatag 1536
<210> 73
<211> 1320
<212> DNA
<213> Clostridium straminisolvens
<400> 73
atggcagagt attttaaaaa tgtaccgaaa atcaaatatg aaggaaagga ttcggacaat 60
cctttagcgt ttaagtacta taatcccgat gaggtcattg gcggtaaaac aatgaaagag 120
catctaaggt ttgctgttgc atattggcat acatatcagg gaacgggtgc agacccattt 180
gggccgggta ctgctgtaag accgtgggat gacatatcgg acccaatgga tcttgcaaag 240
gccaaagtgg ccgcaaattt cgagctgtgt gaaaaattgg gagtaccatt tttctgcttc 300
catgacagag atattgcgcc tgaagcttca actttaagag agaccaataa aagacttgat 360
gagattgttg cactgataaa ggactatatg aaaacaagta gtgtaaaact actctggggt 420
acaacaaatg cttttagcca cccaaggttt gtccatggtg catctacttc tccgaatgca 480
gatgtatttg catatgcagc agctcaggtt aaaaaggcta tggaaattac cctggaactt 540
ggcggtcaga actatgtgtt ctggggtgga agagaaggct atgaaacctt acttaatact 600
gatatgaaat tggagcttga caatatggca aggttccttg gaatggcagt tgactatgca 660
aaagagattg gttttaaagg gcagctcttg attgaaccta agccaaaaga accgacaaag 720
caccagtatg actttgatac agctacagtt atcggtttct taaggactta tggtcttgag 780
aattacttca aaatgaatat tgaagcaaat cacgctacac ttgcagctca tactttccag 840
catgaactta gggtttcaag aattaacggt gtgctaggaa gtatcgatgc aaaccagggt 900
gatcttcttt taggatggga cactgaccaa ttcccgacaa atatctacga tactaccctt 960
gctatgtatg aagtaattaa ggcaggcgga tttacaacgg gaggtctgaa ttttgattct 1020
aaagtcagaa gaggatcatt tgagcctgtg gacctgttct atgcacatat tgcaggtatg 1080
gacgcttttg caaaaggatt taaaatagca tataaaatgg tttccgacgg taagtttgac 1140
aaatttattg atgaaagata tgaaagctat aagagcggta ttggaaaaga tattgtagat 1200
ggaaaagtag ggtttaaaga gcttgaaaaa tatgctttag agcttgatgg tatcaagaat 1260
gtgtcgggaa gacaggaagt tctcgaagct atgttaaaca aatatattct tgaggactag 1320
<210> 74
<211> 8909
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 74
catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatccagta 60
ttctgacatg ggtgtatcaa taacccatgc gtttccgtat tgtatcggaa tggtttcgga 120
cagggcggtg ggaatagaca tggaaaagat ttttttgccc gaggatgcat tgataaagta 180
tttcttttcc gaaagagagg aaaagattct aaagagtttt ggaaatactg atgaatattg 240
tgtgcagagt acaattctat ggacaagaaa agaggctttg tcaaaacttt ttcgtctggg 300
aatgaggatg gattttaaaa agctggatac tttggaggac gaggtggttt ttcaggaaac 360
aaacagggcg cgtctgtttt cttttatatg caataattac tgtatctctc tggcattgcc 420
aggttttaat aaagattaaa attattgact agaaataaaa aaattgtcca taatattaat 480
ggacaaaaaa acaaagaatt acatcaaagg aagataaaaa tactttgtta aaaaattaat 540
tattttttat ctaaactatt gaaaatgaaa ataaaataat ataaaatgaa tcatagtgca 600
agagatactt gccagaggat gaatatttta ctgcattcat gctttatggc agctaataga 660
ggcattaaat taaattttaa tttacaatag gaggcgatat taatgaataa atattttgag 720
aacgtatcta aaataaaata tgaaggacca aaatcaaaca atccttattc ttttaaattt 780
tacaatccag aagaagtaat cgatggcaag acgatggagg agcatctacg cttttctata 840
gcttactggc acacttttac tgctgatgga acagatcaat ttggcaaagc taccatgcaa 900
agaccatgga accactacac agatcctatg gacatagcaa aggcaagggt agaagcagca 960
tttgagtttt ttgataagat aaatgcacct ttcttctgct tccatgacag ggatattgca 1020
cctgaaggag acactcttag agagacaaac aaaaacttag atacaatagt tgccatgata 1080
aaggattact tgaagaccag caagacgaaa gttttgtggg gcaccgcaaa tcttttctcc 1140
aatccgagat ttgtacatgg tgcatcaaca tcctgcaatg ctgatgtttt cgcatattct 1200
gcagctcaag ttaaaaaagc tcttgagatt actaaggagc ttggcggcga aaactacgta 1260
ttctggggtg gcagagaagg atatgaaaca cttctcaata cagacatgga gtttgagctt 1320
gacaactttg caagattttt gcacatggct gttgactacg cgaaggaaat cggctttgaa 1380
ggccagttct tgattgagcc gaagccaaag gagcctacga aacaccaata cgactttgac 1440
gtggcaaatg tattggcatt cttgagaaaa tacggccttg acaaatattt caaagtgaat 1500
atcgaggcaa accatgcgac attggcattc cacgacttcc aacatgagct aagatacgcc 1560
agaataaacg gtgtattagg atcaattgac gcaaatacag gcgatatgct tttaggatgg 1620
gatacagacc agttccctac agatatacgc atgacaacgc ttgctatgta tgaagtcata 1680
aagatgggtg gatttgacaa aggcggcctt aacttcgatg caaaagtaag acgtgcttca 1740
tttgaaccag aagatctttt cttaggtcat atagccggaa tggatgcctt tgcaaaaggc 1800
ttcaaagttg cttacaaact tgtgaaagat ggcgtatttg acaagttcat cgaggaaaga 1860
tacgcaagct acaaagacgg cattggcgct gacattgtaa gcgggaaagc tgacttcaag 1920
agccttgaaa agtacgcatt agagcacagc cagattgtca acaaatcagg caggcaagag 1980
ctgttagaat caatcctaaa tcagtatttg tttgcagaat aatgaaacat gagggcggct 2040
tcatgcttca ttaaagctgc cctcaacaaa aatcatggag gtaaatgtat gtatttttta 2100
gggatagatt tagggacatc atcagttaag ataatactga tgaatgaaag cggcaatgtg 2160
gtatcaagcg tttcaaaaga atatcctgtg tactatccag agccaggctg ggctgagcaa 2220
aatccagaag attggtggaa tggcacaagg gatggaataa gagagattat tgcgaaaagc 2280
ggcgtaaatg gcgatgaaat aaagggtgtt ggcttaagcg ggcagatgca tggactggtg 2340
cttttagaca aagacaataa cgttttaacg ccagccatac tttggtgtga ccagaggaca 2400
caggaagaat gcgactacat cacagagaaa ataggaaaag aaggcctttt gaagtacaca 2460
gggaataaag cattgacagg ttttactgca ccaaagatat tatgggtaaa gaagcacctt 2520
aaagacgtat atgaaagaat cgctcatatc cttttgccaa aagattatat aaggtttaaa 2580
ttgacaggtg agtacgctac agaagtttca gatgcatcag gtacacttct tttcgatgtg 2640
gaaaatagaa gatggtcaaa ggaaatgata gacatatttg aaataccgga aaaagccctt 2700
cctaagtgct acgaatcaac agatgtcaca gggtatgtca ccaaagaggc agcagatttg 2760
acagggcttc atgaagggac tattgtcgta ggcggtggtg gtgaccaagc cagcggcgct 2820
gtaggcactg gcacggtgaa aagcggcata gtgtccatcg cattaggaac ttcaggcgtc 2880
gtatttgcat cacaggacaa gtacgcagca gatgatgagc ttaggcttca ctcattctgc 2940
catgcaaacg gcaaatggca tgtgatgggt gtcatgcttt cggctgcatc atgtcttaaa 3000
tggtgggtag atgatgtaaa taattacaag accgatgtta tgacatttga tggactctta 3060
gaagaagcag agaaggtgaa gccaggcagt gatggattga tattcttgcc atacctgatg 3120
ggtgaaagga ccccttacag cgatccttat gcgagaggca gctttgtagg tttaacaatt 3180
acacacaata gaagccacat gacaagatct atattagaag gcgtcgcatt tggacttagg 3240
gattcgctgg agcttataaa ggctttaaat atacctgtaa atgaagccag ggtaagtggt 3300
ggtggtgcta aaagcaggct ttggaggcaa atacttgccg atgtattcaa tgtaaggata 3360
gacatgataa atgctacaga aggaccttca tttggtgcag caataatggc gtctgtggga 3420
tatggccttt acaaaaatgt agatgatgca tgcaatagtt taataaaagt tacagacagc 3480
gtatatccaa tcaaagaaaa cgtcgaaaag tacaacaaac tgtatccaat ctacgtgagc 3540
ttgtattcaa ggcttaaagg cgcctttgaa gaaattggga agttggattt gtaaaataaa 3600
ttcatttgga aataaattta tgacagtaca agggacattg attaacaaag cttcaggtta 3660
ataatagtaa agttaatatt tgctatgaaa tgaaagcata ataatctgtt ccttgtactt 3720
tgctttatca tgtttattta agatactaat taataaaagt caatttagcc aataataaaa 3780
tcctatatat agtaaatatt tacaataaaa tcactacaaa ataaaaaact ttatttaatc 3840
tcttaaaaat atctacataa gggggtgtta gatgaaaaag gccgtaatca tggtcatagc 3900
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 3960
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 4020
cactgcccgc tttccagtcg ggaaacctgt cgtgccagcc cttcaaactt cccaaaggcg 4080
agccctagtg acattagaaa accgactgta aaaagtacag tcggcattat ctcatattat 4140
aaaagccagt cattaggcct atctgacaat tcctgaatag agttcataaa caatcctgca 4200
tgataaccat cacaaacaga atgatgtacc tgtaaagata gcggtaaata tattgaatta 4260
cctttattaa tgaattttcc tgctgtaata atgggtagaa ggtaattact attattattg 4320
atatttaagt taaacccagt aaatgaagtc catggaataa tagaaagaga aaaagcattt 4380
tcaggtatag gtgttttggg aaacaatttc cccgaaccat tatatttctc tacatcagaa 4440
aggtataaat cataaaactc tttgaagtca ttctttacag gagtccaaat accagagaat 4500
gttttagata caccatcaaa aattgtataa agtggctcta acttatccca ataacctaac 4560
tctccgtcgc tattgtaacc agttctaaaa gctgtatttg agtttatcac ccttgtcact 4620
aagaaaataa atgcagggta aaatttatat ccttcttgtt ttatgtttcg gtataaaaca 4680
ctaatatcaa tttctgtggt tatactaaaa gtcgtttgtt ggttcaaata atgattaaat 4740
atctcttttc tcttccaatt gtctaaatca attttattaa agttcatttg atatgcctcc 4800
taaattttta tctaaagtga atttaggagg cttacttgtc tgctttcttc attagaatca 4860
atcctttttt aaaagtcaat cccgtttgtt gaactactct ttaataaaat aatttttccg 4920
ttcccaattc cacattgcaa taatagaaaa tccatcttca tcggcttttt cgtcatcatc 4980
tgtatgaatc aaatcgcctt cttctgtgtc atcaaggttt aattttttat gtatttcttt 5040
taacaaacca ccataggaga ttaacctttt acggtgtaaa ccttcctcca aatcagacaa 5100
acgtttcaaa ttcttttctt catcatcggt cataaaatcc gtatccttta caggatattt 5160
tgcagtttcg tcaattgccg attgtatatc cgatttatat ttatttttcg gtcgaatcat 5220
ttgaactttt acatttggat catagtctaa tttcattgcc tttttccaaa attgaatcca 5280
ttgtttttga ttcacgtagt tttctgtatt cttaaaataa gttggttcca cacataccaa 5340
tacatgcatg tgctgattat aagaattatc tttattattt attgtcactt ccgttgcacg 5400
cataaaacca acaagatttt tattaatttt tttatattgc atcattcggc gaaatccttg 5460
agccatatct gacaaactct tatttaattc ttcgccatca taaacatttt taactgttaa 5520
tgtgagaaac aaccaacgaa ctgttggctt ttgtttaata acttcagcaa caaccttttg 5580
tgactgaatg ccatgtttca ttgctctcct ccagttgcac attggacaaa gcctggattt 5640
acaaaaccac actcgataca actttctttc gcctgtttca cgattttgtt tatactctaa 5700
tatttcagca caatctttta ctctttcagc ctttttaaat tcaagaatat gcagaagttc 5760
aaagtaatca acattagcga ttttcttttc tctccatggt ctcacttttc cactttttgt 5820
cttgtccact aaaacccttg atttttcatc tgaataaatg ctactattag gacacataat 5880
attaaaagaa acccccatct atttagttat ttgtttggtc acttataact ttaacagatg 5940
gggtttttct gtgcaaccaa ttttaagggt tttcaatact ttaaaacaca tacataccaa 6000
cacttcaacg cacctttcag caactaaaat aaaaatgacg ttatttctat atgtatcaag 6060
aatagaaaga actcgttttt cgctacgctc aaaacgcaaa aaaagcactc attcgagtgc 6120
tttttcttat cgctccaaat catgcgattt tttcctcttt gcttttcttt gctcacgaag 6180
ttctcgatca cgctgcaaaa catcttgaag cgaaaaagta ttcttctttt cttccgatcg 6240
ctcatgctga cgcacgaaaa gccctctagg cgcataggaa caactcctaa atgcatgtga 6300
ggggttttct cgtccatgtg aacagtcgca tacgcaatat tttgtttccc atactgcatt 6360
aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct 6420
cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa 6480
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 6540
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 6600
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 6660
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 6720
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 6780
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 6840
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 6900
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 6960
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 7020
acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 7080
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 7140
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 7200
cggggatcgc ttgcctgtaa cttacacgcg cctcgtatct tttaatgatg gaataatttg 7260
ggaatttact ctgtgtttat ttatttttat gttttgtatt tggattttag aaagtaaata 7320
aagaaggtag aagagttacg gaatgaagaa aaaaaaataa acaaaggttt aaaaaatttc 7380
aacaaaaagc gtactttaca tatatattta ttagacaaga aaagcagatt aaatagatat 7440
acattcgatt aacgataagt aaaatgtaaa atcacaggat tttcgtgtgt ggtcttctac 7500
acagacaaga tgaaacaatt cggcattaat acctgagagc aggaagagca agataaaagg 7560
tagtatttgt tggcgatccc cctagagtct tttacatctt cggaaaacaa aaactatttt 7620
ttctttaatt tcttttttta ctttctattt ttaatttata tatttatatt aaaaaattta 7680
aattataatt atttttatag cacgtgatga aaaggaccca tcgataagct agcttttcaa 7740
ttcaattcat catttttttt ttattctttt ttttgatttc ggtttctttg aaattttttt 7800
gattcggtaa tctccgaaca gaaggaagaa cgaaggaagg agcacagact tagattggta 7860
tatatacgca tatgtagtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg 7920
cacagaacaa aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa 7980
cgtgctgcta ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag 8040
caaacaaact tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt 8100
gaagcattag gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt 8160
tccatggagg gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc 8220
ttcgaagaca gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt 8280
gtatacagaa tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt 8340
attgttagcg gtttgaagca ggcggcagaa gaagtaacaa aggaacctag aggccttttg 8400
atgttagcag aattgtcatg caagggctcc ctatctactg gagaatatac taagggtact 8460
gttgacattg cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg 8520
ggtggaagag atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac 8580
aagggagacg cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct 8640
gacattatta ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt 8700
gaacgttaca gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa 8760
aaaactgtat tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa 8820
ttatatcagt tattacccac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 8880
ttctaaatac attcaaatat gtatccgct 8909
<210> 75
<211> 6972
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 75
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 60
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 120
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 180
tgtcaattcg agctcggtac ccggggatcc ttaagaagac taataaaaag tttctaaaag 240
catgaaatat cctgtatttt ggagttactt gccgttattt atggctaaag ccgaaaaaaa 300
gataaggagg gtgttgtata caaaaaacat tttgtatata attagagttg cttggaaccc 360
agtaaaatag ctgtttatag tgagtaggta ttattacctg atgagttata ctgtcggtac 420
ctatttagcg gagcggcttg tccagattgg tctcaagcat cacttcgcag tcgcgggcga 480
ctacaacctc gtccttcttg acaacctgct tttgaacaaa aacatggagc aggtttattg 540
ctgtaacgaa ctgaactgcg gtttcagtgc agaaggttat gctcgtgcca aaggcgcagc 600
agcagccgtc gttacctaca gcgtcggtgc gctttccgca tttgatgcta tcggtggcgc 660
ctatgcagaa aaccttccgg ttatcctgat ctccggtgct ccgaacaaca atgatcacgc 720
tgctggtcac gtgttgcatc acgctcttgg caaaaccgac tatcactatc agttggaaat 780
ggccaagaac atcacggccg ccgctgaagc gatttacacc ccggaagaag ctccggctaa 840
aatcgatcac gtgattaaaa ctgctcttcg tgagaagaag ccggtttatc tcgaaatcgc 900
ttgcaacatt gcttccatgc cctgcgccgc tcctggaccg gcaagcgcat tgttcaatga 960
cgaagccagc gacgaagctt ctttgaatgc agcggttgaa gaaaccctga aattcatcgc 1020
caaccgcgac aaagttgccg tcctcgtcgg cagcaagctg cgcgcagctg gtgctgaaga 1080
agctgctgtc aaatttgctg atgctctcgg tggcgcagtt gctaccatgg ctgctgcaaa 1140
aagcttcttc ccagaagaaa acccgcatta catcggcacc tcatggggtg aagtcagcta 1200
tccgggcgtt gaaaagacga tgaaagaagc cgatgcggtt atcgctctgg ctcctgtctt 1260
caacgactac tccaccactg gttggacgga tattcctgat cctaagaaac tggttctcgc 1320
tgaaccgcgt tctgtcgtcg ttaacggcat tcgcttcccc agcgtccatc tgaaagacta 1380
tctgacccgt ttggctcaga aagtttccaa gaaaaccggt gcattggact tcttcaaatc 1440
cctcaatgca ggtgaactga agaaagccgc tccggctgat ccgagtgctc cgttggtcaa 1500
cgcagaaatc gcccgtcagg tcgaagctct tctgaccccg aacacgacgg ttattgctga 1560
aaccggtgac tcttggttca atgctcagcg catgaagctc ccgaacggtg ctcgcgttga 1620
atatgaaatg cagtggggtc acattggttg gtccgttcct gccgccttcg gttatgccgt 1680
cggtgctccg gaacgtcgca acatcctcat ggttggtgat ggttccttcc agctgacggc 1740
tcaggaagtc gctcagatgg ttcgcctgaa actgccggtt atcatcttct tgatcaataa 1800
ctatggttac accatcgaag ttatgatcca tgatggtccg tacaacaaca tcaagaactg 1860
ggattatgcc ggtctgatgg aagtgttcaa cggtaacggt ggttatgaca gcggtgctgg 1920
taaaggcctg aaggctaaaa ccggtggcga actggcagaa gctatcaagg ttgctctggc 1980
aaacaccgac ggcccaaccc tgatcgaatg cttcatcggt cgtgaagact gcactgaaga 2040
attggtcaaa tggggtaagc gcgttgctgc cgccaacagc cgtaagcctg ttaacaagct 2100
cctctagatt ctgttaaaac cggacattga agaaggtgtt gcgcagcgtt taataaaaac 2160
atctgtttat cgaagtttag gaataggaaa attaaaaaaa acaagacggg agtgagtttt 2220
tgaaatggct tcttcaactt tttatattcc tttcgtcaac gaaatgggcg aaggttcgct 2280
tgaaaaagca atcaaggatc ttaacggcag cggctttaaa aatgcgctga tcgtttctga 2340
tgctttcatg aacaaatccg gtgttgtgaa gcaggttgct gacctgttga aagcacaggg 2400
tattaattct gctgtttatg atggcgttat gccgaacccg actgttaccg cagttctgga 2460
aggccttaag atcctgaagg ataacaattc agacttcgtc atctccctcg gtggtggttc 2520
tccccatgac tgcgccaaag ccatcgctct ggtcgcaacc aatggtggtg aagtcaaaga 2580
ctacgaaggt atcgacaaat ctaagaaacc tgccctgcct ttgatgtcaa tcaacacgac 2640
ggctggtacg gcttctgaaa tgacgcgttt ctgcatcatc actgatgaag tccgtcacgt 2700
taagatggcc attgttgacc gtcacgttac cccgatggtt tccgtcaacg atcctctgtt 2760
gatggttggt atgccaaaag gcctgaccgc cgccaccggt atggatgctc tgacccacgc 2820
atttgaagct tattcttcaa cggcagctac tccgatcacc gatgcttgcg ctttgaaagc 2880
agcttccatg atcgctaaga atctgaagac cgcttgcgac aacggtaagg atatgccggc 2940
tcgtgaagct atggcttatg cccaattcct cgctggtatg gccttcaaca acgcttcgct 3000
tggttatgtc catgctatgg ctcaccagtt gggcggttac tacaacctgc cgcatggtgt 3060
ctgcaacgct gttctgcttc cgcatgttct ggcttataac gcctctgtcg ttgctggtcg 3120
tctgaaagac gttggtgttg ctatgggtct cgatatcgcc aatctcggtg ataaagaagg 3180
cgcagaagcc accattcagg ctgttcgcga tctggctgct tccattggta ttccagcaaa 3240
cctgaccgag ctgggtgcta agaaagaaga tgtgccgctt cttgctgacc acgctctgaa 3300
agatgcttgt gctctgacca acccgcgtca gggtgatcag aaagaagttg aagaactctt 3360
cctgagcgct ttctaaaaga tgcgttataa ttttacaagc ctgttttttt aggaaacggg 3420
cttataaaat ttttttattt ttttgccggg ttttttcttg tattaatatg tggaatatgt 3480
taataatatt aagaagaaat tccgaattta actaaacaaa attatttttg ttatttaagc 3540
caatctgtca tataattctt gacatgaggg ttattagtta gtataatagt ccttgtcggt 3600
tttaagaggg atcctctaga gtcgacctgc aggcatgcaa gcttggcgta atcatggtca 3660
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 3720
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 3780
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agcccttcaa acttcccaaa 3840
ggcgagccct agtgacatta gaaaaccgac tgtaaaaagt acagtcggca ttatctcata 3900
ttataaaagc cagtcattag gcctatctga caattcctga atagagttca taaacaatcc 3960
tgcatgataa ccatcacaaa cagaatgatg tacctgtaaa gatagcggta aatatattga 4020
attaccttta ttaatgaatt ttcctgctgt aataatgggt agaaggtaat tactattatt 4080
attgatattt aagttaaacc cagtaaatga agtccatgga ataatagaaa gagaaaaagc 4140
attttcaggt ataggtgttt tgggaaacaa tttccccgaa ccattatatt tctctacatc 4200
agaaaggtat aaatcataaa actctttgaa gtcattcttt acaggagtcc aaataccaga 4260
gaatgtttta gatacaccat caaaaattgt ataaagtggc tctaacttat cccaataacc 4320
taactctccg tcgctattgt aaccagttct aaaagctgta tttgagttta tcacccttgt 4380
cactaagaaa ataaatgcag ggtaaaattt atatccttct tgttttatgt ttcggtataa 4440
aacactaata tcaatttctg tggttatact aaaagtcgtt tgttggttca aataatgatt 4500
aaatatctct tttctcttcc aattgtctaa atcaatttta ttaaagttca tttgatatgc 4560
ctcctaaatt tttatctaaa gtgaatttag gaggcttact tgtctgcttt cttcattaga 4620
atcaatcctt ttttaaaagt caatcccgtt tgttgaacta ctctttaata aaataatttt 4680
tccgttccca attccacatt gcaataatag aaaatccatc ttcatcggct ttttcgtcat 4740
catctgtatg aatcaaatcg ccttcttctg tgtcatcaag gtttaatttt ttatgtattt 4800
cttttaacaa accaccatag gagattaacc ttttacggtg taaaccttcc tccaaatcag 4860
acaaacgttt caaattcttt tcttcatcat cggtcataaa atccgtatcc tttacaggat 4920
attttgcagt ttcgtcaatt gccgattgta tatccgattt atatttattt ttcggtcgaa 4980
tcatttgaac ttttacattt ggatcatagt ctaatttcat tgcctttttc caaaattgaa 5040
tccattgttt ttgattcacg tagttttctg tattcttaaa ataagttggt tccacacata 5100
ccaatacatg catgtgctga ttataagaat tatctttatt atttattgtc acttccgttg 5160
cacgcataaa accaacaaga tttttattaa tttttttata ttgcatcatt cggcgaaatc 5220
cttgagccat atctgacaaa ctcttattta attcttcgcc atcataaaca tttttaactg 5280
ttaatgtgag aaacaaccaa cgaactgttg gcttttgttt aataacttca gcaacaacct 5340
tttgtgactg aatgccatgt ttcattgctc tcctccagtt gcacattgga caaagcctgg 5400
atttacaaaa ccacactcga tacaactttc tttcgcctgt ttcacgattt tgtttatact 5460
ctaatatttc agcacaatct tttactcttt cagccttttt aaattcaaga atatgcagaa 5520
gttcaaagta atcaacatta gcgattttct tttctctcca tggtctcact tttccacttt 5580
ttgtcttgtc cactaaaacc cttgattttt catctgaata aatgctacta ttaggacaca 5640
taatattaaa agaaaccccc atctatttag ttatttgttt ggtcacttat aactttaaca 5700
gatggggttt ttctgtgcaa ccaattttaa gggttttcaa tactttaaaa cacatacata 5760
ccaacacttc aacgcacctt tcagcaacta aaataaaaat gacgttattt ctatatgtat 5820
caagaataga aagaactcgt ttttcgctac gctcaaaacg caaaaaaagc actcattcga 5880
gtgctttttc ttatcgctcc aaatcatgcg attttttcct ctttgctttt ctttgctcac 5940
gaagttctcg atcacgctgc aaaacatctt gaagcgaaaa agtattcttc ttttcttccg 6000
atcgctcatg ctgacgcacg aaaagccctc taggcgcata ggaacaactc ctaaatgcat 6060
gtgaggggtt ttctcgtcca tgtgaacagt cgcatacgca atattttgtt tcccatactg 6120
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 6180
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 6240
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 6300
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 6360
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 6420
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 6480
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 6540
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6600
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6660
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6720
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6780
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6840
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6900
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6960
tctacggggt ct 6972
<210> 76
<211> 6936
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 76
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 60
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 120
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 180
tgtcaattcg agctcggtac ccggggatcc ttaagaagac taataaaaag tttctaaaag 240
catgaaatat cctgtatttt ggagttactt gccgttattt atggctaaag ccgaaaaaaa 300
gataaggagg gtgttgtata caaaaaacat tttgtatata attagagttg cttggaaccc 360
agtaaaatag ctgtttatag tgagtaggta ttattacctg atgtataccg ttggtatgta 420
cttggcagaa cgcctagccc agatcggcct gaaacaccac tttgccgtgg ccggtgacta 480
caacctggtg ttgcttgatc agctcctgct gaacaaagac atggagcagg tctactgctg 540
taacgaactt aactgcggct ttagcgccga aggttacgct cgtgcacgtg gtgccgccgc 600
tgccatcgtc acgttcagcg taggtgctat ctctgcaatg aacgccatcg gtggcgccta 660
tgcagaaaac ctgccggtca tcctgatctc tggctcaccg aacaccaatg actacggcac 720
aggccacatc ctgcaccaca ccattggtac tactgactat aactatcagc tggaaatggt 780
aaaacacgtt acctgcgcac gtgaaagcat cgtttctgcc gaagaagcac cggcaaaaat 840
cgaccacgtc atccgtacgg ctctacgtga acgcaaaccg gcttatctgg aaatcgcatg 900
caacgtcgct ggcgctgaat gtgttcgtcc gggcccgatc aatagcctgc tgcgtgaact 960
cgaagttgac cagaccagtg tcactgccgc tgtagatgcc gccgtagaat ggctgcagga 1020
ccgccagaac gtcgtcatgc tggtcggtag caaactgcgt gccgctgccg ctgaaaaaca 1080
ggctgttgcc ctagcggacc gcctgggctg cgctgtcacg atcatggctg ccgaaaaagg 1140
cttcttcccg gaagatcatc cgaacttccg cggcctgtac tggggtgaag tcagctccga 1200
aggtgcacag gaactggttg aaaacgccga tgccatcctg tgtctggcac cggtattcaa 1260
cgactatgct accgttggct ggaactcctg gccgaaaggc gacaatgtca tggtcatgga 1320
caccgaccgc gtcactttcg caggacagtc cttcgaaggt ctgtcattga gcaccttcgc 1380
cgcagcactg gctgagaaag caccttctcg cccggcaacg actcaaggca ctcaagcacc 1440
ggtactgggt attgaggccg cagagcccaa tgcaccgctg accaatgacg aaatgacgcg 1500
tcagatccag tcgctgatca cttccgacac tactctgaca gcagaaacag gtgactcttg 1560
gttcaacgct tctcgcatgc cgattcctgg cggtgctcgt gtcgaactgg aaatgcaatg 1620
gggtcatatc ggttggtccg taccttctgc attcggtaac gccgttggtt ctccggagcg 1680
tcgccacatc atgatggtcg gtgatggctc tttccagctg actgctcaag aagttgctca 1740
gatgatccgc tatgaaatcc cggtcatcat cttcctgatc aacaaccgcg gttacgtcat 1800
cgaaatcgct atccatgacg gcccttacaa ctacatcaaa aactggaact acgctggcct 1860
gatcgacgtc ttcaatgacg aagatggtca tggcctgggt ctgaaagctt ctactggtgc 1920
agaactagaa ggcgctatca agaaagcact cgacaatcgt cgcggtccga cgctgatcga 1980
atgtaacatc gctcaggacg actgcactga aaccctgatt gcttggggta aacgtgtagc 2040
agctaccaac tctcgcaaac cacaagcgta aattctgtta aaaccggaca ttgaagaagg 2100
tgttgcgcag cgtttaataa aaacatctgt ttatcgaagt ttaggaatag gaaaattaaa 2160
aaaaacaaga cgggagtgag tttttgaaat ggcttcttca actttttata ttcctttcgt 2220
caacgaaatg ggcgaaggtt cgcttgaaaa agcaatcaag gatcttaacg gcagcggctt 2280
taaaaatgcg ctgatcgttt ctgatgcttt catgaacaaa tccggtgttg tgaagcaggt 2340
tgctgacctg ttgaaagcac agggtattaa ttctgctgtt tatgatggcg ttatgccgaa 2400
cccgactgtt accgcagttc tggaaggcct taagatcctg aaggataaca attcagactt 2460
cgtcatctcc ctcggtggtg gttctcccca tgactgcgcc aaagccatcg ctctggtcgc 2520
aaccaatggt ggtgaagtca aagactacga aggtatcgac aaatctaaga aacctgccct 2580
gcctttgatg tcaatcaaca cgacggctgg tacggcttct gaaatgacgc gtttctgcat 2640
catcactgat gaagtccgtc acgttaagat ggccattgtt gaccgtcacg ttaccccgat 2700
ggtttccgtc aacgatcctc tgttgatggt tggtatgcca aaaggcctga ccgccgccac 2760
cggtatggat gctctgaccc acgcatttga agcttattct tcaacggcag ctactccgat 2820
caccgatgct tgcgctttga aagcagcttc catgatcgct aagaatctga agaccgcttg 2880
cgacaacggt aaggatatgc cggctcgtga agctatggct tatgcccaat tcctcgctgg 2940
tatggccttc aacaacgctt cgcttggtta tgtccatgct atggctcacc agttgggcgg 3000
ttactacaac ctgccgcatg gtgtctgcaa cgctgttctg cttccgcatg ttctggctta 3060
taacgcctct gtcgttgctg gtcgtctgaa agacgttggt gttgctatgg gtctcgatat 3120
cgccaatctc ggtgataaag aaggcgcaga agccaccatt caggctgttc gcgatctggc 3180
tgcttccatt ggtattccag caaacctgac cgagctgggt gctaagaaag aagatgtgcc 3240
gcttcttgct gaccacgctc tgaaagatgc ttgtgctctg accaacccgc gtcagggtga 3300
tcagaaagaa gttgaagaac tcttcctgag cgctttctaa aagatgcgtt ataattttac 3360
aagcctgttt ttttaggaaa cgggcttata aaattttttt atttttttgc cgggtttttt 3420
cttgtattaa tatgtggaat atgttaataa tattaagaag aaattccgaa tttaactaaa 3480
caaaattatt tttgttattt aagccaatct gtcatataat tcttgacatg agggttatta 3540
gttagtataa tagtccttgt cggttttaag agggatcctc tagagtcgac ctgcaggcat 3600
gcaagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 3660
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 3720
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 3780
tgccagccct tcaaacttcc caaaggcgag ccctagtgac attagaaaac cgactgtaaa 3840
aagtacagtc ggcattatct catattataa aagccagtca ttaggcctat ctgacaattc 3900
ctgaatagag ttcataaaca atcctgcatg ataaccatca caaacagaat gatgtacctg 3960
taaagatagc ggtaaatata ttgaattacc tttattaatg aattttcctg ctgtaataat 4020
gggtagaagg taattactat tattattgat atttaagtta aacccagtaa atgaagtcca 4080
tggaataata gaaagagaaa aagcattttc aggtataggt gttttgggaa acaatttccc 4140
cgaaccatta tatttctcta catcagaaag gtataaatca taaaactctt tgaagtcatt 4200
ctttacagga gtccaaatac cagagaatgt tttagataca ccatcaaaaa ttgtataaag 4260
tggctctaac ttatcccaat aacctaactc tccgtcgcta ttgtaaccag ttctaaaagc 4320
tgtatttgag tttatcaccc ttgtcactaa gaaaataaat gcagggtaaa atttatatcc 4380
ttcttgtttt atgtttcggt ataaaacact aatatcaatt tctgtggtta tactaaaagt 4440
cgtttgttgg ttcaaataat gattaaatat ctcttttctc ttccaattgt ctaaatcaat 4500
tttattaaag ttcatttgat atgcctccta aatttttatc taaagtgaat ttaggaggct 4560
tacttgtctg ctttcttcat tagaatcaat ccttttttaa aagtcaatcc cgtttgttga 4620
actactcttt aataaaataa tttttccgtt cccaattcca cattgcaata atagaaaatc 4680
catcttcatc ggctttttcg tcatcatctg tatgaatcaa atcgccttct tctgtgtcat 4740
caaggtttaa ttttttatgt atttctttta acaaaccacc ataggagatt aaccttttac 4800
ggtgtaaacc ttcctccaaa tcagacaaac gtttcaaatt cttttcttca tcatcggtca 4860
taaaatccgt atcctttaca ggatattttg cagtttcgtc aattgccgat tgtatatccg 4920
atttatattt atttttcggt cgaatcattt gaacttttac atttggatca tagtctaatt 4980
tcattgcctt tttccaaaat tgaatccatt gtttttgatt cacgtagttt tctgtattct 5040
taaaataagt tggttccaca cataccaata catgcatgtg ctgattataa gaattatctt 5100
tattatttat tgtcacttcc gttgcacgca taaaaccaac aagattttta ttaatttttt 5160
tatattgcat cattcggcga aatccttgag ccatatctga caaactctta tttaattctt 5220
cgccatcata aacattttta actgttaatg tgagaaacaa ccaacgaact gttggctttt 5280
gtttaataac ttcagcaaca accttttgtg actgaatgcc atgtttcatt gctctcctcc 5340
agttgcacat tggacaaagc ctggatttac aaaaccacac tcgatacaac tttctttcgc 5400
ctgtttcacg attttgttta tactctaata tttcagcaca atcttttact ctttcagcct 5460
ttttaaattc aagaatatgc agaagttcaa agtaatcaac attagcgatt ttcttttctc 5520
tccatggtct cacttttcca ctttttgtct tgtccactaa aacccttgat ttttcatctg 5580
aataaatgct actattagga cacataatat taaaagaaac ccccatctat ttagttattt 5640
gtttggtcac ttataacttt aacagatggg gtttttctgt gcaaccaatt ttaagggttt 5700
tcaatacttt aaaacacata cataccaaca cttcaacgca cctttcagca actaaaataa 5760
aaatgacgtt atttctatat gtatcaagaa tagaaagaac tcgtttttcg ctacgctcaa 5820
aacgcaaaaa aagcactcat tcgagtgctt tttcttatcg ctccaaatca tgcgattttt 5880
tcctctttgc ttttctttgc tcacgaagtt ctcgatcacg ctgcaaaaca tcttgaagcg 5940
aaaaagtatt cttcttttct tccgatcgct catgctgacg cacgaaaagc cctctaggcg 6000
cataggaaca actcctaaat gcatgtgagg ggttttctcg tccatgtgaa cagtcgcata 6060
cgcaatattt tgtttcccat actgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6120
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 6180
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 6240
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 6300
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 6360
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 6420
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 6480
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 6540
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 6600
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 6660
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 6720
ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 6780
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 6840
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 6900
tctcaagaag atcctttgat cttttctacg gggtct 6936
<210> 77
<211> 1509
<212> DNA
<213> Clostridium thermocellum
<400> 77
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgagcgggg 60
atatacggaa ggtttaccgg aagtatatcc tagcggcgga cgggtgagta acgcgtgggt 120
aacctacctc atacaggggg ataacacagg gaaacctgtg ctaataccgc ataacggggc 180
ggcatcgtcc tgttatcaaa ggagaaatcc ggtatgagat gggcccgcgt ccgattagct 240
agttggtgag gtaacggctc accaaggcga cgatcggtag ccgaactgag aggttggtcg 300
gccacattgg gactgagaca cggcccagac tcctacggga ggcagcagtg gggaatattg 360
cgcaatgggg gaaaccctga cgcagcaacg ccgcgtgaag gaagaaggcc ttcgggttgt 420
aaacttcttt gattggggac gaaggaagtg acggtaccca aagaacaagc cacggctaac 480
tacgtgccag cagccgcggt aatacgtagg tggcgagcgt tgtccggaat tactgggtgt 540
aaagggcgcg taggcgggat gcaagtcaga tgtgaaattc cggggcttaa ccccggggct 600
gcatctgaaa ctgtatctct tgagtgctgg agaggaaagc ggaattccta gtgtagcggt 660
gaaatgcgta gatattagga ggaacaccag tggcgaaggc ggctttctgg acagtaactg 720
acgctgaggc gcgaaagcgt ggggagcaaa caggattaga taccctggta gtccacgccg 780
taaacgatgg atactaggtg taggaggtat cgaccccttc tgtgccggag ttaacacaat 840
aagtatccca cctggggagt acggccgcaa ggttgaaact caaaggaatt gacgggggcc 900
cgcacaagca gtggagtatg tggtttaatt cgaagcaacg cgaagaacct taccagggct 960
tgacatccct ctgacagctc tagagatagg gcttccttcg gggcagagga gacaggtggt 1020
gcatggttgt cgtcagctcg tgtcgtgaga tgttgggtta agtcccgcaa cgagcgcaac 1080
ccttgtcgtt agttgccagc acgttaaggt gggcactcta gcgagactgc cggcgacaag 1140
tcggaggaag gtggggacga cgtcaaatca tcatgcccct tatgtcctgg gctacacacg 1200
tactacaatg gctgctacaa agggaagcga taccgcgagg tggagcaaat ccccaaaagc 1260
agtcccagtt cggattgcag gctgaaactc gcctgcatga agtcggaatt gctagtaatg 1320
gcaggtcagc atactgccgt gaatacgttc ccgggccttg tacacaccgc ccgtcacacc 1380
atgagagtct gcaacacccg aagtcatagt ctaaccgcaa ggagggcgct gccgaaggtg 1440
gggcagatga ttggggtgaa gtcgtaacaa ggtagccgta tcggaaggtg cggctggatc 1500
acctccttt 1509
<210> 78
<211> 1642
<212> DNA
<213> Clostridium cellulolyticum
<220>
<221> modified_base
<222> (9)..(9)
<223> a, c, g or t
<220>
<221> modified_base
<222> (16)..(16)
<223> a, c, g or t
<220>
<221> modified_base
<222> (26)..(26)
<223> a, c, g or t
<220>
<221> modified_base
<222> (70)..(70)
<223> a, c, g or t
<220>
<221> modified_base
<222> (86)..(86)
<223> a, c, g or t
<220>
<221> modified_base
<222> (96)..(96)
<223> a, c, g or t
<220>
<221> modified_base
<222> (113)..(115)
<223> a, c, g or t
<220>
<221> modified_base
<222> (320)..(320)
<223> a, c, g or t
<220>
<221> modified_base
<222> (443)..(443)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1109)..(1109)
<223> a, c, g or t
<400> 78
tgatcctgng acaggncgag cgctgncggc gtgcctaaca catgcgagtc gagcggagtt 60
acctttagcn ctgagtattc ttgganatga tgctgncccg acagcgtcat ccnnnaacaa 120
ccttaatgaa atatttagtt ggagttttgc atcacgcgtt ttatcaaagt gtcaacacat 180
aatagtagaa gagaatgttc agtgctgaag gtaacttagc ggcggacggg tgagtaacgc 240
gtgggcaacc tgcctgttac agggggataa cacagggaaa cttgtgctaa taccgcataa 300
cacaacgaag aagcatttcn ttgttgtcaa aggagcaatc cggtgacaga tgggcccgcg 360
tccaattagc tagttggtga tgtaacggat caccaaggcg acgattggta gccgaactga 420
gaggttgatc ggccacattg ggnctgagac acggcccaga ctcctacggg aggcagcagt 480
ggggaatatt gcacaatggg ggaaaccctg atgcagcaac gccgcgtgaa ggatgaaggt 540
tttcggattg taaacttctt tagtcaggga cgaagaaaat gacggtacct gaagaataag 600
ccacggctaa ctacgtgcca gcagccgcgg taatacgtag gtggcaagcg ttgtccggaa 660
ttactgggtg taaagggcgt gtaggcggga atgtaagtca gatgtgaaat cccagggctt 720
aaccctggag ctgcatctga aactatgttt cttgagtgcc ggagaggaaa gcggaattcc 780
tagtgtagcg gtgaaatgcg tagatattag gaggaacacc agtggcgaag gcggctttct 840
ggacggtaac tgacgctgag gcgcgaaagc gtggggagca aacaggatta gataccctgg 900
tagtccacgc tgtaaacgat ggatactagg tgtaggaggt atcgacccct tctgtgccgg 960
agttaacaca ataagtatcc cacctgggga gtacggccgc aaggttgaaa ctcaaaggaa 1020
ttgacggggg cccgcacaag cagtggagta tgtggtttaa ttcgaagcaa cgcgaagaac 1080
cttaccaagg cttgacatat agcggaatnc ggcagagatg tcgtagtcct tcgggactgc 1140
tatacacagg tggtgcatgg ttgtcgtcag ctcgtgtcgt gagatgttgg gttaagtccc 1200
gcaacgagcg caacccctgt tgctagttga taacattaag atgatcactc tagcgagact 1260
gccggtgaca aatcggagga aggtggggac gacgtcaaat catcatgccc cttatgtctt 1320
gggctacaca cgtactacaa tggctataac agagggaagc taagctgcaa agtggagcaa 1380
atccccaaaa atagtcccag ttcagatggt gggctgcaac ccgcccacat gaagtcggaa 1440
ttgctagtaa tggtaggtca gtatactgtc gtgaatacgt tcccgggcct tgtacacacc 1500
gcccgtcaca ccatgagagt ctgcaacacc cgaagtcgat agtctaaccg caaggaggac 1560
gtcgccgaag gtggggccga tgattggtgt gaagtcgtaa caaggtagcc gtatcggaag 1620
gtgcggctgg atcacctcct tt 1642
<210> 79
<211> 1552
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<220>
<221> modified_base
<222> (64)..(64)
<223> a, c, g or t
<220>
<221> modified_base
<222> (100)..(100)
<223> a, c, g or t
<220>
<221> modified_base
<222> (343)..(343)
<223> a, c, g or t
<400> 79
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgagcgatc 60
cggnactcaa ttaagcgctt acagaaaaag agagagaaan tgagtaaacg caaagttgag 120
tgccggatag cggcggacgg gtgagtaacg cgtggacaat ctaccctgta gtttgggata 180
acacctcgaa aggggtgcta ataccggata atgtcaagaa gtggcatcac tttttgaaga 240
aaggagaaat ccgctatagg atgagtccgc gtcccattag ctagttggcg gggtaaaagc 300
ccaccaaggc gacgatgggt agccggcctg agagggtgaa cgnccacact ggaactgaga 360
cacggtccag actcctacgg gaggcagcag tggggaatat tgttcaatgg gggaaaccct 420
gacacagcga cgccgcgtga gcgaagaagg ccttcgggtc gtaaagctca atagtatggg 480
aagatagtga cggtaccata cgaaagcccc ggctaactac gtgccagcag ccgcggtaat 540
acgtaggggg cgagcgttgt ccggaattac tgggcgtaaa gagcacgtag gcggctgtaa 600
aagtcagatg tgaaaaacct gggctcaacc gagggtgtgc atctgaaact aaacagcttg 660
agtcaaggag aggagagcgg aattcctggt gtagcggtga aatgcgtaga gatcaggaag 720
aataccagtg gcgaaagcgg ctctctggac ttgaactgac gctgaggtgc gaaagcgtgg 780
ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatggat actaggtgtg 840
ggtgaagcat catccgtgcc ggagttaacg caataagtat cccgcctggg gagtacggcc 900
gcaaggttga aactcaaagg aattgacggg ggcccgcaca agcagcggag catgtggttt 960
aattcgaagc aacgcgaaga accttaccag ggcttgacat ccacagaatc aggtagaaat 1020
accagagtgc ctcgaaagag gagctgtgag acaggtggtg catggttgtc gtcagctcgt 1080
gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cctgttggta gttaccagcg 1140
taaagacggg gactctaccg agactgccgt ggagaacacg gaggaaggcg gggatgacgt 1200
caaatcatca tgccctttat gccctgggct acacacgtgc tacaatggcc tgaacagagg 1260
gcagcgaagg agcgatccgg agcgaatccc agaaaacagg tcccagttca gattgcaggc 1320
tgcaacccgc ctgcatgaag acggagttgc tagtaatcgc ggatcagcat gccgcggtga 1380
atacgttccc gggccttgta cacaccgccc gtcacaccac gagagtttac aacacccgaa 1440
gtcagtgacc taaccgcaag ggaggagctg ccgaaggtgg ggtaaatgat tggggtgaag 1500
tcgtaacaag gtagccgtat cggaaggtgc ggctggatca cctcctttcc ct 1552
<210> 80
<211> 1519
<212> DNA
<213> Clostridium stercorarium
<400> 80
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgaacggga 60
tccgtgttac ggaggtcttt ggaccgaagt ggcatggtga gagtggcgga cgggcgagta 120
acgcgtgagc aacctgccct atgctggggg ataacaccgg gaaaccggtg ctaataccgc 180
ataagaccac agtgacgcat gtacagtggt aaagctgagg cggcatagga tgggctcgcg 240
gtccattagc tagttggtag ggtaacggcc taccaaggcg acgatcggta gccggactga 300
gaggttggcc ggccgcattg ggactgagac acggcccaga ctcctacggg aggcagcagt 360
ggggaatatt gcgcaatggg ggaaaccctg acgcagcgac gccgcgtgga ggaagaaggc 420
ctttgggttg taaactcctt tgatcgggga cgaagatgac ggtacccgaa gaacaagcca 480
cggctaacta cgtgccagca gccgcggtaa tacgtaggtg gcgagcgttg tccggaatta 540
ctgggtgtaa agggcgtgta ggcggggtgc caagtcaggt gtgaaatacc ggggcttaac 600
ctcgggggtg catctgaaac tggtgctctt gagtgccgga gaggaaagcg gaattcccag 660
tgtagcggtg aaatgcgtag atattgggag gaacaccagt ggcgaaggcg gctttctgga 720
cggtaactga cgctgaggcg cgaaagcgtg gggagcaaac aggattagat accctggtag 780
tccacgctgt aaacgatgga tactaggtgt aggaggtatc gaccccttct gtgccgtagt 840
taacacaata agtatcccac ctggggagta cggccgcaag gctgaaactc aaaggaattg 900
acgggggccc gcacaagcag tggagcatgt ggtttaattc gaagcaacgc gaagaacctt 960
accagggctt gacatccccc tgacggatgt agagatacat cttctccgca aggagcaggg 1020
gagacaggtg gtgcatggtg cagctcagct cgtgtcgtga gatgttgggt taagtcccgc 1080
aacgagcgca acccttgtcg ttagttgcca gcagtaagat gggcactcta acgagactgc 1140
cggcgagaag tcggaggaag gtggggatga cgtcaaatca tcatgcccct tatgtcctgg 1200
gctacacacg tgctacaatg gcgactacag agggaagcaa atccggcagg aggagcaaat 1260
cccgaaaggt cgtcccagtt cggattgcag gctcgaactc gcctgcatga agccggaatt 1320
gctagtaatg gcaggtcagc atactgccgt gaatacgttc ccgggccttg tacacaccgc 1380
ccgtcacacc atgagagctg gcaacacccg aagccgtagc ctaaccgaga ggggggcgcc 1440
gtcgaaggtg gggcaggtga ttggggtgaa gtcgtaacaa ggtagccgta tcggaaggtg 1500
cggctggatc acctccttt 1519
<210> 81
<211> 1500
<212> DNA
<213> Clostridium stercorarium II
<400> 81
cctggctcag gacgaacgct ggcggcgtgc ctaacacatg caagtcgaac gggatccgtg 60
ttacggaggt cttcggaccg aagtggcatg gtgagagtgg cggacgggcg agtaacgcgt 120
gagcaacctg ccctatgctg ggggataaca ccgggaaacc ggtgctaata ccgcataaga 180
ccacagtgac gcatgtcaca gtggtaaaag ctgaggcggc ataggatggg ctcgcgtccg 240
attagctagt tggtagggta acggcctacc aaggcgacga tcggtagccg gactgagagg 300
ttggccggcc gcattgggac tgagacacgg cccagactcc tacgggaggc agcagtgggg 360
aatattgcgc aatgggggaa accctgacgc agcgacgccg cgtggaggaa gaaggccttt 420
gggttgtaaa ctcctttgat cggggacgaa gatgacggta cccgaagaac aagccacggc 480
taactacgtg ccagcagccg cggtaatacg taggtggcga gcgttgtccg gaattactgg 540
gtgtaaaggg cgtgtaggcg gggtgccaag tcaggtgtga aataccgggg cttaacctcg 600
ggggtgcatc tgaaactggt gctcttgagt gccggagagg aaagcggaat tcccagtgta 660
gcggtgaaat gcgtagatat tgggaggaac accagtggcg aaggcggctt tctggacggt 720
aactgacgct gaggcgcgaa agcgtgggga gcaaacagga ttagataccc tggtagtcca 780
cgctgtaaac gatggatact aggtgtagac cccttctgtg ccgtagttaa cacaataagt 840
atcccacctg gggagtacga ggtatcgggc cgcaaggctg aaactcaaag gaattgacgg 900
gggcccgcac aagcagtgga gcatgtggtt taattcgaag caacgcgaag aaccttacca 960
gggcttgaca tccccctgac ggatgtagag atacatcttc tccgcaagga gcaggggaga 1020
caggtggtgc atggttgtcg tcagctcgtg tcgtgagatg ttgggttaag tcccgcaacg 1080
agcgcaaccc ttgtcgttag ttgccagcag taagatgggc actctaacga gactgccggc 1140
gagaagtcgg aggaaggtgg ggatgacgtc aaatcatcat gccccttatg tcctgggcta 1200
cacacgtgct acaatggcga ctacagaggg aagcaaatcc gcgaggagga gcaaatcccg 1260
aaaggtcgtc ccagttcgga ttgcaggctg caactcgcct gcatgaagcc ggaattgcta 1320
gtaatggcag gtcagcatac tgccgtgaat acgttcccgg gccttgtaca caccgcccgt 1380
cacaccatga gagctggcaa cacccgaagc cggtagccta accgagaggg gggcgccgtc 1440
gaaggtgggg cacccgaagc cggtagccta accgagaggg gggcgccgtc gaaggtgggg 1500
<210> 82
<211> 1508
<212> DNA
<213> Caldiscellulosiruptor kristjanssonii
<220>
<221> modified_base
<222> (213)..(213)
<223> a, c, g or t
<220>
<221> modified_base
<222> (223)..(223)
<223> a, c, g or t
<220>
<221> modified_base
<222> (405)..(405)
<223> a, c, g or t
<400> 82
ggctcaggac gaacgctggc ggcgtgccta acgcatgcaa gtcgagcgga gatggtagct 60
gaaggtgatg agctggaagc tatcatctta gcggcggacg ggtgagtaac acgtgagcaa 120
cctaccctca gcacggggat aacagctcga aagggctgct aatacccgat gggaccacgg 180
catcgcatgg tgctgtggtg aaagggtagc cgnagaggct atnccggctg gggatgggct 240
cgcggcccat cagctagttg gtggggtaac ggcctaccaa ggcgacgacg ggtagccggc 300
ctgagagggt gtacggccac agtgggactg agacacggcc cacactccta cgggaggcag 360
cagcggggaa tcttgcgcaa tgggcgaaag cctgacgcag cgacnccgcg tgagggaaga 420
agcccttcgg ggtgtaaacc tctttggacg gggagaagtg gaagatagta cccgtttaaa 480
aagccacggc taactacgtg ccagcagccg cggtaatacg taggtggcga gcgttgtccg 540
gaattactgg gcgtaaaggg tgcgtaggcg gcctggtaag ttgagcgtga aatttttggg 600
ctcaacccaa aaggagcgct caagactgcc gggcttgagt gcgggagagg acggcggaat 660
tcccggtgta gcggtgaaat gcgtagatat cgggaggaac accagtggcg aaggcggccg 720
tctggaccgt aactgacgct gaggcacgaa agcgtgggga gcaaacagga ttagataccc 780
tggtagtcca cgctgtaaac gatggatgct aggtgtgggg gagaagaact cttccgtgcc 840
gtagttaaca caataagcat cccgcctggg gagtacggtc gcaaggttga aactcaaagg 900
aattgacggg ggcccgcaca agcggtggag catgtggttt aattcgaagc aacgcgaaga 960
accttaccag ggcttgacat gccgggaacc ctgccgaaag gcgggggtgc ctgcttgtta 1020
agagcaggag cccggacaca ggtggtgcat ggttgtcgtc agctcgtgtc gtgagatgtt 1080
gggttaagtc ccgcaacgag cgcaacccct gcccttagtt gccagcggtt ttagccgggc 1140
actctaaggg gactgccgcc gatgaggcgg aggaaggtgg ggatgacgtc aaatcatcat 1200
gccccttatg ccctgggcta cacacgtgct acaatgggtg ctacagaggg cggcgaaggc 1260
gcgagccgga gcgaatccca aaaaagcacc cccagttcgg attgcaggct gcaactcgcc 1320
tgcatgaagt cggaatcgct agtaatcgcg gatcagcatg ccgcggtgaa tacgttcccg 1380
ggccttgtac acaccgcccg tcacaccatg agagtcagca acacctgaag acacaggata 1440
tctgtgttga aggtggggct gatgattggg gtgaagtcgt aacaaggtag ccgtacggga 1500
acgtgcgg 1508
<210> 83
<211> 1370
<212> DNA
<213> Clostridium phytofermentans
<220>
<221> modified_base
<222> (240)..(243)
<223> a, c, g or t
<220>
<221> modified_base
<222> (247)..(247)
<223> a, c, g or t
<220>
<221> modified_base
<222> (250)..(250)
<223> a, c, g or t
<220>
<221> modified_base
<222> (293)..(293)
<223> a, c, g or t
<220>
<221> modified_base
<222> (413)..(413)
<223> a, c, g or t
<220>
<221> modified_base
<222> (421)..(427)
<223> a, c, g or t
<220>
<221> modified_base
<222> (492)..(492)
<223> a, c, g or t
<220>
<221> modified_base
<222> (510)..(511)
<223> a, c, g or t
<220>
<221> modified_base
<222> (530)..(530)
<223> a, c, g or t
<220>
<221> modified_base
<222> (587)..(587)
<223> a, c, g or t
<220>
<221> modified_base
<222> (616)..(617)
<223> a, c, g or t
<220>
<221> modified_base
<222> (646)..(648)
<223> a, c, g or t
<220>
<221> modified_base
<222> (674)..(674)
<223> a, c, g or t
<220>
<221> modified_base
<222> (687)..(687)
<223> a, c, g or t
<220>
<221> modified_base
<222> (722)..(723)
<223> a, c, g or t
<220>
<221> modified_base
<222> (771)..(771)
<223> a, c, g or t
<220>
<221> modified_base
<222> (812)..(813)
<223> a, c, g or t
<220>
<221> modified_base
<222> (848)..(849)
<223> a, c, g or t
<220>
<221> modified_base
<222> (905)..(906)
<223> a, c, g or t
<220>
<221> modified_base
<222> (916)..(916)
<223> a, c, g or t
<220>
<221> modified_base
<222> (923)..(923)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1024)..(1025)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1076)..(1077)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1092)..(1093)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1149)..(1150)
<223> a, c, g or t
<400> 83
cttagtggcg gacgggtgag taacgcgtgg gtaacctgcc tcatacaggg ggataacagt 60
cggaaacgat tgctaaaacc gcataatata gcgaaaccgc atgattttgc tatcaaatat 120
ttataggtat gagatgggcc cgcgtctgat tagctagttg gtggggtaat ggcctaccaa 180
ggcgacgatc agtagccggc ttgagagagt gaccggccac attgggactg agacacggcn 240
nnnactnctn cgggaggcag cagtggggaa tattggacaa tgggggaaac ccngatccag 300
cgacgccgcg tgagtgaaga agtatttcgg tatgtaaagc tctatcagca gggaagataa 360
tgacagtacc tgactaagaa gccccggcta actacgtgcc agcagccgcg gtnatacgta 420
nnnnnnnagc gttatccgga tttactgggt gtaaagggag cgtaggtggt aggtcaagtc 480
agatgtgaaa gnccagggct caaccctggn nctgcatttg aaactggctn actgagtgca 540
ggagaggtaa gtggaattcc tagtgtagcg gtgaaatgcg tagatantag gaggaacacc 600
agtggcgaag gcggcnnact ggactgtaac tgacactgag gctcgnnngc gtggggagca 660
aacaggatta gatnccctgg tagtccncgc cgtaaacgat gaatactagc tgttcggggt 720
cnnacagggc ttcggtggcg cacgtaacgc aataagtatt ccacctgggg ngtacgttcg 780
caagaatgaa actcaaagga attgacgggg anncgcacaa gcggtggagc atgtggttta 840
attcgaanna acgcgaagaa ccttaccaag tcttgacatc cctctgacaa ccgagtaacg 900
tcggnnttct tcgggncaga ggngacaggt ggtgcatggt tgtcgtcagc tcgtgtcgtg 960
agatgttggg ttaagtcccg caacgagcgc aacccctatc tttagtagcc agcagttcgg 1020
ctgnncactc tagagagact gccagggata acctggagga aggcggggat gacgtnnaat 1080
catcatgccc cnnatgattt gggctacaca cgtgctacaa tggtgactac aaagagaagc 1140
aagcctgcnn gggggagcaa atctcaaaaa ggtcatccca gttcggattg tactctgcaa 1200
ctcgagtaca tgaagctgga atcgctagta atcgcgaatc agaatgtcgc ggtgaatacg 1260
ttcccgggtc ttgtacacac cgyycgtcac tccatgggag taggtaacgc ccgaagtcag 1320
tgaccyaacc gtaaggaggg agctgccgaa ggcgggatct ataactgggg 1370
<210> 84
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 84
gaattcgagc tcggtacccg gggatcctct agagtcgacc tgcaggcatg caagctt 57
<210> 85
<211> 1515
<212> DNA
<213> Thermoanaerobacter pseudoethanolicus
<220>
<221> modified_base
<222> (69)..(69)
<223> a, c, g or t
<220>
<221> modified_base
<222> (71)..(71)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1427)..(1427)
<223> a, c, g or t
<400> 85
cctggctcag gacgaacgct ggcggcgtgc ctaacacatg caagtcgagc ggtccggcag 60
ccaacttang ncgggagccg gatagcggcg gacgggtgag taacgcgtgg gcaacctacc 120
cttaagaccg ggataacacc tcgaaagggg tgctaatact ggataagctc cttgtagggc 180
atggtatgag gaggaaggta gcgggactac cgcttaagga tgggcccgcg tcccatcagc 240
tagttggtag ggtaacggcc taccaaggcg acgacgggta gccggcctga gagggtggtc 300
ggccacactg ggactgagac acggcccaga ctcctacggg aggcagcagt ggggaatctt 360
gcgcaatggg cgaaagcctg acgcagcgac gccgcgtgag cgaggaaggc cttcgggtcg 420
taaagctcga tagtgtggga agaagggatg acggtaccac acgaaagccc cggctaacta 480
cgtgccagca gcctcggtaa gacgtagggg gcgagcgttg tccggaatta ctgggcgtaa 540
agggcgcgta ggcggccgtt caagtcaggt gtaaaatacc cgggctcaac ccggggatag 600
cacttgaaac tgggcggcta gagggcagga gaggggagtg gaattcccgg tgtagcggtg 660
aaatgcgtag atatcgggag gaataccagt ggcgaaggcg actctctgga ctgaccctga 720
cgctgaggcg cgaaagcgtg gggagcaaac aggattagat accctggtag tccacgccgt 780
aaacgatggg tactaggtgt gggatgcgga agcattccgt gccgtagtta acgcaataag 840
taccccgcct ggggagtacg gccgcaaggt tgaaactcaa aggaattgac gggggcccgc 900
acaagcggtg gagcatgtgg tttaattcga agcaacgcga agaaccttac cagggcttga 960
catgcaggta gtagcgagcc gaaaggtgag cgaccttacc ttaaaggtga ggagcctgca 1020
caggtggtgc atggttgtcg tcagctcgtg tcgtgagatg ttgggttaag tcccgcaacg 1080
agcgcaaccc ctgcctctag ttgccagcgg gtgaagccgg gcacgctaga gggactgccg 1140
tggacaacac ggaggaaggt ggggatgacg tcaaatcatc atgccctata tgccctgggc 1200
cacacacgtg ctacaatggc cggtacagag ggaagcgaag ccgcgaggtg gagcgaaacc 1260
caaaaagccg gtccaagttc ggattgcagg ctgcaactcg cctgcatgaa gtcggaatcg 1320
ctagtaatcg cggatcagca tgccgcggtg aatacgttcc cgggccttgt acacaccgcc 1380
cgtcacacca cgagagtctg caacacccga agccgtgacc caaccgnaag gagggagccg 1440
tcgaaggtgg ggcagatgat tggggtgaag tcgtaacaag gtagccgtat cggaaggtgc 1500
ggctggatca cctcc 1515
<210> 86
<211> 1395
<212> DNA
<213> Thermoanaerobacter sp.
<400> 86
ctacacatgc agtcgagcga agggagtact acggtacgaa cttagcggcg gacgggtgag 60
taacgcgtgg acaatctacc ctgtagaccg ggataacacc tcgaaagggg tgctaatacc 120
ggataatgtc gagaagcggc atcgcttttt gaagaaagga gagaatccgc tataggagga 180
gtccgcgtcc cattagctag ttggcgaggg taaaagccca ccaaggcgac gatgggtagc 240
cggcctgaga gggtgaacgg ccacactgga actgagacac ggtccagact cctacgggag 300
gcagcagtgg ggaatattgt gcaatggggg aaaccctgac acagcgacgc cgcgtgagtg 360
aagaaggcct tcgggtcgta aagctcaata gtatgggaag aaagaaatga cggtaccata 420
cgaaagcccc ggctaactac gtgccagcag ccgcggtaat acgtaggggg cgagcgttgt 480
ccggaattac tgggcgtaaa gagcacgtag gcggctataa aagtcagatg tgaaaaacct 540
gggctcaacc gagggtatgc atctgaaact aaatagcttg agtcaaggag aggagagcgg 600
aattcctggt gtagcggtga aatgcgtaga gatcaggaag aataccagtg gcgaaagcgg 660
ctctctggac ttgaactgac gctgaggtgc gaaagcgtgg ggagcaaaca ggattagata 720
ccctggtagt ccacgccgta aacgatggat actaggtgtg ggttagatat aatccgtgcc 780
ggagttaacg caataagtat cccgcctggg gagtacggcc gcaaggttga aactcaaagg 840
aattgacggg ggcccgcaca agcagcggag catgtggttt aattcgaagc aacgcgaaga 900
accttaccag ggcttgacat ccacagaatc gagtagaaat acttgagtgc ctcgtaagag 960
gagctgtgag acaggtggtg catggttgtc gtcagctcgt gtcgtgagat gttgggttaa 1020
gtcccgcaac gagcgcaacc cctgttggta gttaccagcg taaagacggg gactctaccg 1080
agactgccgt ggataacacg gaggaaggcg gggatgacgt caaatcatca tgccctttat 1140
gccctgggct acacacgtgc tacaatggcc tgaacagagg gcagcgaagg agcgatccgg 1200
agcgaatccc agaaaacagg tcccagttca gattgcaggc tgcaacccgc ctgcatgaag 1260
acggagttgc tagtaatcgc ggatcagcat gccgcggtga atacgttccc gggccttgta 1320
cacaccgccc gtcacaccac gagagtttac aacacccgaa gtcagtgacc taaccgcaag 1380
ggaggagctg ccgaa 1395
<210> 87
<211> 1552
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<220>
<221> modified_base
<222> (64)..(64)
<223> a, c, g or t
<220>
<221> modified_base
<222> (100)..(100)
<223> a, c, g or t
<220>
<221> modified_base
<222> (343)..(343)
<223> a, c, g or t
<400> 87
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgagcgatc 60
cggnactcaa ttaagcgctt acagaaaaag agagagaaan tgagtaaacg caaagttgag 120
tgccggatag cggcggacgg gtgagtaacg cgtggacaat ctaccctgta gtttgggata 180
acacctcgaa aggggtgcta ataccggata atgtcaagaa gtggcatcac tttttgaaga 240
aaggagaaat ccgctatagg atgagtccgc gtcccattag ctagttggcg gggtaaaagc 300
ccaccaaggc gacgatgggt agccggcctg agagggtgaa cgnccacact ggaactgaga 360
cacggtccag actcctacgg gaggcagcag tggggaatat tgttcaatgg gggaaaccct 420
gacacagcga cgccgcgtga gcgaagaagg ccttcgggtc gtaaagctca atagtatggg 480
aagatagtga cggtaccata cgaaagcccc ggctaactac gtgccagcag ccgcggtaat 540
acgtaggggg cgagcgttgt ccggaattac tgggcgtaaa gagcacgtag gcggctgtaa 600
aagtcagatg tgaaaaacct gggctcaacc gagggtgtgc atctgaaact aaacagcttg 660
agtcaaggag aggagagcgg aattcctggt gtagcggtga aatgcgtaga gatcaggaag 720
aataccagtg gcgaaagcgg ctctctggac ttgaactgac gctgaggtgc gaaagcgtgg 780
ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatggat actaggtgtg 840
ggtgaagcat catccgtgcc ggagttaacg caataagtat cccgcctggg gagtacggcc 900
gcaaggttga aactcaaagg aattgacggg ggcccgcaca agcagcggag catgtggttt 960
aattcgaagc aacgcgaaga accttaccag ggcttgacat ccacagaatc aggtagaaat 1020
accagagtgc ctcgaaagag gagctgtgag acaggtggtg catggttgtc gtcagctcgt 1080
gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cctgttggta gttaccagcg 1140
taaagacggg gactctaccg agactgccgt ggagaacacg gaggaaggcg gggatgacgt 1200
caaatcatca tgccctttat gccctgggct acacacgtgc tacaatggcc tgaacagagg 1260
gcagcgaagg agcgatccgg agcgaatccc agaaaacagg tcccagttca gattgcaggc 1320
tgcaacccgc ctgcatgaag acggagttgc tagtaatcgc ggatcagcat gccgcggtga 1380
atacgttccc gggccttgta cacaccgccc gtcacaccac gagagtttac aacacccgaa 1440
gtcagtgacc taaccgcaag ggaggagctg ccgaaggtgg ggtaaatgat tggggtgaag 1500
tcgtaacaag gtagccgtat cggaaggtgc ggctggatca cctcctttcc ct 1552
<210> 88
<211> 1553
<212> DNA
<213> Thermoanaerobacterium saccharolyticum
<400> 88
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgagcgatc 60
cggcactcaa ctaagcgctt acagaaaaag agagagaaaa tgagtaaacg caaagttgag 120
tgccggatag cggcggacgg gtgagtaacg cgtggacaat ctaccctgta gtttgggata 180
acacctcgaa aggggtgcta ataccggata atgtcaagaa gtggcatcac tttttgaaga 240
aaggagaaat ccgctatagg atgagtccgc gtcccattag ctagttggcg gggtaaaagc 300
ccaccaaggc gacgatgggt agccggcctg agagggtgaa cggccacact ggaactgaga 360
cacggtccag actcctacgg gaggcagcag tggggaatat tgtgcaatgg gggaaaccct 420
gacacagcga cgccgcgtga gcgaagaagg ccttcgggtc gtaaagctca atagtatggg 480
aagatagtga cggtaccata cgaaagcccc gggctactac gtgccagcag ccgcggtaat 540
acgtaggggg cgagcgttgt ccggaattac tgggcgtaaa gagcacgtag gcggctgtaa 600
aagtcagatg tgaaaaacct gggctcaacc gagggtgtgc atctgaaact aaacagcttg 660
agtcaaggag aggagagcgg aattcctggt gtagcggtga aatgcgtaga gatcaggaag 720
aataccagtg gcgaaagcgg ctctctggac ttgaactgac gctgaggtgc gaaagcgtgg 780
ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatggat actaggtgtg 840
ggtgaagcat catccgtgcc ggagttaacg caataagtat cccgcctggg gagtacggcc 900
gcaaggttga aactcaaagg aattgacggg ggcccgcaca agcagcggag catgtggttt 960
aattcgaagc aacgcgaaga accttaccag ggcttgacat ccacagaatc tggtagaaat 1020
accggagtgc ctcgaaagag gagctgtgag acaggtggtg catggttgtc gtcagctcgt 1080
gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cctgttggta gttaccagcg 1140
taaagacggg gactctaccg agactgccgt ggagaacacg gaggaaggcg gggatgacgt 1200
caaatcatca tgccctttat gccctgggct acacacgtgc tacaatggcc tgaacagagg 1260
gcagcgaagg agcgatccgg agcgaatccc agaaaacagg tcccagttca gattgcaggc 1320
tgcaacccgc ctgcatgaag acggagttgc tagtaatcgc ggatcagcat gccgcggtga 1380
atacgtttcc cgggccttgt acacaccgcc cgtcacacca cgagagttta caacacccga 1440
agtcagtgac ctaaccgaaa ggaaggagct gccgaaggtg gggtaaatga ttggggtgaa 1500
gtcgtaacaa ggtagccgta tcggaaggtg cggctggatc acctcctttc taa 1553
<210> 89
<211> 1569
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown Organism: Consensus
Sequence
<220>
<221> modified_base
<222> (71)..(71)
<223> a, c, g or t
<220>
<221> modified_base
<222> (92)..(92)
<223> a, c, g or t
<220>
<221> modified_base
<222> (101)..(101)
<223> a, c, g or t
<220>
<221> modified_base
<222> (250)..(251)
<223> a, c, g or t
<220>
<221> modified_base
<222> (255)..(255)
<223> a, c, g or t
<220>
<221> modified_base
<222> (296)..(296)
<223> a, c, g or t
<220>
<221> modified_base
<222> (494)..(494)
<223> a, c, g or t
<220>
<221> modified_base
<222> (496)..(496)
<223> a, c, g or t
<220>
<221> modified_base
<222> (852)..(852)
<223> a, c, g or t
<220>
<221> modified_base
<222> (864)..(864)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1016)..(1017)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1048)..(1050)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1067)..(1067)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1158)..(1159)
<223> a, c, g or t
<220>
<221> modified_base
<222> (1407)..(1407)
<223> a, c, g or t
<400> 89
tttgatcctg gctcaggacg aacgctggcg gcgtgcctaa cacatgcaag tcgagcgatc 60
cggcactcaa ntaagcgctt acagaaaaag angagcgaaa ntgagtaaac gctaagttga 120
gtgccggata gcggcggacg ggtgagtaac gcgtggacaa tctaccctgt agtttgggat 180
aacacctcga aaggggtgct aataccggat aatgtcaaga agtggcatcg ctttttgaag 240
aaaggagagn naatnccgct ataggatgag tccgcgtccc attagctagt tggcgngggt 300
aaaagcccac caaggcgacg atgggtagcc ggcctgagag ggtgaacggc cacactggaa 360
ctgagacacg gtccagactc ctacgggagg cagcagtggg gaatattgtg caatggggga 420
aaccctgaca cagcgacgcc gcgtgagcga agaaggcctt cgggtcgtaa agctcaatag 480
tatgggaaga tagnantgac ggtaccatac gaaagccccg gctaactacg tgccagcagc 540
cgcggtaata cgtagggggc gagcgttgtc cggaattact gggcgtaaag agcacgtagg 600
cggctgtaaa agtcagatgt gaaaaacctg ggctcaaccg agggtgtgca tctgaaacta 660
aacagcttga gtcaaggaga ggagagcgga attcctggtg tagcggtgaa atgcgtagag 720
atcaggaaga ataccagtgg cgaaagcggc tctctggact tgaactgacg ctgaggtgcg 780
aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa acgatggata 840
ctaggtgtgg gntgaggcat catnccgtgc cggagttaac gcaataagta tcccgcctgg 900
ggagtacggc cgcaaggttg aaactcaaag gaattgacgg gggcccgcac aagcagcgga 960
gcatgtggtt taattcgaag caacgcgaag aaccttacca gggcttgaca tccacnnaga 1020
atcgggtaga aataccagag tgcctcgnnn aaagaggagc tgtgagnaca ggtggtgcat 1080
ggttgtcgtc agctcgtgtc gtgagatgtt gggttaagtc ccgcaacgag cgcaacccct 1140
gttggtagtt accagcgnnt aaagacgggg actctaccga gactgccgtg gagaacacgg 1200
aggaaggcgg ggatgacgtc aaatcatcat gccctttatg ccctgggcta cacacgtgct 1260
acaatggcct gaacagaggg cagcgaagga gcgatccgga gcgaatccca gaaaacaggt 1320
cccagttcag attgcaggct gcaacccgcc tgcatgaaga cggagttgct agtaatcgcg 1380
gatcagcatg ccgcggtgaa tacgttnccc gggccttgta cacaccgccc gtcacaccac 1440
gagagtttac aacacccgaa gtcagtgacc taaccgcaag ggaggagctg ccgaaggtgg 1500
ggtaaatgat tggggtgaag tcgtaacaag gtagccgtat cggaaggtgc ggctggatca 1560
cctcctttc 1569
<210> 90
<211> 1061
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown Organism: Consensus
Sequence
<220>
<221> modified_base
<222> (657)..(657)
<223> a, c, g or t
<220>
<221> modified_base
<222> (789)..(789)
<223> a, c, g or t
<400> 90
gtgtatacaa tatatttctt ctttttagta agaggaatgt ataaaaataa atattttaaa 60
ggaagggacg atcttatgag cattattcaa aacatcattg aaaaagctaa aagtgataaa 120
aagaaaattg ttctgccaga aggtgcagaa cccaggacat taaaagctgc tgaaatagtt 180
ttaaaagaag gaattgcaga tttggtgctt cttggaaatg aagatgagat aagaaatgct 240
gcaaaagact tggacatatc caaagctgaa atcattgacc ctgtaaagtc tgaaatgttt 300
gataggtatg ctaatgattt ttatgagtta aggaagagca aaggaatcac gttggaaaaa 360
gccagagaaa caatcaagga taatatctat tttggatgta tgatggttaa agaaggttat 420
gctgatggat tggtatctgg cgctattcat gctactgcag atttattaag acctgcattt 480
cagataatta aaacggctcc aggagcaaag atagtatcaa gcttttttat aatggaagtg 540
cctaattgtg aatatggtga aaatggtgta ttcttgtttg ctgattgtgc ggtcaatcca 600
tcgcctaatg cagaagaact tgcttctatt gctgtacaat ctgctaatac tgcaaangaa 660
tttgttgggc tttgaaccaa aagttgctat gctatcattt tctacaaaag gtagtgcatc 720
acatgaatta gtagataagg taagaaaagc gacagagata gcaaaagaat tgatgccaga 780
tgttgctant cgatggtgaa ttgcaattgg atgctgctct tgttaaagaa gttgcagagc 840
taaaagcgcc gggaagcaaa gttgcgggat gtgcaaatgt gcttatattc cctgatttac 900
aagctggtaa tataggatat aagcttgtac agagattagc taaggcaaat gcaattggac 960
ctataacaca aggaatgggt gcaccggtta atgatttatc aagaggatgc agctatagag 1020
atattgttga cgtaatagca acaacagctg tgcaggctca a 1061
<210> 91
<211> 1213
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown Organism: Consensus
Sequence
<220>
<221> modified_base
<222> (52)..(52)
<223> a, c, g or t
<220>
<221> modified_base
<222> (72)..(72)
<223> a, c, g or t
<220>
<221> modified_base
<222> (136)..(136)
<223> a, c, g or t
<220>
<221> modified_base
<222> (151)..(153)
<223> a, c, g or t
<400> 91
atgaaaatta tgaaaattct ggttattaat tgtggaagtt cttcactaaa antatcaatt 60
gattgaatca antgatggaa atgtgctggc aaaaggcctt gctgaaagaa tcggcataaa 120
tgattccctg ttgacncata atgctaacgg nnnagaaaaa atcaagataa aaaaagacat 180
gaaagatcac aaagacgcaa taaaattggt tttagatgct ttggtaagta gtgactacgg 240
cgttataaag gatatgtctg agatagatgc tgtaggacat agagttgttc acggaggaga 300
gtcttttaca tcatcagttc tcataaatga tgaagtgtta aaagcgataa cagattgtat 360
agaattagct ccactgcaca atcctgctaa tatagaagga attaaagctt gccagcaaat 420
catgccaaac gttccaatgg tggcggtatt tgatacagcc tttcatcaga caatgcctga 480
ttatgcatat ctttatccaa taccttatga atactacaca aagtacagga tcagaagata 540
tggatttcat ggcacatcgc ataaatatgt ttcaaatagg gctgcagaga ttttgaataa 600
acctattgaa gatttgaaaa tcataacttg tcatcttgga aatggctcca gtattgctgc 660
tgtcaaatat ggtaaatcaa ttgacacaag catgggattt acaccattag aaggtttggc 720
tatgggtaca cgatctggaa gtatagaccc atccattatt tcttatctta tggaaaaaga 780
aaatataagt gctgaagagg tagtaaatat attaaataaa aaatctggtg tttacggtat 840
ttcaggaata agcagcgatt ttagagattt agaagatgcc gcctttaaaa atggagatga 900
aagagctcag ttggctttaa atgtgtttgc atatcgagta aagaagacga ttggcgctta 960
tgcagcagct atgggaggcg ttgatgtcat tgtatttaca gcaggtgttg gtgaaaatgg 1020
tcctgagata cgagaattta tacttgatgg attagagttt ttagggttca gcttggataa 1080
agaaaaaaat aaagtcagag gaaaagaaac tattatatct acgccgaatt caaaagttag 1140
cgtgatggtt gtgcctacta atgaagaata tatgattgct aaagatactg aaaagattgt 1200
aaagagtata aaa 1213
<210> 92
<211> 935
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown Organism: Consensus
Sequence
<220>
<221> modified_base
<222> (15)..(15)
<223> a, c, g or t
<220>
<221> modified_base
<222> (90)..(90)
<223> a, c, g or t
<220>
<221> modified_base
<222> (117)..(117)
<223> a, c, g or t
<220>
<221> modified_base
<222> (255)..(255)
<223> a, c, g or t
<220>
<221> modified_base
<222> (313)..(313)
<223> a, c, g or t
<220>
<221> modified_base
<222> (349)..(349)
<223> a, c, g or t
<220>
<221> modified_base
<222> (485)..(485)
<223> a, c, g or t
<220>
<221> modified_base
<222> (755)..(755)
<223> a, c, g or t
<220>
<221> modified_base
<222> (761)..(761)
<223> a, c, g or t
<220>
<221> modified_base
<222> (779)..(779)
<223> a, c, g or t
<220>
<221> modified_base
<222> (791)..(791)
<223> a, c, g or t
<220>
<221> modified_base
<222> (793)..(793)
<223> a, c, g or t
<220>
<221> modified_base
<222> (800)..(800)
<223> a, c, g or t
<220>
<221> modified_base
<222> (818)..(818)
<223> a, c, g or t
<220>
<221> modified_base
<222> (824)..(824)
<223> a, c, g or t
<220>
<221> modified_base
<222> (836)..(836)
<223> a, c, g or t
<220>
<221> modified_base
<222> (854)..(854)
<223> a, c, g or t
<220>
<221> modified_base
<222> (863)..(863)
<223> a, c, g or t
<220>
<221> modified_base
<222> (869)..(869)
<223> a, c, g or t
<220>
<221> modified_base
<222> (902)..(902)
<223> a, c, g or t
<220>
<221> modified_base
<222> (917)..(917)
<223> a, c, g or t
<220>
<221> modified_base
<222> (929)..(929)
<223> a, c, g or t
<400> 92
atgagcaaag tagcnataat aggttctgga tttgtaggtg ctacatctgc atttacactg 60
gctttaagtg ggactgtgac agatattgtn ttagtagatt taaacaagga caaggcnata 120
ggcgatgcac tggatataag ccatggcata ccgtttatac agcctgtaaa tgtgtatgca 180
ggtgactaca aagatgttga aggcgcagat gtaatagttg tgacagcagg tgctgctcaa 240
aagccgggag agacnaggct tgaccttgtg aagaaaaata cagctatatt taagtccatg 300
atacctgagc ttnttaaagt acaatgacaa ggctatatat ttgattgtna caaatcctgt 360
agatatactg acgtacgtta catacaagat atctggactt ccatggggca gagttttcgg 420
ttctggcact gttcttgaca gttcaaggtt taggtatctt ttaagcaagc attgcaatat 480
agatnccgag aaatgtccac ggaaggataa ttggcgagca tggtgataca gagtttgcag 540
catggagcat aacaaacata tcaggaatat catttaatga gtactgcagt ttatgcggac 600
gcgtctgtaa cacaaatttc agaaaggaag tagaagatga agttgtaaat gctgcttata 660
agataataga caaaaagggt gctacatatt atgctgtggc tgttgcagta agaaggattg 720
tggagtgtat cttaagagat gaaaattcca ttctnacagt ntcatctcca ttaaatggnc 780
aatacggtgt nanagatgtn tctttaagct tgccatcnat tgtnggcaga aatggngttg 840
caaggattct gganttgcct ttntctgang aagaagttga gaagtttaga cattcagcaa 900
gngttatggc agatgtnata aaacagttng atata 935
Claims (92)
- SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열(complement)을 포함하는 분리된 핵산 분자.
- SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열과 80% 이상의 동일성을 공유하는 누클레오티드 서열을 포함하는 분리된 핵산 분자.
- 제 2항에 있어서, SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나의 누클레오티드 서열, 또는 이의 상보서열과 약 95% 이상의 서열 동일성을 지닌 핵산 분자.
- 호열성(thermophilic) 또는 중온성(mesophilic) 세균에서 발현가능한 프로모터에 작동적으로 결합된 SEQ ID NO:1-5, 30-31 및 47-61 중 어느 하나를 포함하는 유전자 구성물(genetic construct).
- 제 4항의 유전자 구성물을 포함하는 재조합 호열성 또는 중온성 세균.
- 제 1항 내지 제 3항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제 1항 내지 제 3항 중 어느 한 항의 핵산 분자를 포함하는 숙주 세포.
- 제 7항에 있어서, 상기 숙주 세포가 호열성 또는 중온성 세균 세포인 숙주 세포.
- 유전자 변형된 호열성 또는 중온성 미생물로서, 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유(native) 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵(silencing)되거나 비활성화되거나 하향조절(down-regulation)됨으로써, 발효 생산물로서 에탄올을 생산하는 상기 호열성 또는 중온성 미생물의 고유 능력이 증가된 유전자 변형된 호열성 또는 중온성 미생물.
- 제 9항에 있어서, 상기 미생물이 그람-음성 세균 또는 그람-양성 세균인 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 써모안에어로박테리움(Thermoanaerobacterium), 써모안에어로박터(Thermoanaerobacter), 클로스트리디움(Clostridium), 게오바실루스(Geobacillus), 사카로코쿠스(Saccharococcus), 패니바실루스(Paenibacillus), 바실루스(Bacillus), 칼디셀룰로시룹터(Caldicellulosiruptor), 안에어로셀룸(Anaerocellum), 또는 안옥시바실루 스(Anoxybacillus) 속(genus)의 종(species)인 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 써모안에어로박테리움 써모술푸리게네스(Thermoanaerobacterium thermosulfurigenes), 써모안에어로박테리움 아오테아로엔세(Thermoanaerobacterium aotearoense), 써모안에어로박테리움 폴리사카롤리티쿰(Thermoanaerobacterium polysaccharolyticum), 써모안에어로박테리움 제애(Thermoanaerobacterium zeae), 써모안에어로박테리움 자일라노리티쿰(Thermoanaerobacterium xylanolyticum), 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum), 써모안에어로비움 브록키(Thermoanaerobium brockii), 써모안에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum), 써모안에어로박터 써모히드로술푸리쿠스(Thermoanaerobacter thermohydrosulfuricus), 써모안에어로박터 에타놀리쿠스(Thermoanaerobacter ethanolicus), 써모안에어로박터 브록키(Thermo anaerobacter brocki), 클로스트리디움 써모셀룸(Clostridium thermocellum), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 피토페르멘탄스(Clostridium phytofermentans), 클로스트리디움 스트라미노솔벤스(Clostridium straminosolvens), 게오바실루스 써모글루코시다시우스(Geobacillus thermoglucosidasius), 게오바실루스 스테아로써모필루스(Geobacillus stearothermophilus), 사카로코쿠스 칼독실로실리티쿠스(Saccharococcus caldoxylosilyticus), 사카로쿠스 써모필루스(Saccharoccus thermophilus), 패니바실루스 캄피나센시스(Paenibacillus campinasensis), 바실루스 플라보써무스(Bacillus flavothermus), 안옥시바실루스 캄차트켄시스(Anoxybacillus kamchatkensis), 안옥시바실루스 고넨시스(Anoxybacillus gonensis), 칼디셀룰로시룹터 아세티게누스(Caldicellulosiruptor acetigenus), 칼디셀룰로시룹터 사카로리티쿠스(Caldicellulosiruptor saccharolyticus), 칼디셀룰로시룹터 크리스티안소니(Caldicellulosiruptor kristjanssonii), 칼디셀룰로시룹터 오웬센시스(Caldicellulosiruptor owensensis), 칼디셀룰로시룹터 락토아세티쿠스(Caldicellulosiruptor lactoaceticus), 및 안에어로셀룸 써모필룸(Anaerocellum thermophilum)로 구성된 군으로부터 선택된 세균인 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum)인 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 (a) 헥소오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물; (b) 펜토오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물; 및 (c) 헥소오스 당과 펜토오스 당을 대사하는 고유 능력을 지닌 호열성 또는 중온성 미생물로 구성된 군으로부터 선택되는 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 헥소오스 당을 대사하는 고유 능력을 지니 는 유전자 변형된 미생물.
- 제 15항에 있어서, 상기 미생물이 클로스트리디움 스트라미노솔벤스(Clostridium straminosolvens) 또는 클로스트리디움 써모셀룸(Clostridium thermocellum)인 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 헥소오스 당과 펜토오스 당을 대사하는 고유 능력을 지니는 유전자 변형된 미생물.
- 제 17항에 있어서, 상기 미생물이 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 크리스티안소니(Clostridium kristjanssonii), 또는 클로스트리디움 스테르코라리움 아종 렙토사프라르툼(Clostridium stercorarium subsp. leptosaprartum)인 유전자 변형된 미생물.
- 제 15항에 있어서, 펜토오스 당을 대사하는 능력을 부여하는 제 1의 비고유(non-native) 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 펜토오스 당으로부터 발효 생산물로서 에탄올을 생산할 수 있게 하는 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이 펜토오스 당을 대사하는 고유 능력을 지니 는 유전자 변형된 미생물.
- 제 20항에 있어서, 상기 미생물이 써모안에어로박테리움 사카롤리티쿰(Thermoanaerobacterium saccharolyticum), 써모안에어로박테리움 자일라노리티쿰(Thermoanaerobacterium xylanolyticum), 써모안에어로박테리움 폴리사카롤리티쿰(Thermoanaerobacterium polysaccharolyticum), 및 써모안에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum)으로 구성된 군으로부터 선택되는 유전자 변형된 미생물.
- 제 20항에 있어서, 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당으로부터 발효 생산물로서 에탄올을 생산할 수 있게 하는 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 유기산이 락트산 및 아세트산으로 구성된 군으로부터 선택되는 것인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 유기산이 락트산인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 유기산이 아세트산인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 락테이트 데히드로게나아제, 아세테이트 키나아제 및 포스포트랜스아세틸라아제로 구성된 군으로부터 선택되는 것인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 락테이트 데히드로게나아제인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 아세테이트 키나아제인 유전자 변형된 미생물.
- 제 9항 내지 제 22항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 포스포트랜스아세틸라아제인 유전자 변형된 미생물.
- 제 9항 내지 제 29항 중 어느 한 항에 있어서, 유기산 또는 이의 염의 대사적 생산에 관여하는 제 2의 고유 효소를 엔코딩하는 제 2의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되는 유전자 변형된 미생물.
- 제 30항에 있어서, 상기 제 2의 고유 효소가 아세테이트 키나아제 또는 포스포트랜스아세틸라아제인 유전자 변형된 미생물.
- 제 30항에 있어서, 상기 제 2의 고유 효소가 락테이트 데히드로게나아제인 유전자 변형된 미생물.
- 유전자 변형된 호열성 또는 중온성 미생물로서, (a) 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되고, (b) 에탄올의 대사적 생산에 관여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 발효 생산물로서 에탄올을 생산할 수 있게 하는 유전자 변형된 호열성 또는 중온성 미생물.
- 제 33항에 있어서, 상기 제 1의 비고유 유전자가 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당을 대사할 수 있게 하는 유전자 변형된 미생물.
- 제 33항에 있어서, 상기 제 1의 비고유 유전자가 펜토오스 당을 대사하는 능 력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 펜토오스 당을 대사할 수 있게 하는 유전자 변형된 미생물.
- 제 33항에 있어서, 상기 제 1의 비고유 유전자가 헥소오스 당을 대사하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하고; 펜토오스 당을 대사하는 능력을 부여하는 제 2의 비고유 효소를 엔코딩하는 제 2의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 헥소오스 당과 펜토오스 당을 대사할 수 있게 하는 유전자 변형된 미생물.
- 제 33항 내지 제 36항 중 어느 한 항에 있어서, 상기 유기산이 락트산인 유전자 변형된 미생물.
- 제 33항 내지 제 36항 중 어느 한 항에 있어서, 상기 유기산이 아세트산인 유전자 변형된 미생물.
- 제 33항, 제 34항 또는 제 36항 중 어느 한 항에 있어서, 상기 제 1의 비고유 효소가 피루베이트 데카르복실라아제(PDC) 또는 알코올 데히드로게나아제(ADH)인 유전자 변형된 미생물.
- 제 33항 또는 제 35항에 있어서, 상기 제 2의 비고유 효소가 자일로오스 이 소머라아제인 유전자 변형된 미생물.
- 제 40항에 있어서, 상기 제 1의 비고유 유전자가 SEQ ID NO:6, 10 또는 14에 상응하는 것인 유전자 변형된 미생물.
- 제 33항, 제 35항 또는 제 36항 중 어느 한 항에 있어서, 상기 비고유 효소가 자일룰로키나아제(xylulokinase)인 유전자 변형된 미생물.
- 제 42항에 있어서, 상기 비고유 유전자가 SEQ ID NO:7, 11 또는 15에 상응하는 것인 유전자 변형된 미생물.
- 제 33항, 제 35항 또는 제 36항 중 어느 한 항에 있어서, 상기 비고유 효소가 L-아라비노오스 이소머라아제인 유전자 변형된 미생물.
- 제 44항에 있어서, 상기 비고유 유전자가 SEQ ID NO:8 또는 12에 상응하는 것인 유전자 변형된 미생물.
- 제 33항, 제 35항 또는 제 36항 중 어느 한 항에 있어서, 상기 비고유 유전자가 L-리불로오스-5-포스페이트 4-에피머라아제인 유전자 변형된 미생물.
- 제 46항에 있어서, 상기 비고유 유전자가 SEQ ID NO:9 또는 13에 상응하는 것인 유전자 변형된 미생물.
- 제 9항 내지 제 47항 중 어느 한 항에 있어서, 상기 미생물이 대사된 바이오매스로부터의 탄소 중 60% 이상을 에탄올로 전환시킬 수 있는 유전자 변형된 미생물.
- 제 9항에 있어서, 상기 미생물이, 셀룰로오스를 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (a), 자일란(xylan)을 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (b) 및 셀룰로오스와 자일란을 가수분해하는 고유 능력을 지닌 호열성 또는 중온성 미생물 (c)로 구성된 군으로부터 선택되는 유전자 변형된 미생물.
- 제 9항 또는 제 33항에 있어서, 상기 미생물이 셀룰로오스를 가수분해하는 고유 능력을 지니는 유전자 변형된 미생물.
- 제 9항 또는 제 33항에 있어서, 상기 미생물이 셀룰로오스와 자일란을 가수분해하는 고유 능력을 지니는 유전자 변형된 미생물.
- 제 50항에 있어서, 자일란을 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입되어 있는 유전자 변형된 미생물.
- 제 9항 또는 제 33항에 있어서, 상기 미생물이 자일란을 가수분해하는 고유 능력을 지니는 유전자 변형된 미생물.
- 제 53항에 있어서, 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입되어 있는 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 유기산이 락트산 및 아세트산으로 구성된 군으로부터 선택되는 것인 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 유기산이 락트산인 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 유기산이 아세트산인 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 락테이트 데히드로게나아제, 아세테이트 키나아제 및 포스포트랜스아세틸라아제로 구 성된 군으로부터 선택되는 것인 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 락테이트 데히드로게나아제인 유전자 변형된 미생물.
- 제 49항 내지 54항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 아세테이트 키나아제인 유전자 변형된 미생물.
- 제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 제 1의 고유 효소가 포스포트랜스아세틸라아제인 유전자 변형된 미생물.
- 제 50항 내지 제 61항 중 어느 한 항에 있어서, 유기산 또는 이의 염의 대사적 생산에 관여하는 제 2의 고유 효소를 엔코딩하는 제 2의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되는 유전자 변형된 미생물.
- 제 62항에 있어서, 상기 제 2의 고유 효소가 아세테이트 키나아제 또는 포스포트랜스아세틸라아제인 유전자 변형된 미생물.
- 제 62항에 있어서, 상기 제 2의 고유 효소가 락테이트 데히드로게나아제인 유전자 변형된 미생물.
- 유전자 변형된 호열성 또는 중온성 미생물로서, (a) 유기산 또는 이의 염의 대사적 생산에 관여하는 제 1의 고유 효소를 엔코딩하는 제 1의 고유 유전자가 부분적으로, 실질적으로 또는 완전히 결실되거나 침묵되거나 비활성화되거나 하향조절되고, (b) 다당류의 가수분해에 관여하는 제 1의 비고유 효소를 엔코딩하는 제 1의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 발효 생산물로서 에탄올을 생산할 수 있게 하는 유전자 변형된 호열성 또는 중온성 미생물.
- 제 65항에 있어서, 상기 제 1의 비고유 유전자가 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 셀룰로오스를 가수분해할 수 있게 하는 유전자 변형된 미생물.
- 제 65항에 있어서, 상기 제 1의 비고유 유전자가 자일란을 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩함으로써, 상기 호열성 또는 중온성 미생물이 자일란을 가수분해할 수 있게 하는 유전자 변형된 미생물.
- 제 65항에 있어서, 상기 제 1의 비고유 유전자가 셀룰로오스를 가수분해하는 능력을 부여하는 제 1의 비고유 효소를 엔코딩하고; 자일란을 가수분해하는 능력을 부여하는 제 2의 비고유 효소를 엔코딩하는 제 2의 비고유 유전자가 삽입됨으로써, 상기 호열성 또는 중온성 미생물이 셀룰로오스와 자일란을 가수분해할 수 있게 하는 유전자 변형된 미생물.
- 제 65항 내지 제 68항 중 어느 한 항에 있어서, 상기 유기산이 락트산인 유전자 변형된 미생물.
- 제 65항 내지 제 68항 중 어느 한 항에 있어서, 상기 유기산이 아세트산인 유전자 변형된 미생물.
- 제 65항, 제 66항 또는 제 68항 중 어느 한 항에 있어서, 상기 제 1의 비고유 효소가 피루베이트 데카르복실라아제(PDC) 또는 알코올 데히드로게나아제(ADH)인 유전자 변형된 미생물.
- 제 49항 내지 제 71항 중 어느 한 항에 있어서, 상기 미생물이 대사된 바이오매스로부터의 탄소 중 60% 이상을 에탄올로 전환시킬 수 있는 유전자 변형된 미생물.
- 제 9항, 제 11항, 제 12항, 제 14항, 제 16항, 제 18항, 제 19항, 제 22항, 제 33항, 제 34항, 제 35항, 제 36항, 제 49항, 제 65항, 제 66항, 제 67항 또는 제 68항 중 어느 한 항에 있어서, 상기 미생물이 중온성 미생물인 유전자 변형된 미생물.
- 제 9항, 제 11항, 제 12항, 제 13항, 제 14항, 제 19항, 제 21항, 제 22항, 제 33항, 제 34항, 제 35항, 제 36항, 제 49항, 제 65항, 제 66항, 제 67항 또는 제 68항 중 어느 한 항에 있어서, 상기 미생물이 호열성 미생물인 유전자 변형된 미생물.
- 리그노셀룰로오스(lignocellosic) 바이오매스를 제 9항 내지 제 48항 중 어느 한 항에 따른 유전자 변형된 호열성 또는 중온성 미생물과 접촉시키는 것을 포함하여, 리그노셀룰로오스 바이오매스를 에탄올로 전환시키는 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 그래스(grass), 스위치 그래스(switch grass), 코드 그래스(cord grass), 라이 그래스(rye grass), 리드 카나리 그래스(reed canary grass), 혼합형 프레어리 그래스(mixed prairie grass), 미스캔투스(miscanthus), 설탕-가공 잔류물(sugar-processing residue), 사탕수수 버개스(sugarcane bagasse), 사탕수수짚(sugarcane straw), 농업 폐기물, 볏짚(rice straw), 왕겨(rice hull), 보리짚(barley straw), 옥수수 속대(corn cob), 곡물짚(cereal straw), 밀짚(wheat straw), 카놀라짚(canola straw), 귀리짚(oat straw), 귀리껍질(oat hull), 옥수수 섬유, 스토버(stover), 대두 스토버, 옥수수 스토버, 산림 폐기물(forestry waste), 리사이클링된 목재 펄프 섬유, 종이 슬러지(paper sludge), 톱밥(sawdust), 경질목재(hardwood), 연질목재(softwood), 및 이들의 조합물로 구성된 군으로부터 선택되는 것인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버, 사탕수수 버개스, 스위치그래스 및 포플러 목재(poplar wood)로 구성된 군으로부터 선택되는 것인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 사탕수수 버개스인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 스위치그래스인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 포플러 목재인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 버드나무(willow)인 방법.
- 제 75항에 있어서, 상기 리그노셀룰로오스 바이오매스가 종이 슬러지인 방법.
- 리그노셀룰로오스 바이오매스를 제 49항 내지 제 74항 중 어느 한 항에 따른 유전자 변형된 호열성 또는 중온성 미생물과 접촉시키는 것을 포함하여, 리그노셀룰로오스 바이오매스를 에탄올로 전환시키는 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 그래스, 스위치 그래스, 코드 그래스, 라이 그래스, 리드 카나리 그래스, 혼합형 프레어리 그래스, 미스캔투스, 설탕-가공 잔류물, 사탕수수 버개스, 사탕수수짚, 농업 폐기물, 볏짚, 왕겨, 보리짚, 옥수수 속대, 곡물짚, 밀짚, 카놀라짚, 귀리짚, 귀리껍질, 옥수수 섬유, 스토버, 대두 스토버, 옥수수 스토버, 산림 폐기물, 리사이클링된 목재 펄프 섬유, 종이 슬러지, 톱밥, 경질목재, 연질목재, 및 이들의 조합물로 구성된 군으로부터 선택되는 것인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버, 사탕수수 버개스, 스위치그래스 및 포플러 목재로 구성된 군으로부터 선택되는 것인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 옥수수 스토버인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 사탕수수 버개스인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 스위치그래스인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 포플러 목재인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 버드나무인 방법.
- 제 84항에 있어서, 상기 리그노셀룰로오스 바이오매스가 종이 슬러지인 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US91697807P | 2007-05-09 | 2007-05-09 | |
US60/916,978 | 2007-05-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20100037031A true KR20100037031A (ko) | 2010-04-08 |
Family
ID=40002867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097025740A KR20100037031A (ko) | 2007-05-09 | 2008-05-09 | 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법 |
Country Status (13)
Country | Link |
---|---|
US (2) | US8435770B2 (ko) |
EP (5) | EP2064225A4 (ko) |
JP (1) | JP2010526536A (ko) |
KR (1) | KR20100037031A (ko) |
CN (1) | CN101848924A (ko) |
AU (1) | AU2008251465B2 (ko) |
BR (1) | BRPI0811556A2 (ko) |
CA (1) | CA2685879A1 (ko) |
IL (1) | IL201824A0 (ko) |
NZ (2) | NZ581493A (ko) |
RU (1) | RU2541785C2 (ko) |
WO (1) | WO2008141174A2 (ko) |
ZA (1) | ZA200908721B (ko) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8163516B2 (en) * | 2008-02-08 | 2012-04-24 | Algenol Biofuels Inc. | Selection of ADH in genetically modified cyanobacteria for the production of ethanol |
WO2009109630A1 (en) * | 2008-03-07 | 2009-09-11 | Dsm Ip Assets B.V. | A pentose sugar fermenting cell |
DE102008031350B4 (de) * | 2008-07-02 | 2011-02-10 | Johann Wolfgang Goethe-Universität Frankfurt am Main | Prokaryotische Xylose-Isomerase zur Konstruktion Xylose-vergärender Hefen |
CA2732078A1 (en) | 2008-07-28 | 2010-02-04 | University Of Massachusetts | Methods and compositions for improving the production of products in microorganisms |
CA2743505A1 (en) * | 2008-11-12 | 2010-05-20 | Mascoma Corporation | Gene knockout mesophilic and thermophilic organisms, and methods of use thereof |
EP2194120A1 (en) * | 2008-12-02 | 2010-06-09 | Total S.A. | Bioprocessing ligno-cellulose into ethanol with recombinant clostridium |
WO2010075213A2 (en) * | 2008-12-22 | 2010-07-01 | Mascoma Corporation | Production of ethanol from lignocellulosic biomass |
WO2011059314A1 (en) * | 2009-11-12 | 2011-05-19 | Stichting Voor De Technische Wetenschappen | Pentose transporters and uses thereof |
US20120301937A1 (en) | 2010-01-26 | 2012-11-29 | Scale Biofuel, ApS | Methods for producing and harvesting ethanol and apparatus for producing and harvesting the same |
GB2478791A (en) * | 2010-03-19 | 2011-09-21 | Qteros Inc | Ethanol production by genetically-modified bacteria |
US8927254B2 (en) | 2010-09-29 | 2015-01-06 | University Of Georgia Research Foundation, Inc. | Pyrococcus furiosus strains and methods of using same |
CN103429751A (zh) * | 2010-12-22 | 2013-12-04 | 马斯科马公司 | 经工程化以发酵木糖的遗传修饰的热纤梭菌 |
SG192958A1 (en) | 2011-02-28 | 2013-09-30 | Midori Renewables Inc | Polymeric acid catalysts and uses thereof |
US8962333B2 (en) | 2011-04-04 | 2015-02-24 | University Of Georgia Research Foundation, Inc. | Restriction/modification polypeptides, polynucleotides, and methods |
WO2013023713A1 (en) | 2011-05-18 | 2013-02-21 | Scale Biofuel, ApS | Solar-assisted volatile fermentation products production processes |
ES2638910T3 (es) | 2011-09-22 | 2017-10-24 | Direvo Industrial Biotechnology Gmbh | Nuevas bacterias termófilas extremas del género Caldicellulosiruptor |
US9803221B2 (en) | 2011-09-30 | 2017-10-31 | Enchi Corporation | Engineering microorganisms to increase ethanol production by metabolic redirection |
WO2013141905A2 (en) * | 2011-11-30 | 2013-09-26 | Mascoma Corporation | Engineering an increase in ethanol production by altering cofactor specificity |
US9309542B2 (en) | 2012-08-17 | 2016-04-12 | University Of Georgia Research Foundation, Inc. | Recombinant Caldicellulosiruptor bescii and methods of use |
US9238845B2 (en) | 2012-08-24 | 2016-01-19 | Midori Usa, Inc. | Methods of producing sugars from biomass feedstocks |
WO2014039879A1 (en) | 2012-09-06 | 2014-03-13 | North Carolina State University | Sequestration of carbon dioxide with hydrogen to useful products |
US9850512B2 (en) | 2013-03-15 | 2017-12-26 | The Research Foundation For The State University Of New York | Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield |
US9951363B2 (en) | 2014-03-14 | 2018-04-24 | The Research Foundation for the State University of New York College of Environmental Science and Forestry | Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects |
JP6730199B2 (ja) * | 2014-06-11 | 2020-07-29 | デューク ユニバーシティ | 合成代謝弁を用いた迅速かつ動的なフラックス制御のための組成物及び方法 |
CN104263680B (zh) * | 2014-09-05 | 2017-02-01 | 华南理工大学 | 一种嗜热厌氧杆菌及利用其生产乙醇的方法 |
CN105154465A (zh) * | 2015-07-23 | 2015-12-16 | 昆明理工大学 | 一种敲除乙酸激酶基因的重组质粒及其应用 |
CN106893745A (zh) * | 2017-04-12 | 2017-06-27 | 浙江畯和生物科技有限公司 | 一种木质纤维素生物质的高效转化利用方法 |
TWI664286B (zh) * | 2017-08-02 | 2019-07-01 | 國立清華大學 | 生產醋酸的基因轉殖藍綠菌及其應用 |
US11203744B2 (en) | 2018-06-21 | 2021-12-21 | Duke University | Compositions and methods for the production of pyruvic acid and related products using dynamic metabolic control |
CN110484466B (zh) * | 2019-08-15 | 2023-04-21 | 华南理工大学 | 一种提高嗜热厌氧杆菌发酵性能的方法 |
CN111423256A (zh) * | 2020-04-23 | 2020-07-17 | 上海国璨环境科技有限公司 | 一种有机垃圾热解方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5698421A (en) | 1995-09-12 | 1997-12-16 | The Ohio State Research Foundation | Ribonucleoprotein particles for cleaving double-stranded DNA and inserting an RNA/DNA molecule into the cleavage site |
US6027895A (en) | 1995-09-12 | 2000-02-22 | The Ohio State University Research Foundation | Methods for cleaving DNA with nucleotide integrases |
DE69731451T2 (de) * | 1996-09-27 | 2005-11-24 | Dsm Ip Assets B.V. | Biotin-Biosynthese-Gene II |
US5804418A (en) | 1996-11-19 | 1998-09-08 | The Ohio State University Research Foundation | Methods for preparing nucleotide integrases |
WO1999043854A1 (en) | 1998-02-26 | 1999-09-02 | The Ohio State Research Foundation | Methods for cleaving single-stranded and double-stranded dna substrates with nucleotide integrase |
GB0000185D0 (en) | 2000-01-06 | 2000-03-01 | Agrol Limited | Ethanol production |
GB0011186D0 (en) | 2000-05-09 | 2000-06-28 | Agrol Limited | Modification of bacteria |
CN1336432A (zh) * | 2000-07-31 | 2002-02-20 | 武汉迪普生物技术有限公司 | 重组枯激酶的生产方法及其生物活性 |
CA2424890C (en) | 2000-10-06 | 2014-06-03 | Elsworth Biotechnology Limited | Ethanol production in gram-positive bacteria with a stabilized mutation in lactate dehydrogenase |
US20030165859A1 (en) * | 2001-10-23 | 2003-09-04 | Invitrogen Corporation | Primers and methods for the detection and discrimination of nucleic acids |
US7026464B2 (en) | 2002-10-21 | 2006-04-11 | E. I. Du Pont De Nemours And Company | Natural promoters for gene expression in C1 metabolizing bacteria |
EP1769092A4 (en) | 2004-06-29 | 2008-08-06 | Europ Nickel Plc | IMPROVED LIXIVIATION OF BASE METALS |
US20060105348A1 (en) | 2004-11-15 | 2006-05-18 | Lee Jun E | Compositions and methods for the detection and discrimination of nucleic acids |
WO2006099615A2 (en) * | 2005-03-16 | 2006-09-21 | The Johns Hopkins University | Adenoviral fiber exchange shuttle system |
NZ563043A (en) | 2005-05-04 | 2010-04-30 | Tmo Renewables Ltd | Thermophilic microorganisms with inactivated lactate dehydrogenase gene (LDH) for ethanol production |
GB0511602D0 (en) | 2005-06-07 | 2005-07-13 | Tmo Biotec Ltd | Microorganisms |
ATE498358T1 (de) | 2005-06-29 | 2011-03-15 | Compumedics Ltd | Sensoranordnung mit leitfähiger brücke |
CN101505589A (zh) * | 2005-08-30 | 2009-08-12 | 菲龙有限责任公司 | 昆虫抗性转基因草坪草 |
GB0520344D0 (en) | 2005-10-06 | 2005-11-16 | Tmo Biotec Ltd | Microoganisms |
BRPI0618074A2 (pt) * | 2005-10-31 | 2011-08-16 | Dartmouth College | organismos termofìlicos para conversão de biomassa lignocelulósica em etanol |
TW200801513A (en) | 2006-06-29 | 2008-01-01 | Fermiscan Australia Pty Ltd | Improved process |
EP1920051B1 (en) | 2006-09-14 | 2010-10-20 | TMO Renewables Limited | Lipase |
BRPI0717228A2 (pt) | 2006-09-28 | 2013-10-08 | Tmo Renewables Ltd | Micro-organismos termofílicos para produção de etanol |
-
2008
- 2008-05-09 CN CN200880024031A patent/CN101848924A/zh active Pending
- 2008-05-09 WO PCT/US2008/063237 patent/WO2008141174A2/en active Application Filing
- 2008-05-09 JP JP2010507693A patent/JP2010526536A/ja active Pending
- 2008-05-09 US US12/599,458 patent/US8435770B2/en not_active Expired - Fee Related
- 2008-05-09 NZ NZ581493A patent/NZ581493A/en not_active IP Right Cessation
- 2008-05-09 BR BRPI0811556A patent/BRPI0811556A2/pt not_active IP Right Cessation
- 2008-05-09 EP EP08769395A patent/EP2064225A4/en not_active Withdrawn
- 2008-05-09 KR KR1020097025740A patent/KR20100037031A/ko not_active Application Discontinuation
- 2008-05-09 EP EP12164672A patent/EP2511286A3/en not_active Withdrawn
- 2008-05-09 AU AU2008251465A patent/AU2008251465B2/en not_active Ceased
- 2008-05-09 EP EP12164671A patent/EP2511285A3/en not_active Withdrawn
- 2008-05-09 RU RU2009145274/10A patent/RU2541785C2/ru not_active IP Right Cessation
- 2008-05-09 EP EP12164670A patent/EP2511284A3/en not_active Withdrawn
- 2008-05-09 CA CA002685879A patent/CA2685879A1/en not_active Abandoned
- 2008-05-09 EP EP12164673A patent/EP2511287A3/en not_active Withdrawn
-
2009
- 2009-10-29 IL IL201824A patent/IL201824A0/en unknown
- 2009-12-08 ZA ZA200908721A patent/ZA200908721B/xx unknown
-
2012
- 2012-04-20 NZ NZ599526A patent/NZ599526A/xx not_active IP Right Cessation
-
2013
- 2013-05-07 US US13/888,610 patent/US20150024450A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
AU2008251465B2 (en) | 2013-01-10 |
EP2511284A3 (en) | 2012-11-28 |
CN101848924A (zh) | 2010-09-29 |
WO2008141174A3 (en) | 2009-03-12 |
CA2685879A1 (en) | 2008-11-20 |
JP2010526536A (ja) | 2010-08-05 |
US20100297721A1 (en) | 2010-11-25 |
EP2064225A4 (en) | 2010-03-03 |
EP2511287A3 (en) | 2012-11-28 |
ZA200908721B (en) | 2010-08-25 |
BRPI0811556A2 (pt) | 2017-05-02 |
EP2511286A3 (en) | 2012-11-28 |
AU2008251465A1 (en) | 2008-11-20 |
NZ599526A (en) | 2013-07-26 |
IL201824A0 (en) | 2010-06-16 |
US20150024450A1 (en) | 2015-01-22 |
EP2511285A3 (en) | 2012-11-28 |
NZ581493A (en) | 2012-05-25 |
WO2008141174A9 (en) | 2012-07-05 |
RU2541785C2 (ru) | 2015-02-20 |
EP2511286A2 (en) | 2012-10-17 |
EP2511284A2 (en) | 2012-10-17 |
EP2511287A2 (en) | 2012-10-17 |
WO2008141174A2 (en) | 2008-11-20 |
EP2064225A2 (en) | 2009-06-03 |
EP2511285A2 (en) | 2012-10-17 |
US8435770B2 (en) | 2013-05-07 |
RU2009145274A (ru) | 2011-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20100037031A (ko) | 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
CA2834053C (en) | Yeast strains engineered to produce ethanol from glycerol | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
AU2023226754A1 (en) | Compositions and methods for modifying genomes | |
DK3108014T3 (en) | Methods and systems for rapid detection of microorganisms using recombinant bacteriophage | |
CN108138121B (zh) | 用微生物高水平生产长链二羧酸 | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
DK2670846T3 (en) | METHODS FOR THE DEVELOPMENT OF TERPEN SYNTHASE VARIETIES | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
DK2324120T3 (en) | Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS | |
AU2010258955B2 (en) | Expression cassettes derived from maize | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20130032897A (ko) | 알코올 발효 시의 알코올 에스테르의 생성 및 원위치에서의 생성물 제거 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
US20040003420A1 (en) | Modified recombinase | |
CN110423705A (zh) | 用于通过添加交替电子受体改善微生物中的产品收率和产量的方法 | |
KR20140146616A (ko) | 부타놀로겐용 배지의 아세테이트 보충물 | |
KR20180053684A (ko) | Fdca의 진균 제조 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |