RU2717642C1 - Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil - Google Patents
Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil Download PDFInfo
- Publication number
- RU2717642C1 RU2717642C1 RU2018146443A RU2018146443A RU2717642C1 RU 2717642 C1 RU2717642 C1 RU 2717642C1 RU 2018146443 A RU2018146443 A RU 2018146443A RU 2018146443 A RU2018146443 A RU 2018146443A RU 2717642 C1 RU2717642 C1 RU 2717642C1
- Authority
- RU
- Russia
- Prior art keywords
- seq
- varieties
- marker
- sunflower seeds
- fatty acid
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/03—Edible oils or edible fats
Abstract
Description
Область техникиTechnical field
Изобретение относится к областям геномики, молекулярной биологии, биоинформатики и селекции растений, в частности относится к селекции семян подсолнечника с помощью разработанной SNP-панели.The invention relates to the fields of genomics, molecular biology, bioinformatics and plant breeding, in particular, to the selection of sunflower seeds using the developed SNP panel.
Уровень техникиState of the art
Жирнокислотный состав масла является параметром, определяющим функциональные и технические свойства масла. Высокое содержание олеиновой кислоты определяет большую устойчивость масла к окислению, а также вносит вклад в снижение уровня холестерола в крови и уменьшение риска сердечно-сосудистых заболеваний (Grundy, 1986, Premnath et al., 2016, Fuller et al., 1967). Пониженное содержание линолевой кислоты и повышенное содержание линоленовой кислоты улучшают соотношениие омега-6 к омега-3 в масле, что является важным для уменьшения риска сердечно-сосудистых и воспалительных заболеваний ( and Murphy, 2009). Масло подсолнечника с оптимизированным соотношением омега-6 к омега-3 может найти применение в кондитерской и медицинской промышленности (Rauf et al., 2017). Получение подсолнечника с улучшенным соотношением омега-6 к омега-3 в масле семян представляется особенно важным в РФ, где он является основной масличной культурой.The fatty acid composition of the oil is a parameter that determines the functional and technical properties of the oil. The high oleic acid content determines the greater oxidation stability of the oil, and also contributes to lowering blood cholesterol and reducing the risk of cardiovascular disease (Grundy, 1986, Premnath et al., 2016, Fuller et al., 1967). Low linoleic acid and high linolenic acid improve the ratio of omega-6 to omega-3 in oil, which is important to reduce the risk of cardiovascular and inflammatory diseases ( and Murphy, 2009). Sunflower oil with an optimized ratio of omega-6 to omega-3 can be used in the confectionery and medical industries (Rauf et al., 2017). Obtaining sunflower with an improved ratio of omega-6 to omega-3 in seed oil is especially important in the Russian Federation, where it is the main oilseed crop.
По теме применения молекулярных маркеров в селекции подсолнечника и в области геномной селекции существуют публикации и патенты, однако, большинство из них касаются применения отдельных молекулярных маркеров на единичные хозяйственно-ценные признаки (например, US 2013254927, US 20090258346, WO 2017106274; Hongtrakul V., et al., (1998) A seed specific delta-12 oleate desaturase gene is duplicated, rearranged, and weakly expressed in high oleic acid sunflower lines. Crop Sci 38(5):1245-1249; Lacombe S., Berville A. (2001) A dominant mutation for high oleic acid content in sunflower seed oil is genetically linked to a single oleate-desaturase RFLP locus. Mol Breed 8(2):129-137; Perez-Vich B., Fernandez-Martinez J.M., Grondona M., Knapp S.J., Berry S.T. (2002) Stearoyl-ACP and oleoyl-PC desaturase genes cosegregate with quantitative trait loci underlying high stearic and high oleic acid mutant phenotypes in sunflower. Theor Appl Genet 104(2-3):338-349).There are publications and patents on the use of molecular markers in sunflower breeding and in the field of genomic selection, however, most of them relate to the use of individual molecular markers for single economically valuable traits (e.g., US 2013254927, US 20090258346, WO 2017106274; Hongtrakul V., et al., (1998) A seed specific delta-12 oleate desaturase gene is duplicated, rearranged, and weakly expressed in high oleic acid sunflower lines. Crop Sci 38 (5): 1245-1249; Lacombe S., Berville A. ( 2001) A dominant mutation for high oleic acid content in sunflower seed oil is genetically linked to a single oleate-desaturase RFLP locus. Mol Breed 8 (2): 129-137; Perez-Vich B., Fernandez-Martinez JM, Grondona M ., Knapp SJ, Berry ST (2002) Stearoyl -ACP and oleoyl-PC desaturase genes cosegregate with quantitative trait loci underlying high stearic and high oleic acid mutant phenotypes in sunflower. Theor Appl Genet 104 (2-3): 338-349).
Несмотря на известность ряда способов селекции семян подсолнечника, на сегодняшний день на рынке сохраняется потребность в эффективном методе генотипирования семян подсолнечника для отбора семян с улучшенным жирнокислотным составом масла.Despite the popularity of a number of methods for the selection of sunflower seeds, today there remains a need in the market for an effective method of genotyping sunflower seeds for seed selection with an improved fatty acid composition of the oil.
Сущность изобретенияSUMMARY OF THE INVENTION
Задачей настоящего изобретения является создание панели маркеров для генотипирования, представляющей собой набор из молекулярных маркеров на основе однонуклеотидных полиморфизмов генома подсолнечника. Данная панель предназначена для осуществления оценки геномной ценности селекционного материала подсолнечника и проведения селекции подсолнечника по комплексу хозяйственно-ценных признаков, включающих содержание жирных кислот 16:2, 18:1, 18:2, 18:3 и 20:2 в масле семян. Маркеры были выявлены в результате полногеномного поиска ассоциаций на основании данных о генотипе и фенотипе примерно 500 линий подсолнечника различного происхождения. Подобная панель маркеров имеет ряд преимуществ. Во-первых, панель маркеров обеспечивает лучший результат прогнозирования, чем единичный маркер. Во-вторых, использование панели позволяет принимать селекционные решения раньше, чем в традиционных селекционных программах, тем самым сокращая время селекции подсолнечника. Наконец, ДНК-маркеры легко измеримы стандартными методами (секвенированием, ПЦР или с помощью микрочипов).An object of the present invention is to provide a marker panel for genotyping, which is a collection of molecular markers based on single nucleotide polymorphisms of the sunflower genome. This panel is designed to evaluate the genomic value of sunflower breeding material and to conduct sunflower breeding by a set of economically valuable traits, including the content of fatty acids 16: 2, 18: 1, 18: 2, 18: 3 and 20: 2 in seed oil. Markers were identified as a result of a genome-wide search for associations based on data on the genotype and phenotype of approximately 500 lines of sunflower of various origin. A similar marker panel has several advantages. First, the marker pane provides a better prediction result than a single marker. Secondly, the use of the panel allows you to make breeding decisions earlier than in traditional breeding programs, thereby reducing the time of selection of sunflower. Finally, DNA markers are easily measurable by standard methods (sequencing, PCR, or using microarrays).
Указанная задача решается путем создания способа отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирных кислот, выбранных из группы: 16:2, 18:1, 18:2, 18:3 и 20:2, включающего следующие стадии: а) выделяют геномную ДНК из семян подсолнечника меньшей мере двух различных сортов; б) для каждого из этих сортов определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из одной из следующих групп: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205529, S14_65302793, S14_65303987, S14_72096756, S17_18759543, или S01_117769266, S03_35155696, S03_45985345, S03_45985383, S03_57714775, S03_57714809, S08_129069633, или S02_22008907, S12_31930711, S12_36426640, или S01_110639563, S02_172598425, S02_179620148, S02_179872061, S03_167862882, S05_134224005, S05_165389465, S06_24822077, S08_5534412, S08_6242126, S09_112143602, S09_112153552, S09_14502473, S09_54150875, S10_178263586, S10_178337729, S10_178433439, S10_178513648, S10_204069518, S10_209927613, S10_213767877, S10_51538842, S11_82358252, S11_97936654, S12_107524160, S12_112746220, S12_120762889, S12_77297771, S13_105463640, S13_105487148, S13_123854633, S13_123930072, S13_124931273, S13_126530608, S13_133448536, S13_158874709, S13_159575588, S13_159575716, S13_160298625, S13_160341835, S13_162181797, S13_163335561, S13_165620043, S13_165620174, S13_166163943, S13_166236370, S13_39228680, S13_83080014, S13_83080207, S14_145387573, S14_27659348, S14_53314465, S14_53314632, S14_53329907,S14_53423360, S14_53423548, S14_53450243, S14_53450417, S14_53480813, S14_53480947, S14_53551912, S14_53562978, S14_59747903, S14_59866616, S14_59958364, S14_60107013, S14_60321165, S14_60321330, S14_60355581, S14_60429765, S14_60721757, S14_60765247, S14_60814564, S14_60826402, S14_60828070, S14_60952895, S14_61085378, S14_67039039, S14_70475580, S14_81249398, S15_118132600, S15_15985773, S15_54276880, S15_54276984, S15_54277167, S15_79200965, S16_108240559, S17_123498014, S17_158529906, S17_4501092, S17_55725068, или S04_154189714, S05_135016906, S09_49744939, S09_51030763, S10_193542723, S12_117949481, S16_4537999, при этом для каждого из этих сортов определяют последовательность ДНК в одинаковых маркерах; в) для каждого сорта вычисляют параметр содержания жирной кислоты, соответствующей определенному в (б) маркеру согласно приведенной в описании SNP-панели, при этом вычисление производят суммируя соответствующие значения эффектов аллеля, взятые из приведенной в описании SNP-панели, для каждого маркера, чья последовательность ДНК была определена и соответствующего данной жирной кислоте, и суммируя данные значения по всем маркерам, чья последовательность ДНК была определена и соответствующего данной жирной кислоте согласно приведенной в описании SNP-панели; г) сравнивают вычисленные параметры содержания жирной кислоты, соответствующей определенному в (б) маркеру согласно приведенной в описании SNP-панели, для каждого сорта семян подсолнечника, и определяют сорт с наибольшим или наименьшим параметром содержания данной жирной кислоты.This problem is solved by creating a method for selecting a variety of sunflower seeds with a high or low content of fatty acids selected from the group: 16: 2, 18: 1, 18: 2, 18: 3 and 20: 2, which includes the following stages: a) isolate the genomic DNA from sunflower seeds of at least two different varieties; b) for each of these cultivars, the DNA sequence is determined in at least one marker selected from one of the following groups: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205514769, 79639, 79769, 39739, 79769, 79769, 391, 797, 797 , S03_35155696, S03_45985345, S03_45985383, S03_57714775, S03_57714809, S08_129069633, or S02_22008907, S12_31930711, S12_36426640, or S01_110639563, S02_172598425, S02_179620148, S02_179872061, S03_167862882, S05_134224005, S05_165389465, S06_24822077, S08_5534412, S08_6242126, S09_112143602, S09_112153552, S09_14502473, S09_54150875, S10_178263586 , S10_178337729, S10_178433439, S10_178513648, S10_204069518, S10_209927613, S10_213767877, S10_51538842, S11_82358252, S11_97936654, S12_107524160, S12_1 872_1 287 287 281 287 40, S13_105487148, S13_123854633, S13_123930072, S13_124931273, S13_126530608, S13_133448536, S13_158874709, S13_159575588, S13_159575716, S13_160298625, S13_160341835, S13_162181797, S13_163335561, S13_165620043, S13_165620174, S13_166163943, S13_166236370, S13_39228680, S13_83080014, S13_83080207, S14_145387573, S14_27659348, S14_53314465, S14_53314632, S14_53329907, S14_53423360, S14_53423548, S14_53450243, S14_53450417, S14_53480813, S14_53480947, S14_53551912, S14_53562978, S14_59747903, S14_59866616, S14_59958364, S14_60107013, S14_60321165, S14_60321330, S14_60355581, S14_60429765, S14_60721757, S14_60765247, S14_60814564, S14_60826402, S14_60828070, S14_60952895, S14_61085378, S14_67039039, S14_70475580, S14_81249398, S15_118132600, S15_15985773, S15_54276880, S15_54276984, S15_54277167, S15_79200965, S16_108240559, S17_123498014, S17_158529906, S17_4501092, S17_55725068, or S04_154189714, S05_135016906, S09_49744939, S09_51030763, S10_193542723, S12_117949481, S16_4537999, while for each of these varieties determine the DNA sequence in the same markers; c) for each variety, the parameter of the fatty acid content corresponding to the marker defined in (b) is calculated according to the description of the SNP panel, and the calculation is made by summing the corresponding values of allele effects taken from the description of the SNP panel for each marker whose the DNA sequence was determined and corresponding to a given fatty acid, and summing these values for all markers whose DNA sequence was determined and corresponding to a given fatty acid according to Saniya SNP-panel; d) compare the calculated parameters of the fatty acid content corresponding to the marker defined in (b) according to the description of the SNP panel for each variety of sunflower seeds, and determine the variety with the highest or lowest parameter for the content of this fatty acid.
В некоторых вариантах изобретения данный способ характеризуется тем, что для отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирной кислоты с формулой 16:2 для каждого из сортов семян подсолнечника определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из следующей группы: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205529, S14_65302793, S14_65303987, S14_72096756, S17_18759543.In some embodiments of the invention, this method is characterized in that for the selection of varieties of sunflower seeds with high or low fatty acid content with the formula 16: 2 for each of the varieties of sunflower seeds determine the DNA sequence in at least one marker selected from the following group: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205529, S14_65302793, S14_65303987, S14_72096756, S17_18759543.
В некоторых вариантах изобретения данный способ характеризуется тем, что для отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирной кислоты с формулой 18:1 для каждого из сортов семян подсолнечника определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из следующей группы: S01_117769266, S03_35155696, S03_45985345, S03_45985383, S03_57714775, S03_57714809, S08_129069633.In some embodiments of the invention, this method is characterized in that for the selection of varieties of sunflower seeds with high or low fatty acid content with the formula 18: 1 for each of the varieties of sunflower seeds determine the DNA sequence in at least one marker selected from the following group: S01_117769266, S03_35155696, S03_45985345, S03_45985383, S03_57714775, S03_57714809, S08_129069633.
В некоторых вариантах изобретения данный способ характеризуется тем, что для отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирной кислоты с формулой 18:2 для каждого из сортов семян подсолнечника определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из следующей группы: S02_22008907, S12_31930711, S12_36426640.In some embodiments of the invention, this method is characterized in that for the selection of varieties of sunflower seeds with high or low fatty acid content with the formula 18: 2 for each of the varieties of sunflower seeds determine the DNA sequence in at least one marker selected from the following group: S02_22008907, S12_31930711, S12_36426640.
В некоторых вариантах изобретения данный способ характеризуется тем, что для отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирной кислоты с формулой 18:3 для каждого из сортов семян подсолнечника определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из следующей группы: S01_110639563, S02_172598425, S02_179620148, S02_179872061, S03_167862882, S05_134224005, S05_165389465, S06_24822077, S08_5534412, S08_6242126, S09_112143602, S09_112153552, S09_14502473, S09_54150875, S10_178263586, S10_178337729, S10_178433439, S10_178513648, S10_204069518, S10_209927613, S10_213767877, S10_51538842, S11_82358252, S11_97936654, S12_107524160, S12_112746220, S12_120762889, S12_77297771, S13_105463640, S13_105487148, S13_123854633, S13_123930072, S13_124931273, S13_126530608, S13_133448536, S13_158874709, S13_159575588, S13_159575716, S13_160298625, S13_160341835, S13_162181797, S13_163335561, S13_165620043, S13_165620174, S13_166163943, S13_166236370, S13_39228680, S13_83080014, S13_83080207, S14_145387573, S14_27659348, S14_53314465, S14_53314632, S14_53329907,S14_53423360, S14_53423548, S14_53450243, S14_53450417, S14_53480813, S14_53480947, S14_53551912, S14_53562978, S14_59747903, S14_59866616, S14_59958364, S14_60107013, S14_60321165, S14_60321330, S14_60355581, S14_60429765, S14_60721757, S14_60765247, S14_60814564, S14_60826402, S14_60828070, S14_60952895, S14_61085378, S14_67039039, S14_70475580, S14_81249398, S15_118132600, S15_15985773, S15_54276880, S15_54276984, S15_54277167, S15_79200965, S16_108240559, S17_123498014, S17_158529906, S17_4501092, S17_55725068.In some embodiments of the invention, this method is characterized in that for the selection of varieties of sunflower seeds with high or low fatty acid content with the formula 18: 3 for each of the varieties of sunflower seeds determine the DNA sequence in at least one marker selected from the following group: S01_110639563, S02_172598425, S02_179620148, S02_179872061, S03_167862882, S05_134224005, S05_165389465, S06_24822077, S08_5534412, S08_6242126, S09_112143602, S09_112153552, S09_14502473, S09_54150875, S10_178263586, S10_178337729, S10_178433439, S10_178513648, S10_204069518, S10_209927613, S10_213767877, S10_51538842, S11_82358252, S11_97936654, S12_107524160, S12_112746220, S12_120762889, S12_77297771, S13_105463640, S13_105487148, S13_123854633, S13_123930072, S13_124931273, S13_126530608, S13_133448536, S13_158874709, S13_159575588, S13_159575716, S13_160298625, S13_160341835, S13_162181797, S13_163335561, S13_165620043, S13_165620174, S13_166163943, S13_166236370, S13_39228680, S13_83080014, S13_83080207, S14_145387573, S14_27659348, S14_53314465, S14_53314632, S14_53329907, S14_53423360, S14_53423548, S14_53450243, S14_53450417, S14_53480813, S14_53480947, S14_53551912, S14_53562978, S14_59747903, S14_59866616, S14_59958364, S14_60107013, S14_60321165, S14_60321330, S14_60355581, S14_60429765, S14_60721757, S14_60765247, S14_60814564, S14_60826402, S14_60828070, S14_60952895, S14_61085378, S14_67039039, S14_70475580, S14_81249398, S15_118132600, S15_15985773, S15_54276880, S15_54276984, S15_54277167, S15_79200965, S16_108240559.
В некоторых вариантах изобретения данный способ характеризуется тем, что для отбора сорта семян подсолнечника с повышенным или пониженным содержанием жирной кислоты с формулой 20:2 для каждого из сортов семян подсолнечника определяют последовательность ДНК в по меньшей мере одном маркере, выбранном из следующей группы: S04_154189714, S05_135016906, S09_49744939, S09_51030763, S10_193542723, S12_117949481, S16_4537999.In some embodiments of the invention, this method is characterized in that for the selection of varieties of sunflower seeds with high or low fatty acid content with the formula 20: 2 for each of the varieties of sunflower seeds determine the DNA sequence in at least one marker selected from the following group: S04_154189714, S05_135016906, S09_49744939, S09_51030763, S10_193542723, S12_117949481, S16_4537999.
В предпочтительных вариантах изобретения данный способ характеризуется тем, что для каждого из сортов семян подсолнечника последовательность ДНК маркеров определяют при помощи ДНК-микрочипов.In preferred embodiments of the invention, the method is characterized in that for each of the sunflower seed varieties, the DNA marker sequence is determined using DNA microarrays.
Особенностью разработанной SNP-панели является то, что входящие в нее маркеры ассоциированы с признаками жирнокислотного состава масла семян подсолнечника. Техническим результатом настоящего изобретения является повышение надежности предсказания содержания определенных жирных кислот в масле семян подсолнечника.A feature of the developed SNP panel is that the markers included in it are associated with signs of the fatty acid composition of sunflower seed oil. The technical result of the present invention is to increase the reliability of predicting the content of certain fatty acids in sunflower seed oil.
Краткое описание рисунковBrief Description of Drawings
Фиг. 1. Этапы подготовки образцов ДНК к генотипированию.FIG. 1. Stages of preparing DNA samples for genotyping.
Подробное раскрытие изобретенияDetailed Disclosure of Invention
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе. Для обозначения ЖК в описании используется формула N:K, где N обозначает число атомов углерода в цепи (длину цепи), а K - число двойных С=С связей. Обозначения маркеров SNP панели в Таблице 1 соответствуют позициям полиморфизма ДНК в хромосоме ДНК подсолнечника, при этом авторы использовали версию генома подсолнечника HanXRQr1.0, впервые опубликованную в статье (Badouin, Helene et al. "The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution". Nature. 2017 Jun 1;546(7656):148-152), и хранящуюся на сайте https://www.heliagene.org/. Последовательность хромосом доступна по ссылке https://www.heliagene.org/HanXRQ-SUNRISE/HanXRQr1.0-20151230-EGN-r1.2.zip . В названии каждого маркера закодировано его уникальное положение в указанном выше геноме. Например, для маркера S02_52501989, 02 перед нижним подчеркиванием обозначает хромосому номер 2 из указанного выше генома. Число после нижнего подчеркивания (в данном случае 52501989) соответствует позиции маркера от начала этой хромосомы.In the description of the present invention, the terms “includes” and “including” are interpreted as meaning “includes, among other things.” These terms are not intended to be construed as “consists of only”. Unless defined separately, technical and scientific terms in this application have standard meanings generally accepted in the scientific and technical literature. To denote LC in the description, the formula N: K is used, where N is the number of carbon atoms in the chain (chain length), and K is the number of double C = C bonds. The designations of the SNP panel markers in Table 1 correspond to the positions of DNA polymorphism in the sunflower DNA chromosome, while the authors used the version of the sunflower genome HanXRQr1.0, first published in the article (Badouin, Helene et al. "The sunflower genome provides insights into oil metabolism, flowering and Asterid evolution ". Nature. 2017 Jun 1; 546 (7656): 148-152), and is available at https://www.heliagene.org/. The sequence of chromosomes is available at https://www.heliagene.org/HanXRQ-SUNRISE/HanXRQr1.0-20151230-EGN-r1.2.zip. In the name of each marker, its unique position in the above genome is encoded. For example, for marker S02_52501989, 02 before underscore denotes chromosome number 2 from the above genome. The number after underscore (in this case 52501989) corresponds to the position of the marker from the beginning of this chromosome.
Данное изобретение описывает ДНК-маркеры для определения генотипа и отбора растений подсолнечника, несущих оптимальный набор аллелей локусов генома, ассоциированных с содержанием жирных кислот в масле семян.The present invention describes DNA markers for determining the genotype and selection of sunflower plants carrying an optimal set of alleles of genome loci associated with the content of fatty acids in seed oil.
Определение генотипа растений подсолнечника с помощью SNP-панели может быть использовано в работах по анализу разнообразия, родства, сортовой чистоты образцов подсолнечника. Полученные с помощью SNP-панели данные о генотипе могут быть использованы для выявления образцов несущих набор аллелей, ассоциированных с пониженным, или повышенным содержанием отдельных жирных кислот для использования их в селекции.Determining the genotype of sunflower plants using the SNP panel can be used in the analysis of the diversity, kinship, varietal purity of sunflower samples. The genotype data obtained using the SNP panel can be used to identify samples bearing a set of alleles associated with a reduced or high content of individual fatty acids for use in breeding.
Для отбора образцов подсолнечника для селекции на повышенное содержание жирной кислоты необходимо отбирать образцы, несущие комбинации аллелей с максимальным суммарным эффектом, в то время как для отбора образцов подсолнечника для селекции на пониженное содержание жирной кислоты необходимо отбирать образцы, несущие комбинации аллелей с минимальным суммарным эффектом.For the selection of sunflower samples for selection for a high fatty acid content, it is necessary to take samples bearing combinations of alleles with a maximum total effect, while for the selection of sunflower samples for selection for a low fatty acid content, it is necessary to take samples bearing combinations of alleles with a minimum total effect.
Для этого проводится определение генотипа образцов и его сопоставление с SNP-панелью, раскрытой в настоящем изобретении. Используя значения эффекта аллелей для каждого из маркеров для соответствующей жирной кислоты вычисляется эффект маркера по формуле ЭМ=ЭА1*2 (формула 1) или ЭМ=ЭА2*2 (формула 2) для гомозиготного состояния маркера, и ЭМ=ЭА1+ЭА2 (формула 3) для гетерозиготного состояния маркера, где ЭA1 - эффект аллеля 1, ЭА2 - эффект аллеля 2. Вычисляется сумма эффектов по всем маркерам и отбирается образец с максимальным (для селекции на повышенное содержание жирной кислоты), или минимальным (для селекции на пониженное содержание жирной кислоты) суммарным эффектом. Схема отбора растений подсолнечника для селекции по содержанию жирных кислот в масле семян подсолнечника на основе данных генотипирования с использованием SNP-панели раскрыта в примере 2.For this, the genotype of the samples is determined and compared with the SNP panel disclosed in the present invention. Using the values of the allele effect for each of the markers for the corresponding fatty acid, the marker effect is calculated by the formula EM = EA1 * 2 (formula 1) or EM = EA2 * 2 (formula 2) for the homozygous state of the marker, and EM = EA1 + EA2 (formula 3 ) for the heterozygous state of the marker, where EA1 is the effect of allele 1, EA2 is the effect of allele 2. The sum of the effects for all markers is calculated and a sample is selected with the maximum (for selection for a high fatty acid content) or minimum (for selection for a low fatty acid content) ) total effect. A selection scheme for sunflower plants for selection according to the content of fatty acids in sunflower seed oil based on genotyping data using an SNP panel is disclosed in Example 2.
Маркеры, используемые в разработанной SNP-панели, были выявлены в результате полногеномного поиска ассоциаций на основании данных о генотипе и фенотипе примерно 500 линий подсолнечника различного происхождения. Суммарную ДНК из семян подсолнечника выделяли с использованием набора Nucleospin Plant Extraction Kit («MacheryNagel», Германия), следуя стандартному протоколу производителя. Генотипирование линий проводилось с использованием RAD-анализа c использованием эндонуклеаз рестрикции HindIII и Nlalll. Библиотеки RAD были секвенированы методами массового параллельного секвенирования при помощи Illumina HiSeq4000. Предварительная обработка сырых чтений была выполнена с использованием программного обеспечения Trimmomatic (версия 0.30) (Bolger, Lohse & Usadel, 2014), после чего в качестве входного сигнала для программы Tassel (версия 5.0) использовали 552 481 747 хороших баркодированных односторонних считываний (Bradbury et al., 2007) с длиной k-мера 65 пар нуклеотилов (п.н.). При выборе вариантов были применены дополнительные опции фильтрации: -mnMAF 0.01, -minMAPQ 10 и -mnQS 20. Для извлечения SNP маркеров использовали программу bcftools (версия 1.9). The markers used in the developed SNP panel were identified as a result of a genome-wide search for associations based on data on the genotype and phenotype of approximately 500 lines of sunflower of various origin. Total DNA from sunflower seeds was isolated using the Nucleospin Plant Extraction Kit (MacheryNagel, Germany) following the manufacturer's standard protocol. Line genotyping was performed using RAD analysis using restriction endonucleases HindIII and Nlalll. RAD libraries were sequenced using mass parallel sequencing using the Illumina HiSeq4000. Raw readings were pre-processed using Trimmomatic software (version 0.30) (Bolger, Lohse & Usadel, 2014), after which 552,481,747 good barcoded one-way reads were used as input to the Tassel program (version 5.0) (Bradbury et al ., 2007) with a length of k-measure of 65 pairs of nucleotyls (bp). When selecting options, additional filtering options were applied: -mnMAF 0.01, -minMAPQ 10 and
Анализ состава жирных кислот в семенах культур был выполнен с использованием ультраэффективной жидкостной хроматографии, совмещенной с масс-спектрометром (Ultra performance liquid chromatography - tandem mass spectrometer (UPLC-MS)). Для экстракции липидов 10 мг (для каждой линии) семян подсолнечника гомогенизировали при температуре не более 10°C с использованием шести шариков из оксида циркония размером 2,8 мм (Bertin Instruments, Франция) в гомогенизаторе Precellys Evolution (Bertin Instruments, Франция), совмещенным с Cryolis, заполненным сухим льдом. Этот протокол основан на протоколе, описанном Giavalisco et al. (2011). Для количественного определения жирных кислот (ЖК) к экстракционной смеси добавляли три внутренних стандарта ЖК, меченных углеродным изотопом 13C (3 мкг каждой ЖК на образец: олеиновая кислота-13C18 (№ 490431, Sigma Aldrich), пальмитиновая кислота-13C16 (№ 605573, Sigma Aldrich) и стеариновая кислота. кислота-13C18 (# 605581, Sigma Aldrich)). Для анализа ЖК экстракты, полученные на предыдущем этапе, были гидролизованы с использованием протокола, описанного у Bromke et al (2015).Analysis of the composition of fatty acids in the seeds of the cultures was performed using ultra-performance liquid chromatography combined with a mass spectrometer (Ultra performance liquid chromatography - tandem mass spectrometer (UPLC-MS)). For lipid extraction, 10 mg (for each line) of sunflower seeds was homogenized at a temperature not exceeding 10 ° C using six 2.8 mm zirconia beads (Bertin Instruments, France) in a Precellys Evolution homogenizer (Bertin Instruments, France), combined with Cryolis filled with dry ice. This protocol is based on the protocol described by Giavalisco et al. (2011). For the quantitative determination of fatty acids (FA), three internal FA standards labeled with the 13 C carbon isotope (3 μg of each FA per sample) were added to the extraction mixture: oleic acid 13 C18 (No. 490431, Sigma Aldrich), palmitic acid 13 C16 (No. 605573, Sigma Aldrich) and stearic acid. Acid- 13 C18 (# 605581, Sigma Aldrich)). For analysis, LC extracts obtained in the previous step were hydrolyzed using the protocol described by Bromke et al (2015).
Чтобы подготовить образцы для инъекции в систему UPLC-MS, высушенные экстракты сначала ресуспендировали в смеси ацетонитрил / изопропанол (70:30), встряхивали в течение 10 сек и инкубировали в течение 10 минут при 4°С при встряхивании с последующей обработкой ультразвуком в течение 10 минут на льду и центрифугирования в течение 7 минут при 4°С со скоростью 12700 об/мин. После завершения этих процедур готовили конечные разведения ацетонитрил / изопропанол (70:30) во пробирках для масс-спектрометрии. Разделение UPLC осуществляли с использованием колонки C8 Acquity Beh (2,1 мм × 100 мм, размер частиц - 1,7 мкм; Waters, США) и предварительной колонки Acquity BEH C8 1,7 мкм Vanguard (Waters) при 60°C. Для градиента UPLC подвижные фазы состояли из двух растворителей. Были испытаны две разные системы растворителей и градиентов. Конечное разведение образца составляло 5 для буферных систем, описанных ниже:To prepare samples for injection into the UPLC-MS system, the dried extracts were first resuspended in acetonitrile / isopropanol (70:30), shaken for 10 seconds and incubated for 10 minutes at 4 ° C with shaking, followed by sonication for 10 minutes on ice and centrifugation for 7 minutes at 4 ° C at a speed of 12700 rpm. After completion of these procedures, final dilutions of acetonitrile / isopropanol (70:30) were prepared in tubes for mass spectrometry. UPLC separation was carried out using a C8 Acquity Beh column (2.1 mm × 100 mm, particle size 1.7 μm; Waters, USA) and a preliminary column Acquity BEH C8 1.7 μm Vanguard (Waters) at 60 ° C. For the UPLC gradient, the mobile phases consisted of two solvents. Two different solvent and gradient systems were tested. The final dilution of the sample was 5 for the buffer systems described below:
Растворитель А: 1% 1 М NH4Ac и 0,1% муравьиной кислоты в воде; и растворитель B: ацетонитрил / изопропанол (7:3, 1% 1 М NH4Ac, 0,1% муравьиная кислота) с объемом введения 3 мкл. Применяли следующий профиль градиента: 55% растворителя В, 1 мин; линейный градиент от 55% растворителя В до 80% растворителя В, 3 мин; линейный градиент от 80% растворителя B до 85% растворителя B, 8 мин; линейный градиент от 85% растворителя B до 100% растворителя B, 3 мин. После промывки колонки в течение 4 минут 50 секунд со 100% растворителя B смесь снова доводили до 55% растворителя B, и колонку повторно уравновешивали в течение 4 минут 10 секунд (общее время работы 24,5 минут) со скоростью потока подвижной фазы равной 400 мкл/мин.Solvent A: 1% 1 M NH 4 Ac and 0.1% formic acid in water; and solvent B: acetonitrile / isopropanol (7: 3, 1% 1 M NH 4 Ac, 0.1% formic acid) with an injection volume of 3 μl. The following gradient profile was used: 55% solvent B, 1 min; linear gradient from 55% solvent B to 80% solvent B, 3 min; linear gradient from 80% solvent B to 85% solvent B, 8 min; linear gradient from 85% solvent B to 100% solvent B, 3 min. After washing the column for 4 minutes 50 seconds with 100% solvent B, the mixture was again brought to 55% solvent B, and the column was re-equilibrated for 4 minutes 10 seconds (total run time 24.5 minutes) with a flow rate of the mobile phase of 400 μl / min
Программное обеспечение Xcms использовали для обработки данных UPLC-MS. Оптимальные параметры были выбраны с помощью пакета IPO. Пиковые интенсивности были получены с использованием функции peakTable, реализованной в пакете xcms при помощи метода method='maxint'. В результате был получен набор пиков, содержащий информацию о времени удержания молекул, массе ионов, деленной на заряд (m/z), и интенсивности для каждого образца. Чтобы идентифицировать пики, соответствующие жирным кислотам (ЖК), были сгенерированы все возможные химические формулы, которые соответствуют ЖК с длиной цепи, варьирующей от 10 до 28 атомов углерода (n) и с числом двойных связей, варьирующим от 0 до 6 (k), определяемые как CnH2n-2kO2. Поскольку используемый метод не позволяет различать изомерные ЖК, в дальнейшем в настоящем описании термин «ЖК» будет использоваться для обозначения групп изомеров, имеющих определенные n и k, например, ЖК С18:1 обозначает все жирные кислоты с 18 углеродами в цепи и однократной двойной связью. Были рассчитаны массы всех этих ЖК в депротонированном состоянии, и проанализированы все пики, которые соответствовали рассчитанным массам в пределах 20 ppm (часть на миллион, для двух масс m1 и m2 ppm = abs (m1-m2)/(max(m1,m2)*106)).Xcms software was used to process UPLC-MS data. The optimal parameters were selected using the IPO package. Peak intensities were obtained using the peakTable function implemented in the xcms package using the method = 'maxint' method. As a result, a set of peaks was obtained containing information on the retention time of molecules, the mass of ions divided by the charge (m / z), and intensity for each sample. In order to identify peaks corresponding to fatty acids (FAs), all possible chemical formulas were generated that correspond to FAs with a chain length varying from 10 to 28 carbon atoms (n) and with the number of double bonds varying from 0 to 6 (k), defined as C n H 2n-2k O 2 . Since the method used does not allow to distinguish between isomeric FAs, in the following description the term “FA” will be used to denote groups of isomers having certain n and k, for example, FA C18: 1 denotes all fatty acids with 18 carbons in the chain and a single double bond . The masses of all these FAs in the deprotonated state were calculated, and all peaks that corresponded to the calculated masses within 20 ppm (part per million, for two masses m1 and m2 ppm = abs (m1-m2) / (max (m1, m2) were analyzed * 10 6 )).
Затем вручную были выбраны пики на основе сетевых паттернов. Вкратце, было обнаружено, что увеличение длины цепи ЖК увеличивает время удержания молекул, в то время как добавление двойной связи уменьшает время удержания молекул, и таким образом, пики ЖК образуют сетевой паттерн. Интенсивность всех обнаруженных ЖК была как минимум на три порядка выше в образцах растений, чем в контрольных (пустых) образцах. В результате было выявлено 29 ЖК: C14:0, C15:0, C15:1, C16:0, C16:1, C16:2, C17:0, C17:1, C17:2, C18:0, C18:1, C18:2, C18:3, C19:0, C19:1, C19:2, C20:0, C20:1, C20:2, C21:0, C22:0, C22:1, C23:0, C23:1, C24:0, C24:1, C25:0, C26:0, C28:0. Данные RAD-генотипирования и количественные данные о содержании жирных кислот в масле семян были использованы для полногеномного поиска ассоциаций. Далее, был выполнен статистический анализ с использованием смешанных линейных моделей (MLMs) (Bradbury et al., 2007), реализованный в программном обеспечении Tassel, для выявления ассоциаций, используя MDS (многомерное шкалирование) и матрицы родства в качестве ковариатов. Перед анализом были отфильтрованы многоаллельные варианты и варианты с высокой возможностью ошибки (high missing call rates). Также исключены образцы подсолнечника с большим количеством недостающих данных. Статистически значимые локусы были идентифицированы на основе скорректированных методом Bonferroni p-значений. Локусы, для которых было показано наличие значимых ассоциаций, были отобраны в качестве маркеров. Были выявлены эффекты для аллелей каждого отобранного локуса.Then manually selected peaks based on network patterns. In short, it was found that increasing the length of the LC chain increases the retention time of the molecules, while the addition of a double bond decreases the retention time of the molecules, and thus, the peaks of the LC form a network pattern. The intensity of all detected FAs was at least three orders of magnitude higher in plant samples than in control (empty) samples. As a result, 29 LCs were revealed: C14: 0, C15: 0, C15: 1, C16: 0, C16: 1, C16: 2, C17: 0, C17: 1, C17: 2, C18: 0, C18: 1 , C18: 2, C18: 3, C19: 0, C19: 1, C19: 2, C20: 0, C20: 1, C20: 2, C21: 0, C22: 0, C22: 1, C23: 0, C23 : 1, C24: 0, C24: 1, C25: 0, C26: 0, C28: 0. RAD genotyping data and quantitative data on the content of fatty acids in seed oil were used for a genome-wide search for associations. Further, statistical analysis was performed using mixed linear models (MLMs) (Bradbury et al., 2007), implemented in Tassel software, to identify associations using MDS (multidimensional scaling) and kinship matrices as covariates. Before the analysis, multiallelic variants and variants with a high possibility of error (high missing call rates) were filtered. Also excluded are sunflower samples with a lot of missing data. Statistically significant loci were identified based on Bonferroni-corrected p-values. Loci for which significant associations were shown were selected as markers. Effects were identified for the alleles of each selected locus.
Таким образом, изобретение раскрывает ДНК-маркеры для определения генотипа и отбора растений подсолнечника, несущих оптимальный набор аллелей локусов генома, ассоциированных с содержанием жирных кислот в масле семян. Список отобранных маркеров приведен в Таблице 1. Для использования в качестве маркеров аллельные состояния данных локусов генома могут быть идентифицированы с помощью ПЦР, ПЦР в реальном времени, гибридизации, или прямого секвенирования.Thus, the invention discloses DNA markers for determining the genotype and selection of sunflower plants carrying an optimal set of alleles of genome loci associated with the content of fatty acids in seed oil. A list of selected markers is shown in Table 1. For use as markers, allelic states of these genome loci can be identified by real-time PCR, real-time PCR, hybridization, or direct sequencing.
По Таблице 1, содержащей данные о SNP-панели, можно определить соответствие маркеров с типом жирной кислоты, а также для каждого маркера определить соответствующие значения эффектов аллеля. Например, маркер S02_52501989 соответствует жирной кислоте С16:2; поэтому, для вычисления параметра содержания жирной кислоты С16:2 можно использовать значения эффектов аллеля для маркера S02_52501989 (4,27187 или 4,2379, в зависимости от аллелей, присутствующих в ДНК конкретного сорта семян), либо значения эффектов аллеля для маркеров, выбранных из группы: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205529, S14_65302793, S14_65303987, S14_72096756, S17_18759543. При этом можно использовать как один маркер, так и любую комбинацию этих маркеров, в том числе одновременно все вышеуказанные маркеры; при использовании комбинации маркеров значения эффектов аллеля, соответствующие этим маркерам, необходимо суммировать для вычисления параметра содержания жирной кислоты. Для каждого из сортов подсолнечника необходимо определить последовательность ДНК в одинаковых маркерах.From Table 1, containing data on the SNP panel, it is possible to determine the correspondence of markers with the type of fatty acid, and also for each marker to determine the corresponding values of the effects of the allele. For example, marker S02_52501989 corresponds to C16: 2 fatty acid; therefore, to calculate the C16: 2 fatty acid content parameter, you can use the allele effect values for the marker S02_52501989 (4.27187 or 4.2379, depending on the alleles present in the DNA of a particular seed variety), or the allele effect values for markers selected from groups: S02_52501989, S06_5246521, S07_90144106, S11_68995900, S13_145305830, S14_109987127, S14_56559549, S14_64205529, S14_65302793, S14_65303987, S14_720967595,. In this case, you can use both a single marker and any combination of these markers, including simultaneously all of the above markers; when using a combination of markers, the values of the allele effects corresponding to these markers must be summed up to calculate the parameter of the fatty acid content. For each of the sunflower varieties, it is necessary to determine the DNA sequence in the same markers.
Коэффициенты "Эффект аллеля" были рассчитаны с помощью программы Tassel 5 (Bradbury PJ, Zhang Z, Kroon DE, Casstevens TM, Ramdoss Y, Buckler ES. (2007) TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics 23:2633-2635). Каждый из указанных аллелей для одной ЖК может быть использован для предсказания независимо от других аллелей. Использование сразу нескольких аллелей для одной ЖК одновременно повышает вероятность нахождения семян с существенно отличными показателями присутствия этой ЖК. Поэтому, хотя использование только одного аллеля для предсказания может быть достаточным для обнаружения разницы по присутствию определенной ЖК, в предпочтительных вариантах изобретения для предсказания используют одновременно несколько, или все из указанных аллелей для одной ЖК.Allele effect coefficients were calculated using the
Обозначения маркеров SNP панели в Таблице 1 соответствуют позициям полиморфизма ДНК в хромосоме ДНК подсолнечника, при этом авторы использовали версию генома подсолнечника HanXRQr1.0, впервые опубликованную в статье (Badouin, Helene et al., Nature, 2017 Jun 1;546(7656): 148-152), и хранящуюся на сайте https://www.heliagene.org/. В названии каждого маркера закодировано его уникальное положение в указанном выше геноме. Например, для маркера S02_52501989, 02 перед нижним подчеркиванием обозначает хромосому номер 2 из указанного выше генома. Число после нижнего подчеркивания (в данном случае 52501989) соответствует позиции маркера от начала этой хромосомы. Для однозначной идентификации позиций маркеров на хромосомах подсолнечника ниже приведены фрагменты последовательностей геномной ДНК подсолнечника, содержащие маркеры SNP из Таблицы 1 (приведены 150 п. н. до каждого маркера и 150 п. н. после каждого маркера, каждый SNP полиморфизм из Таблицы 1 указан в скобках):The designations of the SNP panel markers in Table 1 correspond to the positions of DNA polymorphism in the chromosome of sunflower DNA, while the authors used the version of the sunflower genome HanXRQr1.0, first published in the article (Badouin, Helene et al., Nature, 2017 Jun 1; 546 (7656): 148-152), and stored on the website https://www.heliagene.org/. In the name of each marker, its unique position in the above genome is encoded. For example, for marker S02_52501989, 02 before underscore denotes chromosome number 2 from the above genome. The number after underscore (in this case 52501989) corresponds to the position of the marker from the beginning of this chromosome. For unambiguous identification of marker positions on sunflower chromosomes, fragments of sunflower genomic DNA sequences containing the SNP markers from Table 1 are shown below (150 bp before each marker and 150 bp after each marker, each SNP polymorphism from Table 1 is listed in brackets):
SEQ ID NO: 1SEQ ID NO: 1
SEQ ID NO: 117SEQ ID NO: 117
SEQ ID NO: 118SEQ ID NO: 118
SEQ ID NO: 12SEQ ID NO: 12
SEQ ID NO: 6SEQ ID NO: 6
SEQ ID NO: 36SEQ ID NO: 36
SEQ ID NO: 121SEQ ID NO: 121
SEQ ID NO: 31SEQ ID NO: 31
SEQ ID NO: 72SEQ ID NO: 72
SEQ ID NO: 4SEQ ID NO: 4
SEQ ID NO: 58SEQ ID NO: 58
SEQ ID NO: 29SEQ ID NO: 29
SEQ ID NO: 32SEQ ID NO: 32
SEQ ID NO: 10SEQ ID NO: 10
SEQ ID NO: 45SEQ ID NO: 45
SEQ ID NO: 43SEQ ID NO: 43
SEQ ID NO: 103SEQ ID NO: 103
SEQ ID NO: 46SEQ ID NO: 46
SEQ ID NO: 8SEQ ID NO: 8
SEQ ID NO: 104SEQ ID NO: 104
SEQ ID NO: 27SEQ ID NO: 27
SEQ ID NO: 13SEQ ID NO: 13
SEQ ID NO: 14SEQ ID NO: 14
SEQ ID NO: 9SEQ ID NO: 9
SEQ ID NO: 18SEQ ID NO: 18
SEQ ID NO: 16SEQ ID NO: 16
SEQ ID NO: 47SEQ ID NO: 47
SEQ ID NO: 28SEQ ID NO: 28
SEQ ID NO: 3SEQ ID NO: 3
SEQ ID NO: 119SEQ ID NO: 119
SEQ ID NO: 101SEQ ID NO: 101
SEQ ID NO: 88SEQ ID NO: 88
SEQ ID NO: 38SEQ ID NO: 38
SEQ ID NO: 42SEQ ID NO: 42
SEQ ID NO: 22SEQ ID NO: 22
SEQ ID NO: 116SEQ ID NO: 116
SEQ ID NO: 111SEQ ID NO: 111
SEQ ID NO: 85SEQ ID NO: 85
SEQ ID NO: 109SEQ ID NO: 109
SEQ ID NO: 25SEQ ID NO: 25
SEQ ID NO: 86SEQ ID NO: 86
SEQ ID NO: 87SEQ ID NO: 87
SEQ ID NO: 94SEQ ID NO: 94
SEQ ID NO: 35SEQ ID NO: 35
SEQ ID NO: 84SEQ ID NO: 84
SEQ ID NO: 21SEQ ID NO: 21
SEQ ID NO: 81SEQ ID NO: 81
SEQ ID NO: 74SEQ ID NO: 74
SEQ ID NO: 75SEQ ID NO: 75
SEQ ID NO: 80SEQ ID NO: 80
SEQ ID NO: 95SEQ ID NO: 95
SEQ ID NO: 98SEQ ID NO: 98
SEQ ID NO: 93SEQ ID NO: 93
SEQ ID NO: 26SEQ ID NO: 26
SEQ ID NO: 78SEQ ID NO: 78
SEQ ID NO: 19SEQ ID NO: 19
SEQ ID NO: 120SEQ ID NO: 120
SEQ ID NO: 89SEQ ID NO: 89
SEQ ID NO: 90SEQ ID NO: 90
SEQ ID NO: 91SEQ ID NO: 91
SEQ ID NO: 40SEQ ID NO: 40
SEQ ID NO: 79SEQ ID NO: 79
SEQ ID NO: 48SEQ ID NO: 48
SEQ ID NO: 99SEQ ID NO: 99
SEQ ID NO: 97SEQ ID NO: 97
SEQ ID NO: 68SEQ ID NO: 68
SEQ ID NO: 77SEQ ID NO: 77
SEQ ID NO: 92SEQ ID NO: 92
SEQ ID NO: 83SEQ ID NO: 83
SEQ ID NO: 102SEQ ID NO: 102
SEQ ID NO: 7SEQ ID NO: 7
SEQ ID NO: 76SEQ ID NO: 76
SEQ ID NO: 37SEQ ID NO: 37
SEQ ID NO: 100SEQ ID NO: 100
SEQ ID NO: 39SEQ ID NO: 39
SEQ ID NO: 49SEQ ID NO: 49
SEQ ID NO: 2SEQ ID NO: 2
SEQ ID NO: 82SEQ ID NO: 82
SEQ ID NO: 44SEQ ID NO: 44
SEQ ID NO: 30SEQ ID NO: 30
SEQ ID NO: 96SEQ ID NO: 96
SEQ ID NO: 112SEQ ID NO: 112
SEQ ID NO: 69SEQ ID NO: 69
SEQ ID NO: 114SEQ ID NO: 114
SEQ ID NO: 20SEQ ID NO: 20
SEQ ID NO: 65SEQ ID NO: 65
SEQ ID NO: 66SEQ ID NO: 66
SEQ ID NO: 5SEQ ID NO: 5
SEQ ID NO: 11SEQ ID NO: 11
SEQ ID NO: 55SEQ ID NO: 55
SEQ ID NO: 57SEQ ID NO: 57
SEQ ID NO: 24SEQ ID NO: 24
SEQ ID NO: 70SEQ ID NO: 70
SEQ ID NO: 64SEQ ID NO: 64
SEQ ID NO: 56SEQ ID NO: 56
SEQ ID NO: 54SEQ ID NO: 54
SEQ ID NO: 53SEQ ID NO: 53
SEQ ID NO: 71SEQ ID NO: 71
SEQ ID NO: 41SEQ ID NO: 41
SEQ ID NO: 73SEQ ID NO: 73
SEQ ID NO: 33SEQ ID NO: 33
SEQ ID NO: 115SEQ ID NO: 115
SEQ ID NO: 23SEQ ID NO: 23
SEQ ID NO: 63SEQ ID NO: 63
SEQ ID NO: 50SEQ ID NO: 50
SEQ ID NO: 105SEQ ID NO: 105
SEQ ID NO: 62SEQ ID NO: 62
SEQ ID NO: 52SEQ ID NO: 52
SEQ ID NO: 67SEQ ID NO: 67
SEQ ID NO: 61SEQ ID NO: 61
SEQ ID NO: 59SEQ ID NO: 59
SEQ ID NO: 60SEQ ID NO: 60
SEQ ID NO: 108SEQ ID NO: 108
SEQ ID NO: 106SEQ ID NO: 106
SEQ ID NO: 107SEQ ID NO: 107
SEQ ID NO: 110SEQ ID NO: 110
SEQ ID NO: 113SEQ ID NO: 113
SEQ ID NO: 34SEQ ID NO: 34
SEQ ID NO: 51SEQ ID NO: 51
Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.The following examples of the method are given in order to disclose the characteristics of the present invention and should not be construed as in any way limiting the scope of the invention.
Пример 1. Применение SNP-панели для генотипирования образцов подсолнечника.Example 1. The use of SNP-panels for genotyping of sunflower samples.
Для демонстрации возможности использования SNP-панели для генотипирования растительного материала, были взяты 8 образцов подсолнечника с ранее неизвестным генотипом. С использованием SNP-панели для генотипирования и геномной селекции подсолнечника были определены генотипы 8 образцов подсолнечника на платформе MassArray. Этапы определения генотипов описаны ниже.To demonstrate the possibility of using the SNP panel for genotyping plant material, 8 samples of sunflower with a previously unknown genotype were taken. Using the SNP panel for genotyping and genomic selection of sunflower, the genotypes of 8 sunflower samples were determined on the MassArray platform. The steps for determining genotypes are described below.
1. На первом этапе была проведена подготовка образцов к дальнейшему анализу, которая включала несколько последовательных этапов (Фиг. 1):1. At the first stage, samples were prepared for further analysis, which included several successive stages (Fig. 1):
• Мультиплексная ПЦР заключается в многократном увеличении количества фрагментов, содержащих однонуклеотидные полиморфизмы. Для этого была проведена классическая ПЦР-реакция, включающая денатурацию, отжиг и элонгацию;• Multiplex PCR consists in a multiple increase in the number of fragments containing single nucleotide polymorphisms. For this, a classical PCR reaction was carried out, including denaturation, annealing and elongation;
• SAP-реакция проводится с целью удаления не включенных в ампликоны одиночных нуклеотидов (dNTPs) с использованием фермента щелочной фосфатазы (SAP). Для этого сразу после мультиплексной ПЦР к образцам была добавлена фосфатаза, после чего смесь инкубировали 40 мин при 37°С, и инактивировали действие фермента прогреванием при 85°С в течении 15 мин;• The SAP reaction is performed to remove single nucleotides (dNTPs) not included in the amplicons using alkaline phosphatase enzyme (SAP). For this, phosphatase was added to the samples immediately after multiplex PCR, after which the mixture was incubated for 40 min at 37 ° C, and the enzyme was inactivated by heating at 85 ° C for 15 min;
• iPlex-реакция заключается во включении модифицированного нуклеотида (ddNTP) в позицию, комплементарную каждому SNP, находящегося в полиморфной позиции, т.о. была получена смесь фрагментов по полиморфным маркерам. Для проведения iPlex-реакции к образцам были добавлены специальный буфер, ДНК-полимераза, нуклеотиды с модифицированной молекулярной массой и праймеры и была проведена амплификация. Затем образцы ДНК были очищены от остатков реакции (соли, ионы, ферменты), которые при анализе на масс-спектрометре вносят шум;• The iPlex reaction involves the incorporation of a modified nucleotide (ddNTP) at a position complementary to each SNP located in a polymorphic position, that is, a mixture of fragments was obtained by polymorphic markers. To carry out the iPlex reaction, a special buffer, DNA polymerase, modified molecular weight nucleotides and primers were added to the samples and amplification was performed. Then, the DNA samples were purified from reaction residues (salts, ions, enzymes), which, when analyzed on a mass spectrometer, introduce noise;
• Перенос образцов на чип (SpectroCHIP Array) для генотипирования методом масс-спектрометрии MALDI-TOF. Чип представлен в виде подложки с матрицей для ионизации.• Transfer of samples to a chip (SpectroCHIP Array) for genotyping using MALDI-TOF mass spectrometry. The chip is presented as a substrate with an ionization matrix.
2. Далее была произведена ионизация образцов. Образцы были помещены в рабочую камеру, будучи равномерно смешаны с большим количеством тонкого слоя кислоты, выполняющего роль матрицы. Матрица поглощает ультрафиолетовый свет (длина волны азотного лазера 337 нм), преобразуя его в тепловую энергию. При этом небольшая часть матрицы (до 100 нм от верхней наружной поверхности анализируемого вещества) нагревается за несколько нано секунд и испаряется вместе с образцом.2. Next was the ionization of the samples. Samples were placed in the working chamber, being uniformly mixed with a large amount of a thin layer of acid, acting as a matrix. The matrix absorbs ultraviolet light (wavelength of a nitrogen laser 337 nm), converting it into thermal energy. In this case, a small part of the matrix (up to 100 nm from the upper outer surface of the analyte) is heated in a few nano seconds and evaporates with the sample.
Заряженные ионы различных размеров генерируются на слайде образца. Разность потенциалов между скольжением образца и землей обеспечивает движение ионов. Скорость притягиваемых ионов определяется законом сохранения энергии. Поскольку разность потенциалов постоянна по отношению ко всем ионам, ионы с меньшим значением отношения массы к заряду (более легкие ионы) и более высоконагруженные ионы движутся быстрее через дрейфовое пространство, пока не достигнут детектора. Следовательно, время полета иона различается в зависимости от отношения массы к заряду (m/z) иона.Charged ions of various sizes are generated on a sample slide. The potential difference between the sliding of the sample and the ground provides the movement of ions. The speed of the attracted ions is determined by the law of conservation of energy. Since the potential difference is constant with respect to all ions, ions with a lower mass to charge ratio (lighter ions) and higher loaded ions move faster through the drift space until they reach the detector. Therefore, the flight time of the ion varies depending on the ratio of mass to charge (m / z) of the ion.
Процесс ионизации и получения масс-спектров 96-луночного спектро-чипа занимает примерно 20 минут. Анализ масс-спектров в реальном времени поводили с помощью программного обеспечения MassARRAY TYPER 4.0 ("Sequenom").The process of ionizing and acquiring mass spectra of a 96-well spectrum chip takes approximately 20 minutes. Real-time mass spectrum analysis was performed using MassARRAY TYPER 4.0 software ("Sequenom").
Результаты определения генотипа 8 образцов подсолнечника с помощью SNP-панели для генотипирования и геномной селекции подсолнечника приведены в Таблице 2.The results of determining the genotype of 8 sunflower samples using the SNP panel for genotyping and genomic selection of sunflower are shown in Table 2.
С - обозначают гомозиготу СС,C - denote homozygous SS,
А - обозначают гомозиготу АА,A - denote homozygote AA,
Т - обозначают гомозиготу ТТ,T - denote the homozygote of TT,
G - обозначают гомозиготу GG,G - denote homozygote GG,
N - обозначают гетерозиготные состояния маркера.N - denote the heterozygous state of the marker.
Полученные результаты показывают возможность успешного применения SNP-панели для определения генотипа селекционного материала подсолнечника.The results show the possibility of successful use of the SNP-panel to determine the genotype of the selection material of sunflower.
Пример 2. Схема отбора растений подсолнечника для селекции по признаку повышенного содержания омега-3 линоленовой кислоты в масле семян подсолнечника на основе данных генотипирования с использованием SNP-панели.Example 2. The selection scheme of sunflower plants for selection based on the increased content of omega-3 linolenic acid in sunflower seed oil based on genotyping data using the SNP panel.
Определение селекционной ценности сортов включает в себя несколько этапов.Determination of the breeding value of varieties includes several stages.
(1) Определение генотипа семян подсолнечника (интересующих релевантных аллелей) и сравнение их с SNP-панелью, раскрытой в настоящем изобретении, по локусам, ассоциированным с содержанием омега-3 линоленовой кислоты (генотип образцов 5 и 2, определенный с использованием SNP-панели, приведен в таблице 3 в столбцах «Генотип образца 5» и «Генотип образца 2»). Суммарную ДНК выделяли с использованием набора Nucleospin Plant Extraction Kit («MacheryNagel», Германия), следуя стандартному протоколу производителя.(1) Determining the genotype of sunflower seeds (relevant alleles of interest) and comparing them with the SNP panel disclosed in the present invention at the loci associated with the omega-3 content of linolenic acid (
(2) Используя значения эффекта аллелей для каждого из маркеров из соответствующего столбца таблицы 3 вычисляли эффект маркера по формуле ЭМ=ЭА1*2 (формула 1) или ЭМ=ЭА2*2 (формула 2) для гомозиготного состояния маркера, и ЭМ=ЭА1+ЭА2 (формула 3), для гетерозиготного состояния маркера, где ЭА1 - эффект аллеля 1, ЭА2 - эффект аллеля 2. Поскольку образцы 2 и 5 являются гомозиготными по всем маркерам, использовали только формулы 1 и 2.(2) Using the allele effect values for each of the markers from the corresponding column of Table 3, the marker effect was calculated by the formula EM = EA1 * 2 (formula 1) or EM = EA2 * 2 (formula 2) for the homozygous state of the marker, and EM = EA1 + EA2 (formula 3), for the heterozygous state of the marker, where EA1 is the effect of allele 1, EA2 is the effect of allele 2. Since
(3) Вычисляли сумму эффектов по всем маркерам, ассоциированным с содержанием омега-3 линоленовой кислоты для образцов 5 и 2. Сумма эффектов маркеров для образца 5 равняется 520,926, сумма эффектов для образца 2 равняется 510,3483.(3) The sum of the effects for all markers associated with the omega-3 content of linolenic acid for
Таким образом, для селекции по признаку повышенного содержания омега-3 линоленовой кислоты в масле семян подсолнечника следует отобрать образец 5, как имеющий большее значение суммы эффектов маркеров.Thus, for selection on the basis of an increased content of omega-3 linolenic acid in sunflower seed oil,
Для проверки правильности предсказания было проведено прямое измерение содержания омега-3 линоленовой кислоты в образцах 2 и 5 в масле семян подсолнечника с использованием UPLC-MS. Для перевода результатов измерения на масс-спектрометре в значения содержания жирной кислоты рассчитывались нормированные на верхнюю квартиль логарифмы интенсивностей. Полученные значения содержания омега-3 линоленовой кислоты для образца 5 равнялась 13.143773502, для образца 2-11.6786155956.To verify the correctness of the prediction, a direct measurement of the content of omega-3 linolenic acid in
Таким образом, разработанная SNP-панель может быть использована для селекции подсолнечника по жирнокислотному составу семян.Thus, the developed SNP-panel can be used for selection of sunflower according to the fatty acid composition of seeds.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.Although the invention has been described with reference to the disclosed embodiments, it should be apparent to those skilled in the art that the specific details described are for illustrative purposes only and should not be construed as limiting the scope of the invention in any way. It should be understood that various modifications are possible without departing from the gist of the present invention.
Список литературы:List of references:
1. Bolger, A.M.; Lohse, М.; Usadel, В. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics 2014, 30, 2114-2120.1. Bolger, A.M .; Lohse, M .; Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics 2014, 30, 2114-2120.
2. Bradbury PJ, Zhang Z, Kroon DE, Casstevens TM, Ramdoss Y, Buckler ES. (2007) TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics 23:2633-26352. Bradbury PJ, Zhang Z, Kroon DE, Casstevens TM, Ramdoss Y, Buckler ES. (2007) TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics 23: 2633-2635
3. Giavalisco, P. et a/. Elemental formula annotation of polar and lipophilic metabolites using 13C, 15N and 34S isotope labelling, in combination with high-resolution mass spectrometry. Plant J. 68, (2011).3. Giavalisco, P. et a /. Elemental formula annotation of polar and lipophilic metabolites using 13C, 15N and 34S isotope labelling, in combination with high-resolution mass spectrometry. Plant J. 68, (2011).
4. Bromke, M.A. et al. Liquid chromatography high-resolution mass spectrometry for fatty acid profiling. Plant J. 81, 529-536 (2015).4. Bromke, M.A. et al. Liquid chromatography high-resolution mass spectrometry for fatty acid profiling. Plant J. 81, 529-536 (2015).
5. Zhang, Z.; Ersoz, E.; Lai, C.-Q.; Todhunter, R.J.; Tiwari, H.K.; Gore, M.A.; Bradbury, P.J.; Yu, J.; Arnett, D.K.; Ordovas, J.M.; et al. Mixed linear model approach adapted for genome-wide association studies. Nat. Genet. 2010, 42, 355-360.5. Zhang, Z .; Ersoz, E .; Lai, C.-Q .; Todhunter, R.J .; Tiwari, H.K .; Gore, M.A .; Bradbury, P.J .; Yu, J .; Arnett, D.K .; Ordovas, J.M .; et al. Mixed linear model approach adapted for genome-wide association studies. Nat. Genet. 2010, 42, 355-360.
6. Grundy, S. M. Comparison of monounsaturated fatty acids and carbohydrates for lowering plasma cholesterol. N. Engl. J. Med. 314, 745-748 (1986).6. Grundy, S. M. Comparison of monounsaturated fatty acids and carbohydrates for lowering plasma cholesterol. N. Engl. J. Med. 314, 745-748 (1986).
7. Premnath, A., Narayana, M., Ramakrishnan, C, Kuppusamy, S. & Chockalingam, V. Mapping quantitative trait loci controlling oil content, oleic acid and linoleic acid content in sunflower (Helianthus annuus L.). Mol. Breed. 36, (2016).7. Premnath, A., Narayana, M., Ramakrishnan, C, Kuppusamy, S. & Chockalingam, V. Mapping quantitative trait loci controlling oil content, oleic acid and linoleic acid content in sunflower (Helianthus annuus L.). Mol. Breed 36, (2016).
8. Fuller, G., Diamond, M. J. & Applewhite, Т. H. High-oleic sanflower oil. Stability and chemical modification. J. Am. Oil Chem. Soc. 44, 264-2668. Fuller, G., Diamond, M. J. & Applewhite, T. H. High-oleic sanflower oil. Stability and chemical modification. J. Am. Oil Chem. Soc. 44, 264-266
9. G and Murphy E J, Alpha-linolenic acid and its conversion to longer chain n-3 fatty acids: Benefits for human health and a role in maintaining tissue n-3 fatty acid levels. Prog Lipid Res 48: 355-374 (2009).nine. G and Murphy EJ, Alpha-linolenic acid and its conversion to longer chain n-3 fatty acids: Benefits for human health and a role in maintaining tissue n-3 fatty acid levels. Prog Lipid Res 48: 355-374 (2009).
10. Rauf, S., Jamil, N., Tariq, S. A., Khan, M., Kausar, M., & Kaya, Y. (2017). Progress in modification of sunflower oil to expand its industrial value. Journal of the Science of Food and Agriculture, 97(7), 1997-2006. doi:10.1002/jsfa.8214.10. Rauf, S., Jamil, N., Tariq, S. A., Khan, M., Kausar, M., & Kaya, Y. (2017). Progress in modification of sunflower oil to expand its industrial value. Journal of the Science of Food and Agriculture, 97 (7), 1997-2006. doi: 10.1002 / jsfa.8214.
Claims (22)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018146443A RU2717642C1 (en) | 2018-12-26 | 2018-12-26 | Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2018146443A RU2717642C1 (en) | 2018-12-26 | 2018-12-26 | Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2717642C1 true RU2717642C1 (en) | 2020-03-24 |
Family
ID=69943251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018146443A RU2717642C1 (en) | 2018-12-26 | 2018-12-26 | Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2717642C1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060147962A1 (en) * | 2003-06-16 | 2006-07-06 | Mars, Inc. | Genotype test |
RU2518241C2 (en) * | 2007-08-13 | 2014-06-10 | Коммонвелт Сайентифик Энд Индастриал Рисерч Организейшн | Barley with low hordein content |
WO2015109230A1 (en) * | 2014-01-17 | 2015-07-23 | Harper Ruthie | Methods of weight analysis and uses thereof |
RU2630641C2 (en) * | 2011-07-01 | 2017-09-11 | Эдванта Интернэшнл Бв | Nucleotide sequences, subject to mutation by insert coding truncated protein of oleate-desaturase, proteins, methods and applications |
-
2018
- 2018-12-26 RU RU2018146443A patent/RU2717642C1/en active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060147962A1 (en) * | 2003-06-16 | 2006-07-06 | Mars, Inc. | Genotype test |
RU2518241C2 (en) * | 2007-08-13 | 2014-06-10 | Коммонвелт Сайентифик Энд Индастриал Рисерч Организейшн | Barley with low hordein content |
RU2630641C2 (en) * | 2011-07-01 | 2017-09-11 | Эдванта Интернэшнл Бв | Nucleotide sequences, subject to mutation by insert coding truncated protein of oleate-desaturase, proteins, methods and applications |
WO2015109230A1 (en) * | 2014-01-17 | 2015-07-23 | Harper Ruthie | Methods of weight analysis and uses thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Malausa et al. | High‐throughput microsatellite isolation through 454 GS‐FLX Titanium pyrosequencing of enriched DNA libraries | |
Liu et al. | Mapping QTLs for oil traits and eQTLs for oleosin genes in jatropha | |
Bettencourt et al. | The vitamin D receptor gene FokI polymorphism and Multiple Sclerosis in a Northern Portuguese population | |
JP2008526247A5 (en) | ||
JP2021100932A (en) | Method of treatment using genetic predictors of response to treatment with crhr1 antagonists | |
Jo et al. | De novo transcriptome assembly and the identification of gene-associated single-nucleotide polymorphism markers in Asian and American ginseng roots | |
CN104894230B (en) | The group-specific primers PCR-SBT methods and reagent of a kind of HLA-DQB1 Genotypings | |
Yaguchi et al. | Identification of candidate genes in the type 2 diabetes modifier locus using expression QTL | |
Saini et al. | Promoter polymorphism in FAE1. 1 and FAE1. 2 genes associated with erucic acid content in Brassica juncea | |
US20170283854A1 (en) | Multiplexed pcr assay for high throughput genotyping | |
Ulrich et al. | Towards the development of molecular markers for apple volatiles | |
Belokon et al. | Development of microsatellite genetic markers in Siberian stone pine (Pinus sibirica Du Tour) based on the de novo whole genome sequencing | |
RU2717642C1 (en) | Snp-panel for genotyping and genomic selection of sunflower by content of fatty acids in seed oil | |
Li et al. | A multiplex microsatellite PCR method for evaluating genetic diversity in grass carp (Ctenopharyngodon idellus) | |
JP2022002539A (en) | Major histocompatibility complex single nucleotide polymorphisms | |
Maudet et al. | Development of microsatellite multiplexes for wild goats using primers designed from domestic Bovidae | |
US20060263815A1 (en) | Multiple SNP for diagnosing cardiovascular disease, microarray and kit comprising the same, and method of diagnosing cardiovascular disease using the same | |
JP2011120558A (en) | Method for designing probe in dna microarray, and dna microarray having probe designed by the method | |
Luo et al. | A diagnostic gene chip for hereditary spastic paraplegias | |
Cullis | Molecular markers in date palm | |
NL2025233B1 (en) | Snp molecular marker for 'ester-type flavour' trait identification of apple fruits as well as primers and applications thereof | |
RU2740798C1 (en) | Markers for marker selection of soya according to utility signs | |
Peng et al. | Application of denaturing high-performance liquid chromatography for rice variety identification and seed purity assessment | |
JP2005176619A (en) | Selection marker for clubroot-resistant rapes | |
CN111197078A (en) | Method for distinguishing nifedipine personalized medicine by mass spectrometry through product detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD4A | Correction of name of patent owner | ||
QB4A | Licence on use of patent |
Free format text: LICENCE FORMERLY AGREED ON 20210607 Effective date: 20210607 |