JP2023048810A - 慢性ストレスレベルの検出方法 - Google Patents
慢性ストレスレベルの検出方法 Download PDFInfo
- Publication number
- JP2023048810A JP2023048810A JP2021158337A JP2021158337A JP2023048810A JP 2023048810 A JP2023048810 A JP 2023048810A JP 2021158337 A JP2021158337 A JP 2021158337A JP 2021158337 A JP2021158337 A JP 2021158337A JP 2023048810 A JP2023048810 A JP 2023048810A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- genes
- expression
- expression level
- stress
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000037326 chronic stress Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 84
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 296
- 230000014509 gene expression Effects 0.000 claims abstract description 198
- 102100038778 Amphiregulin Human genes 0.000 claims abstract description 29
- 102100031518 Collagen alpha-2(VI) chain Human genes 0.000 claims abstract description 29
- 102100028606 E3 ubiquitin-protein ligase ZNRF2 Human genes 0.000 claims abstract description 29
- 101000809450 Homo sapiens Amphiregulin Proteins 0.000 claims abstract description 29
- 101000941585 Homo sapiens Collagen alpha-2(VI) chain Proteins 0.000 claims abstract description 29
- 101000956444 Homo sapiens Cytokine receptor-like factor 3 Proteins 0.000 claims abstract description 29
- 101000915569 Homo sapiens E3 ubiquitin-protein ligase ZNRF2 Proteins 0.000 claims abstract description 29
- 101000613798 Homo sapiens OTU domain-containing protein 7B Proteins 0.000 claims abstract description 29
- 101000988394 Homo sapiens PDZ and LIM domain protein 5 Proteins 0.000 claims abstract description 29
- 101000798707 Homo sapiens Transmembrane protease serine 13 Proteins 0.000 claims abstract description 29
- 101000626703 Homo sapiens YEATS domain-containing protein 2 Proteins 0.000 claims abstract description 29
- 102100040562 OTU domain-containing protein 7B Human genes 0.000 claims abstract description 29
- 102100029181 PDZ and LIM domain protein 5 Human genes 0.000 claims abstract description 29
- 102100032467 Transmembrane protease serine 13 Human genes 0.000 claims abstract description 29
- 102100024781 YEATS domain-containing protein 2 Human genes 0.000 claims abstract description 29
- 108040008770 methylated-DNA-[protein]-cysteine S-methyltransferase activity proteins Proteins 0.000 claims abstract description 29
- 102100038492 Cytokine receptor-like factor 3 Human genes 0.000 claims abstract description 28
- 102100025825 Methylated-DNA-protein-cysteine methyltransferase Human genes 0.000 claims abstract description 27
- 210000004761 scalp Anatomy 0.000 claims abstract description 22
- 150000002632 lipids Chemical class 0.000 claims abstract description 15
- 230000035882 stress Effects 0.000 claims description 77
- -1 GOLGA6L5 Proteins 0.000 claims description 27
- 239000003153 chemical reaction reagent Substances 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 14
- 239000003550 marker Substances 0.000 claims description 14
- 101150072531 10 gene Proteins 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 7
- 230000001225 therapeutic effect Effects 0.000 claims description 7
- 108020004999 messenger RNA Proteins 0.000 claims description 6
- 230000003449 preventive effect Effects 0.000 claims description 6
- 101150015144 88 gene Proteins 0.000 claims description 4
- 101150096316 5 gene Proteins 0.000 claims description 3
- 101150044182 8 gene Proteins 0.000 claims description 3
- 101150000874 11 gene Proteins 0.000 claims description 2
- 101150101112 7 gene Proteins 0.000 claims description 2
- 239000000090 biomarker Substances 0.000 abstract description 5
- 102100034120 Golgin subfamily A member 6A Human genes 0.000 abstract 1
- 101001070498 Homo sapiens Golgin subfamily A member 6A Proteins 0.000 abstract 1
- 239000000047 product Substances 0.000 description 73
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 44
- 108020004414 DNA Proteins 0.000 description 41
- 238000007637 random forest analysis Methods 0.000 description 26
- 238000004422 calculation algorithm Methods 0.000 description 25
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 150000007523 nucleic acids Chemical class 0.000 description 25
- 210000003491 skin Anatomy 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 14
- 238000010276 construction Methods 0.000 description 14
- 102000004169 proteins and genes Human genes 0.000 description 13
- 238000003066 decision tree Methods 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 239000002299 complementary DNA Substances 0.000 description 10
- 208000007684 Occupational Stress Diseases 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 238000010839 reverse transcription Methods 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 102100034343 Integrase Human genes 0.000 description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 6
- 238000007403 mPCR Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 239000002250 absorbent Substances 0.000 description 4
- 230000002745 absorbent Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 210000004209 hair Anatomy 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 101150076401 16 gene Proteins 0.000 description 3
- 101150091349 95 gene Proteins 0.000 description 3
- 238000000018 DNA microarray Methods 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 238000010805 cDNA synthesis kit Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 210000002374 sebum Anatomy 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000012232 AGPC extraction Methods 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 238000003657 Likelihood-ratio test Methods 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 230000037328 acute stress Effects 0.000 description 2
- 239000000853 adhesive Substances 0.000 description 2
- 230000001070 adhesive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- JYGXADMDTFJGBT-VWUMJDOOSA-N hydrocortisone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 JYGXADMDTFJGBT-VWUMJDOOSA-N 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 210000001732 sebaceous gland Anatomy 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 210000004927 skin cell Anatomy 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 239000003021 water soluble solvent Substances 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 102000010792 Chromogranin A Human genes 0.000 description 1
- 108010038447 Chromogranin A Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 210000004207 dermis Anatomy 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 210000003499 exocrine gland Anatomy 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 210000003780 hair follicle Anatomy 0.000 description 1
- 239000003676 hair preparation Substances 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229960000890 hydrocortisone Drugs 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 239000005445 natural material Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 210000000434 stratum corneum Anatomy 0.000 description 1
- 210000000106 sweat gland Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
【課題】頭皮から採取されたSSL由来のバイオマーカーを用いた慢性ストレスレベルの検出方法を提供する。【解決手段】被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。【選択図】なし
Description
本発明は、バイオマーカーを用いた慢性ストレスレベルの検出方法に関する。
ストレスは、物理的、環境的、心理的な様々な刺激や負荷を受けたときに生じる心身の機能変化とされている。現代社会においては働く世代に中心に、多くの方々がストレスを抱えながら生活している。ストレスは心理面、身体面に悪影響を及ぼし、生活の質(Quality of life:QOL)の低下を招くだけでなく、様々な疾患の発症や増悪に関与することが知られている。
ストレスは、急性ストレスと、持続的なストレスの負荷によって生じる慢性ストレスに大きく区分される。中でも慢性ストレスは、精神疾患などさまざまな疾患の要因となることが知られており、そのメカニズムの理解や改善技術の開発が望まれている。改善技術を開発するにあたってはストレスの評価指標が必要であるが、従来、慢性ストレスは、主に問診やアンケート(例えば、職業性ストレス簡易調査票の領域B(29項目))に基づくスコアリングによって評価されている。このような評価法は、客観性や定量性に劣ることがあり、また試験間での評価の比較を困難にする。
また、近年、急性ストレスに対してはコルチゾールに加えクロモグラニンA(非特許文献1)が、慢性ストレスに対してはα-クロト(非特許文献2)及び特許文献1~4に開示されるようなストレスマーカーが提案されている。しかし、これらのストレスマーカーの多くが侵襲的な方法でしか採取できないことに加え、慢性ストレスとは必ずしも関連するとは限らない。したがって、バイオマーカーによる慢性ストレスの客観的又は定量的な評価手法は未だ確立されていない。
また、近年、急性ストレスに対してはコルチゾールに加えクロモグラニンA(非特許文献1)が、慢性ストレスに対してはα-クロト(非特許文献2)及び特許文献1~4に開示されるようなストレスマーカーが提案されている。しかし、これらのストレスマーカーの多くが侵襲的な方法でしか採取できないことに加え、慢性ストレスとは必ずしも関連するとは限らない。したがって、バイオマーカーによる慢性ストレスの客観的又は定量的な評価手法は未だ確立されていない。
一方、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在、さらには将来の生理状態を調べる技術が開発されている。生体由来の核酸は、血液等の組織、体液、分泌物などから抽出することができる。特許文献5には、皮膚表上脂質(SSL)から被験体の皮膚細胞に由来するRNA等の核酸を分離し、生体の解析用の試料として用いることが記載されている。
Stress. 2006,9(3):127-131.
J Investig Med, 2019,67(7):1082-1086
本発明は、頭皮から採取されたSSL由来のバイオマーカーを用いた慢性ストレスレベルの検出方法を提供することに関する。
本発明者らは、健常な男女を慢性ストレスレベルが高い群と低い群に分け、それぞれの頭皮からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが両群間で有意に異なり、これを指標として慢性ストレスレベルを検出できることを見出した。
すなわち、本発明は、以下の1)~4)に係るものである。
1)被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。
2)慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
3)SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、1)の方法に用いられる慢性ストレスレベル検出用キット又は2)の方法に用いられる介入効果の評価用キット。
4)MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる慢性ストレスマーカー。
1)被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。
2)慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
3)SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、1)の方法に用いられる慢性ストレスレベル検出用キット又は2)の方法に用いられる介入効果の評価用キット。
4)MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる慢性ストレスマーカー。
本発明において用いられるSSLは、非侵襲的に採取可能である。したがって、本発明の方法によれば、検体採取の手間や、採取による被験者への負担をかけることなく、慢性ストレスレベルの検出が可能となる。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
本発明において、遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「高ストレス」とは、慢性的にストレスレベルが高い状態(慢性的ストレス状態)を表す。すなわち慢性ストレスのレベルが高いことを表す。慢性ストレスのレベルは、問診やアンケートに基づいてスコアリングすることができる。例えば、労働安全衛生法に基づくストレスチェック制度実施マニュアル改訂版(厚生労働省、2016)に従う職業性ストレス簡易調査票の領域B(29項目)では、主観的スコアリングに基づくストレススコア(最高スコア30点、最低スコア6点)として慢性ストレスのレベルを評価することができる。該職業性ストレス簡易調査票によるストレススコアは、低い値を示すほどストレスが高いことを示す。そこで、本発明において「高ストレス」に該当する慢性ストレスレベルとは、該職業性ストレス簡易調査票の領域B(29項目)のストレススコアが12点以下である状態をいい、「低ストレス」に該当する慢性ストレスレベルとは、該ストレススコアが23点以上である状態をいう。また本発明において、慢性ストレスレベルが「健常」とは、該職業性ストレス簡易調査票簡易版(23項目)のストレススコアが13~30点である状態をいう。
本発明において、慢性ストレスレベルの「検出」とは慢性的ストレス状態の存在又は不存在を明らかにする意味であり、検査、測定、判定又は評価支援などの用語で言い換えることもできる。本明細書における慢性ストレスレベルの「検出」、「検査」、「測定」、「判定」又は「評価」という用語は、医師によるストレス性疾患の診断を含むものではない。
後述する実施例に示すように、職業性ストレス簡易調査票の領域B(29項目)に基づき判定された高ストレス群と低ストレス群の間で、頭皮SSLにおいて発現レベルが異なっている遺伝子が見出された。すなわち、頭皮SSLから抽出されたRNAの発現量のデータ(リードカウント値)について、DESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)を用いて、高ストレス群と低ストレス群で尤度比検定によるp値の補正値(FDR)が0.05未満かつ、発現変動比が2倍以上もしくは0.5倍以下である遺伝子を抽出することにより、高ストレス群で発現が上昇する遺伝子127種(後記表1の「UP」)、発現が低下する遺伝子25種(後記表1の「DOWN」)、計152遺伝子が同定された。
したがって、斯かる152種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための慢性ストレスマーカーとなり得る。この場合、高ストレス群で発現が上昇する遺伝子又はその発現産物はポジティブマーカーであり、発現が低下する遺伝子又はその発現産物はネガティブマーカーである。
したがって、斯かる152種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための慢性ストレスマーカーとなり得る。この場合、高ストレス群で発現が上昇する遺伝子又はその発現産物はポジティブマーカーであり、発現が低下する遺伝子又はその発現産物はネガティブマーカーである。
また、被験者から検出された全てのSSL由来RNAの発現量のデータ(8324遺伝子のLog2(RPM+1)値)を説明変数とし、高ストレス群と低ストレス群を目的変数とし、機械学習アルゴリズムとしてランダムフォレスト(Breiman L. Machine Learning (2001) 45;5-32)を用いて特徴量遺伝子の抽出及び予測モデルの構築を試みた。後述する実施例に示すように、ジニ係数に基づく変数重要度の上位95遺伝子(後記表2)を特徴量遺伝子として選択し、これを用いたモデルで慢性ストレスレベルの検出が可能であることが示された。
したがって、斯かる95種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための好適な慢性ストレスマーカーとなり得る。
したがって、斯かる95種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための好適な慢性ストレスマーカーとなり得る。
また、機械学習アルゴリズムとしてBoruta法(Kursa et al. Fundamental Informaticae (2010) 101;271-286)を用いて特徴量遺伝子の抽出(最大試行回数1000回、p値0.01未満)を行ったところ、16遺伝子(後記表3)が特徴量遺伝子として抽出され、後述の実施例で示すように、これを用いたランダムフォレストによる予測モデルで慢性ストレスレベルの検出が可能であることが示された。
したがって、斯かる16種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための慢性ストレスマーカーとなり得る。
したがって、斯かる16種の遺伝子群より選択される遺伝子又はその発現産物は、慢性ストレスレベルを検出するための慢性ストレスマーカーとなり得る。
上述した発現変動解析で抽出された後記表1で示される152種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された後記表2で示される95種の遺伝子群(B)及びBoruta法により特徴量遺伝子として選択された後記表3で示される16種の遺伝子群(C)の和(A∪B∪C)である253種の遺伝子(後記表4)はいずれも慢性ストレスマーカーとなり得る。斯かる253種の遺伝子は、これまでに慢性ストレスとの関係が報告されていない新規な遺伝子である。
本発明のMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群のうち、MGMT、COL6A2、AREG、YEATS2及びTMPRSS13の5遺伝子は、上述した発現変動解析で抽出された後記表1に記載の152種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された後記表2に記載の95種の遺伝子群(B)に共通する遺伝子(A∩B)であり、CRLF3及びPDLIM5の2遺伝子は、ランダムフォレストにより特徴量遺伝子として選択された後記表2に記載の95種の遺伝子群(B)とBoruta法により特徴量遺伝子として選択された後記表3に記載の16種の遺伝子群(C)に共通する遺伝子(B∩C)であり、GOLGA6L5、OTUD7B及びZNRF2の3遺伝子は、発現変動解析で抽出された後記表1に記載の152種の遺伝子群(A)とBoruta法により特徴量遺伝子として選択された後記表3に記載の16種の遺伝子群(C)に共通する遺伝子(A∩C)である。したがって、これらの遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物は、慢性ストレスレベルを検出するための慢性ストレスマーカーとして特に有用である。
本発明の慢性ストレスレベルの検出においては、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群から1種以上、2種以上、好ましくは5種以上、より好ましくは7種以上を選択して用いることができ、10種全てを用いることもできる。
また、上記10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2からなる8種の遺伝子群から選択される遺伝子と、後記表1で示される152種のうち当該8種を除いた144種の遺伝子群(下記表1A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2からなる8種の遺伝子群から選択される遺伝子と、後記表1で示される152種のうち当該8種を除いた144種の遺伝子群(下記表1A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される95種のうち当該7種を除いた88種の遺伝子群(下記表2A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記10種の遺伝子のうちGOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5からなる5種の遺伝子群から選択される遺伝子と、後記表3で示される16種のうち当該5種を除いた11種の遺伝子群(下記表3A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記10種の遺伝子群から選択される遺伝子と、後記表4で示される253種のうち当該10種を除いた243種の遺伝子群(表4A)から選択される少なくとも1つの遺伝子又を組み合わせて用いることができる。
なお、上記の慢性ストレスマーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、慢性ストレスレベルを検出するためのバイオマーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=-3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、さらにより好ましく98%以上の同一性があることを意味する。
本発明の慢性ストレスレベルの検出方法は、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明の慢性ストレスレベルの検出方法において用いられる生体試料は、被験者の頭皮から採取された皮膚表上脂質(SSL)が用いられる。なお、被験者は、性別や人種など特に限定されないが、慢性ストレスレベルの検出を必要とするヒト又は慢性ストレスレベルの検出を希望するヒトが好ましい。
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む(前記特許文献5参照)。また、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。本発明において、SSLが採取される皮膚は、頭部の毛髪が生える領域の皮膚、すなわち頭皮である。
被験者の頭皮からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、などが挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは-20±20℃~-80±20℃、より好ましくは-20±10℃~-80±10℃、さらに好ましくは-20±20℃~-40±20℃、さらに好ましくは-20±10℃~-40±10℃、さらに好ましくは-20±10℃、さらに好ましくは-20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられ、RNAが好ましく、より好ましくはmRNAである。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、RNAを標的遺伝子又はその発現産物の発現レベルの測定対象とする場合、RNAの発現レベルが解析されてもよいが、好ましくはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M-MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT-PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT-PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(-鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT-PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上、よりさらに好ましくは99%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上、よりさらに好ましくは99%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC-MS/MS、MALDI-TOF/MS)、1-ハイブリッド法(PNAS 100, 12271-12276(2003))や2-ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者の頭皮から採取されたSSL中の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいて慢性ストレスレベルが検出される。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
本発明における慢性ストレスレベルの検出は、本発明の標的遺伝子又はその発現産物の発現レベルを、各遺伝子又はその発現産物の参照値(カットオフ値)と比較することにより行われる。参照値としては、例えば、予め健常人(ストレスレベルが健常範囲である人)における当該標的遺伝子又はその発現産物の発現レベルを基準データとして取得しておき、それに基づく発現レベルの平均値や標準偏差等の統計的数値に基づき、適宜決定すれば良い。
例えば、本発明の標的遺伝子又はその発現産物がポジティブマーカーとなる場合、該マーカーの発現レベルが参照値よりも高い場合、被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的にストレス状態にはないと検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値と比べて統計学的に有意に高ければ、該被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的なストレス状態にはないと検出され得る。また例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値に対して、好ましくは110%以上、より好ましくは150%以上、さらに好ましくは200%以上であれば、該被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的にストレス状態にはないと検出され得る。
一方、本発明の標的遺伝子又はその発現産物がネガティブマーカーとなる場合、該マーカーの発現レベルが参照値よりも低い場合、被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的にストレス状態にはないと検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値と比べて統計学的に有意に低ければ、該被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的にストレス状態にはないと検出され得る。また例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値に対して、好ましくは90%以下、より好ましくは75%以下、さらに好ましくは50%以下であれば、該被験者は慢性的にストレス状態にあると検出され得、そうでない場合、被験者は慢性的にストレス状態にはないと検出され得る。
あるいは、複数の標的遺伝子又はその発現産物を組み合わせて用いる場合には、それらの標的遺伝子又はその発現産物の一定割合、例えば50%以上、好ましくは70%以上、より好ましくは90%以上、さらに好ましくは100%が上述した発現レベルの基準を満たすか否かに基づいて、被験者の慢性ストレスレベルを検出することができる。
別の一実施形態においては、一被験者から本発明の標的遺伝子又はその発現産物の発現レベルを定期的に(例えば毎月)測定し、参照値を対照レベルとして、その発現レベルの変動を追跡することで、該被験者の慢性ストレスレベルの推移を検出することができる。この場合の参照値には、予め決定した値、例えば、同じ被験者から複数回測定した標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値)から該参照値を算出してもよい。あるいは、該参照値は、参照集団(慢性ストレスレベルが任意である個体からなる群)、健常群(慢性ストレスレベルが健常範囲[例えば、前述した職業性ストレス簡易調査票の領域B(29項目)のストレススコアが13~30点]である個体からなる群)、低ストレス群(慢性ストレスレベルが低ストレス範囲[例えば、前述した職業性ストレス簡易調査票の領域B(29項目)のストレススコアが23点以上]である個体からなる群)、又は高ストレス群(慢性ストレスレベルが高ストレス範囲[例えば、前述した職業性ストレス簡易調査票の領域B(29項目)のストレススコアが12点以下]である個体からなる群)から測定した本発明の標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値など)に基づいて決定することができる。本発明の標的遺伝子又はその発現産物として複数種を用いる場合は、各々の標的遺伝子又はその発現産物について参照値を求めることが好ましい。
さらに、慢性ストレスレベルが高い個体(高ストレス群)由来の標的遺伝子又はその発現産物の発現レベルと、慢性ストレスレベルが低い個体(低ストレス群)由来の標的遺伝子又はその発現産物の発現レベルの測定値(発現プロファイル)を利用して、慢性的なストレス状態にあるかそうではないかを分ける判別式(予測モデル)を構築し、当該判別式を利用して、慢性的ストレスレベルを検出することができる。
すなわち、高ストレス群由来の標的遺伝子又はその発現産物の発現レベルと、健常又は低ストレス群由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高ストレス群と健常又は低ストレス群を分ける判別式(予測モデル)を構築し、当該判別式に基づいて慢性ストレス状態の存在又は不存在を判別する参照値(カットオフ値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者の頭皮から採取されたSSLから標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者における慢性的ストレスレベルを評価できる。
すなわち、高ストレス群由来の標的遺伝子又はその発現産物の発現レベルと、健常又は低ストレス群由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高ストレス群と健常又は低ストレス群を分ける判別式(予測モデル)を構築し、当該判別式に基づいて慢性ストレス状態の存在又は不存在を判別する参照値(カットオフ値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者の頭皮から採取されたSSLから標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者における慢性的ストレスレベルを評価できる。
判別式の構築に用いる変数には説明変数と目的変数がある。説明変数としては、例えば、下記の方法で選択した標的遺伝子又はその発現産物の発現レベル(特徴量)を用いることができる。目的変数としては、例えば、そのサンプルが慢性ストレス状態にある(高ストレス)かそうではない(健常又は低ストレス)か、を用いることができる。
特徴量の選択には、判別する2群間の統計学的に有意な差異、例えば、発現レベルが2群間で有意に変動する遺伝子(発現変動遺伝子)又はその発現産物の発現レベルを用いることができる。また、機械学習に用いるアルゴリズムなどの公知のものを利用して特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。例えば、下記に示すランダムフォレストにおける変数重要度の高い遺伝子またはその発現産物の発現レベルを用いたり、R言語の“Boruta”パッケージなどを用いて特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。
判別式の構築におけるアルゴリズムは、機械学習に用いるアルゴリズムなどの公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)などが挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、予測モデルの精度の指標として、未知データに対する推定の誤答率(OOB error rate)を算出することができる(Breiman L. Machine Learning (2001) 45;5-32)。
ランダムフォレストにおいては、ブートストラップ法という手法に従い、全サンプル中から重複を許して、サンプル数の約3分の2のサンプルをランダムに抽出し、決定木と呼ばれる分類器を作成する。この時抽出されなかったサンプルはOut of bug(OOB)と呼ばれ、1本の決定木を用いて、OOBの目的変数の予測を行い、正解ラベルと比較することでその誤答率を算出することができる(決定木におけるOOB error rate)。同様の作業を500回繰り返し行い、500本の決定木におけるOOB error rateの平均値をとった値を、該ランダムフォレストのモデルのOOB error rateとすることができる。
なお、ランダムフォレストのモデルを構築する決定木の数(ntree値)は、デフォルトでは500本であるが、必要に応じて1本から任意の本数に変更することができる。さらに、1つの決定木においてサンプルの判別式の作成に用いる変数の数(mtry値)は、デフォルトでは説明変数の数の平方根をとった値であるが、必要に応じて1つから全説明変数の数までの値のいずれかに変更することができる。
mtry値の決定にはR言語の“caret”パッケージを用いることができる。“caret”パッケージのメソッドにランダムフォレストを指定し、8通りのmtry値を試行し、例えばAccuracyが最大となるmtry値を最適なmtry値として選択することができる。なお、mtry値の試行回数は、必要に応じて任意の試行回数に変更することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、モデルの構築に用いた説明変数の重要度を数値(変数重要度)化することができる。変数重要度の値には、例えば、ジニ係数の減少量(Mean Decrease Gini)を用いることができる。
カットオフ値(参照値)の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性被験者において陽性の結果がでる確率(感度)と、横軸に陰性被験者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1-特異度)」に関し、「真陽性(感度)」-「偽陽性(1-特異度)」が最大となる値(Youden index)をカットオフ値(参照値)とすることができる。
本発明の慢性ストレスレベルの検出に用いられる予測モデルを構築するための特徴量遺伝子としては、例えば、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群、当該10種の遺伝子を全て含む後記表4で示される253遺伝子からなる遺伝子群、当該10種のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2の8種を含む後記表1で示される152遺伝子からなる遺伝子群、当該10種のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5の7種を含む後記表2で示される95種の遺伝子からなる遺伝子群、当該10種のうちのGOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5の5種を含む、後記表3で示される16種の遺伝子からなる遺伝子群が挙げられる。
また、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2からなる8種の遺伝子群から選択される遺伝子と、後記表1で示される152種のうち当該8種を除いた146種の遺伝子群(前記表1A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される95種のうち当該7種を除いた88種の遺伝子群(前記表2A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。ここで、前記表2Aで示される遺伝子群から選択される遺伝子は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から選択するのが好ましい。
また、上記10種の遺伝子のうち、GOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5からなる5種の遺伝子群から選択される遺伝子と、後記表3で示される16種のうち当該5種を除いた11種の遺伝子群(前記表3A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記10種の遺伝子群から選択される遺伝子と、後記表4で示される253種のうち当該10種を除いた243種の遺伝子群(前記表4A)から選択される少なくとも1つの遺伝子又を組み合わせて特徴量遺伝子とすることができる。
また、上記10種の遺伝子のうちMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される95種のうち当該7種を除いた88種の遺伝子群(前記表2A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。ここで、前記表2Aで示される遺伝子群から選択される遺伝子は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から選択するのが好ましい。
また、上記10種の遺伝子のうち、GOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5からなる5種の遺伝子群から選択される遺伝子と、後記表3で示される16種のうち当該5種を除いた11種の遺伝子群(前記表3A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記10種の遺伝子群から選択される遺伝子と、後記表4で示される253種のうち当該10種を除いた243種の遺伝子群(前記表4A)から選択される少なくとも1つの遺伝子又を組み合わせて特徴量遺伝子とすることができる。
上述した本発明の慢性ストレスレベルの検出方法は、慢性ストレスに対する予防又は治療的介入の存在下で実施することにより当該介入の効果を評価することができる。
すなわち、本発明の介入効果の評価方法は、慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む。
すなわち、本発明の介入効果の評価方法は、慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む。
ここで、慢性ストレスに対する予防又は治療的介入とは、慢性ストレスに対して予防又は治療的効果を期待して実施される介入であり、化学的介入、物理的又は機械的介入が包含される。化学的介入としては、天然物質、合成物質、組成物等の物質の投与が挙げられ、物理的又は機械的介入としては、電磁波、光等の照射、温熱付与、マッサージなどの施術が挙げられる。
介入効果の評価は、介入によって生じる被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく慢性ストレスレベルの変化に基づいて評価することができる。
例えば、介入存在下における被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく慢性ストレスレベルを、対照(介入非存在下)と比較することで、その効果を評価することが挙げられる。そして、被験者の慢性ストレスレベルを低下するような介入は、慢性ストレスの予防又は治療のために有効な介入と評価できる。
例えば、介入存在下における被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく慢性ストレスレベルを、対照(介入非存在下)と比較することで、その効果を評価することが挙げられる。そして、被験者の慢性ストレスレベルを低下するような介入は、慢性ストレスの予防又は治療のために有効な介入と評価できる。
慢性ストレスレベル検出用キット又は介入効果の評価用キットは、本発明による慢性ストレスレベル検出方法に従って被験者の慢性ストレスレベルを検出するためのキット、及び本発明による介入効果の評価方法に従って介入効果を評価するためのキットである。
本発明のキットは、SSLの採取及び保存に必要な用具及び試薬、標的遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する。
SSLの採取及び保存に必要な用具及び試薬としては、例えば、SSLを採取するための脂取りフィルム、採取したSSLを保存するための試薬、保存用の容器等が挙げられる。
標的遺伝子又はその発現産物の発現レベルを測定するための試薬としては、例えば採取したSSLからRNAを抽出・精製するための試薬、標的遺伝子に由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー、シーケンシング用アダプター配列等)を含む、核酸増幅又はハイブリダイゼーションのための試薬、遺伝子発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤、ポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、試験に必要な器具の他、標的遺伝子又はその発現産物の発現レベルを検出するための指標又はガイダンス等が包含される。
本発明のキットは、SSLの採取及び保存に必要な用具及び試薬、標的遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する。
SSLの採取及び保存に必要な用具及び試薬としては、例えば、SSLを採取するための脂取りフィルム、採取したSSLを保存するための試薬、保存用の容器等が挙げられる。
標的遺伝子又はその発現産物の発現レベルを測定するための試薬としては、例えば採取したSSLからRNAを抽出・精製するための試薬、標的遺伝子に由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー、シーケンシング用アダプター配列等)を含む、核酸増幅又はハイブリダイゼーションのための試薬、遺伝子発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤、ポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、試験に必要な器具の他、標的遺伝子又はその発現産物の発現レベルを検出するための指標又はガイダンス等が包含される。
本発明においては上述した実施形態に関し、さらに以下の態様が開示される。
<1>被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。
<2>前記10種の遺伝子のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2からなる8種の遺伝子群から選択される遺伝子と、前記表1Aで示される144種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<3>前記10種の遺伝子のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5からなる7種の遺伝子群から選択される遺伝子と、前記表2Aで示される88種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<4>前記10種の遺伝子のうちのGOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5からなる5種の遺伝子群から選択される遺伝子と、前記表3Aで示される11種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<5>前記10種の遺伝子群から選択される遺伝子と、前記表4Aで示される243種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<6>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>~<5>のいずれかの方法。
<7>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、慢性ストレス状態の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<8>高ストレス群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低ストレス群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高ストレス群と健常又は低ストレス群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における慢性ストレス状態の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<9>慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
<10>SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、<1>~<8>のいずれかの方法に用いられる慢性ストレスレベル検出用キット又は<9>の方法に用いられる介入効果の評価用キット。
<11>MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる慢性ストレスマーカー。
<12>MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、慢性ストレスマーカーとしての使用。
<1>被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。
<2>前記10種の遺伝子のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、GOLGA6L5、OTUD7B及びZNRF2からなる8種の遺伝子群から選択される遺伝子と、前記表1Aで示される144種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<3>前記10種の遺伝子のうちのMGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3及びPDLIM5からなる7種の遺伝子群から選択される遺伝子と、前記表2Aで示される88種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<4>前記10種の遺伝子のうちのGOLGA6L5、OTUD7B、ZNRF2、CRLF3及びPDLIM5からなる5種の遺伝子群から選択される遺伝子と、前記表3Aで示される11種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<5>前記10種の遺伝子群から選択される遺伝子と、前記表4Aで示される243種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<6>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>~<5>のいずれかの方法。
<7>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、慢性ストレス状態の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<8>高ストレス群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低ストレス群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高ストレス群と健常又は低ストレス群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における慢性ストレス状態の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<9>慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
<10>SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、<1>~<8>のいずれかの方法に用いられる慢性ストレスレベル検出用キット又は<9>の方法に用いられる介入効果の評価用キット。
<11>MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる慢性ストレスマーカー。
<12>MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、慢性ストレスマーカーとしての使用。
以下、実施例に基づき本発明をさらに詳細に説明するが、本発明はこれに限定されるものではない。
実施例1 発現変動遺伝子を用いた慢性ストレスレベル判別モデルの構築
1)被験者の選抜及びSSL採取
20~60歳代の健常な男女72名に、職業性ストレス簡易調査票調査票の領域B(29項目)(厚生労働省、2016)に回答させ、回答結果に基づいてストレススコアを算出した。該ストレススコアは低いほど慢性ストレスが高いことを示し、厚労省基準(労働安全衛生法に基づくストレスチェック制度実施マニュアル改訂版、厚生労働省、2016)で高ストレスと認定される基準である、該ストレススコアが12点以下であった16名を高ストレス群の被験者として選抜した。一方、該ストレススコアが23点以上であった15名を低ストレス群の被験者として選抜した。両群合わせて31名の各被験者の頭部からあぶら取りフィルム(5cm×8cm、ポリプロピレン製、3M社)を用いて皮脂を採取した。採取に当たっては当日の整髪料等の毛髪化粧料の使用を禁止した。皮脂は、毛髪をかき分けてからその根元の頭皮を擦るように採取し、これを頭部全体で数回繰り返して採取した。皮脂を採取したあぶら取りフィルムは、ガラスバイアルに移し、RNA抽出に使用するまで-80℃で保存した。
実施例1 発現変動遺伝子を用いた慢性ストレスレベル判別モデルの構築
1)被験者の選抜及びSSL採取
20~60歳代の健常な男女72名に、職業性ストレス簡易調査票調査票の領域B(29項目)(厚生労働省、2016)に回答させ、回答結果に基づいてストレススコアを算出した。該ストレススコアは低いほど慢性ストレスが高いことを示し、厚労省基準(労働安全衛生法に基づくストレスチェック制度実施マニュアル改訂版、厚生労働省、2016)で高ストレスと認定される基準である、該ストレススコアが12点以下であった16名を高ストレス群の被験者として選抜した。一方、該ストレススコアが23点以上であった15名を低ストレス群の被験者として選抜した。両群合わせて31名の各被験者の頭部からあぶら取りフィルム(5cm×8cm、ポリプロピレン製、3M社)を用いて皮脂を採取した。採取に当たっては当日の整髪料等の毛髪化粧料の使用を禁止した。皮脂は、毛髪をかき分けてからその根元の頭皮を擦るように採取し、これを頭部全体で数回繰り返して採取した。皮脂を採取したあぶら取りフィルムは、ガラスバイアルに移し、RNA抽出に使用するまで-80℃で保存した。
2)RNA調製及びシーケンシング
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出したRNAは、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃で90分間逆転写し、cDNAを合成した。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、及び増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。シーケンシングで得られた各リード配列をヒトゲノムのリファレンス配列であるhg19 AmpliSeq Transcriptome ERCC v1を用いて遺伝子マッピングすることで各リード配列の由来する遺伝子を決定した。
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出したRNAは、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃で90分間逆転写し、cDNAを合成した。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、及び増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。シーケンシングで得られた各リード配列をヒトゲノムのリファレンス配列であるhg19 AmpliSeq Transcriptome ERCC v1を用いて遺伝子マッピングすることで各リード配列の由来する遺伝子を決定した。
3)データ解析及び特徴量遺伝子の選択
上記2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、DESeq2という手法を用いて補正した。但し、全被験者の発現レベルデータのうち90%以上の被験者で欠損値ではない発現レベルデータが得られた8324遺伝子のみ以下の解析に使用した。解析では、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用い、群間(低ストレス群及び高ストレス群)で尤度比検定によるp値の補正値(FDR)が0.05未満かつ、発現変動比が2倍以上もしくは0.5倍以下である遺伝子を抽出した。その結果、表1に示す152種の遺伝子が得られた。表1のUPで示される127遺伝子は、高ストレス群で発現レベルがより高かったことから、慢性ストレスにより発現レベルが増加するマーカー(ポジティブマーカー)であった。表1のDOWNで示される25遺伝子は、高ストレス群で発現レベルがより低かったことから、慢性ストレスにより発現レベルが低下するマーカー(ネガティブマーカー)であった。これらの遺伝子を以下の予測モデル構築に用いる特徴量遺伝子として選択した。
上記2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、DESeq2という手法を用いて補正した。但し、全被験者の発現レベルデータのうち90%以上の被験者で欠損値ではない発現レベルデータが得られた8324遺伝子のみ以下の解析に使用した。解析では、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用い、群間(低ストレス群及び高ストレス群)で尤度比検定によるp値の補正値(FDR)が0.05未満かつ、発現変動比が2倍以上もしくは0.5倍以下である遺伝子を抽出した。その結果、表1に示す152種の遺伝子が得られた。表1のUPで示される127遺伝子は、高ストレス群で発現レベルがより高かったことから、慢性ストレスにより発現レベルが増加するマーカー(ポジティブマーカー)であった。表1のDOWNで示される25遺伝子は、高ストレス群で発現レベルがより低かったことから、慢性ストレスにより発現レベルが低下するマーカー(ネガティブマーカー)であった。これらの遺伝子を以下の予測モデル構築に用いる特徴量遺伝子として選択した。
4)モデル構築
3)で選択した152の特徴量遺伝子の発現レベルデータとして、2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。得られた152の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rateを算出した。その結果、152遺伝子全ての発現レベルデータを変数に用いた場合のモデルではOOB error rateは25.8%であり、表1に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
3)で選択した152の特徴量遺伝子の発現レベルデータとして、2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。得られた152の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rateを算出した。その結果、152遺伝子全ての発現レベルデータを変数に用いた場合のモデルではOOB error rateは25.8%であり、表1に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
実施例2 ランダムフォレスト変数重要度の高い遺伝子を用いた慢性ストレスレベル判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた8324種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた8324種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
ランダムフォレストのアルゴリズムを用いて、予測モデル構築に用いる特徴量遺伝子の選択を行った。1)で得られた8324遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位95遺伝子を算出した(表2)。これら95遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
ランダムフォレストのアルゴリズムを用いて、予測モデル構築に用いる特徴量遺伝子の選択を行った。1)で得られた8324遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位95遺伝子を算出した(表2)。これら95遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
3)モデル構築
2)で選択した95の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、95遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは25.8%であり、表2に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
2)で選択した95の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、95遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは25.8%であり、表2に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
実施例3 Boruta法により抽出した特徴量遺伝子を用いた慢性ストレスレベル判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた8324種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた8324種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
1)で得られた8324遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、R言語の“Boruta”パッケージのアルゴリズムを実行し、慢性ストレスレベルを判別する予測モデルを構築した。最大試行回数を1000回とし、p値が0.01未満である16遺伝子を算出した(表3)。これら16遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
1)で得られた8324遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、R言語の“Boruta”パッケージのアルゴリズムを実行し、慢性ストレスレベルを判別する予測モデルを構築した。最大試行回数を1000回とし、p値が0.01未満である16遺伝子を算出した(表3)。これら16遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
3)モデル構築
2)で選択した16の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、16遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは12.9%であり、表3に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
2)で選択した16の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、16遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは12.9%であり、表3に示す遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
実施例4 実施例1~3で重複して用いられた特徴量遺伝子に基づく慢性ストレスレベル判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3で用いられた特徴量遺伝子のうち、実施例間で重複して用いられた遺伝子は、実施例1と2で重複して用いられたMGMT、COL6A2、AREG、YEATS2及びTMPRSS13の5遺伝子、実施例2と実施例3で重複して用いられたCRLF3及びPDLIM5の2遺伝子、実施例1と3で重複して用いられたGOLGA6L5、OTUD7B及びZNRF2の3遺伝子の計10遺伝子であった。これら10遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
1)特徴量遺伝子の選択
実施例1~3で用いられた特徴量遺伝子のうち、実施例間で重複して用いられた遺伝子は、実施例1と2で重複して用いられたMGMT、COL6A2、AREG、YEATS2及びTMPRSS13の5遺伝子、実施例2と実施例3で重複して用いられたCRLF3及びPDLIM5の2遺伝子、実施例1と3で重複して用いられたGOLGA6L5、OTUD7B及びZNRF2の3遺伝子の計10遺伝子であった。これら10遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
2)モデル構築
1)で選択した10の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、10遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは22.6%であり、上記10遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
1)で選択した10の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、10遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは22.6%であり、上記10遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
実施例5 実施例1~3で用いられた全ての特徴量遺伝子に基づく慢性ストレスレベル判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3のいずれかで用いられた特徴量遺伝子の全て(表4に示された計253種の遺伝子)を予測モデル構築に用いる特徴量遺伝子として選択した。
1)特徴量遺伝子の選択
実施例1~3のいずれかで用いられた特徴量遺伝子の全て(表4に示された計253種の遺伝子)を予測モデル構築に用いる特徴量遺伝子として選択した。
2)モデル構築
1)で選択した253の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、253遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは35.5%であり、表4の253遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
1)で選択した253の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、慢性ストレスレベル(高ストレス又は低ストレス)を目的変数として用いて、慢性ストレスレベルを判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、253遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは35.5%であり、表4の253遺伝子を、慢性ストレスレベルを検出するためのマーカーとして使用できることが示された。
Claims (11)
- 被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における慢性ストレスレベルの検出方法。
- 遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、請求項1~5のいずれか1項記載の方法。
- 発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、慢性ストレス状態の存在又は不存在を評価する、請求項1~6のいずれか1項記載の方法。
- 高ストレス群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低ストレス群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高ストレス群と健常又は低ストレス群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における慢性ストレス状態の存在又は不存在を評価する、請求項1~6のいずれか1項記載の方法。
- 慢性ストレスに対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる10種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
- SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、請求項1~8のいずれか1項記載の方法に用いられる慢性ストレスレベル検出用キット又は請求項9記載の方法に用いられる介入効果の評価用キット。
- MGMT、COL6A2、AREG、YEATS2、TMPRSS13、CRLF3、PDLIM5、GOLGA6L5、OTUD7B及びZNRF2からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる慢性ストレスマーカー。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021158337A JP2023048810A (ja) | 2021-09-28 | 2021-09-28 | 慢性ストレスレベルの検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021158337A JP2023048810A (ja) | 2021-09-28 | 2021-09-28 | 慢性ストレスレベルの検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023048810A true JP2023048810A (ja) | 2023-04-07 |
Family
ID=85780226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021158337A Pending JP2023048810A (ja) | 2021-09-28 | 2021-09-28 | 慢性ストレスレベルの検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023048810A (ja) |
-
2021
- 2021-09-28 JP JP2021158337A patent/JP2023048810A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2494065B1 (en) | Means and methods for non-invasive diagnosis of chromosomal aneuploidy | |
US20150100242A1 (en) | Method, kit and array for biomarker validation and clinical use | |
JP2023157965A (ja) | アトピー性皮膚炎の検出方法 | |
WO2022220298A1 (ja) | 乳幼児おむつ皮膚炎の症度の検出方法 | |
WO2021230379A1 (ja) | パーキンソン病の検出方法 | |
JP2023048810A (ja) | 慢性ストレスレベルの検出方法 | |
US20210087634A1 (en) | Determination of risk for development of cardiovascular disease by measuring urinary levels of podocin and nephrin messenger rna | |
JP2023048811A (ja) | 疲労の検出方法 | |
JP2023073134A (ja) | ホットフラッシュの検出方法 | |
JP2023073135A (ja) | 更年期障害の重症度の検出方法 | |
JP2023045067A (ja) | 不眠の検出方法 | |
WO2022220299A1 (ja) | 乳幼児顔湿疹の症度の検出方法 | |
JP2021175382A (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
JP2023002298A (ja) | 糖尿病指標値の検出方法 | |
JP2024075099A (ja) | アンモニア代謝能力の検出方法 | |
JP2022016416A (ja) | アトピー性皮膚炎の重症度の検出方法 | |
JP2022134127A (ja) | アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法 | |
JP2022134126A (ja) | アトピー性皮膚炎の症度悪化の検出方法 | |
WO2022059745A1 (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
JP2023002299A (ja) | 内臓脂肪面積の検出方法 | |
JP2024045047A (ja) | 肥満改善剤の有効性予測方法 | |
JP2023069499A (ja) | 乾燥による皮膚表面形状悪化の検出方法 | |
JP2024045048A (ja) | 肥満改善剤の有効性予測方法 | |
WO2008048795A2 (en) | Methods for determining collateral artery development in coronary artery disease | |
JP2022097303A (ja) | 疲労マーカー及びそれを用いた疲労の検出方法 |