WO2017043647A1 - 転写因子結合部位特異的なdna脱メチル化方法 - Google Patents

転写因子結合部位特異的なdna脱メチル化方法 Download PDF

Info

Publication number
WO2017043647A1
WO2017043647A1 PCT/JP2016/076669 JP2016076669W WO2017043647A1 WO 2017043647 A1 WO2017043647 A1 WO 2017043647A1 JP 2016076669 W JP2016076669 W JP 2016076669W WO 2017043647 A1 WO2017043647 A1 WO 2017043647A1
Authority
WO
WIPO (PCT)
Prior art keywords
gene
transcription factor
cells
site
cell
Prior art date
Application number
PCT/JP2016/076669
Other languages
English (en)
French (fr)
Inventor
貴紘 鈴木
治和 鈴木
Original Assignee
国立研究開発法人理化学研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人理化学研究所 filed Critical 国立研究開発法人理化学研究所
Priority to JP2017538550A priority Critical patent/JP6937513B2/ja
Publication of WO2017043647A1 publication Critical patent/WO2017043647A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/502Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects
    • G01N33/5023Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing non-proliferative effects on expression patterns
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0647Haematopoietic stem cells; Uncommitted or multipotent progenitors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5011Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics for testing antineoplastic activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Definitions

  • the present invention relates to a site-specific DNA demethylation method.
  • DNA methylation is an epigenetic modification that suppresses gene expression and regulates on / off of gene expression. Correct DNA methylation patterns at CpG sites on genomic DNA are essential for development, gametogenesis, and somatic differentiation. Abnormal DNA methylation is often known to cause cell carcinogenesis. Therefore, in recent years, DNA methylation inhibitors and the like have begun to be used as anticancer agents. For example, cancer treatment strategies targeting DNA methylation may be effective for myelodysplastic syndrome (MDS) and acute myeloid leukemia (AML), which are known to have abnormal DNA methylation. Azacitidine (trade name Vidaza), which is a DNA methylation inhibitor, has achieved certain results as a therapeutic agent.
  • MDS myelodysplastic syndrome
  • AML acute myeloid leukemia
  • Non-patent Document 1 Non-patent Document 1
  • anticancer agents conventional treatment with these agents works nonspecifically, and it has not been clarified which part of DNA contributes to the improvement of reprogramming efficiency.
  • Non-Patent Documents 2 to 5 there is a report that site-specific demethylation has been successfully performed using a fusion protein in which thymine DNA glycosylase (TDG) is linked to a DNA-binding domain NF ⁇ B-derived Rel-homology domain (RHD) (non-patent literature) 6).
  • TDG thymine DNA glycosylase
  • RHD Rel-homology domain
  • site-specific demethylation has been successfully performed using a fusion protein in which a TET protein is linked to a TALE domain.
  • these methods have problems such that demethylation induction efficiency is not sufficient, or only demethylation targeting a very limited specific site can be induced. Therefore, development of a method that can induce site-specific demethylation more efficiently is desired.
  • An object of the present invention is to provide a method for inducing site-specific DNA demethylation at a high level.
  • the present inventors have been able to select a transcription factor capable of inducing site-specific DNA demethylation by a predetermined screening method, and such a transcription factor can be selected in a cell.
  • Overexpression can induce high levels of transcription factor binding site-specific DNA demethylation, and by overexpressing such transcription factors in cells with TET and TDG It has been found that DNA demethylation can be further enhanced, and the present invention has been completed.
  • the present invention includes the following.
  • [1] Enhance transcription factor binding site-specific demethylation in DNA in cells, including overexpressing in cells the genes encoding transcription factors that induce site-specific DNA demethylation Method.
  • [2] The method according to [1] above, wherein the transcription factor is selected from the group consisting of RUNX family, C / EBP family, MAF family, NR4A family, MYOD family, GATA family, and TBX family transcription factors.
  • [3] The method according to [1] or [2] above, comprising overexpressing a gene encoding the transcription factor and a TET gene and / or a TDG gene in a cell.
  • [4] The method according to any one of [1] to [3] above, wherein the transcription factor is selected from the group consisting of RUNX1, RUNX3, CEBPA, CEBPB, MAFB, NR4A2, MYOD1, GATA2, and TBX5.
  • the TET gene is a TET2 gene or a TET3 gene.
  • the TET gene encodes a full-length TET protein or a fragment thereof containing an enzyme active site.
  • the transcription factor is selected from the group consisting of transcription factors of RUNX family, C / EBP family, MAF family, NR4A family, MYOD family, GATA family, and TBX family. Converted cell.
  • the transformed cell according to [13] or [14] above is cultured in the presence of a test substance, the methylation state of DNA in the cell is evaluated, and methyl compared with a cell in the absence of the test substance
  • a transcription factor capable of inducing site-specific DNA demethylation at a high level can be selected, and the site-specific demethylation in DNA is enhanced using the transcription factor. be able to.
  • FIG. 1 shows the schematic structure of a plasmid vector used in the Examples for preparing a lentiviral vector.
  • FIG. 2 is a schematic diagram showing the procedure for preparing the lentiviral vector used in the examples.
  • A shows the preparation procedure of 293T-RUNX1 cells
  • B shows the preparation procedure of 293T-TET2-TDG-RUNX1 cells and 293T-TET3-TDG-RUNX1 cells.
  • FIG. 3 is a scatter plot for comparing probe M values between two cell lines.
  • A is between 293T-mock cells and 293T-RUNX1 cells
  • B is between 293T-TET2-TDG cells and 293T-TET2-TDG-RUNX1 cells
  • C is between 293T-TET3-TDG cells and 293T-TET3-TDG-RUNX1 cells. It is a comparison. One small dot corresponds to each probe.
  • FIG. 4 is a scatter plot for comparing probe M values between two cell lines. A is a comparison between 293T-mock cells and 293T-TET2-TDG cells, and B is a comparison between 293T-mock cells and 293T-TET3-TDG cells. One small dot corresponds to each probe.
  • FIG. 4 is a scatter plot for comparing probe M values between two cell lines. A is a comparison between 293T-mock cells and 293T-TET2-TDG cells
  • B is a comparison between 293T-mock cells and 293T-TET3-T
  • FIG. 5 shows the results of bisulfite sequencing of PTPN22 and RUNX3 regions in 293T-mock cells and 293T-RUNX1 cells.
  • A shows PTPN22 in 293T-mock cells
  • B shows PTPN22 in 293T-RUNX1 cells
  • C shows RUNX3 in 293T-mock cells
  • D shows RUNX3 results in 293T-RUNX1 cells.
  • Each line points to the clone genome, with black and white circles representing methylated and unmethylated CpG, respectively.
  • the arrow indicates the CpG of the prominently demethylated probe.
  • the percentages listed below are the total methylation ratio for each region (* P ⁇ 0.05, ** P ⁇ 0.01).
  • FIG. 6 is a diagram showing the distribution and frequency of appearance of a RUNX1 binding motif of ⁇ 500 bp from the probe CpG.
  • A is 293T-RUNX1 cells compared to 293T-mock cells
  • B is 293T-TET2-TDG-RUNX1 cells compared to 293T-TET2-TDG cells
  • C is 293T-TET3-TDG compared to 293T-TET3-TDG cells.
  • FIG. 7 is a scatter plot for comparing M values between two cell lines.
  • A is between ESC and CD34
  • B is between ESC and CD14
  • C is a comparison between ESC and PBMC.
  • FIG. 8 is a diagram showing a frequency-corrected appearance frequency distribution of a transcription factor binding motif in a sequence near a demethylated CpG site in cells overexpressing transcription factors, TET, and TDG.
  • A shows the results of using RUNX1 as a transcription factor
  • B shows the results of using RUNX3.
  • FIG. 9 is a diagram showing the frequency distribution of appearance-corrected transcription factor binding motifs in the vicinity of demethylated CpG sites in cells overexpressing transcription factors, TET, and TDG.
  • A shows the result of using CEBPB as a transcription factor
  • B shows the result of using CEBPA.
  • FIG. 10 is a graph showing the frequency distribution of appearance-corrected transcription factor binding motifs in the vicinity of demethylated CpG sites in cells overexpressing transcription factors, TET, and TDG.
  • A shows the results using MAFB as a transcription factor
  • B shows the results using NR4A2.
  • FIG. 11 is a graph showing the frequency distribution of appearance-corrected transcription factor binding motifs in the vicinity of demethylated CpG sites in cells overexpressing transcription factors, TET, and TDG.
  • A shows the result using MYOD1 as a transcription factor and B shows GATA2.
  • FIG. 12 is a diagram showing a frequency-corrected appearance frequency distribution of a transcription factor binding motif in a sequence near a demethylated CpG site in cells overexpressing transcription factors, TET, and TDG.
  • FIG. 13 is a diagram showing a frequency-corrected frequency distribution of transcription factor binding motifs in the vicinity of demethylated CpG sites in cells overexpressing SPI1, TET, and TDG.
  • FIG. 14 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg15752436 (chromosome 17: position 20937757) in 293T-TcdT cells and 293T-TcdT-RUNX1 cells.
  • A shows 293T-TcdT cells (67.0%), and B shows 293T-TcdT-RUNX1 cells (48.6%, p ⁇ 10 ⁇ 2 ).
  • the vertical column indicates the same methylation site between different clones, and the horizontal column indicates a plurality of methylation sites possessed by one clone.
  • Black and white circles represent methylated and unmethylated CpG, respectively.
  • the arrow indicates the CpG (demethylated CpG) of the probe that was significantly demethylated in the methylation array.
  • the percentages listed represent the total methylation ratio detected in each region (* P ⁇ 0.05, ** P ⁇ 0.01). 15 to 22 also use the same notation as in FIG. FIG.
  • FIG. 15 shows the results of bisulfite sequencing of the demethylation region (within ⁇ 250 bp of probe ID cg07921503 (chromosome 7: position 2445843)) in 293T-TcdT cells and 293T-TcdT-RUNX3 cells.
  • A shows 293T-TcdT cells (93.5%)
  • B shows 293T-TcdT-RUNX3 cells (58.4%, p ⁇ 10 -9 ).
  • FIG. 16 shows the results of bisulfite sequencing of demethylated regions (within ⁇ 250 bp of probe ID cg25949447 (Chromosome 2: 128169860)) in 293T-TcdT cells and 293T-TcdT-CEBPB cells.
  • A shows 293T-TcdT cells (87.0%)
  • B shows 293T-TcdT-CEBPB cells (0.62%, p ⁇ 10 ⁇ 37 ).
  • FIG. 17 shows the results of bisulfite sequencing of demethylated regions (within ⁇ 250 bp of probe ID cg04855216 (5th chromosome: 118609567 position)) in 293T-TcdT cells and 293T-TcdT-CEBPA cells.
  • A shows 293T-TcdT cells (71.1%)
  • B shows 293T-TcdT-CEBPA cells (63.9%, p ⁇ 10 ⁇ 6 ).
  • FIG. 18 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg14628914 (6th chromosome: position 24659344)) in 293T-TcdT cells and 293T-TcdT-MAFB cells.
  • A shows 293T-TcdT cells (86.7%)
  • B shows 293T-TcdT-MAFB cells (63.5%, p ⁇ 10 ⁇ 3 ).
  • FIG. 19 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg21697198 (Chromosome 11: 129246394 position)) in 293T-TcdT cells and 293T-TcdT-NR4A2 cells.
  • A shows 293T-TcdT cells (71.1%)
  • B shows 293T-TcdT-NR4A2 cells (63.9%, p ⁇ 10 ⁇ 2 ).
  • FIG. 20 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg04117764 (Chromosome 1: 10917451)) in 293T-TcdT cells and 293T-TcdT-MYOD1 cells.
  • A shows 293T-TcdT cells (88.2%)
  • B shows 293T-TcdT-MYOD1 cells (56.7%, p ⁇ 10 ⁇ 19 ).
  • FIG. 21 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg21016188 (X chromosome: position 153672702)) in 293T-TcdT cells and 293T-TcdT-GATA2 cells.
  • A shows 293T-TcdT cells (30.0%)
  • B shows 293T-TcdT-GATA2 cells (4.3%, p ⁇ 10 ⁇ 36 ).
  • FIG. 22 shows the results of bisulfite sequencing of the demethylated region (within ⁇ 250 bp of probe ID cg21012061 (1st chromosome: 205568557)) in 293T-TcdT cells and 293T-TcdT-SPI1 cells.
  • A shows 293T-TcdT cells (91.4%)
  • B shows 293T-TcdT-SPI1 cells (71.8%, p ⁇ 10 ⁇ 3 ).
  • FIG. 23 is a diagram showing the methylation state of the CpG site in the SPI1 control region due to RUNX1 overexpression. Columns represent the same CpG site in different clone genomes, and black and white circles represent methylated and unmethylated CpG, respectively.
  • FIG. 24 is a diagram showing two RUNX1 binding sites contained in the SPI1 gene control region. The base sequence of the SPI1 gene control region in the figure is shown in SEQ ID NO: 71.
  • FIG. 25 is a diagram showing the frequency-corrected frequency distribution of transcription factor binding motifs in the vicinity of demethylated CpG sites in cells overexpressing transcription factors TBX5, TET, and TDG.
  • FIG. 26 is a heat map showing the state of concentration of transcription factor binding motifs in different cell differentiation processes. The name of the transcription factor binding motif is shown on the right side of the heat map, and the cell differentiation process is shown below.
  • iPSC-HPC is the process of differentiation from iPSC (iPS cells) to HPC (hematopoietic progenitor cells)
  • HPC-MON is the process of differentiation from HPC to MON (monocytes)
  • HPC-BC is from HPC to BC (B cells)
  • HPC-TC represents the differentiation process from HPC to TC (T cells).
  • the color key (color legend) of the concentration score is also shown in the upper left. If each transcription factor binding motif does not show a significant difference in an exact test with the Poisson distribution model, the data are shown as diagonal lines.
  • the present inventors have obtained knowledge suggesting that the state of the epigenome of the start cell may inhibit the transdifferentiation to the target cell in direct reprogramming that induces another differentiated cell from the differentiated cell.
  • the present inventors have succeeded in inducing cells having a monocyte-like function from human fibroblasts by identifying and introducing a transcription factor that plays an important role in monocytes.
  • Such a method has not been known so far.
  • the method of the present invention capable of inducing a high level of site-specific DNA demethylation was first discovered by the present inventors.
  • Epigenetic methylation of DNA is the addition of a methyl group to C (carbon atom) at position 5 of the pyrimidine ring of the cytosine base or N (nitrogen atom) at position 6 of the purine ring of the adenine base in DNA.
  • a site (methylation site) to be methylated on DNA is mainly a CpG sequence (CpG site), but may be a CpA sequence.
  • DNA methylation leads to suppression of gene expression, and regulation of gene expression by DNA methylation and demethylation is performed in cells.
  • the present invention when a certain type of transcription factor is overexpressed in a cell, active deactivation that interacts with the TET protein and TDG protein in the cell and targets the transcription factor binding site on DNA or the vicinity thereof is targeted. Induces methylation, resulting in enhanced transcription factor binding site-specific demethylation in DNA in the cell, and overexpression of TET and TDG proteins in the cell along with such transcription factor This is basically based on further enhancement of transcription factor binding site-specific demethylation in DNA in cells.
  • the present invention first relates to a method for screening a transcription factor that induces such site-specific DNA demethylation. Specifically, a gene encoding a transcription factor is overexpressed in a cell, a methylation site demethylated in the DNA in the cell is identified, and transcription at the identified demethylation site and its neighboring sequences is performed. By selecting transcription factors that induce site-specific DNA demethylation based on the frequency pattern of factor-binding motifs, transcription factors that induce site-specific DNA demethylation can be screened. .
  • the TET gene and / or the TDG gene may be overexpressed in the cell.
  • the transcription factor binding site or its vicinity Induction of active DNA demethylation targeted to DNA is further promoted, further enhancing demethylation of DNA in cells, and as a result, the sensitivity of selecting transcription factors that induce site-specific DNA demethylation.
  • overexpression of these genes is not necessarily required.
  • a gene encoding an arbitrary transcription factor to be determined whether or not to induce site-specific DNA demethylation can be used for the transcription factor screening method of the present invention.
  • the TET gene refers to a gene encoding a full-length TET (ten-eleven translocation) protein that is a methylated cytosine dioxygenase, or a fragment thereof including an enzyme active site.
  • TET proteins eg, TET1, TET2, and TET3 are all sequentially converted from 5-methylcytosine (5mC) to 5-hydroxymethylcytosine (5hmC), 5-formylcytosine (5fC), and 5-carboxycytosine (5caC). Can be oxidized.
  • the TET gene is preferably derived from an organism of the same species or a closely related species to the cell to be introduced.
  • the TET gene is preferably, but not limited to, derived from a mammal, such as a primate (preferably human).
  • the TET gene used in the present invention may be a TET1 gene, a TET2 gene or a TET3 gene, for example, a TET2 gene or a TET3 gene.
  • the mRNA sequences of TET1, TET2 and TET3 genes and the amino acid sequences encoded thereby can be obtained, for example, under GenBank accession numbers NM_030625, NM_001127208.2 and NM_001287491.1, respectively.
  • the TET1 gene in the present invention may be a nucleic acid encoding a TET1 protein including, for example, a protein consisting of the amino acid sequence represented by SEQ ID NO: 15, or a TET1 partial fragment containing the enzyme active site (active domain). It may be a nucleic acid encoding.
  • the TET1 gene of the present invention also has an amino acid sequence represented by SEQ ID NO: 15, or a partial sequence of SEQ ID NO: 15, which includes an amino acid sequence comprising positions 1580 to 2052 (enzyme active site).
  • a deleted, substituted or added amino acid sequence for example, an amino acid sequence in which 1 to 50, preferably 1 to 20, more preferably several (1 to 10) amino acids are deleted, substituted or added.
  • the TET1 gene also has an amino acid sequence represented by SEQ ID NO: 15, or a partial sequence of SEQ ID NO: 15 and an amino acid sequence containing positions 1580 to 2052 (enzyme active site), and 80% or more, preferably 90% or more, More preferably, it may be a nucleic acid that encodes a protein having an amino acid sequence showing sequence identity of 95% or more, more preferably 98% or more, 99% or more, or 99.5% or more, and having oxidative activity.
  • the TET1 gene used in the present invention may also be a nucleic acid comprising the base sequence represented by SEQ ID NO: 14 that encodes the amino acid sequence represented by SEQ ID NO: 15.
  • the TET1 gene also has a base sequence represented by SEQ ID NO: 14, or a partial sequence of SEQ ID NO: 14, which includes positions 4738 to 6156 (corresponding to an enzyme active site) and 70% or more, preferably 80% More preferably, it may be a nucleic acid encoding a protein having a base sequence exhibiting sequence identity of 90% or more, more preferably 98% or more, 99% or more, or 99.5% or more and having oxidative activity. .
  • the protein encoded by the TET1 gene preferably retains the amino acid sequence from positions 1580 to 2052 of SEQ ID NO: 15, that is, deleted within the amino acid sequence from positions 1580 to 2052. It is preferred to have no substitutions or additions.
  • the TET1 gene preferably retains the nucleotide sequence of positions 4738 to 6156 of SEQ ID NO: 14, that is, has no deletion, substitution or addition in the nucleotide sequence of positions 4738 to 6156. Is preferred.
  • the TET1 gene encoding the TET1 partial fragment is not limited to, for example, a nucleic acid encoding an amino acid sequence in which a protein tag or other additional sequence is added to the amino terminus or carboxy terminus of the amino acid sequence of the enzyme active site Is included.
  • Examples of the TET1 gene encoding the TET1 partial fragment include a nucleic acid consisting of the base sequence represented by SEQ ID NO: 49 or a nucleic acid encoding the amino acid sequence represented by SEQ ID NO: 50.
  • the TET1 gene encoding the TET1 partial fragment may be 1419 to 3000 bases in length, for example, 1419 to 2220 bases in one embodiment.
  • the TET1 gene encoding a TET1 partial fragment may also encode an amino acid sequence that is 473-1000 amino acids long, eg, 473-740 amino acids long.
  • SEQ ID NO: 15 in the description relating to the above TET1 gene is SEQ ID NO: 17, its 1580th to 2052 positions (enzyme active site) are 1290 to 1905 positions (enzyme active site), and SEQ ID NO: 14 Can be described in the same manner by replacing SEQ ID NO: 16 with positions 4738 to 6156 (corresponding to the enzyme active site) to positions 3868 to 5715 (corresponding to the enzyme active site).
  • SEQ ID NO: 15 in the description relating to the above TET1 gene is SEQ ID NO: 19, its 1580 to 2052 positions (enzyme active site) are located at positions 985 to 1697 (enzyme active site), Can be similarly explained by replacing SEQ ID NO: 18 with positions 4738 to 6156 (corresponding to the enzyme active site) to positions 2953 to 5091 (corresponding to the enzyme active site), respectively.
  • the TDG gene refers to a gene encoding the full-length thymine DNA glycosylase (TDG) protein or a gene encoding a fragment thereof containing an enzyme active site. TDG repairs base excision of thymine at G / T mismatch site in DNA to cytosine and base excision repair of 5fC and 5caC to cytosine by DNA glycosylase activity that removes unpaired base at mismatch site.
  • the TDG gene is preferably derived from an organism of the same species or a closely related species to the cell to be introduced.
  • the TDG gene is preferably derived from a mammal, for example, a primate (preferably human).
  • the TDG gene in the present invention may encode, for example, a TDG protein including a protein consisting of the amino acid sequence represented by SEQ ID NO: 23.
  • the TDG gene of the present invention has an amino acid sequence in which one or more amino acids are deleted, substituted or added in the amino acid sequence represented by SEQ ID NO: 23, for example, 1 to 50, more preferably 1 to 20, more preferably May be a nucleic acid consisting of an amino acid sequence in which several (1 to 10) amino acids have been deleted, substituted or added, and encoding a protein having DNA glycosylase activity.
  • nucleic acids examples include, but are not limited to, DNA encoding an amino acid sequence in which a protein tag or other additional sequence is added to the amino terminus or carboxy terminus of the TDG protein.
  • the TDG gene also comprises an amino acid sequence that shows 80% or more, preferably 90% or more, more preferably 95% or more, and still more preferably 98% or more of the amino acid sequence shown in SEQ ID NO: 23, and DNA It may encode a protein having glycosylase activity.
  • the TDG gene used in the present invention may also include a base sequence represented by SEQ ID NO: 22 that encodes an amino acid sequence represented by SEQ ID NO: 23.
  • the TDG gene also comprises a nucleotide sequence having a sequence identity of 70% or more, preferably 80% or more, more preferably 90% or more, and even more preferably 98% or more with the nucleotide sequence represented by SEQ ID NO: 22, and DNA It may encode a protein having glycosylase activity.
  • the “gene” is not limited, but may be genomic DNA, cDNA, DNA such as DNA partially containing a modified base, or RNA.
  • a “gene” is a nucleic acid fragment containing a coding sequence (CDS) typically containing a start codon and a stop codon, but introduced into a cell so that the target gene product (protein etc.) is produced. As long as it is done, the start codon and / or the stop codon may not be included.
  • the “gene” may further include an untranslated region (UTR), a promoter, a terminator and the like.
  • overexpression of transcription factor-encoding gene, TET gene and / or TDG gene in cells may be induced by any method.
  • “overexpression” of a gene means that the expression level of the gene is significantly increased as compared to a cell that does not induce overexpression (wild type cell).
  • the gene can be overexpressed in the cell.
  • the TET gene can be overexpressed in cells by introducing it into the cells under the control of a promoter.
  • the TDG gene can be overexpressed in cells by introducing it into the cells under the control of a promoter.
  • a gene encoding a transcription factor, a TET gene and / or a TDG gene can be introduced into a cell by a conventional method using a vector (expression vector) containing the gene under the control of a promoter.
  • a promoter capable of inducing gene expression in the cell into which the gene is introduced can be used, and such a promoter is preferably an overexpression promoter, for example, a constitutive (constant) expression that induces constitutive (constant) expression.
  • the promoter may be, but not limited to, an inducible promoter that induces transient expression by stimulation of a specific factor, a tissue-specific promoter, a time-specific promoter, and the like. Examples of promoters include, but are not limited to, cytomegalovirus (CMV) promoter, SV40 promoter, RSV promoter, CA promoter, EF-1 ⁇ promoter, and the like.
  • CMV cytomegalovirus
  • a vector containing a gene encoding a transcription factor under the control of a promoter, a TET gene and / or a TDG gene can be a viral vector or a plasmid vector.
  • the gene encoding a transcription factor, TET gene and / or TDG gene is preferably arranged downstream of the promoter.
  • each gene may be contained in a separate vector, or each gene in the introduced cell.
  • an IRES internal ribosomal entry site
  • IRES immunodeficiency virus
  • ECMV encephalomyocarditis virus
  • FMDV foot-and-mouth disease virus
  • HAV hepatitis A virus
  • HAV human immunodeficiency virus
  • a vector containing the gene under the control of the promoter can be prepared.
  • Gateway registered trademark
  • cloning the genes alone or in combination from an entry clone (recombinant vector) containing the gene into an expression vector allows the gene to be under the control of a promoter.
  • Vectors containing them can also be made.
  • “including a gene under the control of a promoter” typically means that the gene is arranged downstream of a promoter within a range in which gene expression can be induced by the promoter.
  • the vector may contain a selection marker gene and / or a reporter gene together with a gene encoding a transcription factor, a TET gene and / or a TDG gene.
  • Selection marker genes include, but are not limited to, for example, glufosinate resistance gene, kanamycin resistance gene, gentamicin resistance gene, vancomycin resistance gene, neomycin resistance gene, hygromycin resistance gene, puromycin resistance gene, zeocin resistance gene, blast Examples include antibiotic resistance genes such as a saidine resistance gene, a dihydrofolate reductase gene, and an ampicillin resistance gene.
  • reporter genes include fluorescent protein-coding genes (GFP gene, Venus gene, YFP gene, RFP gene, CFP gene, BFP gene, etc.), luciferase gene, lacZ, and the like.
  • a viral vector containing a gene encoding a transcription factor, a TET gene and / or a TDG gene under the control of a promoter can also be suitably used for gene introduction into a cell.
  • a “virus vector” is a virus particle (including virus-like particles such as pseudotyped viruses) having the ability to introduce a target gene to be retained into a cell by infecting the cell.
  • a pseudovirus is a virus particle packaged to have an envelope containing an envelope component derived from a heterologous virus.
  • the viral vector can be, for example, a retroviral vector or a lentiviral vector.
  • a virus vector can be easily prepared by those skilled in the art using various commercially available virus vector preparation kits.
  • transgenes genes encoding transcription factors, TET genes and / or TDG genes
  • viral structural genes necessary for packaging gag, pol, rev, etc.
  • vesicular stomatitis virus for pseudotyping Vesicular ⁇ Stomatitis293Virus; TVSVG) -derived envelope G glycoprotein (VSV-G) containing a gene encoding a single or separate expression vector under the control of a promoter, transfected into a host cell (eg, 293T cell), After culturing for a certain period of time (for example, 12 to 60 hours, preferably 24 to 48 hours), the culture supernatant containing the generated pseudotyped virus particles is recovered, so that a gene encoding a transcription factor under the control of the promoter
  • a lentiviral vector containing a TET gene and / or a TDG gene can be prepared.
  • a self-inactivating (SIN) lentiviral plasmid vector containing a transgene, a packaging vector that expresses the viral (eg, HIV) structural proteins gag and pol, but lacks accessory and regulatory genes Transfection of plasmid vectors expressing VSV-G and Rev for pseudotyping into host cells (eg, 293T cells), culturing, and collecting the culture supernatant containing the pseudotyped virus particles generated
  • a lentiviral vector can be prepared.
  • the obtained culture supernatant is filtered (for example, with a 0.45 ⁇ m filter), the filtrate is centrifuged (for example, 50,000 x g, 2 hours), the supernatant is discarded, and the pelleted virus particles are collected and appropriately collected. It is preferable to resuspend in a simple solution, such as a physiological isotonic buffered salt solution (Hank's Balanced Salt Solution; HBSS).
  • HBSS Hort Balanced Salt Solution
  • the virus particles thus obtained can be used as a lentiviral vector for gene transfer into cells.
  • an expression vector containing a gene encoding a transcription factor under the control of a promoter into a cell and expressing the transgene, overexpression of the gene in the cell can be caused, Thereby, demethylation specific to transcription factor binding site of DNA in the cell can be enhanced.
  • a single or separate expression vector containing a gene encoding a transcription factor, a TET gene and / or a TDG gene under the control of a promoter is introduced into a cell, and these transgenes are expressed.
  • the cell into which the gene is introduced is not particularly limited, but is preferably derived from the same species or a closely related species to the gene (for example, a cell derived from human or primate if the gene is derived from human).
  • the cell into which the gene is introduced may be derived from any organism, but is preferably derived from an animal, particularly preferably from a mammal.
  • primates such as humans, chimpanzees, gorillas, rats, mice, guinea pigs, hamsters, etc.
  • Examples include cells derived from rodents, domestic animals such as cows, horses, sheep, goats, dogs, cats, rabbits, and the like.
  • the cells may be derived from any tissue or organ, such as bone marrow, blood, muscle, skin, testis, ovary, brain, adipose tissue, gastrointestinal tract, liver, kidney, heart, spleen, mucous membrane, etc. Things.
  • Preferable examples of the cell into which the gene is introduced include epithelial cells (for example, human fetal kidney kidney epithelial cells 293T).
  • Another preferred example of the cell into which the gene is introduced is a hematopoietic cell.
  • hematopoietic cells refer to hematopoietic stem cells and blood cells (particularly nucleated cells) generated from hematopoietic stem cells.
  • hematopoietic stem cells For example, hematopoietic stem cells, megakaryocytes, leukocytes such as lymphocytes (T cells, B cells) , Natural killer cells, etc.), monocytes, dendritic cells, macrophages, granulocytes (neutrophils, eosinophils, basophils), etc., and their precursor cells.
  • the hematopoietic cells according to the present invention may be CD34 + hematopoietic stem / progenitor cells, CD14 + monocytes, peripheral blood mononuclear cells (PBMC) and the like.
  • the cell into which the gene is introduced may be a cell collected from a living body or a cell line established from a cell collected from a living body.
  • the cell into which the gene is introduced may be a cell into which a foreign gene has been introduced in advance.
  • the cell into which the gene is introduced may be a cultured cell.
  • the cell into which the gene is introduced may be a cancer cell, a universal cell (ES cell, iPS cell, etc.) or a stem cell.
  • ES cell a universal cell
  • iPS cell a cell into which the gene is introduced
  • stem cell a cell into which the gene is introduced.
  • Gene transfer into a cell can be achieved by infecting a cell with a viral vector containing a gene encoding a transcription factor under the control of the promoter, or by controlling the promoter of a gene encoding a transcription factor, the TET gene and / or the TDG gene. This can be caused by infecting cells with a single or separate viral vector contained below. In infecting cells with a viral vector, it is also preferable to use a gene transfer promoter such as polybrene or retronectin.
  • gene transfer into a cell can be achieved by a viral vector containing a gene encoding a transcription factor under the control of a promoter, or a single gene containing a gene encoding a transcription factor, TET gene and / or TDG gene under the control of a promoter.
  • it may be carried out by introducing a separate expression plasmid vector into cells by physical or chemical techniques. Plasmid vectors are introduced into cells by commonly used gene transfer methods such as calcium phosphate method, electroporation method, lipofection method, particle gun method, polyethylene glycol (PEG) method, Agrobacterium-mediated transformation
  • the method can be carried out using any method such as a protoplast fusion method.
  • a cell obtained by gene introduction and holding a gene encoding a transcription factor under the control of a promoter can express the gene by the activity of the promoter.
  • a gene obtained by gene transfer encoding a transcription factor under the control of a promoter, and a cell carrying a TET gene and / or a TDG gene can express the gene by the activity of the promoter.
  • constitutive expression of the transgene can be induced by simply culturing the cells, resulting in overexpression of the transgene (compared to wild type cells). be able to.
  • an inducible promoter is used, transient expression of the transgene can be induced by culturing the cells in the presence of an inducer of promoter activity.
  • Cells expressing the transgene can be selected by conventional methods based on the function of the selectable marker gene or reporter gene.
  • the present invention also includes a transformed cell into which a gene encoding a transcription factor has been introduced, and a transformed cell into which a gene encoding a transcription factor and a TET gene and / or a TDG gene have been introduced. provide.
  • a cell into which a foreign gene has been introduced through infection with a virus vector or the like may be referred to as a transduced cell.
  • a gene encoding a transcription factor and a TET gene and / or TDG gene are introduced into a cell and co-expressed, the gene encoding the transcription factor and the TET gene and / or TDG gene are simultaneously introduced into the cell. Or may be performed sequentially. For example, a vector containing a TET gene and a vector containing a TDG gene are introduced into a cell, a transformed cell is selected, and then a vector containing a gene encoding a transcription factor is introduced into the resulting transformed cell.
  • a gene encoding a factor, a TET gene, and a TDG gene may be introduced into the same cell.
  • the selectable marker genes in separate vectors containing the transcription factor-encoding gene, TET gene, and TDG gene are the same, select the cells under the same conditions by infecting these three vectors simultaneously. You may go.
  • demethylation of DNA in the cells is enhanced.
  • demethylation of DNA in a cell overexpressing a gene encoding a transcription factor and a TET gene and / or a TDG gene, demethylation of DNA (genomic DNA or extrachromosomal DNA) in the cell is further enhanced.
  • demethylation specific to a DNA site transcription factor binding site
  • demethylation specific to a transcription factor binding site site-specific is performed in the vicinity of the transcription factor binding site, specifically, a region having a width of about 500 bp ( ⁇ 250 bp) around the transcription factor binding site.
  • a methylation site (typically a CpG site) existing in a region preferably about 400 bp wide ( ⁇ 200 bp) is demethylated.
  • Demethylation other than transcription factor binding site-specific demethylation in cells overexpressing a gene encoding a transcription factor and in cells overexpressing a gene encoding a transcription factor and a TET gene and / or TDG gene the rate of demethylation specific to the transcription factor binding site can be remarkably increased. This is because the overexpressed transcription factor strongly induces demethylation specific to the transcription factor binding site.
  • a cell overexpressing a gene encoding a transcription factor, a gene encoding the transcription factor, and a transcription factor at and near a demethylated site in a cell overexpressing the TET gene and / or TDG gene A transcription factor that induces site-specific DNA demethylation can be selected based on the frequency pattern of the binding motif.
  • a cell overexpressing a gene encoding a transcription factor and a site demethylated in a gene encoding a transcription factor and a cell overexpressing a TET gene and / or a TDG gene may be any methyl group known to those skilled in the art. It can be identified using chemical analysis techniques. First, methylation status of methylation sites (typically CpG sites) in cells that overexpress genes encoding transcription factors, and methylation in cells that do not overexpress genes encoding transcription factors (wild type cells). A methylation site with significantly reduced methylation (or increased demethylation) compared to the methylation status of the site can be determined as a site-specific demethylation site.
  • a gene encoding a transcription factor and a methylation state of a methylation site in a cell overexpressing the TET gene and / or TDG gene and a gene encoding a transcription factor overexpressing the TET gene and / or TDG gene Methylation sites with significantly reduced methylation (or increased demethylation) compared to the methylation status of the methylation sites in cells that do not over-express RNA are determined as site-specific demethylation sites can do.
  • “enhancement” of demethylation means that methylation at a methylation site is reduced (or demethylation as compared with the case where there is no overexpression of a gene encoding a transcription factor as described above. Increase).
  • Detection of methylation status (methylation profile) and identification of demethylation sites can be performed by methylome analysis using a methylation array and / or bisulfite sequencing.
  • a methylated array is an array (beads, microarray, etc.) to which probes for detecting methylation sites on DNA are immobilized.
  • Methylome analysis means a comprehensive analysis of the methylation status of the genome (wide range).
  • Various methylation arrays for methylome analysis are commercially available and can be suitably used in the present invention.
  • Methylome analysis using a methylated array can be performed by various methods depending on the methylated array used.
  • a demethylation site can also be identified by examining the base sequence of a methylation site on DNA by the bisulfite sequencing method.
  • Methylome analysis and bisulfite sequencing using a methylated array can be carried out using commercially available methylated arrays and kits, methylation detection kits, etc. For specific experimental procedures, see the examples below. be able to.
  • the demethylation site identified on the genomic DNA in the cell and its upstream sequence and downstream sequence (eg, ⁇ 10 kbp or less, preferably ⁇ 5 kbp or less upstream and downstream with the demethylation site as position 0) Examine the frequency of transcription factor binding motifs in the region.
  • transcription factor binding sequence databases such as JASPAR (http://jaspar.genereg.net/), TRANSFAC (http://www.gene-regulation.com/index2.html), Genomatix, etc.
  • the transcription factor binding motif of the overexpressed transcription factor may be searched for using the region.
  • a methylation site selected at random, preferably genome-wide, and upstream and downstream sequences thereof (for example, ⁇ 10 kbp or less, preferably ⁇ 5 kbp or less upstream and downstream with the methylation site as position 0
  • the frequency of appearance of the transcription factor binding motif in the region of preferably the same length as in the case of the demethylation site is also determined.
  • a fixed length at a methylation site selected in the vicinity upstream and downstream sequences
  • the appearance probability of a transcription factor-binding motif of a certain length at the same distance from the demethylation site is obtained.
  • the peak of the appearance probability distribution (the position where the appearance frequency is significantly increased) overlaps with the demethylation site.
  • “overlapping with a demethylation site” means that the peak of the appearance probability distribution is located within a distance of ⁇ 500 bp from the demethylation site, for example.
  • a random distribution is selected from a mixed distribution of kernel functions (normal distribution, equalization, etc.) centered on the position of each transcription factor binding motif in the demethylation site and its vicinity (upstream and downstream sequences).
  • the mixing frequency distribution is obtained by subtracting the mixing distribution obtained by adding the kernel functions (normal distribution, equalization, etc.) centering on the position of the transcription factor binding motif in the vicinity of the transcription site and in the vicinity (upstream sequence and downstream sequence).
  • the gene encoding the transcription factor is overexpressed in the cell, or the gene encoding the transcription factor, and the TET gene and / or the TDG gene are overexpressed in the cell to be bisal.
  • the present invention provides a method of screening a transcription factor that induces site-specific DNA demethylation by selecting such a transcription factor.
  • Transcription factor binding site-specific method for enhancing DNA demethylation can induce site-specific DNA demethylation. If a transcription factor that induces site-specific DNA demethylation obtained by the screening method as described above is used, transcription factor-binding site-specific demethylation in DNA in cells can be enhanced. In the present invention, a gene encoding a transcription factor that induces such site-specific DNA demethylation is overexpressed in cells, whereby active DNA demethylation targeting the transcription factor binding site or its vicinity is targeted. Also provided is a method of inducing methylation to high levels and consequently enhancing transcription factor binding site specific demethylation in DNA in cells.
  • a transcription factor binding gene is obtained by overexpressing a gene encoding a transcription factor that induces site-specific DNA demethylation together with a TET gene and / or a TDG gene. It can also promote the induction of active DNA demethylation targeting at or near the site, thereby further enhancing the site-specific demethylation of DNA in the cell.
  • the overexpression of a gene encoding a transcription factor that induces site-specific DNA demethylation and the TET gene and / or TDG gene may be induced by any method. “Overexpression” of these genes is as described above for the screening method.
  • a gene encoding a transcription factor that induces site-specific DNA demethylation, or a gene encoding a transcription factor, and a TET gene and / or TDG gene are introduced into a cell under the control of a promoter. Thus, those genes can be overexpressed in the cell.
  • the introduction of the gene into the cell is the same as described above for the screening method.
  • the transcription factor that induces site-specific DNA demethylation used in the present invention may be a factor that acts on cell differentiation, and examples thereof include hematopoietic transcription factors.
  • the hematopoietic transcription factor refers to a transcription factor that acts on maintenance of hematopoietic stem cells and differentiation of blood cells.
  • Transcription factors that induce site-specific DNA demethylation are not limited to the following, but include the RUNX (Runt-related transcription factor) family, MYOD (Myogenic differentiation) family, C / EBP (CCAAT / enhancer binding protein ) Family, GATA (GATA binding protein) family, MAF (v-maf avian musculoaponeurotic fibrosarcoma oncogene homolog) family, NR4A (nuclear receptor subfamily 4, group A) family (eg NR4A2), and TBX (T-box) family ( For example, it can be a transcription factor such as TBX5).
  • RUNX family transcription factors include RUNX1, RUNX2, and RUNX3.
  • C / EBP family transcription factors include CEBPA, CEBPB, CEBPG, CEBPD, CEBPE, and CEBPZ.
  • An example of a transcription factor of the MAF family is MAF.
  • NR4A family transcription factors include NR4A1, NR4A2, and NR4A3.
  • transcription factors of the MYOD family include MYOD, MYRF, MYF5, MYOG, and MYF6.
  • Examples of GATA family transcription factors include GATA1, GATA2, GATA3, GATA4, GATA5 and GATA6.
  • Examples of TBX family transcription factors include TBX1 to TBX6, TBX10, TBX15, and TBX18.
  • transcription factors that induce site-specific DNA demethylation examples include RUNX1, RUNX3, CEBPA, CEBPB, MAFB, NR4A2, MYOD1, GATA2, and TBX5.
  • Other examples of transcription factors that induce site-specific DNA demethylation include the engrailed (EN) family, HAND family, IRF family, FOXD family, FOXO family, TAL family, TCF family, NFE2L family, and ELF family.
  • a transcription factor that induces site-specific DNA demethylation may have a mutation in a known amino acid sequence, but retains a DNA binding domain and demethylation activity.
  • a transcription factor that induces site-specific DNA demethylation can also be defined by a transcription factor binding motif to which a transcription factor binds.
  • a transcription factor binding motif to which a transcription factor binds.
  • any transcription factor that binds to a transcription factor-binding motif as shown in the examples described later is used. Can be used.
  • a transcription factor binding motif Hand1 Tcfe2a, IRF1, FOXD1, to promote differentiation from iPS cells (iPSC) to hematopoietic progenitor cells (HPC)
  • Any transcription factor that binds to a motif selected from the group consisting of FOXO3, IRF2, TAL1 :: TCF3, NFE2L2, ELF5, NFATC2, BRCA1, RUNX1, SPI1 and SPIB can be used; from HPC to monocytes (MON).
  • ELF5 binds to a motif selected from the group consisting of ELF5, NFATC2, HLF, NFIL3, AP1, BRCA1, RUNX1, SPI1 and SPIB
  • any transcription factor that binds to a motif selected from the group consisting of transcription factor binding motifs IRF1 and ELF5 can be used to promote differentiation from HPC to B cells (BC); and HPC to T Transcription
  • the gene encoding the transcription factor is not limited, but is preferably derived from the same species or closely related species to the cell to be introduced (for example, a gene derived from human or primate if the introduced cell is human).
  • the gene encoding the transcription factor is not limited, but is preferably derived from a mammal, for example, a primate (preferably human).
  • the RUNX1 gene can typically encode a RUNX1 protein consisting of the amino acid sequence represented by SEQ ID NO: 12.
  • the RUNX1 gene used in the present invention may also include a nucleotide sequence represented by SEQ ID NO: 11 that encodes an amino acid sequence represented by SEQ ID NO: 12.
  • the RUNX1 gene of the present invention preferably encodes a protein having the DNA binding domain sequence (SEQ ID NO: 13) located at positions 47 to 184 of the amino acid sequence shown in SEQ ID NO: 12. The position of the DNA binding domain is based on the information obtained with the accession number Q01196 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the RUNX3 gene can typically encode a RUNX3 protein consisting of the amino acid sequence represented by SEQ ID NO: 29.
  • the RUNX3 gene used in the present invention may also include a nucleotide sequence represented by SEQ ID NO: 28 that encodes an amino acid sequence represented by SEQ ID NO: 29.
  • the RUNX3 gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 30) located at positions 52 to 188 of the amino acid sequence represented by SEQ ID NO: 29. The position of the DNA binding domain is based on the information obtained with the accession number Q13761 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the MYOD1 gene can typically encode a MYOD1 protein consisting of the amino acid sequence represented by SEQ ID NO: 32.
  • the MYOD1 gene used in the present invention may also include a base sequence represented by SEQ ID NO: 31 encoding an amino acid sequence represented by SEQ ID NO: 32.
  • the MYOD1 gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 33) located at positions 100 to 170 of the amino acid sequence represented by SEQ ID NO: 32. The position of the DNA binding domain is based on the information obtained with the accession number P15172 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the CEBPA gene can typically encode a CEBPA protein consisting of the amino acid sequence represented by SEQ ID NO: 35.
  • the CEBPA gene used in the present invention may also include a base sequence represented by SEQ ID NO: 34 that encodes an amino acid sequence represented by SEQ ID NO: 35.
  • the CEBPA gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 36) located at positions 280 to 345 of the amino acid sequence represented by SEQ ID NO: 35. The position of the DNA binding domain is based on the information obtained with the accession number P49715 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the CEBPB gene can typically encode a CEBPB protein consisting of the amino acid sequence represented by SEQ ID NO: 38.
  • the CEBPB gene used in the present invention may also include a base sequence represented by SEQ ID NO: 37 that encodes an amino acid sequence represented by SEQ ID NO: 38.
  • the CEBPB gene of the present invention preferably encodes a protein having the sequence of the DNA binding domain (SEQ ID NO: 39) located at positions 269 to 334 of the amino acid sequence represented by SEQ ID NO: 38. The position of the DNA binding domain is based on the information obtained with the accession number P17676 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the GATA2 gene can typically encode a GATA2 protein consisting of the amino acid sequence represented by SEQ ID NO: 41.
  • the GATA2 gene used in the present invention may also include a base sequence represented by SEQ ID NO: 40 encoding an amino acid sequence represented by SEQ ID NO: 41.
  • the GATA2 gene of the present invention preferably encodes a protein having the DNA binding domain sequence (SEQ ID NO: 42) located at positions 289 to 401 in the amino acid sequence represented by SEQ ID NO: 41. The position of the DNA binding domain is based on the information obtained with the accession number P23769 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the MAFB gene can typically encode a MAFB protein consisting of the amino acid sequence represented by SEQ ID NO: 44.
  • the MAFB gene used in the present invention may also include a base sequence represented by SEQ ID NO: 43 that encodes an amino acid sequence represented by SEQ ID NO: 44.
  • the MAFB gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 45) located at positions 211 to 301 of the amino acid sequence represented by SEQ ID NO: 44. The position of the DNA binding domain is based on the information obtained with the accession number Q9Y5Q3 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the NR4A2 gene can typically encode an NR4A2 protein consisting of the amino acid sequence represented by SEQ ID NO: 47.
  • the NR4A2 gene used in the present invention may also include a nucleotide sequence represented by SEQ ID NO: 46 that encodes an amino acid sequence represented by SEQ ID NO: 47.
  • the NR4A2 gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 48) located at positions 260 to 335 of the amino acid sequence represented by SEQ ID NO: 47. The position of the DNA binding domain is based on the information obtained with the accession number P43354 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the TBX5 gene can typically encode a TBX5 protein consisting of the amino acid sequence represented by SEQ ID NO: 73.
  • the TBX5 gene used in the present invention may also include a base sequence represented by SEQ ID NO: 72 that encodes an amino acid sequence represented by SEQ ID NO: 73.
  • the TBX5 gene of the present invention preferably encodes a protein having a DNA binding domain sequence (SEQ ID NO: 74) located at positions 53 to 237 of the amino acid sequence represented by SEQ ID NO: 73. The location of the DNA binding domain is based on the information obtained with accession number Q99593 in the InterPro database (http://www.ebi.ac.uk/interpro/).
  • the RUNX1 gene, RUNX3 gene, MYOD1 gene, CEBPA gene, CEBPB gene, GATA2 gene, MAFB gene, NR4A2 gene, or TBX5 gene used in the present invention are also SEQ ID NO: 12, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, an amino acid sequence in which one or more amino acids are deleted, substituted or added in the amino acid sequence shown by SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, or SEQ ID NO: 73, for example, 1-50
  • Examples of such DNA include, but are not limited to, SEQ ID NO: 12, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, or SEQ ID NO: Examples include DNA encoding an amino acid sequence in which a protein tag is added to the amino terminus or carboxy terminus of the amino acid sequence shown in No. 72.
  • the RUNX1 gene, RUNX3 gene, MYOD1 gene, CEBPA gene, CEBPB gene, GATA2 gene, MAFB gene, NR4A2 gene, or TBX5 gene are also SEQ ID NO: 12, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 35, respectively. 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, or SEQ ID NO: 73, 80% or more, preferably 90% or more, more preferably 95% or more, and still more preferably 98% or more of the amino acid sequence. It may consist of an amino acid sequence exhibiting sex and encode a protein having DNA binding activity.
  • the RUNX1 gene, RUNX3 gene, MYOD1 gene, CEBPA gene, CEBPB gene, GATA2 gene, MAFB gene, NR4A2 gene, or TBX5 gene are also SEQ ID NO: 11, SEQ ID NO: 28, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 34, respectively.
  • TET gene and TDG gene are the same as those described for the above screening method.
  • TET gene and / or TDG gene Overexpression in a cell of a gene encoding a transcription factor that induces site-specific DNA demethylation, TET gene and / or TDG gene is induced by any method as described above for the screening method. do it.
  • a gene encoding a transcription factor that induces site-specific DNA demethylation, a TET gene and / or a TDG gene are usually introduced into cells using a vector (expression vector) containing the gene under the control of a promoter. Can be done by law.
  • the present invention also provides cells with a single or separate expression vector comprising a gene encoding a transcription factor that induces site-specific DNA demethylation, and a TET gene and / or TDG gene under the control of a promoter. Introducing and expressing the transgene can cause overexpression of the gene in the cell, thereby further enhancing transcription factor binding site-specific demethylation of DNA in the cell be able to.
  • the promoter, vector, cell, and gene transfer method to be used are the same as those described for the above screening method.
  • a cell obtained by gene introduction and holding a gene encoding the above transcription factor under the control of a promoter can express the gene by the activity of the promoter.
  • a gene obtained by gene transfer that encodes the transcription factor under the control of the promoter and a cell that retains the TET gene and / or the TDG gene can express the gene by the activity of the promoter.
  • constitutive promoters When constitutive promoters are used, constitutive expression of these genes can be induced by simply culturing the cells, resulting in overexpression of these genes (compared to wild type cells). be able to.
  • inducible promoters transient expression of these genes can be induced by culturing cells in the presence of an inducer of promoter activity.
  • Cells expressing the transgene can be selected by conventional methods based on the function of the selectable marker gene or reporter gene.
  • the present invention relates to a transformed cell into which a gene encoding a transcription factor that induces site-specific DNA demethylation thus obtained, and transcription that induces site-specific DNA demethylation are obtained. Also provided is a transformed cell into which a gene encoding a factor and a TET gene and / or TDG gene have been introduced.
  • a cell into which a foreign gene has been introduced through infection with a virus vector or the like may be referred to as a transduced cell.
  • the gene encoding the transcription factor, and the TET gene and / or TDG gene may be introduced simultaneously or sequentially. For example, by introducing a vector containing a TET gene and a vector containing a TDG gene into a cell, selecting a transformed cell, and then introducing a vector containing a gene encoding the transcription factor into the resulting transformed cell, The gene encoding the transcription factor, TET gene and TDG gene may be introduced into the same cell. Alternatively, if the selectable marker genes in separate vectors containing the above-mentioned transcription factor-encoding gene, TET gene, and TDG gene are the same, select the cells under the same conditions by simultaneously infecting these three vectors. May be performed.
  • a cell overexpressing a gene encoding a transcription factor that induces site-specific DNA demethylation produced as described above demethylation of DNA in the cell is enhanced.
  • a cell that overexpresses a gene encoding a transcription factor that induces site-specific DNA demethylation and TET gene and / or TDG gene demethylation of DNA in the cell (genomic DNA or extrachromosomal DNA) Is further enhanced.
  • demethylation specific to a DNA site (transcription factor binding site) where the introduced transcription factor is recognized and bound is frequently induced.
  • demethylation specific to a transcription factor binding site is within a region of about 500 bp width, preferably about 400 bp ( ⁇ 200 bp) around the transcription factor binding site.
  • the methylation site typically CpG site
  • demethylation other than transcription factor binding site-specific demethylation is performed.
  • the rate of demethylation specific to the transcription factor binding site can be significantly increased. This is because the overexpressed transcription factor strongly induces demethylation specific to the transcription factor binding site.
  • a gene encoding a transcription factor that induces site-specific DNA demethylation is overexpressed in the cell together with the TET gene and the TDG gene, so that the transcription factor binding site of DNA in the cell is specifically determined.
  • the methylation site is not limited to the following, it can be reduced by, for example, 10% or more, more preferably 20% or more, and particularly preferably 50% or more.
  • Transcription factor binding sites in DNA can be determined using, for example, the Clover program (Frith et al., (2004) Nucleic Acids Res., 32: p.1372-1381) and the JASPAR CORE database (ver. 2009) or It can be easily identified using TRANSFAC (http://www.gene-regulation.com/index2.html), Genomatix and the like.
  • the RUNX1 binding motif in the DNA sequence is A (0.1435, 0.1170, 0.0615, 0.0285, 0.0000, 0.0435, 0.0000, 0.0085, 0.0050, 0.0655, 0.2500), C (0.2480, (0.2425, 0.5360, 0.0000,3600.0375, 0.0635, 0.0000, 0.0210, 0.2000, 0.2315, 0.0790), G (0.3480, 0.2335, 0.0745, 0.0035, 0.9360, 0.0350, 0.9935, 0.9240, 0.1255, 0.0405, 0.1445), T (0.2605, 0.4070, 0.3280, 0.9680, 0.0265, 0.8580, 0.0065, 0.0465, 0.6695, 0.6625 0.526 5), and a specific DNA sequence When the score calculated for is 6 or more, the DNA sequence can be identified as a candidate RUNX1 binding site
  • Cells that overexpress genes encoding transcription factors that induce site-specific DNA demethylation, genes that encode transcription factors that induce site-specific DNA demethylation, and TET and / or TDG genes DNA sites that are demethylated in cells overexpressing can be identified by methylation array analysis and / or bisulfite sequencing. More specifically, the methylation state of a methylation site (typically a CpG site) in a cell overexpressing a gene encoding a transcription factor that induces site-specific DNA demethylation is expressed as follows.
  • Methylation sites with significantly reduced methylation (or increased demethylation) compared to the methylation status of methylation sites in cells that do not overexpress the encoded gene (wild type cells) are site-specific It can be determined as a demethylated site.
  • the methylation status of a gene encoding a transcription factor that induces site-specific DNA demethylation and a methylation site (typically a CpG site) in a cell overexpressing the TET gene and / or the TDG gene is significantly compared to the methylation status of methylation sites (typically CpG sites) in cells that overexpress the TET gene and / or the TDG gene but do not overexpress the gene encoding the transcription factor.
  • Methylation sites with reduced (or increased demethylation) can be determined as site-specific demethylation sites. Detection of methylation status (methylation profile) and identification of demethylation sites can be performed by methylation array analysis and / or bisulfite sequencing. Demethylation can be further confirmed by examining the nucleotide sequence of a methylation site identified as a demethylation site by methylation array analysis by the bisulfite sequencing method. Methylation array analysis and bisulfite sequencing can be carried out using commercially available methylation analysis arrays and kits, methylation detection kits, etc., and specific examples of experimental procedures can also be referred to below. . Examples of DNA sites (CpG) that are demethylated in cells overexpressing the RUNX1 gene, TET gene and TDG gene are shown in Tables 1 and 2 below.
  • the site-specific demethylation of DNA in the cell can be further enhanced by overexpressing the gene encoding the transcription factor and the TET gene and / or the TDG gene in the cell.
  • This system can be advantageously used as a research tool for investigating the function of DNA demethylation, since it causes a change in gene expression based on enhanced demethylation specific to a transcription factor binding site.
  • This system can also be used to enhance DNA demethylation in hematopoietic cells and promote blood cell differentiation.
  • overexpression of genes encoding transcription factors or overexpression of genes encoding transcription factors and TET and / or TDG genes in all-purpose cells (ESC, iPS cells, etc.), hematopoietic stem cells or hematopoietic progenitor cells By doing so, the hematopoietic gene is activated (that is, gene expression is induced by releasing the expression suppression in the promoter region of the gene), and the fate determination of the cell to the hematopoietic system can be strongly promoted.
  • the transcription factor-encoding gene to be overexpressed is not limited to the following, for example, engrailed (EN) family, NR4A family, HAND family, IRF family, FOXD family, FOXO family, TAL family, TCF family, NFE2L family , ELF family, NFATC family, HLF family, NFIL3 family, AP1 family, BRCA family, RUNX family, and SPI family encoding transcription factors.
  • EN engrailed
  • This system can also be advantageously used for screening for drugs that affect demethylation specific to transcription factor binding sites (demethylation regulators).
  • a cell overexpressing a gene encoding a transcription factor, or a cell overexpressing a gene encoding a transcription factor and a TET gene and / or a TDG gene is used as a test substance (preferably Treated with a test substance by culturing in the presence of a demethylation regulator candidate), the methylated state of DNA in the treated cells is evaluated, and compared with cells in the absence of the test substance What is necessary is just to detect the fluctuation
  • a cell in which a gene encoding a transcription factor is overexpressed in a cell, or a cell in which a gene encoding a transcription factor and a TET gene and / or a TDG gene are overexpressed in the cell Culture may be performed in the absence of the test substance, and the methylation state of DNA in the cells may be evaluated.
  • evaluation of the methylation state of DNA means measurement of methylation level (number, relative amount or ratio of methylated methylation sites (CpG sites, etc.), or methylated methylation sites (CpG sites). Etc.) or an evaluation of an arbitrary methylation index or the like such as specifying the distribution thereof, but is not limited thereto.
  • the test substance is removed from the transcription factor binding site-specific site. It can identify as a demethylation regulator (demethylation inhibitor) which has the effect
  • the test substance is It can be identified as a demethylation regulator (demethylation enhancer) having an action of further enhancing the demethylation.
  • test substance is promoted to demethylate at that specific site. It can also be identified as a demethylation regulator (demethylation promoter) having the action of Such a screening method for a demethylation regulator is useful for searching for candidate substances for the treatment / prevention of a disease caused by methylation or abnormal demethylation.
  • the test substance applied to this screening method is not particularly limited, and examples thereof include low molecular or high molecular organic compounds, proteins, peptides, amino acids, nucleic acid molecules such as siRNA and shRNA, and inorganic compounds.
  • the test substance may also be a known drug such as an anticancer drug.
  • the demethylation activity of a test substance can also be detected using the same procedure as this screening method.
  • the “demethylation activity” of a test substance means an activity that promotes demethylation of a methylation site in DNA.
  • a cell overexpressed with a gene encoding a transcription factor, or a cell overexpressed with a gene encoding a transcription factor and a TET gene and / or a TDG gene is cultured in the presence of the test substance. Treating and evaluating the methylation status of the DNA in the treated cells and detecting the demethylation activity of the test substance by detecting changes in the methylation status compared to cells in the absence of the test substance. it can.
  • the present invention also provides a method for detecting the demethylation activity of such a test substance.
  • the test substance applied to this method and the DNA methylation state evaluation method are the same as the screening method for the demethylation regulator.
  • 293T cells used in the following examples were obtained from RIKEN BioResource Center (RIKEN BRC) (Japan). 293T cells were cultured in poly-D-lysine-coated culture plates (Beckton Dickinson and Co., Franklin Lakes, NJ, USA) in 10% fetal calf serum, penicillin and streptomycin (final concentrations 100 U / mL, 100 ⁇ g / Cultured in Dulbecco's Modified Eagle Medium (DMEM) (Wako Pure Chemical Industries, Ltd, Osaka, Japan) supplemented with mL; mLThermo Fisher Scientific Inc.,. Waltham, MA, USA).
  • DMEM Dulbecco's Modified Eagle Medium
  • Pair hyg forward: 5'-AATATGGCCACAACCGCGGCCGCGACTCTAGAT-3 '(SEQ ID NO: 1) and reverse: 5'-TAGAGTCGCGGCCGCCTATTCCTTTGCCCTCGG-3' (SEQ ID NO: 2)
  • primer pair puro forward: 5'-AATATGGCCACAACCATGACCGAGTACAAGCCCACG-3 '(sequence No. 3) and reverse: 5′-TAGAGTCGCGGCCGCTCAGGCACCGGGCTTGCG-3 ′ (SEQ ID NO: 4) was used for amplification with KOD-plus DNA polymerase (Toyobo Co).
  • the obtained PCR products were respectively inserted and ligated into linearized pIRES2 plasmid DNA using In-Fusion (registered trademark) cloning technology (Clontech) to prepare recombinant plasmids pIRES2-hyg and pIRES2-puro.
  • the linearized pIRES2 plasmid DNA was prepared by using the forward primer 5'-GCGGCCGCGACTCTAGATCATAATC-3 '(SEQ ID NO: 5) and the reverse primer 5'-GGTTGTGGCCATATTATCATCGTGTTTTTC-3 except for the DsRed-Express2 sequence of pIRES2-DsRed-Express2 (Clontech). It was prepared by amplifying using '(SEQ ID NO: 6).
  • primer pairs for IRES2-hyg forward: 5'-CCGCGGATCCTCTAGGCCCCTCTCCCTCCCCCC-3 '(SEQ ID NO: 7), reverse: 5'-CGATGTTAACTCTAGCTATTCCTTTGCCCTCGGACGAGTGTG-3' (SEQ ID NO: 8)
  • a primer pair for IRES-puro forward: 5'-CCGCGGATCCTCTAGGCCCCTCTCCCTCCCCCC-3 '(SEQ ID NO: 9) and reverse: 5'-CGATGTTAACTCTAGTCAGGCACCGGGCTTGCGGGT-3' (SEQ ID NO: 10)
  • IRES2-hyg fragment and IRES2- The puro fragment was amplified.
  • the human TET2 gene (SEQ ID NO: 16; the encoded amino acid sequence is shown in SEQ ID NO: 17; GenBank accession number NP_001120680) or the human TET3 gene (sequence) No. 18; the encoded amino acid sequence is shown in SEQ ID NO: 19; from the Gateway® entry clone (Thermo Scientific, Gene Copoiea) of GenBank Accession No.
  • NP_001274420 by the LR reaction of Gateway technology, the TET2 gene or the TET3 gene Plasmid vectors TET2-HygR and TET3-HygR that can constitutively express both blasticidin resistance genes under the control of the EF1 ⁇ promoter were prepared.
  • the blasticidin resistance gene was obtained from the vector pCMV-Bsd (Life Technologies) from the primer pair (forward: 5'-AATATGGCCACAACCATGGCCAAGCCTTTGTCTCAAGAAG-3 '(SEQ ID NO: 20) and reverse: 5'-TAGAGTCGCGGCCGCTTAGCCCTCCCACACATAACCAG-3' (SEQ ID NO: 21). ) And was amplified by PCR using KOD-plus DNA polymerase (Toyobo Co).
  • Gateway registered trademark entry clone (Thermo Scientific) of the human TDG gene (SEQ ID NO: 22; the encoded amino acid sequence is shown in SEQ ID NO: 23; GenBank accession number NP_003202)
  • the plasmid vector TDG-BsdR which can constitutively express both the TDG gene and the blasticidin resistance gene under the control of the EF1 ⁇ promoter, was prepared by the LR reaction of Gateway technology.
  • the plasmid vector CSII-EF-RfA-IRES2-Venus transferred from Dr. Hiroyuki Miyoshi of RIKEN BRC was transferred to both the RUNX1 and Venus genes from the Gateway (registered trademark) entry clone of the RUNX1 gene by the LR reaction of Gateway technology.
  • a plasmid vector RUNX1-Venus that can be constitutively expressed under the control of the EF1 ⁇ promoter was prepared.
  • FIG. 1 A schematic diagram of the above plasmid vector is shown in FIG.
  • lentiviral vector (pseudovirus particle)
  • a lentiviral vector was prepared according to the method described in Suzuki et al., PLos ONE, (2012) Vol.7, (3) e33474. Briefly, 293T cells (4 x 10 6 cells) were seeded 24 hours prior to transfection in 10 cm dishes coated with poly-D-lysine (Becton, Dickinson and Co., Franklin Lakes, NJ, USA). . One hour before transfection, the medium was fresh medium supplemented with 5% fetal calf serum and 25 ⁇ M chloroquine (Opti-MEM (Thermo Fisher Scientific Inc.
  • Lentiviral expression plasmid vector RUNX1-PuroR containing RUNX1 gene and puromycin resistance gene prepared above was transferred from packaging plasmids pCMV-VSV-G-RSV-Rev and pCAG-HIVgp (both from Dr. Hiroyuki Miyoshi of RIKEN BRC) ) Were transfected into 293T cells using Fugene® HD transfection reagent (Promega Corp., Madison, Wis., USA).
  • the other lentiviral expression plasmid vectors TET2 / TET3-HygR, TDG-BsdR, and RUNX1-Venus prepared in 2) above were also transfected into 293T cells together with the packaging plasmid and obtained after culture.
  • Packaged pseudotyped virus particles were obtained and stored.
  • the obtained lentiviral vectors were named TET2-hygVP, TDG-bsdVP, and RUNX1-venusVP, respectively.
  • the empty vector is a lentiviral vector obtained by transfecting the same lentiviral expression plasmid vector with the above packaging plasmid into 293T cells except that it contains a puromycin resistance gene but does not contain the RUNX1 gene. Pseudotype virus particles). The resulting 293T-RUNX1 cells constitutively (constantly) overexpress RUNX1.
  • both the lentiviral vector TET2-hygVP or TET3-hygVP prepared above and the lentiviral vector TDG-BsdVP were infected with 293T cells at 1 MOI (Multiplicity ⁇ Of Infection) using 8 ⁇ g / mL polybrene, 293T-TET2-TDG cells and 293T-TET3-TDG cells were prepared by transduction (FIG. 2B). Transduced cells were selected by culturing for 7 days in the presence of hygromycin (final concentration 100 ⁇ g / mL) and blasticidin (final concentration 20 ⁇ g / mL) (FIG. 2B). The resulting 293T-TET2-TDG cells and 293T-TET3-TDG cells constitutively (constantly) overexpress TET2 or TET3 and TDG.
  • the lentiviral vector (RUNX1-Venus lentiviral vector) containing the RUNX1 gene and the Venus gene prepared above was prepared at 1 MOI using 8 ⁇ g / mL polybrene, and the 293T-TET2-TDG cell or 293T prepared above.
  • -TET3-TDG cells were infected and transduced to produce 293T-TET2-TDG-RUNX1 cells and 293T-TET3-TDG-RUNX1 cells, respectively (FIG. 2B).
  • Transduced cells were purified from Venus positive cells by FACS (registered trademark) sorting using Venus fluorescence using a SORP FACSAria TM II cell sorter (Becton, Dickinson and Co.) 7 days after infection treatment (Fig. 2B).
  • FACS registered trademark
  • SORP FACSAria TM II cell sorter Becton, Dickinson and Co.
  • transduced cells were constructed that constitutively (constantly) expressed (overexpressed) the transgene.
  • Example 2 Methylation array analysis
  • the transduced cells prepared in Example 1 were profiled for genome-wide DNA methylation using an Infinium (registered trademark) HumanMethylation450 BeadsChip array (Illumina Inc.).
  • Genomic DNA was extracted from the transduced cells by a conventional method.
  • Genomic DNA treated with EZ DNA Methylation-Gold TM Kit was hybridized to a methylated array according to the manufacturer's instructions. From the obtained methylated array signal data, the M value indicating the degree of methylation was calculated for each probe on the methylated array using lumi of the Bioconductor package for Illumina microarray data processing.
  • Table 1 shows the demethylated probes identified in 293T-TET2-TDG-RUNX1 cells.
  • Table 2 shows the demethylated probes identified in 293T-TET3-TDG-RUNX1 cells.
  • the probe ID is a probe ID number of Infinium (registered trademark) HumanMethylation450 BeadsChip.
  • the CpG position is a C base number determined based on the human genome reference sequence version hg19 (UCSC Genome Bioinformatics; http://hgdownload.cse.ucsc.edu/downloads.html).
  • methylation probes and demethylation probes in the absence of RUNX1, ie, 293T-TET2-TDG cells and 293T-TET3-TDG cells were also identified.
  • the M value of each probe in 293T-TET2-TDG cells and 293T-TET3-TDG cells was compared with the M value in 293T-mock cells.
  • a scatter plot based on the M value is shown in FIG. In FIG.
  • FIG. 3 shows that demethylation is induced by overexpression of RUNX1. Further, from the comparison between FIG. 3 and FIG. 4, when RUNX1 is overexpressed together with TET and TDG, it may shift to demethylation enhancement rather than methylation enhancement compared to the case where TET and TDG are overexpressed. Indicated.
  • Example 3 Analysis of site specificity of DNA demethylation
  • 293T-RUNX1 Two probes that were demethylated in (the PTPN22 gene and the RUNX3 gene, respectively) were randomly selected, and the vicinity of these probes was analyzed by bisulfite sequencing.
  • Genomic DNA used for bisulfite sequencing can be obtained from 293T-mock cells and 293T-RUNX1 cells using the NucleoSpin® Tissue Kit (Macherey-Nagel GmbH & Co. KG, Duren, Germany) according to the manufacturer's instructions. Isolated. Using methylation detection kit EZ DNA Mathylation-Gold TM Kit (Zymo Research Corp., Irvine, CA, USA), unmethylated cytosine of genomic DNA was converted to uracil by bisulfite treatment.
  • the target genomic region is converted into a primer pair for PPN22 gene (forward: 5'-TTGTTTTGGGTTTTATTTAGGA-3 '(SEQ ID NO: 24), reverse: 5'-AATAATCTCAATTAAACAAACCACA-3' (SEQ ID NO: 25) )
  • a primer pair for RUNX3 gene forward: 5′-TTAAGGAAAGTAAGTTTTTGTTTGT-3 ′ (SEQ ID NO: 26); reverse: 5′-ACTAAAAAAACCTAATCCCTCA-3 ′ (SEQ ID NO: 27)
  • EpiTaq TM HS (Takara Bio Inc. .) was amplified according to the manufacturer's instructions.
  • the obtained PCR product was cloned into the pTA2 plasmid using TArget TM Clone KIt (Toyobo Co., Ltd.) and 3730 ⁇ 1 using BigDye (registered trademark) Terminator Ver3.1 Cycle Sequencing Kit (Thermo Fisher Scientific Inc.). Sequencing was performed with DNA Analyzer (Thermo Fisher Scientific Inc.). Twenty-four clones were sequenced for each target. In the obtained base sequence, the sequence of methylated CpG was detected as CG, and the sequence of unmethylated CpG was detected as TG.
  • FIG. 5 schematically shows the result. In FIG.
  • the RUNX1 binding motif appeared most frequently around the demethylated CpG site identified in any cell.
  • the RUNX1 binding motif is the CpG of the demethylated probe in all of 293T-RUNX1 cells, 293T-TET2-TDG-RUNX1 cells, and 293T-TET3-TDG-RUNX1 cells. It was concentrated around the site (demethylated CpG) (solid line in FIG. 6). A considerable number of RUNX1 binding motifs were located in the vicinity of demethylated CpG, particularly within ⁇ 200 bp. In contrast, the RUNX1 binding motif was evenly distributed over the CpG sites of 145 probes randomly selected from all probes (dotted line in FIG. 6).
  • RUNX1 induces DNA demethylation specific to the RUNX1 binding site within a region of approximately 400 bp including the RUNX1 binding motif.
  • the demethylation sites to be investigated are CpGs of 451 demethylation probes (hereinafter referred to as RUNX1 target probes) identified in 293T-TET2-TDG-RUNX1 cells and 293T-TET3-TDG-RUNX1 cells. For comparison, the DNA methylation status of all probes on the array was also examined.
  • ESC embryonic stem cells
  • CD34 CD34 + hematopoietic stem / progenitor cells
  • CD14 + monocytes CD14
  • PBMC peripheral blood mononuclear cells
  • RUNX1 target probe was used as an unmethylated probe and M ⁇ 0 using M ⁇ 0 as an index. It was classified as a methylated probe as an index.
  • FIG. 7 when divided into four regions as indicated by dotted lines, the probe methylated by both ESC and CD34, CD14, or PBMC is in the upper right (MM), and methylated by ESC is CD34, CD14. Probes that were not methylated with PBMC are plotted in the lower right (MU).
  • Table 6 shows the genes corresponding to the RUNX1 target probe in the MU group that showed increased gene expression in CD34, CD14 or PBMC compared to ESC.
  • RUNX1 contributes to the differentiation of hematopoietic cells by activating hematopoietic genes through demethylation.
  • Example 5 Promotion of site-specific demethylation induction by co-expression of various transcription factors with TET and TDG
  • TET variant a gene encoding another transcription factor (Table 7)
  • TET variant a TET1 partial fragment containing an enzyme active site as a TET gene
  • TET gene and TDG gene in the same manner as in Example 1 except that the encoded TET gene variant (base sequence: SEQ ID NO: 49, amino acid sequence: SEQ ID NO: 50; corresponding to positions 4204 to 6408 of SEQ ID NO: 14) is used.
  • TDG gene used is the same as in Example 1.
  • methylation array analysis was performed using an Infinium (registered trademark) HumanMethylation450 BeadsChip array, the M value of each probe was calculated, and the M value was compared between the cells, thereby demethylating. Was confirmed and a demethylated probe was identified.
  • a transcription factor binding motif was searched for the base sequence in the region of ⁇ 5 kbp from the demethylated CpG site of each probe.
  • a statistical analysis was performed on the search result of the transcription factor binding motif obtained by the method described in Example 3. Specifically, a transcription factor binding motif in the sequence near the demethylated CpG site ( ⁇ 5 kbp) in the demethylated probe when each transcription factor is overexpressed in 293T cells with TDG and TET or a TET variant. From the mixed distribution of the standard normal distribution centered at the position of, the mixed distribution of the standard normal distribution centered at the position of the transcription factor binding motif in the neighboring sequence ( ⁇ 5kbp) of the randomly selected probe was subtracted to obtain a mixing frequency distribution. This mixed frequency distribution is a background-corrected frequency distribution of transcription factor binding motifs in the vicinity of the demethylated probe.
  • Example 3 The same analysis was performed for RUNX1, which was searched for transcription factor binding motifs in Example 3. The obtained mixing frequency distributions are shown in FIGS. On the other hand, the same transcription factor binding motifs were searched and analyzed for PAX4 (NCBI RefSeq protein accession number NP_006184) and NKX2-5 (NCBI RefSeq protein accession number NP_004378). The result is shown in FIG. “293T-TcdT” represents 293T cells overexpressing a TET variant (Tcd; TET catalytic domain) and TDG (T). “293T-TcdT-RUNX1” represents a TET variant, 293T cells overexpressing TDG and RUNX1. 293T cells in which other transcription factor genes are overexpressed are similarly expressed.
  • Example 2 and Example 3 the vicinity of the demethylation probe was analyzed by bisulfite sequencing, and it was confirmed that demethylation actually occurred in a site-specific manner.
  • the primer pair for demethylation region amplification used in the bisulfite sequence is as follows.
  • Example 6 Demethylation of SPI1 gene control region by RUNX1 overexpression
  • demethylation of SPI1 gene control region of genomic DNA was induced.
  • 293T cells overexpressing RUNX1 and 293T cells (transduced cells) into which an empty lentiviral vector was introduced as a negative control were prepared.
  • Primer pair for the SPI1 regulatory region forward: 5′-GTTGGATATTTTTTTGAGGTTTGG-3 ′ (SEQ ID NO: 69), reverse: 5′-TAAAACCTAAAACTACTAAACCCA-3 ′ (SEQ ID NO: 70) was used to analyze the methylation status of the SPI1 control region by bisulfite sequencing.
  • Example 7 Promotion of site-specific demethylation induction by TBX5 TET gene and TDG gene in the same manner as in Example 5 except that a gene encoding transcription factor TBX5 (GenBank accession number Q99593) is used.
  • a transcription factor binding motif was searched for the base sequence in the region of ⁇ 5 kbp from the methylated CpG site, and the search results were statistically analyzed. The obtained results are shown in FIG. The maximum peak value was 173.200, and (IQRx3) + Q3 was 71.141.
  • FIG. 25 even when TBX5 was used, the binding motif was concentrated around the demethylated CpG site. This indicates that TBX5 induces site-specific DNA demethylation.
  • iPSC iPSC-253G1; RIKEN Bio-resource Center (BRC), HPS0002
  • CD34 + hematopoietic progenitor cells HPC
  • HPC hematopoietic progenitor cells
  • MON monocytes
  • TC CD3 + T cells
  • BC CD19 + B cells
  • genomic DNA was isolated using a NucleoSpin (registered trademark) ⁇ ⁇ ⁇ Tissue kit (Macherey-Nagel), and methylation analysis was performed using Infinium (registered trademark) HumanMethylation450 BeadsArray (Illumina). Normalization and calculation of M-value were performed using lumi Bioconductor package (Du et al., 2008; Yousefi et al.,) 2013).
  • i and j represent transcription factor binding motifs identified in the DMC region and randomly selected controls, respectively
  • ⁇ t and ⁇ c represent transcription factor binding motifs in the DMC region and randomly selected controls, respectively. Represents each position.
  • the smoothing parameter h was calculated as 50, and K was calculated as a Gaussian kernel function.
  • DNA methylation status as shown by methylation analysis was determined between iPS cells and HPC (iPSC-HPC) and between HPC and one of the three terminally differentiated hematopoietic cell types (HPC-MON, HPC-BC and HPC-TC), 32,434, 12,410, 10,278, and 26,376 demethylated CpG were identified in iPSC-HPC, HPC-MON, HPC-BC, and HPC-TC, respectively.
  • TFBM human or mouse transcription factor binding motifs registered in the JASPAR CORE database (Sandelin, A. et al., (2004) Nucleic Acids Res., 32, D91-94), iPSC- In HPC, HPC-MON, HPC-BC, and HPC-TC, 13, 9, 2, and 8 excess motifs were identified in the demethylated region, respectively (FIG. 26).
  • FIG. 26 the maximum enrichment score of the over-appearing transcription factor binding motif found in the vicinity of DMC was visualized as a heat map for the demethylated region.
  • the transcription factor binding motif shown on the right side of FIG. 26 was concentrated during the cell differentiation process of any of iPSC-HPC, HPC-MON, HPC-BC, and HPC-TC.
  • concentration level is indicated by the concentration corresponding to the concentration score. The higher the enrichment score, the easier it is to induce demethylation.
  • the enrichment shown in the figure shows the relationship with the demethylation of the transcription factor binding motif in each cell differentiation process.
  • NR4A2 is involved in differentiation from hematopoietic progenitor cells (HPC) to T cells (TC), and NFATC2 is differentiated from iPS cells (iPSC) to hematopoietic progenitor cells (HPC) and from HPC to monocytes (MON). It is shown from FIG. 26 that it is involved in the differentiation into.
  • Hematopoietic progenitor cells are cells that are the origin of various blood cells.
  • transcription factors that bind to transcription factor-binding motifs enriched in HPC differentiation and differentiation from HPC to monocytes (MON), T cells (TC), and B cells (BC) are removed during blood cell differentiation. It plays an important role in methylation, and is thought to promote direct reprogramming of blood cells and differentiation from universal cells (iPS cells and ES cells).
  • the transcription factor binding motif concentrated in terminal differentiation HPC-MON, HPC-BC, and HPC-TC
  • HPC-TC transcription factor binding motif concentrated in terminal differentiation
  • introduction of transcription factors that bind to each transcription factor binding motif into HPC is thought to promote specific terminal differentiation induction from HPC.
  • Table 9 shows representative examples of transcription factors that can bind to the transcription factor binding motif shown in FIG.
  • the Jasper IDs of the transcription factor binding motifs SPIB, IRF1, and IRF1 are MA0081.1, MA0050.1, and MA0051.1, respectively.
  • the present invention obtains a transcription factor that induces a high level of transcription factor binding site-specific DNA demethylation, and can be used as a tool for enhancing site-specific DNA demethylation in intracellular DNA. .
  • the present invention can also be used for screening for a drug that suppresses or enhances DNA demethylation specific to a transcription factor binding site and for detecting demethylation activity of a test substance.
  • the present invention can be used for the development of an anticancer agent having a low side effect that acts on a specific site with high efficiency and for improving the efficiency of cell reprogramming or direct reprogramming.
  • SEQ ID NOs: 1 to 10 Primer SEQ ID NO: 11: RUNX1 gene base sequence SEQ ID NO: 12: RUNX1 amino acid sequence SEQ ID NO: 13: DNA binding domain of RUNX1 SEQ ID NO: 14: TET1 gene base sequence SEQ ID NO: 15: TET1 amino acid sequence SEQ ID NO: 16: TET2 gene base sequence SEQ ID NO: 17: TET2 amino acid sequence SEQ ID NO: 18: TET3 gene base sequence SEQ ID NO: 19: TET3 amino acid sequence SEQ ID NO: 20 and 21: primer SEQ ID NO: 22: TDG gene base sequence SEQ ID NO: 23 TDG amino acid sequence SEQ ID NO: 24-27: primer SEQ ID NO: 28: base sequence of RUNX3 gene SEQ ID NO: 29: RUNX3 amino acid sequence SEQ ID NO: 30: DNA binding domain of RUNX3 SEQ ID NO: 31: base sequence of MYOD1 gene SEQ ID NO: 32: MYOD1 amino acid SEQ ID NO: 33: DNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Urology & Nephrology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Pathology (AREA)
  • Toxicology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本発明は、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を、細胞中で過剰発現させることを含む、細胞中のDNAにおける転写因子結合部位特異的な脱メチル化を増強する方法、及び転写因子をコードする遺伝子を細胞中で過剰発現させ、その細胞中のDNAにおいて脱メチル化された部位を同定し、同定された脱メチル化部位とその上流配列及び下流配列における転写因子結合モチーフの出現頻度に基づいて、部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法を提供する。

Description

転写因子結合部位特異的なDNA脱メチル化方法
 本発明は、部位特異的なDNA脱メチル化方法に関する。
 DNAのメチル化は遺伝子発現を抑制するエピジェネティックな修飾であり、遺伝子発現のオン・オフを規定している。ゲノムDNA上のCpG部位での正しいDNAメチル化パターンは、発生、配偶子形成、及び体細胞分化において必須である。異常なDNAメチル化はしばしば細胞のがん化を引き起こすことが知られている。そのため近年では、DNAメチル化阻害剤などが抗がん剤として使用され始めている。例えば、DNAメチル化に異常があることが知られている骨髄異形成症候群(MDS)や急性骨髄性白血病(AML)に対し、DNAメチル化をターゲットとしたがん治療戦略が有効であることが分かってきており、DNAメチル化阻害剤であるアザシチジン(商品名ビダーザ)などが治療薬として一定の成果を上げている。しかし、従来のいわゆるエピゲノム薬は非特異的にエピゲノムに作用するため、しばしば深刻な副作用が生じる。さらに、その作用メカニズムが明らかではないため適応は限定的であり、現時点では固形がんへの治療には用いられていない。どの部位のメチル化異常ががんの発生に重要な役割を果たしているのかを明らかにすることができれば、新規の癌マーカーや効率的な治療薬の創薬ターゲットの探索に重要な知見を与えることが期待される。そのためには、部位特異的にDNA脱メチル化を誘導し、その効果を逆遺伝的に調べるアプローチが有効であると考えられる。しかし、部位特異的にDNA脱メチル化を誘導する技術はまだ確立されていない。
 また、近年注目されている細胞リプログラミングではその効率の低さや不完全なリプログラミングが問題となっている。細胞リプログラミングにおいては、エピジェネティック因子の初期化がその効率増加や不完全さを回避するために重要である。実際、DNAメチル化阻害剤やヒストン脱アセチル化阻害剤での処理によってiPS細胞の作製効率が上がることが知られている(非特許文献1)。しかし、抗がん剤と同様に従来のそれら薬剤による処理は非特異的に働くため、DNAのどの部位がリプログラミング効率の向上に寄与しているのかは判明していない。
 DNA脱メチル化の部位特異性を決定する因子として、NANOG、EBF1、SPI1(PU.1)、PPARγが同定されている(非特許文献2~5)。また、チミンDNAグリコシラーゼ(TDG)をDNA結合ドメインであるNFκB由来Rel-ホモロジードメイン(RHD)に連結させた融合タンパク質を用いて部位特異的な脱メチル化に成功したという報告がある(非特許文献6)。また、TETタンパク質をTALEドメインと連結させた融合タンパク質を用いて部位特異的な脱メチル化に成功したという報告もある(非特許文献7)。しかしこれらの方法には、脱メチル化誘導効率が十分ではない、又は極めて限られた特定部位をターゲットとした脱メチル化しか誘導できないなどの問題がある。そのため、部位特異的な脱メチル化をより効率的に誘導可能な方法の開発が望まれている。
Theunissen, T.W. et al., (2011) Current Biology 21: p.65-71 Costa Y., et al., (2013) Nature 495: p.370-374 Guilhamon P., et al., (2013) Nature Communications 4: p.2166 de la Rica L., et al., (2013) Genome Biology 14: R99 Fujiki K., et al., (2013) Nature Communications 4: p.2262 Gregory D.J., et al., (2012) Epigenetics 7: p.344-349 Maeder M.L., et al., (2013) Nature Biotechnology 31: p.1137-1142
 本発明は、部位特異的なDNA脱メチル化を高レベルに誘導する方法を提供することを目的とする。
 本発明者らは、上記課題を解決するため鋭意検討を重ねた結果、所定のスクリーニング方法により部位特異的なDNA脱メチル化を誘導できる転写因子を選抜できること、そのような転写因子を細胞中で過剰発現させることにより、転写因子結合部位特異的なDNA脱メチル化を高レベルに誘導できること、さらにそのような転写因子をTET及びTDGと共に細胞中で過剰発現させることにより転写因子結合部位特異的なDNA脱メチル化をさらに増強できることを見出し、本発明を完成するに至った。
 すなわち、本発明は以下を包含する。
[1] 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を、細胞中で過剰発現させることを含む、細胞中のDNAにおける転写因子結合部位特異的な脱メチル化を増強する方法。
[2] 前記転写因子が、RUNXファミリー、C/EBPファミリー、MAFファミリー、NR4Aファミリー、MYODファミリー、GATAファミリー、及びTBXファミリーの転写因子からなる群から選択される、上記[1]に記載の方法。
[3] 前記転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させることを含む、上記[1]又は[2]に記載の方法。
[4] 前記転写因子が、RUNX1、RUNX3、CEBPA、CEBPB、MAFB、NR4A2、MYOD1、GATA2、及びTBX5からなる群から選択される、上記[1]~[3]のいずれかに記載の方法。
[5] TET遺伝子がTET2遺伝子又はTET3遺伝子である、上記[3]に記載の方法。
[6] TET遺伝子が全長TETタンパク質又は酵素活性部位を含むその断片をコードする、上記[3]又は[5]に記載の方法。
[7] 転写因子をコードする遺伝子を細胞中で過剰発現させ、その細胞中のDNAにおいて脱メチル化された部位を同定し、同定された脱メチル化部位とその上流配列及び下流配列における転写因子結合モチーフの出現頻度分布をその脱メチル化部位からの距離を変数として求め、そこから、ランダムに選択されたメチレーション部位とその上流配列及び下流配列における転写因子結合モチーフの出現頻度分布を差し引き、得られるバックグラウンド補正された出現頻度分布が前記距離X=0付近を頂点としたピークを形成する転写因子を選抜することを含む、部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法。
[8] 転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させる、上記[7]に記載の方法。
[9] TET遺伝子が全長TETタンパク質又は酵素活性部位を含むその断片をコードする、上記[8]に記載の方法。
[10] メチル化アレイを用いたメチローム解析により、脱メチル化された部位を同定する、上記[7]~[9]のいずれかに記載の方法。
[11] 細胞が哺乳動物細胞である、上記[1]~[10]のいずれかに記載の方法。
[12] 哺乳動物細胞がヒト細胞である、上記[11]に記載の方法。
[13] 上記[7]~[10]のいずれかに記載の方法によって得られる部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子をプロモーターの制御下で導入した、形質転換細胞。
[14] 前記転写因子が、RUNXファミリー、C/EBPファミリー、MAFファミリー、NR4Aファミリー、MYODファミリー、GATAファミリー、及びTBXファミリーの転写因子からなる群から選択される、上記[13]に記載の形質転換細胞。
[15] 上記[13]又は[14]に記載の形質転換細胞を被験物質の存在下で培養し、その細胞中のDNAのメチル化状態を評価し、被験物質不在下の細胞と比較したメチル化状態の変動を検出することを含む、被験物質の脱メチル化活性の測定方法。
 本明細書は本願の優先権の基礎となる日本国特許出願番号2015-180184号の開示内容を包含する。
 本発明によれば、部位特異的なDNA脱メチル化を高レベルに誘導することができる転写因子を選抜することができ、その転写因子を用いてDNAにおける部位特異的な脱メチル化を増強することができる。
図1は、実施例で用いた、レンチウイルスベクター作製用のプラスミドベクターの概略構造を示す。 図2は、実施例で用いたレンチウイルスベクターの作製手順を示す概略図である。Aは293T-RUNX1細胞の作製手順、Bは293T-TET2-TDG-RUNX1細胞及び293T-TET3-TDG-RUNX1細胞の作製手順を示す。 図3は、2細胞株間でプローブのM値を比較するためのスキャッタープロットである。Aは293T-mock細胞と293T-RUNX1細胞間、Bは293T-TET2-TDG細胞と293T-TET2-TDG-RUNX1細胞間、Cは293T-TET3-TDG細胞と293T-TET3-TDG-RUNX1細胞間の比較である。小さなドット1つずつが各プローブに対応する。 図4は、2細胞株間でプローブのM値を比較するためのスキャッタープロットである。Aは293T-mock細胞と293T-TET2-TDG細胞間、Bは293T-mock細胞と293T-TET3-TDG細胞間の比較である。小さなドット1つずつが各プローブに対応する。 図5は、293T-mock細胞及び293T-RUNX1細胞におけるPTPN22及びRUNX3領域のバイサルファイトシークエンスの結果を示す。Aは293T-mock細胞におけるPTPN22、Bは293T-RUNX1細胞におけるPTPN22、Cは293T-mock細胞におけるRUNX3、Dは293T-RUNX1細胞におけるRUNX3の結果を示す。各ラインはクローンゲノムを指し、黒丸及び白丸はそれぞれメチル化及び非メチル化CpGを表す。矢印は顕著に脱メチル化されたプローブのCpGを示す。下に記載したパーセンテージはそれぞれの領域の合計メチル化比率である(* P<0.05, ** P<0.01)。 図6は、プローブCpGから±500bpのRUNX1結合モチーフの分布及び出現頻度を示す図である。Aは293T-mock細胞と比較した293T-RUNX1細胞、Bは293T-TET2-TDG細胞と比較した293T-TET2-TDG-RUNX1細胞、Cは293T-TET3-TDG細胞と比較した293T-TET3-TDG-RUNX1細胞で同定された脱メチル化プローブ中のCpGについての結果を示す。 図7は、2細胞株間でM値を比較するためのスキャッタープロットである。AはESCとCD34間、BはESCとCD14間、CはESCとPBMCの比較である。小さなドット1つずつが各プローブに対応する。 図8は、転写因子、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。Aは転写因子としてRUNX1、BはRUNX3を用いた結果を示す。 図9は、転写因子、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。Aは転写因子としてCEBPB、BはCEBPAを用いた結果を示す。 図10は、転写因子、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。Aは転写因子としてMAFB、BはNR4A2を用いた結果を示す。 図11は、転写因子、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。Aは転写因子としてMYOD1、BはGATA2を用いた結果を示す。 図12は、転写因子、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。Aは転写因子としてPAX4、BはNKX2-5を用いた結果を示す。 図13は、SPI1、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。 図14は、293T-TcdT細胞及び293T-TcdT-RUNX1細胞における脱メチル化領域(プローブID cg15752436(17番染色体:20937757位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(67.0%)、Bは293T-TcdT-RUNX1細胞(48.6%, p<10-2)を示す。縦の列が、異なるクローン間の同じメチレーション部位、横の列が、1クローンが有する複数のメチレーション部位を示しており、黒丸及び白丸はそれぞれメチル化及び非メチル化CpGを表す。矢印はメチル化アレイで顕著に脱メチル化されたプローブのCpG(脱メチル化CpG)を示す。記載したパーセンテージはそれぞれの領域で検出された合計メチル化比率を表す(* P<0.05, ** P<0.01)。なお図15~22も図14と同様の表記方法を用いている。 図15は、293T-TcdT細胞及び293T-TcdT-RUNX3細胞における脱メチル化領域(プローブID cg07921503(7番染色体:2445843位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(93.5%)、Bは293T-TcdT-RUNX3細胞(58.4%, p<10-9)を示す。 図16は、293T-TcdT細胞及び293T-TcdT-CEBPB細胞における脱メチル化領域(プローブID cg25949447(2番染色体:128169860位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(87.0%)、Bは293T-TcdT-CEBPB細胞(0.62%, p<10-37)を示す。 図17は、293T-TcdT細胞及び293T-TcdT-CEBPA細胞における脱メチル化領域(プローブID cg04855216(5番染色体:118609567位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(71.1%)、Bは293T-TcdT-CEBPA細胞(63.9%, p<10-6)を示す。 図18は、293T-TcdT細胞及び293T-TcdT-MAFB細胞における脱メチル化領域(プローブID cg14628914(6番染色体:24659344位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(86.7%)、Bは293T-TcdT-MAFB細胞(63.5%, p<10-3)を示す。 図19は、293T-TcdT細胞及び293T-TcdT-NR4A2細胞における脱メチル化領域(プローブID cg21697198(11番染色体:129246394位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(71.1%)、Bは293T-TcdT-NR4A2細胞(63.9%, p<10-2)を示す。 図20は、293T-TcdT細胞及び293T-TcdT-MYOD1細胞における脱メチル化領域(プローブID cg04117764(1番染色体:10917451位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(88.2%)、Bは293T-TcdT-MYOD1細胞(56.7%, p<10-19)を示す。 図21は、293T-TcdT細胞及び293T-TcdT-GATA2細胞における脱メチル化領域(プローブID cg21016188(X染色体:153672702位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(30.0%)、Bは293T-TcdT-GATA2細胞(4.3%, p<10-36)を示す。 図22は、293T-TcdT細胞及び293T-TcdT-SPI1細胞における脱メチル化領域(プローブID cg21012061(1番染色体:205568557位)の±250bp内)のバイサルファイトシークエンスの結果を示す。Aは293T-TcdT細胞(91.4%)、Bは293T-TcdT-SPI1細胞(71.8%, p<10-3)を示す。 図23は、RUNX1過剰発現によるSPI1制御領域のCpG部位のメチル化状態を示す図である。縦列は異なるクローンゲノム中の同じCpG部位を表し、黒丸及び白丸はそれぞれメチル化及び非メチル化CpGを表す。 図24は、SPI1遺伝子制御領域に含まれる2つのRUNX1結合部位を示す図である。図中のSPI1遺伝子制御領域の塩基配列を配列番号71に示す。 図25は、転写因子TBX5、TET、及びTDGを過剰発現させた細胞における、脱メチル化CpG部位の近傍配列における転写因子結合モチーフのバックグラウンド補正された出現頻度分布を示す図である。 図26は、転写因子結合モチーフの異なる細胞分化過程における濃縮状態を示すヒートマップである。ヒートマップの右側に転写因子結合モチーフの名称、下方に細胞分化過程を示す。iPSC-HPCはiPSC(iPS細胞)からHPC(造血前駆細胞)への分化過程、HPC-MONはHPCからMON(単球)への分化過程、HPC-BCはHPCからBC(B細胞)への分化過程、HPC-TCはHPCからTC(T細胞)への分化過程を表す。左上に濃縮スコアのカラーキー(色凡例)も示す。各転写因子結合モチーフがポアソン分布モデルでの正確検定で有意差を示さない場合、データは斜線で示した。
 以下、本発明を詳細に説明する。
 本発明者らは、分化細胞から別の分化細胞を誘導するダイレクト・リプログラミングではスタート細胞のエピゲノムの状態が、ターゲット細胞への分化転換を阻害する可能性を示唆する知見を得ている。本発明者らは、単球で重要な働きをする転写因子を同定しそれを導入することによりヒト繊維芽細胞から単球様の機能をもつ細胞の誘導に成功したが、その単球様細胞は遺伝子発現が単球とは完全に一致せず、部分的に分化転換した細胞であることが明らかとなった(Suzuki T.,et al., (2012) PLoS ONE 7(3):e33474)。このことから、完全なダイレクト・リプログラミングを実施するためには、DNAの特定部位のエピゲノムを操作する必要が示唆された。しかし、そのような方法はこれまで知られていなかった。部位特異的なDNA脱メチル化を高レベルに誘導することができる本発明の方法は、本発明者らによって初めて見出された。
 DNAのエピジェネティックなメチル化は、DNA中のシトシン塩基のピリミジン環の5位のC(炭素原子)又はアデニン塩基のプリン環の6位のN(窒素原子)へのメチル基の付加反応である。DNA上のメチル化対象となる部位(メチレーション部位)は主としてCpG配列(CpG部位)であるが、CpA配列であることもある。DNAメチル化は遺伝子発現の抑制をもたらし、細胞内ではDNAメチル化や脱メチル化による遺伝子発現の調節が行われている。本発明は、ある種の転写因子を細胞内で過剰発現させた場合、細胞内のTETタンパク質及びTDGタンパク質と相互作用してDNA上の転写因子結合部位又はその近傍を標的とした能動的な脱メチル化を誘導し、結果として、その細胞中のDNAにおいて転写因子結合部位特異的な脱メチル化が増強されること、さらに、そのような転写因子とともにTETタンパク質及びTDGタンパク質を細胞内で過剰発現させると、細胞中のDNAにおいて転写因子結合部位特異的な脱メチル化がさらに増強されることに基本的には基づくものである。
1)部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法
 本発明は、第1に、そのような部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法に関する。具体的には、転写因子をコードする遺伝子を細胞中で過剰発現させ、その細胞中のDNAにおいて脱メチル化されたメチレーション部位を同定し、同定された脱メチル化部位及びその近傍配列における転写因子結合モチーフの出現頻度のパターンに基づいて、部位特異的なDNA脱メチル化を誘導する転写因子を選抜することにより、部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングすることができる。
 本発明の転写因子のスクリーニング方法ではまた、転写因子をコードする遺伝子に加えて、TET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させてもよい。後述の実施例に示すとおり、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させると、転写因子結合部位又はその近傍を標的とした能動的なDNA脱メチル化の誘導が促進され、細胞中のDNAにおける脱メチル化がさらに増強され、結果として、部位特異的なDNA脱メチル化を誘導する転写因子の選別感度を向上させることができる。しかし、細胞においてTET遺伝子及びTDG遺伝子のいずれか一方又は両方が本発明の方法のために十分なレベルで発現されている場合は、これらの遺伝子の過剰発現は必ずしも必要ではない。
 部位特異的なDNA脱メチル化を誘導するか否かを判定すべき任意の転写因子をコードする遺伝子を、本発明の転写因子のスクリーニング方法に供することができる。
 一方、本発明においてTET遺伝子は、メチル化シトシンジオキシゲナーゼであるTET(ten-eleven translocation)タンパク質の全長、又は酵素活性部位を含むその断片をコードする遺伝子を指す。TETタンパク質(例えばTET1、TET2、及びTET3)はいずれも、5-メチルシトシン(5mC)を5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)、5-カルボキシシトシン(5caC)へと順次酸化することができる。TET遺伝子は、限定するものではないが、導入する細胞と同種又は近縁種の生物由来であることが好ましい。TET遺伝子は、限定するものではないが、哺乳動物由来、例えば、霊長類(好ましくはヒト)由来であることが好ましい。本発明で用いるTET遺伝子は、TET1遺伝子、TET2遺伝子又はTET3遺伝子であってよく、例えば、TET2遺伝子又はTET3遺伝子であってよい。TET1遺伝子、TET2遺伝子及びTET3遺伝子のmRNA配列及びそれにコードされるアミノ酸配列は、例えば、それぞれGenBankアクセッション番号NM_030625、NM_001127208.2、及びNM_001287491.1の下で入手できる。
 本発明におけるTET1遺伝子は、例えば、配列番号15で示されるアミノ酸配列からなるタンパク質をはじめとするTET1タンパク質をコードする核酸であってよいし、その酵素活性部位(活性ドメイン)を含むTET1部分断片をコードする核酸であってもよい。本発明のTET1遺伝子はまた、配列番号15で示されるアミノ酸配列、又は配列番号15の部分配列であって1580位~2052位(酵素活性部位)を含むアミノ酸配列において、1若しくは複数個のアミノ酸が欠失、置換又は付加されたアミノ酸配列、例えば1~50個、好ましくは1~20個、より好ましくは数個(1~10個)のアミノ酸が欠失、置換又は付加されたアミノ酸配列からなり、かつ酸化活性を有するタンパク質をコードする核酸であってもよい。TET1遺伝子はまた、配列番号15で示されるアミノ酸配列、又は配列番号15の部分配列であって1580位~2052位(酵素活性部位)を含むアミノ酸配列と、80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは98%以上、99%以上、又は99.5%以上の配列同一性を示すアミノ酸配列からなり、かつ酸化活性を有するタンパク質をコードする核酸であってもよい。本発明で用いるTET1遺伝子はまた、配列番号15で示されるアミノ酸配列をコードする、配列番号14で示される塩基配列を含む核酸でもよい。TET1遺伝子はまた、配列番号14で示される塩基配列、又は配列番号14の部分配列であって4738位~6156位(酵素活性部位に相当)を含む塩基配列と、70%以上、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは98%以上、99%以上、又は99.5%以上の配列同一性を示す塩基配列からなり、かつ酸化活性を有するタンパク質をコードする核酸であってもよい。一実施形態では、上記のTET1遺伝子にコードされるタンパク質は、配列番号15の1580位~2052位のアミノ酸配列を保持することが好ましく、すなわち1580位~2052位の当該アミノ酸配列内に欠失、置換又は付加を有しないことが好ましい。一実施形態では、TET1遺伝子は、配列番号14の4738位~6156位の塩基配列を保持することが好ましく、すなわち4738位~6156位の当該塩基配列内に欠失、置換又は付加を有しないことが好ましい。TET1部分断片をコードするTET1遺伝子には、限定するものではないが、例えば、酵素活性部位のアミノ酸配列のアミノ末端又はカルボキシ末端にタンパク質タグや他の追加配列が付加されたアミノ酸配列をコードする核酸が包含される。TET1部分断片をコードするTET1遺伝子の例としては、配列番号49で示される塩基配列からなる核酸、又は配列番号50で示されるアミノ酸配列をコードする核酸が挙げられる。TET1部分断片をコードするTET1遺伝子は、一実施形態では、1419~3000塩基長、例えば、1419~2220塩基長であってよい。一実施形態では、TET1部分断片をコードするTET1遺伝子はまた、473~1000アミノ酸長、例えば、473~740アミノ酸長のアミノ酸配列をコードするものであってよい。
 本発明におけるTET2遺伝子については、上記TET1遺伝子に関する説明における配列番号15を配列番号17に、その1580位~2052位(酵素活性部位)を1290位~1905位(酵素活性部位)に、配列番号14を配列番号16に、その4738位~6156位(酵素活性部位に相当)を3868位~5715位(酵素活性部位に相当)にそれぞれ置き換えて同様に説明することができる。
 本発明におけるTET3遺伝子については、上記TET1遺伝子に関する説明における配列番号15を配列番号19に、その1580位~2052位(酵素活性部位)を985位~1697位(酵素活性部位)に、配列番号14を配列番号18に、その4738位~6156位(酵素活性部位に相当)を2953位~5091位(酵素活性部位に相当)にそれぞれ置き換えて同様に説明することができる。
 本発明において、TDG遺伝子は、チミンDNAグリコシラーゼ(TDG)タンパク質の全長をコードする遺伝子、又は酵素活性部位を含むその断片をコードする遺伝子を指す。TDGは、ミスマッチ部位の不対塩基を除去するDNAグリコシラーゼ活性により、DNA中のG/Tミスマッチ部位のチミンをシトシンへと塩基除去修復し、また5fCや5caCをシトシンへと塩基除去修復する。TDG遺伝子は、限定するものではないが、導入する細胞と同種又は近縁種の生物由来であることが好ましい。TDG遺伝子は、限定するものではないが、哺乳動物由来、例えば、霊長類(好ましくはヒト)由来であることが好ましい。
 本発明におけるTDG遺伝子は、例えば、配列番号23で示されるアミノ酸配列からなるタンパク質をはじめとするTDGタンパク質をコードするものであってよい。本発明のTDG遺伝子は、配列番号23で示されるアミノ酸配列において1若しくは複数個のアミノ酸が欠失、置換又は付加されたアミノ酸配列、例えば1~50個、より好ましくは1~20個、さらに好ましくは数個(1~10個)のアミノ酸が欠失、置換又は付加されたアミノ酸配列からなり、かつDNAグリコシラーゼ活性を有するタンパク質をコードする核酸であってもよい。そのような核酸としては、限定するものではないが、例えば、TDGタンパク質のアミノ末端又はカルボキシ末端にタンパク質タグや他の追加配列が付加されたアミノ酸配列をコードするDNAが挙げられる。TDG遺伝子はまた、配列番号23で示されるアミノ酸配列と80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは98%以上の配列同一性を示すアミノ酸配列からなり、かつDNAグリコシラーゼ活性を有するタンパク質をコードするものであってもよい。本発明で用いるTDG遺伝子はまた、配列番号23で示されるアミノ酸配列をコードする、配列番号22で示される塩基配列を含むものでもよい。TDG遺伝子はまた、配列番号22で示される塩基配列と70%以上、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは98%以上の配列同一性を示す塩基配列からなり、かつDNAグリコシラーゼ活性を有するタンパク質をコードするものであってもよい。
 本発明において「遺伝子」とは、限定するものではないが、ゲノムDNA、cDNA、及び修飾塩基を一部に含むDNA等のDNA、又はRNAであり得る。本発明において「遺伝子」は、典型的には開始コドン及び終止コドンを含むコーディング配列(CDS)を含む核酸断片であるが、目的の遺伝子産物(タンパク質等)が生成されるように細胞内に導入される限り、開始コドン及び/又は終止コドンを含まなくてもよい。本発明において「遺伝子」はまた、非翻訳領域(UTR)、プロモーター、ターミネーターなどをさらに含んでもよい。
 転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子の細胞中での過剰発現は、任意の方法により誘導すればよい。本発明において、遺伝子の「過剰発現」とは、過剰発現を誘導していない細胞(野生型細胞)と比較して当該遺伝子の発現量を有意に増加させることを意味する。典型的には、転写因子をコードする遺伝子を、プロモーターの制御下で細胞に導入することにより、当該遺伝子を細胞中で過剰発現させることができる。またTET遺伝子を、プロモーターの制御下で細胞に導入することにより、細胞中で過剰発現させることができる。またTDG遺伝子を、プロモーターの制御下で細胞に導入することにより、細胞中で過剰発現させることができる。
 転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子の細胞への導入は、プロモーターの制御下に当該遺伝子を含むベクター(発現ベクター)を用いて常法により行うことができる。遺伝子導入する細胞において遺伝子発現を誘導可能な任意のプロモーターを用いることができ、そのようなプロモーターは、過剰発現プロモーターであることが好ましく、例えば、構成的(恒常的)な発現を誘導する構成的プロモーター、特定の因子の刺激により一過性の発現を誘導する誘導性プロモーター、組織特異的プロモーター、時期特異的プロモーター等であってよいが、これらに限定されない。プロモーターの例として、サイトメガロウイルス(CMV)プロモーター、SV40プロモーター、RSVプロモーター、CAプロモーター、EF-1αプロモーター等が挙げられるが、これらに限定されない。
 プロモーターの制御下に転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子を含むベクターは、ウイルスベクター又はプラスミドベクターであり得る。転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子は、プロモーターの下流に配置されることが好ましい。転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞内で共発現させる場合は、それぞれの遺伝子が別個のベクターに含まれていてもよいし、導入された細胞内でそれぞれの遺伝子の発現が誘導される限り、2つ又は3つの遺伝子が1つのベクターに同時に含まれていてもよい。後者の場合、遺伝子と遺伝子の間にはIRES(internal ribosomal entry site; 内部リボソーム進入部位)が含まれることが好ましい。IRESとしては、以下に限定するものではないが、例えば脳心筋炎ウイルス(ECMV)、***ウイルス(FMDV)、A型肝炎ウイルス(HAV)、ヒト免疫不全ウイルス(HIV)等のウイルス由来のIRESが挙げられる。
 例えば、転写因子をコードする遺伝子、TET遺伝子及びTDG遺伝子のうち1つ以上を含む核酸増幅断片を、制限酵素処理後にプラスミドベクター中のプロモーター下流の任意のクローニングサイトに挿入及び連結することにより、当該遺伝子をプロモーターの制御下に含むベクターを作製することができる。あるいは、Gateway(登録商標)技術を用いて、当該遺伝子を含むエントリークローン(組換えベクター)から発現ベクターへと、それら遺伝子を単独で又は組み合わせてクローニングすることにより、当該遺伝子をプロモーターの制御下に含むベクターを作製することもできる。本発明において遺伝子を「プロモーターの制御下に含む」とは、典型的にはプロモーターによる遺伝子発現誘導が可能な範囲内のプロモーターの下流に遺伝子が配置されることを意味する。
 ベクターは、転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子とともに、選択マーカー遺伝子及び/又はリポーター遺伝子を含んでもよい。選択マーカー遺伝子としては、限定するものではないが、例えば、グルホシネート耐性遺伝子、カナマイシン耐性遺伝子、ゲンタマイシン耐性遺伝子、バンコマイシン耐性遺伝子、ネオマイシン耐性遺伝子、ハイグロマイシン耐性遺伝子、ピューロマイシン耐性遺伝子、ゼオシン耐性遺伝子、ブラストサイジン耐性遺伝子、ジヒドロ葉酸還元酵素遺伝子、及びアンピシリン耐性遺伝子等の抗生物質耐性遺伝子等が挙げられる。リポーター遺伝子としては、蛍光タンパク質コード遺伝子(GFP遺伝子、Venus遺伝子、YFP遺伝子、RFP遺伝子、CFP遺伝子、BFP遺伝子等)、ルシフェラーゼ遺伝子、lacZ等が挙げられる。
 本発明では、転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子をプロモーターの制御下に含むウイルスベクターも、細胞への遺伝子導入に好適に用いることができる。本発明において、「ウイルスベクター」とは、細胞に感染することにより、保持する目的の遺伝子を細胞に導入する能力を有する、ウイルス粒子(偽型ウイルス等のウイルス様粒子を包含する)である。偽型ウイルスとは、異種ウイルス由来エンベロープ成分を含むエンベロープを有するようにパッケージングされたウイルス粒子である。ウイルスベクターは、例えば、レトロウイルスベクター又はレンチウイルスベクターであってよい。ウイルスベクターは、市販の様々なウイルスベクター作製キットを用いて当業者であれば容易に作製することができる。例えば、導入遺伝子(転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子)、パッケージングに必要なウイルス構造遺伝子(gag、pol、rev等)、及び偽型化のための水泡性口内炎ウイルス(Vesicular Stomatitis Virus; VSVG)由来エンベロープG糖タンパク質(VSV-G)をコードする遺伝子をプロモーターの制御下に含む単一の又は別個の発現ベクターを、宿主細胞(例えば、293T細胞)にトランスフェクションし、一定時間(例えば12時間~60時間、好ましくは24時間~48時間)培養した後、生成した偽型ウイルス粒子を含む培養上清を回収することにより、プロモーターの制御下に転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子を含むレンチウイルスベクターを作製することができる。一実施形態では、導入遺伝子を含む自己不活化(self inactivating; SIN)レンチウイルスプラスミドベクター、ウイルス(例えばHIV)構造タンパク質gag及びpolを発現するがアクセサリー遺伝子及び調節遺伝子は削除されているパッケージングベクター、及び偽型化のためのVSV-G及びRevを発現するプラスミドベクターを宿主細胞(例えば、293T細胞)にトランスフェクションし、培養し、生成した偽型ウイルス粒子を含む培養上清を回収することにより、レンチウイルスベクターを作製することができる。得られた培養上清は(例えば0.45μmフィルターで)ろ過し、ろ液を遠心分離(例えば、50,000 x g、2時間)にかけ、上清を廃棄してペレット化したウイルス粒子を回収し、適当な溶液、例えば、生理的等張緩衝塩溶液(Hank's Balanced Salt Solution; HBSS)中に再懸濁することが好ましい。このようにして得られたウイルス粒子をレンチウイルスベクターとして細胞への遺伝子導入用に用いることができる。
 本発明では、細胞に、転写因子をコードする遺伝子をプロモーターの制御下に含む発現ベクターを導入し、その導入遺伝子を発現させることにより、細胞内での当該遺伝子の過剰発現を引き起こすことができ、それによりその細胞中でのDNAの転写因子結合部位特異的な脱メチル化を増強することができる。
 本発明ではまた、細胞に、転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子をプロモーターの制御下に含む単一の又は別個の発現ベクターを導入し、それらの導入遺伝子を発現させることにより、細胞内での当該遺伝子の過剰発現を引き起こすことができ、それによりその細胞中でのDNAの転写因子結合部位特異的な脱メチル化をさらに増強することができる。
 上記遺伝子を導入する細胞(宿主細胞)は、特に限定されないが、上記遺伝子と同種又は近縁種由来(例えば上記遺伝子がヒト由来であればヒト又は霊長類由来の細胞)であることが好ましい。上記遺伝子を導入する細胞は、任意の生物由来であってよいが、動物由来、特に哺乳動物由来であることが好ましく、例えばヒト、チンパンジー、ゴリラ等の霊長類、ラット、マウス、モルモット、ハムスター等のげっ歯類、ウシ、ウマ、ヒツジ、ヤギ等の家畜、イヌ、ネコ、ウサギ等に由来する細胞が挙げられる。細胞は、任意の組織又は臓器由来であってよく、例として、骨髄、血液、筋肉、皮膚、精巣、卵巣、脳、脂肪組織、消化管、肝臓、腎臓、心臓、脾臓、粘膜等に由来するものが挙げられる。上記遺伝子を導入する細胞の好ましい例として、上皮細胞(例えば、ヒト胎児由来腎臓上皮細胞293T)が挙げられる。上記遺伝子を導入する細胞の別の好ましい例として、造血系細胞が挙げられる。本発明において造血系細胞とは、造血幹細胞及び造血幹細胞から生成される血液系細胞(特に有核細胞)を指し、例えば、造血幹細胞、巨核球、白血球、例えば、リンパ球(T細胞、B細胞、ナチュラルキラー細胞等)、単球、樹状細胞、マクロファージ、及び顆粒球(好中球、好酸球、好塩基球)等、並びにそれらの前駆細胞などを包含する。本発明に係る造血系細胞は、CD34+造血幹細胞/前駆細胞、CD14+単球、末梢血単核細胞(PBMC)等であってもよい。上記遺伝子を導入する細胞は、生体から採取した細胞であってもよいし、生体から採取した細胞から樹立した細胞株であってもよい。上記遺伝子を導入する細胞は、外来遺伝子が予め導入された細胞であってもよい。上記遺伝子を導入する細胞は培養細胞であってもよい。上記遺伝子を導入する細胞は、癌細胞であってもよいし、万能細胞(ES細胞、iPS細胞等)や幹細胞であってもよい。レンチウイルスベクター以外のベクターを用いる場合には、増殖期の細胞を用いることが好ましい。
 細胞への遺伝子導入は、転写因子をコードする遺伝子をプロモーターの制御下に含むウイルスベクターを細胞に感染させることにより、又は、転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子をプロモーターの制御下に含む単一の又は別個のウイルスベクターを細胞に感染させることにより、引き起こすことができる。ウイルスベクターの細胞への感染の際には、遺伝子導入促進剤、例えばポリブレン、レトロネクチン等を使用することも好ましい。
 あるいは細胞への遺伝子導入は、転写因子をコードする遺伝子をプロモーターの制御下に含むウイルスベクター、又は、転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子をプロモーターの制御下に含む単一の若しくは別個の発現プラスミドベクターを細胞に物理的又は化学的手法により導入することにより、実施してもよい。細胞へのプラスミドベクターの導入は、一般的に行われている遺伝子導入法、例えば、リン酸カルシウム法、エレクトロポレーション法、リポフェクション法、パーテイクルガン法、ポリエチレングリコール(PEG)法、アグロバクテリウム媒介形質転換法、プロトプラスト融合法等の任意の方法を用いて行うことができる。
 遺伝子導入により得られた、プロモーターの制御下にある転写因子をコードする遺伝子を保持する細胞は、当該プロモーターの活性により当該遺伝子を発現することができる。また、遺伝子導入により得られた、プロモーターの制御下にある転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を保持する細胞は、当該プロモーターの活性によりそれら遺伝子を発現することができる。構成的プロモーターを用いた場合には、単に細胞を培養することにより、導入遺伝子の恒常的な発現を誘導することができ、その結果、導入遺伝子を(野生型細胞と比較して)過剰発現させることができる。誘導性プロモーターを用いた場合には、プロモーター活性の誘導因子の存在下で細胞を培養することにより、導入遺伝子の一過性発現を誘導することができ、その結果、導入遺伝子を一過性に(野生型細胞と比較して)過剰発現することができる。導入遺伝子を発現している細胞は、選択マーカー遺伝子又はリポーター遺伝子の機能に基づいて常法により選択することができる。本発明は、そのようにして得られる、転写因子をコードする遺伝子が導入された形質転換細胞、及び、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子が導入された形質転換細胞も提供する。なおウイルスベクター等の感染を介して外来遺伝子が導入された細胞を形質導入細胞と呼ぶことがある。
 転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞に導入して共発現させる場合、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子の細胞への導入は、同時に行ってもよいし、逐次行ってもよい。例えば、TET遺伝子を含むベクターとTDG遺伝子を含むベクターを細胞に導入し、形質転換細胞を選択した後、得られた形質転換細胞に転写因子をコードする遺伝子を含むベクターを導入することにより、転写因子をコードする遺伝子、TET遺伝子及びTDG遺伝子を同じ細胞に導入してもよい。あるいは、転写因子をコードする遺伝子、TET遺伝子及びTDG遺伝子をそれぞれ含む別個のベクター中の選択マーカー遺伝子が同一である場合には、それら3種のベクターを同時に細胞に感染させて同じ条件で選択を行ってもよい。
 以上のようにして作製された、転写因子をコードする遺伝子を過剰発現する細胞では、細胞中のDNAの脱メチル化が増強される。また転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞では、細胞中のDNA(ゲノムDNA又は染色体外DNA)の脱メチル化がさらに増強される。それらの細胞では、特に、導入した転写因子が認識及び結合するDNA部位(転写因子結合部位)に特異的な脱メチル化がより高頻度に誘導される。本発明において、転写因子結合部位に特異的な(部位特異的な)脱メチル化は、転写因子結合部位の近傍、具体的には転写因子結合部位を中心として約500bp幅(±250bp)の領域内、好ましくは約400bp幅(±200bp)の領域内に存在するメチレーション部位(典型的にはCpG部位)が脱メチル化されることを指す。転写因子をコードする遺伝子を過剰発現する細胞、並びに、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞では、転写因子結合部位特異的な脱メチル化以外の脱メチル化も生じてもよいが、転写因子結合部位特異的な脱メチル化の割合を顕著に増加させることができる。これは過剰発現した転写因子が、転写因子結合部位特異的な脱メチル化を強力に誘導するためである。
 本発明では、転写因子をコードする遺伝子を過剰発現する細胞、並びに転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞における脱メチル化された部位及びその近傍における転写因子結合モチーフの出現頻度のパターンに基づいて、部位特異的なDNA脱メチル化を誘導する転写因子を選抜することができる。
 転写因子をコードする遺伝子を過剰発現する細胞、並びに転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞において脱メチル化された部位は、当業者に公知の任意のメチル化解析技術を用いて同定することができる。まず、転写因子をコードする遺伝子を過剰発現する細胞におけるメチレーション部位(典型的にはCpG部位)のメチル化状態を、転写因子をコードする遺伝子を過剰発現しない細胞(野生型細胞)におけるメチレーション部位のメチル化状態と比較し、有意にメチル化が低減した(又は、脱メチル化が増加した)メチレーション部位を、部位特異的な脱メチル化部位と判定することができる。あるいは、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞におけるメチレーション部位のメチル化状態を、TET遺伝子及び/又はTDG遺伝子を過剰発現するが転写因子をコードする遺伝子を過剰発現しない細胞におけるメチレーション部位のメチル化状態と比較して、有意にメチル化が低減した(又は、脱メチル化が増加した)メチレーション部位を、部位特異的な脱メチル化部位と判定することができる。本明細書において脱メチル化の「増強」とは、上記のように転写因子をコードする遺伝子の過剰発現が存在しない場合に比較してメチレーション部位のメチル化が低減する(又は、脱メチル化が増加する)ことを指す。メチル化状態(メチル化プロファイル)の検出及び脱メチル化部位の同定は、メチル化アレイを用いたメチローム解析及び/又はバイサルファイトシークエンス法により実施することができる。メチル化アレイとは、DNA上のメチレーション部位を検出するためのプローブが固定されたアレイ(ビーズ、マイクロアレイ等)である。メチローム解析とは、メチル化状態のゲノムワイドな(ゲノム上の広範囲な)網羅的解析を意味する。様々なメチローム解析用メチル化アレイが市販されており、本発明において好適に用いることができる。メチル化アレイを用いたメチローム解析は、用いるメチル化アレイにより様々な手法で行うことができる。また、バイサルファイトシークエンス法でDNA上のメチレーション部位の塩基配列を調べることにより、脱メチル化部位を同定することもできる。メチル化アレイを用いたメチローム解析及びバイサルファイトシークエンス法は市販のメチル化アレイ及びキット、メチル化検出キット等を用いて実施することができ、具体的な実験手順については後述の実施例も参照することができる。
 続いて、細胞中のゲノムDNA上で同定された脱メチル化部位とその上流配列及び下流配列(例えば、脱メチル化部位を位置0として上流及び下流に±10kbp以下、好ましくは±5kbp以下)の領域における転写因子結合モチーフの出現頻度を調べる。具体的には、まず、転写因子結合配列データベース、例えばJASPAR(http://jaspar.genereg.net/)、TRANSFAC(http://www.gene-regulation.com/index2.html)、Genomatix等を用いて、前記領域について、過剰発現させた転写因子の転写因子結合モチーフを検索すればよい。一方、ランダムに、好ましくはゲノムワイドに選択されたメチレーション部位とその上流配列及び下流配列(例えば、メチレーション部位を位置0として上流及び下流に±10kbp以下、好ましくは±5kbp以下であり、上記の脱メチル化部位の場合と好ましくは同じ長さである)の領域における転写因子結合モチーフの出現頻度も求める。一定長(例えば50bp~100bp)ずつスライドさせた配列内の転写因子結合モチーフの出現回数(出現頻度)に基づいて、ランダム選択したメチレーション部位とその近傍(上流配列及び下流配列)での一定長配列内の転写因子結合モチーフの出現回数をλとする以下の式:
Figure JPOXMLDOC01-appb-M000001
で表される出現確率分布(ピアソン分布)モデルに基づいて、脱メチル化部位から同距離にある一定長の転写因子結合モチーフの出現確率を求める。ここで出現確率分布のピーク(出現頻度が有意に増加した位置)が脱メチル化部位と重なることを確認することが好ましい。本発明では「脱メチル化部位と重なる」とは、出現確率分布のピークが例えば脱メチル化部位から±500bpの距離内に位置することをいう。さらに、脱メチル化部位とその近傍(上流配列及び下流配列)における各転写因子結合モチーフの位置を中心とするカーネル関数(正規分布、均等化等)を足し合わせた混合分布から、ランダム選択したメチレーション部位とその近傍(上流配列及び下流配列)における転写因子結合モチーフの位置を中心とするカーネル関数(正規分布、均等化等)を足し合わせた混合分布を差し引いた混合頻度分布を得る。このようにして得られた混合頻度分布が、バックグラウンド補正された出現頻度分布に相当する。得られた混合頻度分布が脱メチル化部位からの距離(X)=0付近を頂点としたピークを形成するかどうかを判定し、そのようなピークを形成する転写因子を選抜する。得られた混合頻度分布が脱メチル化部位からの距離(X)=0付近を頂点としたピークを形成する場合、過剰発現させた転写因子を、部位特異的なDNA脱メチル化を誘導する転写因子の有力な候補として選抜できる。なお本発明において、脱メチル化部位からの距離(X)=0「付近」とは、脱メチル化部位から±100bpの範囲を指す。さらに、得られた混合頻度分布において、混合頻度分布のピークの最大値(最大頻度)が、得られた混合頻度分布全体の四分位範囲×3+第3四分位の値を超えることを確認することにより、過剰発現させた転写因子が、部位特異的なDNA脱メチル化を誘導する転写因子であることをさらに確実に同定することができる。選抜された転写因子については、転写因子をコードする遺伝子を細胞中で過剰発現させるか、又は、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させて、バイサルファイトシークエンス法等により、転写因子結合部位特異的な脱メチル化の誘導が生じていることを確認することが好ましい。本発明は、このような転写因子の選抜により、部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法を提供する。
2)転写因子結合部位特異的なDNA脱メチル化の増強方法
 上記のスクリーニングにより選抜される転写因子は、部位特異的なDNA脱メチル化を誘導することができる。そして、上記のようなスクリーニング方法により得られる部位特異的なDNA脱メチル化を誘導する転写因子を用いれば、細胞中のDNAにおける転写因子結合部位特異的な脱メチル化を増強することができる。本発明はそのような部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を、細胞中で過剰発現させ、それにより転写因子結合部位又はその近傍を標的とした能動的なDNA脱メチル化を高レベルに誘導し、その結果として細胞中のDNAにおける転写因子結合部位特異的な脱メチル化を増強する方法も提供する。
 この本発明の脱メチル化増強方法では、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を、TET遺伝子及び/又はTDG遺伝子と共に細胞中で過剰発現させることにより、転写因子結合部位又はその近傍を標的とした能動的なDNA脱メチル化の誘導を促進し、その結果、細胞中のDNAの部位特異的な脱メチル化をさらに増強することもできる。
 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子の過剰発現は、任意の方法により誘導すればよい。これらの遺伝子の「過剰発現」は、スクリーニング方法について上述したとおりである。典型的には、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、又は転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を、プロモーターの制御下で細胞に導入することにより、それらの遺伝子を細胞中で過剰発現させることができる。遺伝子の細胞への導入についても、スクリーニング方法について上述したのと同じである。
 本発明で用いる部位特異的なDNA脱メチル化を誘導する転写因子は細胞分化にはたらく因子であってよく、一例として造血系転写因子が挙げられる。本発明において造血系転写因子とは、造血幹細胞の維持や血球細胞の分化に働く転写因子をいう。
 部位特異的なDNA脱メチル化を誘導する転写因子は、以下に限定するものではないが、RUNX(Runt-related transcription factor)ファミリー、MYOD(Myogenic differentiation)ファミリー、C/EBP(CCAAT/enhancer binding protein)ファミリー、GATA(GATA binding protein)ファミリー、MAF(v-maf avian musculoaponeurotic fibrosarcoma oncogene homolog)ファミリー、NR4A(nuclear receptor subfamily 4, group A)ファミリー(例えば、NR4A2)、及びTBX(T-box)ファミリー(例えば、TBX5)等の転写因子であり得る。RUNXファミリーの転写因子の例としては、RUNX1、RUNX2及びRUNX3が挙げられる。C/EBPファミリーの転写因子の例としては、CEBPA、CEBPB、CEBPG、CEBPD、CEBPE及びCEBPZが挙げられる。MAFファミリーの転写因子の例としてはMAFが挙げられる。NR4Aファミリーの転写因子の例としては、NR4A1、NR4A2及びNR4A3が挙げられる。MYODファミリーの転写因子の例としては、MYOD、MYRF、MYF5、MYOG及びMYF6が挙げられる。GATAファミリーの転写因子の例としては、GATA1、GATA2、GATA3、GATA4、GATA5及びGATA6が挙げられる。TBXファミリーの転写因子の例としては、TBX1~TBX6、TBX10、TBX15、及びTBX18等が挙げられる。本発明で用いる部位特異的なDNA脱メチル化を誘導する転写因子の例としては、例えば、RUNX1、RUNX3、CEBPA、CEBPB、MAFB、NR4A2、MYOD1、GATA2、及びTBX5が挙げられる。また、部位特異的なDNA脱メチル化を誘導する転写因子の別の例として、engrailed(EN)ファミリー、HANDファミリー、IRFファミリー、FOXDファミリー、FOXOファミリー、TALファミリー、TCFファミリー、NFE2Lファミリー、ELFファミリー、NFATCファミリー、HLFファミリー、NFIL3ファミリー、AP1ファミリー、BRCAファミリー、SPIファミリーの転写因子も挙げられる。本発明において部位特異的なDNA脱メチル化を誘導する転写因子は、公知のアミノ酸配列に変異を有していてもよいが、DNA結合ドメイン及び脱メチル化活性を保持する。
 本発明において部位特異的なDNA脱メチル化を誘導する転写因子を、転写因子が結合する転写因子結合モチーフで規定することもできる。本発明では、部位特異的なDNA脱メチル化の誘導/増強、及びそれによる細胞分化の促進等のために、後述の実施例で示されるような転写因子結合モチーフに結合する任意の転写因子を使用することができる。本発明の一実施形態では、限定するものではないが、例えば、iPS細胞(iPSC)から造血前駆細胞(HPC)への分化の促進のために転写因子結合モチーフHand1::Tcfe2a、IRF1、FOXD1、FOXO3、IRF2、TAL1::TCF3、NFE2L2、ELF5、NFATC2、BRCA1、RUNX1、SPI1及びSPIBからなる群より選択されるモチーフに結合する任意の転写因子を使用することができ;HPCから単球(MON)への分化の促進のために転写因子結合モチーフELF5、NFATC2、HLF、NFIL3、AP1、BRCA1、RUNX1、SPI1及びSPIBからなる群より選択されるモチーフに結合する任意の転写因子を使用することができ;HPCからB細胞(BC)への分化の促進のために転写因子結合モチーフIRF1及びELF5からなる群より選択されるモチーフに結合する任意の転写因子を使用することができ;そしてHPCからT細胞(TC)への分化の促進のために転写因子結合モチーフEn1、NR4A2、Hand1::Tcfe2a、IRF1、BRCA1、RUNX1、SPI1及びSPIBからなる群より選択されるモチーフに結合する任意の転写因子を使用することができる。これらのモチーフに結合する転写因子は当業者に公知であり、下記の表9に例示されている。
 転写因子をコードする遺伝子は、限定するものではないが、導入する細胞と同種又は近縁種由来(例えば、導入する細胞がヒトであればヒト又は霊長類由来の遺伝子)であることが好ましい。転写因子をコードする遺伝子は、限定するものではないが、哺乳動物由来、例えば、霊長類(好ましくはヒト)由来であることが好ましい。
 RUNX1遺伝子は、典型的には、配列番号12で示されるアミノ酸配列からなるRUNX1タンパク質をコードするものでありうる。本発明で用いるRUNX1遺伝子はまた、配列番号12で示されるアミノ酸配列をコードする、配列番号11で示される塩基配列を含むものでもよい。本発明のRUNX1遺伝子は、配列番号12で示されるアミノ酸配列の47位~184位に位置するDNA結合ドメインの配列(配列番号13)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号Q01196で得られる情報に基づく。
 RUNX3遺伝子は、典型的には、配列番号29で示されるアミノ酸配列からなるRUNX3タンパク質をコードするものでありうる。本発明で用いるRUNX3遺伝子はまた、配列番号29で示されるアミノ酸配列をコードする、配列番号28で示される塩基配列を含むものでもよい。本発明のRUNX3遺伝子は、配列番号29で示されるアミノ酸配列の52位~188位に位置するDNA結合ドメインの配列(配列番号30)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号Q13761で得られる情報に基づく。
 MYOD1遺伝子は、典型的には、配列番号32で示されるアミノ酸配列からなるMYOD1タンパク質をコードするものでありうる。本発明で用いるMYOD1遺伝子はまた、配列番号32で示されるアミノ酸配列をコードする、配列番号31で示される塩基配列を含むものでもよい。本発明のMYOD1遺伝子は、配列番号32で示されるアミノ酸配列の100位~170位に位置するDNA結合ドメインの配列(配列番号33)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号P15172で得られる情報に基づく。
 CEBPA遺伝子は、典型的には、配列番号35で示されるアミノ酸配列からなるCEBPAタンパク質をコードするものでありうる。本発明で用いるCEBPA遺伝子はまた、配列番号35で示されるアミノ酸配列をコードする、配列番号34で示される塩基配列を含むものでもよい。本発明のCEBPA遺伝子は、配列番号35で示されるアミノ酸配列の280位~345位に位置するDNA結合ドメインの配列(配列番号36)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号P49715で得られる情報に基づく。
 CEBPB遺伝子は、典型的には、配列番号38で示されるアミノ酸配列からなるCEBPBタンパク質をコードするものでありうる。本発明で用いるCEBPB遺伝子はまた、配列番号38で示されるアミノ酸配列をコードする、配列番号37で示される塩基配列を含むものでもよい。本発明のCEBPB遺伝子は、配列番号38で示されるアミノ酸配列の269位~334位に位置するDNA結合ドメインの配列(配列番号39)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号P17676で得られる情報に基づく。
 GATA2遺伝子は、典型的には、配列番号41で示されるアミノ酸配列からなるGATA2タンパク質をコードするものでありうる。本発明で用いるGATA2遺伝子はまた、配列番号41で示されるアミノ酸配列をコードする、配列番号40で示される塩基配列を含むものでもよい。本発明のGATA2遺伝子は、配列番号41で示されるアミノ酸配列の289位~401位に位置するDNA結合ドメインの配列(配列番号42)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号P23769で得られる情報に基づく。
 MAFB遺伝子は、典型的には、配列番号44で示されるアミノ酸配列からなるMAFBタンパク質をコードするものでありうる。本発明で用いるMAFB遺伝子はまた、配列番号44で示されるアミノ酸配列をコードする、配列番号43で示される塩基配列を含むものでもよい。本発明のMAFB遺伝子は、配列番号44で示されるアミノ酸配列の211位~301位に位置するDNA結合ドメインの配列(配列番号45)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号Q9Y5Q3で得られる情報に基づく。
 NR4A2遺伝子は、典型的には、配列番号47で示されるアミノ酸配列からなるNR4A2タンパク質をコードするものでありうる。本発明で用いるNR4A2遺伝子はまた、配列番号47で示されるアミノ酸配列をコードする、配列番号46で示される塩基配列を含むものでもよい。本発明のNR4A2遺伝子は、配列番号47で示されるアミノ酸配列の260位~335位に位置するDNA結合ドメインの配列(配列番号48)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号P43354で得られる情報に基づく。
 TBX5遺伝子は、典型的には、配列番号73で示されるアミノ酸配列からなるTBX5タンパク質をコードするものでありうる。本発明で用いるTBX5遺伝子はまた、配列番号73で示されるアミノ酸配列をコードする、配列番号72で示される塩基配列を含むものでもよい。本発明のTBX5遺伝子は、配列番号73で示されるアミノ酸配列の53位~237位に位置するDNA結合ドメインの配列(配列番号74)を保持しているタンパク質をコードすることが好ましい。DNA結合ドメインの位置はInterProデータベース(http://www.ebi.ac.uk/interpro/)のアクセッション番号Q99593で得られる情報に基づく。
 本発明で用いるRUNX1遺伝子、RUNX3遺伝子、MYOD1遺伝子、CEBPA遺伝子、CEBPB遺伝子、GATA2遺伝子、MAFB遺伝子、NR4A2遺伝子、又はTBX5遺伝子はまた、それぞれ、配列番号12、配列番号29、配列番号32、配列番号35、配列番号38、配列番号41、配列番号44、配列番号47、又は配列番号73で示されるアミノ酸配列において1若しくは複数個のアミノ酸が欠失、置換又は付加されたアミノ酸配列、例えば1~50個、好ましくは1~20個、より好ましくは数個(1~10個)のアミノ酸が欠失、置換又は付加されたアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードするDNAであってもよい。そのようなDNAとしては、限定するものではないが、例えば、配列番号12、配列番号29、配列番号32、配列番号35、配列番号38、配列番号41、配列番号44、配列番号47、又は配列番号72に示されるアミノ酸配列のアミノ末端又はカルボキシ末端にタンパク質タグが付加されたアミノ酸配列をコードするDNAが挙げられる。RUNX1遺伝子、RUNX3遺伝子、MYOD1遺伝子、CEBPA遺伝子、CEBPB遺伝子、GATA2遺伝子、MAFB遺伝子、NR4A2遺伝子、又はTBX5遺伝子はまた、それぞれ、配列番号12、配列番号29、配列番号32、配列番号35、配列番号38、配列番号41、配列番号44、配列番号47、又は配列番号73で示されるアミノ酸配列と80%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは98%以上の配列同一性を示すアミノ酸配列からなり、かつDNA結合活性を有するタンパク質をコードするものであってもよい。RUNX1遺伝子、RUNX3遺伝子、MYOD1遺伝子、CEBPA遺伝子、CEBPB遺伝子、GATA2遺伝子、MAFB遺伝子、NR4A2遺伝子、又はTBX5遺伝子はまた、それぞれ、配列番号11、配列番号28、配列番号31、配列番号34、配列番号37、配列番号40、配列番号43、又は配列番号46、又は配列番号72で示される塩基配列と70%以上、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは98%以上の配列同一性を示す塩基配列からなり、かつDNA結合活性を有するタンパク質をコードするものであってもよい。これらの遺伝子にコードされる転写因子はまた、脱メチル化活性を有する。
 TET遺伝子及びTDG遺伝子は、上記スクリーニング方法に関して記載したものと同じである。
 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子の細胞中での過剰発現は、上記スクリーニング方法に関して記載したのと同様に、任意の方法により誘導すればよい。
 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、TET遺伝子及び/又はTDG遺伝子の細胞への導入は、プロモーターの制御下に当該遺伝子を含むベクター(発現ベクター)を用いて常法により行うことができる。
 本発明ではまた、細胞に、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子をプロモーターの制御下に含む単一の又は別個の発現ベクターを導入し、その導入遺伝子を発現させることにより、細胞内での当該遺伝子の過剰発現を引き起こすことができ、それによりその細胞中でのDNAの転写因子結合部位特異的な脱メチル化をさらに増強することができる。
 用いるプロモーター、ベクター、細胞、細胞への遺伝子導入方法は、上記スクリーニング方法に関して記載したものと同じである。
 遺伝子導入により得られた、プロモーターの制御下にある上記転写因子をコードする遺伝子を保持する細胞は、当該プロモーターの活性により当該遺伝子を発現することができる。また、遺伝子導入により得られた、プロモーターの制御下にある上記転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を保持する細胞は、当該プロモーターの活性によりそれら遺伝子を発現することができる。構成的プロモーターを用いた場合には、単に細胞を培養することにより、それら遺伝子の恒常的な発現を誘導することができ、その結果、それら遺伝子を(野生型細胞と比較して)過剰発現させることができる。誘導性プロモーターを用いた場合には、プロモーター活性の誘導因子の存在下で細胞を培養することにより、それら遺伝子の一過性発現を誘導することができ、その結果、それら遺伝子を一過性に(野生型細胞と比較して)過剰発現することができる。導入遺伝子を発現している細胞は、選択マーカー遺伝子又はリポーター遺伝子の機能に基づいて常法により選択することができる。本発明は、そのようにして得られる、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子が導入された形質転換細胞、及び、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子が導入された形質転換細胞も提供する。なおウイルスベクター等の感染を介して外来遺伝子が導入された細胞を形質導入細胞と呼ぶことがある。
 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞に導入して共発現させる場合、その転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子の細胞への導入は、同時に行ってもよいし、逐次行ってもよい。例えば、TET遺伝子を含むベクターとTDG遺伝子を含むベクターを細胞に導入し、形質転換細胞を選択した後、得られた形質転換細胞に上記転写因子をコードする遺伝子を含むベクターを導入することにより、上記転写因子をコードする遺伝子、TET遺伝子及びTDG遺伝子を同じ細胞に導入してもよい。あるいは、上記転写因子をコードする遺伝子、TET遺伝子及びTDG遺伝子をそれぞれ含む別個のベクター中の選択マーカー遺伝子が同一である場合には、それら3種のベクターを同時に細胞に感染させて同じ条件で選択を行ってもよい。
 以上のようにして作製された、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を過剰発現する細胞では、細胞中のDNAの脱メチル化が増強される。また部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞では、細胞中のDNA(ゲノムDNA又は染色体外DNA)の脱メチル化がさらに増強される。それらの細胞では、特に、導入した転写因子が認識及び結合するDNA部位(転写因子結合部位)に特異的な脱メチル化が高頻度に誘導される。本発明において、転写因子結合部位に特異的な(部位特異的な)脱メチル化とは、転写因子結合部位を中心として約500bp幅の領域内、好ましくは約400bp幅(±200bp)の領域内に存在するメチレーション部位(典型的にはCpG部位)が脱メチル化されることを意味する。上記転写因子をコードする遺伝子を過剰発現する細胞、並びに上記転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞では、転写因子結合部位特異的な脱メチル化以外の脱メチル化も生じてもよいが、転写因子結合部位特異的な脱メチル化の割合を顕著に増加させることができる。これは過剰発現した転写因子が、転写因子結合部位特異的な脱メチル化を強力に誘導するためである。好ましい実施形態では、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子をTET遺伝子及びTDG遺伝子とともに細胞で過剰発現させることにより、細胞中のDNAの転写因子結合部位特異的に、メチル化部位を、以下に限定するものではないが、例えば10%以上、より好ましくは20%以上、特に好ましくは50%以上低減することができる。
 DNA中の転写因子結合部位は、例えば、Cloverプログラム(Frith et al., (2004) Nucleic Acids Res., 32: p.1372-1381)、及びJASPAR COREデータベース(ver. 2009)を用いて、あるいはTRANSFAC(http://www.gene-regulation.com/index2.html)、Genomatix等を用いて、容易に同定することができる。
 例えば、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子がRUNX1遺伝子の場合、DNA配列中のRUNX1結合モチーフは、A(0.1435, 0.1170, 0.0615, 0.0285, 0.0000, 0.0435, 0.0000, 0.0085, 0.0050, 0.0655, 0.2500), C(0.2480, 0.2425, 0.5360, 0.0000, 0.0375, 0.0635, 0.0000, 0.0210, 0.2000, 0.2315, 0.0790), G(0.3480, 0.2335, 0.0745, 0.0035, 0.9360, 0.0350, 0.9935, 0.9240, 0.1255, 0.0405, 0.1445), T(0.2605, 0.4070, 0.3280, 0.9680, 0.0265, 0.8580, 0.0065, 0.0465, 0.6695, 0.6625 0.526 5)で表される位置特異的重み行列で表され、特定のDNA配列について算出されたスコアが6以上となる場合に、当該DNA配列を候補RUNX1結合部位として同定することができる。
 部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を過剰発現する細胞や、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞において脱メチル化されるDNA部位は、メチル化アレイ解析及び/又はバイサルファイトシークエンス法により同定することができる。より具体的には、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を過剰発現する細胞におけるメチレーション部位(典型的にはCpG部位)のメチル化状態を、上記転写因子をコードする遺伝子を過剰発現しない細胞(野生型細胞)におけるメチレーション部位のメチル化状態と比較し、有意にメチル化が低減した(又は、脱メチル化が増加した)メチレーション部位を、部位特異的な脱メチル化部位と判定することができる。あるいは、部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現する細胞におけるメチレーション部位(典型的にはCpG部位)のメチル化状態を、TET遺伝子及び/又はTDG遺伝子を過剰発現するが上記転写因子をコードする遺伝子を過剰発現しない細胞におけるメチレーション部位(典型的にはCpG部位)のメチル化状態と比較して、有意にメチル化が低減した(又は、脱メチル化が増加した)メチレーション部位を、部位特異的な脱メチル化部位と判定することができる。メチル化状態(メチル化プロファイル)の検出及び脱メチル化部位の同定は、メチル化アレイ解析及び/又はバイサルファイトシークエンス法により実施することができる。メチル化アレイ解析で脱メチル化部位として同定されたメチレーション部位についてバイサルファイトシークエンス法で塩基配列を調べることにより、脱メチル化をさらに確認することもできる。メチル化アレイ解析及びバイサルファイトシークエンス法は市販のメチル化解析アレイ及びキット、メチル化検出キット等を用いて実施することができ、具体的な実験手順については後述の実施例も参照することができる。RUNX1遺伝子、TET遺伝子及びTDG遺伝子を過剰発現する細胞において脱メチル化されるDNA部位(CpG)の例を、後掲の表1及び表2に示す。
 以上のようにして部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を細胞中で過剰発現させることにより、細胞中のDNAの部位特異的な脱メチル化を増強することができる。また、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させることにより、細胞中のDNAの部位特異的な脱メチル化をさらに増強することができる。この系は、転写因子結合部位特異的な脱メチル化の増強に基づく遺伝子発現の変化を細胞にもたらすことから、DNA脱メチル化の機能を調べるための研究ツールとして有利に用いることができる。
 この系はまた、造血系細胞におけるDNA脱メチル化を増強し、血液細胞の分化を促進するために用いることもできる。特に万能細胞(ESC、iPS細胞など)や造血幹細胞又は造血前駆細胞において転写因子をコードする遺伝子を過剰発現させるか、又は、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現させることにより、造血系遺伝子を活性化し(すなわち遺伝子のプロモーター領域における発現抑制を解除して遺伝子発現を誘導し)、当該細胞の造血系への運命決定を強く促すことができる。過剰発現させる転写因子コード遺伝子としては、以下に限定するものではないが、例えば、engrailed(EN)ファミリー、NR4Aファミリー、HANDファミリー、IRFファミリー、FOXDファミリー、FOXOファミリー、TALファミリー、TCFファミリー、NFE2Lファミリー、ELFファミリー、NFATCファミリー、HLFファミリー、NFIL3ファミリー、AP1ファミリー、BRCAファミリー、RUNXファミリー、SPIファミリーの転写因子をコードするものが挙げられる。
 この系はまた、転写因子結合部位特異的な脱メチル化に影響を及ぼす薬剤(脱メチル化調節剤)のスクリーニングに有利に用いることができる。そのようなスクリーニング方法では、転写因子をコードする遺伝子を過剰発現させた細胞、又は、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現させた細胞を、被験物質(好ましくは脱メチル化調節剤の候補となり得る物質)の存在下で培養することにより被験物質で処理し、処理したその細胞中のDNAのメチル化状態を評価し、被験物質不在下の細胞と比較したメチル化状態の変動を検出すればよい。コントロールとしては、それぞれ、転写因子をコードする遺伝子を細胞中で過剰発現させた細胞、又は、転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させた細胞を、被験物質の不在下で培養し、細胞中のDNAのメチル化状態を評価すればよい。ここでDNAのメチル化状態の評価とは、メチル化レベル(メチル化されたメチレーション部位(CpG部位等)の数、相対量又は割合)の測定、又はメチル化されたメチレーション部位(CpG部位等)又はその分布の特定等の任意のメチル化指標等の評価であってよいが、これらに限定されない。被験物質で処理した細胞のDNAメチル化レベルが、被験物質で処理しなかった細胞のDNAメチル化レベルと比較して有意に増加した場合、その被験物質を、当該転写因子結合部位特異的な脱メチル化を抑制する作用を有する脱メチル化調節剤(脱メチル化抑制剤)として同定することができる。あるいは、被験物質で処理した細胞のDNAメチル化レベルが、被験物質で処理しなかった細胞のDNAメチル化レベルと比較して有意に低下した場合、その被験物質を、その転写因子結合部位特異的な脱メチル化をさらに増強する作用を有する脱メチル化調節剤(脱メチル化増強剤)として同定することができる。あるいは、被験物質で処理した細胞においてメチル化された特定部位が、被験物質で処理しなかった細胞において脱メチル化された場合には、その被験物質を、その特定部位での脱メチル化を促進する作用を有する脱メチル化調節剤(脱メチル化促進剤)として同定することもできる。このような脱メチル化調節剤のスクリーニング方法は、メチル化又は脱メチル化の異常に起因する疾患の治療・予防薬候補物質の探索のために有用である。本スクリーニング方法に適用する被験物質は、特に限定されないが、例えば、低分子又は高分子の有機化合物、タンパク質、ペプチド、アミノ酸、siRNAやshRNA等の核酸分子、無機化合物等が挙げられる。被験物質はまた、抗がん剤等の既知の薬剤であってもよい。また、このスクリーニング方法と同様の手順を用いて、被験物質の脱メチル化活性を検出することもできる。ここで、被験物質の「脱メチル化活性」とは、DNA中のメチレーション部位の脱メチル化を促進する活性を意味する。転写因子をコードする遺伝子を過剰発現させた細胞、又は転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を過剰発現させた細胞を、被験物質の存在下で培養することにより被験物質で処理し、処理したその細胞中のDNAのメチル化状態を評価し、被験物質不在下の細胞と比較したメチル化状態の変動を検出することにより、被験物質の脱メチル化活性を検出することができる。そのDNAのメチル化状態の評価において、被験物質で処理した細胞のDNAメチル化レベルが、被験物質で処理しなかった細胞のDNAメチル化レベルと比較して有意に低下した場合、被験物質の脱メチル化活性が検出されたものと判定することができ、その脱メチル化活性は、測定されたメチル化低下レベルを指標として表すことができる。一方、DNAのメチル化状態の評価において、被験物質で処理した細胞のDNAメチル化レベルが、被験物質で処理しなかった細胞のDNAメチル化レベルと比較して有意な変化がない又は有意に増加した場合、被験物質の脱メチル化活性は検出されなかったものと判定することができる。したがって本発明は、このような被験物質の脱メチル化活性の検出方法も提供する。この方法に適用する被験物質やDNAのメチル化状態の評価方法は上記脱メチル化調節剤のスクリーニング方法と同じである。
 以下、実施例を用いて本発明をさらに具体的に説明する。但し、本発明の技術的範囲はこれら実施例に限定されるものではない。
 以下の実施例において用いる293T細胞は理化学研究所バイオリソースセンター(理研BRC)(日本)から入手した。293T細胞は、ポリ-D-リシンコートした培養プレート(Beckton Dickinson and Co., Franklin Lakes, NJ, USA)中、10%ウシ胎仔血清、ペニシリン及びストレプトマイシン(それぞれ最終濃度100 U/mL、100 μg/mL; Thermo Fisher Scientific Inc., Waltham, MA, USA)を添加したダルベッコ改変イーグル培地(DMEM)(Wako Pure Chemical Industries, Ltd, Osaka, Japan)で培養したものを用いた。
[実施例1]RUNX1過剰発現細胞の構築
1)プラスミドベクターの構築
 理研BRCの三好浩之博士から譲渡された第三世代自己不活化(self inactivating; SIN)レンチウイルスプラスミドベクターCSII-EF-RfAに転写因子遺伝子RUNX1と抗生物質耐性遺伝子をクローン化した発現ベクターを作製した。具体的には、抗生物質耐性遺伝子であるハイグロマイシン耐性遺伝子(NCBI RefSeq proteinアクセッション番号YP_009062988)及びピューロマイシン耐性遺伝子(RefSeq proteinアクセッション番号YP_006732174)を、ベクターpIREShyg3及びpIRESpuro3(Clontech)から、それぞれプライマーペアhyg(フォワード: 5'-AATATGGCCACAACCGCGGCCGCGACTCTAGAT-3'(配列番号1)及びリバース: 5'-TAGAGTCGCGGCCGCCTATTCCTTTGCCCTCGG-3'(配列番号2))、又はプライマーペアpuro(フォワード: 5'-AATATGGCCACAACCATGACCGAGTACAAGCCCACG-3'(配列番号3)及びリバース: 5'-TAGAGTCGCGGCCGCTCAGGCACCGGGCTTGCG-3'(配列番号4))を用いてKOD-plus DNAポリメラーゼ(Toyobo Co)により増幅した。得られたPCR産物をそれぞれ線状化pIRES2プラスミドDNAにIn-Fusion(登録商標)クローニング技術(Clontech)を用いて挿入及び連結し、組換えプラスミドpIRES2-hyg及びpIRES2-puroを作製した。なお線状化pIRES2プラスミドDNAは、pIRES2-DsRed-Express2(Clontech)のDsRed-Express2配列を除く全長配列をフォワードプライマー 5'-GCGGCCGCGACTCTAGATCATAATC-3'(配列番号5)及びリバースプライマー 5'-GGTTGTGGCCATATTATCATCGTGTTTTTC-3'(配列番号6)を用いて増幅することにより作製した。
 得られたプラスミドpIRES2-hyg及びpIRES2-puroから、それぞれIRES2-hyg用プライマーペア(フォワード: 5'-CCGCGGATCCTCTAGGCCCCTCTCCCTCCCCCC-3'(配列番号7)、リバース: 5'-CGATGTTAACTCTAGCTATTCCTTTGCCCTCGGACGAGTG-3'(配列番号8))又は IRES-puro用プライマーペア(フォワード: 5'-CCGCGGATCCTCTAGGCCCCTCTCCCTCCCCCC-3'(配列番号9)及びリバース: 5'-CGATGTTAACTCTAGTCAGGCACCGGGCTTGCGGGT-3'(配列番号10))を用いて、IRES2-hyg断片及びIRES2-puro断片を増幅させた。これら断片を、SINレンチウイルスプラスミドベクターCSII-EF-RfAのXbaI部位に挿入してそれぞれプラスミドベクターCSII-EF-RfA-IRES2-hyg及びCSII-EF-RfA-IRES2-puroを作製した。
 得られたレンチウイルスプラスミドベクターCSII-EF-RfA-IRES2-puroに、転写因子RUNX1(配列番号12)をコードするヒト遺伝子(RUNX1遺伝子;配列番号11)のGateway(登録商標)エントリークローンからGateway技術のLR反応によりRUNX1遺伝子とピューロマイシン耐性遺伝子の両方をEF-1αプロモーターの制御下で構成的に発現可能なプラスミドベクターRUNX1-PuroRを作製した。
 同様に、上記で作製したCSII-EF-RfA-IRES2-hygに、ヒトTET2遺伝子(配列番号16;コードされるアミノ酸配列を配列番号17に示す;GenBankアクセッション番号NP_001120680)又はヒトTET3遺伝子(配列番号18;コードされるアミノ酸配列を配列番号19に示す;GenBankアクセッション番号NP_001274420)のGateway(登録商標)エントリークローン(Thermo Scientific, Gene Copoiea)からGateway技術のLR反応により、TET2遺伝子又はTET3遺伝子とブラストサイジン耐性遺伝子の両方をEF1αプロモーターの制御下で構成的に発現可能なプラスミドベクターTET2-HygR及びTET3-HygRを作製した。
 また、CSII-EF-RfA中にブラストサイジン耐性遺伝子(NCBI RefSeq proteinアクセッション番号XP_002849617)をクローン化したプラスミドベクターとして、上記と同様の方法で以前に作製したCSII-EF-RfA-IRES2-Bsd(Suzuki et al., PLos ONE, (2012) Vol.7, (3) e33474)を用意した。なおブラストサイジン耐性遺伝子は、ベクターpCMV-Bsd(Life Technologies)から、プライマーペア(フォワード: 5'-AATATGGCCACAACCATGGCCAAGCCTTTGTCTCAAGAAG-3'(配列番号20)及びリバース: 5'-TAGAGTCGCGGCCGCTTAGCCCTCCCACACATAACCAG-3'(配列番号21))を用いてKOD-plus DNAポリメラーゼ(Toyobo Co)を使用したPCR法により増幅されたものである。このCSII-EF-RfA-IRES2-Bsdに、ヒトTDG遺伝子(配列番号22;コードされるアミノ酸配列を配列番号23に示す;GenBankアクセッション番号NP_003202)のGateway(登録商標)エントリークローン(Thermo Scientific)からGateway技術のLR反応によりTDG遺伝子とブラストサイジン耐性遺伝子の両方をEF1αプロモーターの制御下で構成的に発現可能なプラスミドベクターTDG-BsdRを作製した。
 さらに、理研BRCの三好浩之博士から譲渡されたプラスミドベクターCSII-EF-RfA-IRES2-Venusに、RUNX1遺伝子のGateway(登録商標)エントリークローンからGateway技術のLR反応により、RUNX1遺伝子とVenus遺伝子の両方をEF1αプロモーターの制御下で構成的に発現可能なプラスミドベクターRUNX1-Venusを作製した。
 以上のプラスミドベクターの概略図を図1に示す。
2)レンチウイルスベクター(偽型ウイルス粒子)の作製
 レンチウイルスベクターの作製はSuzuki et al., PLos ONE, (2012) Vol.7, (3) e33474に記載の方法に従って行った。簡単に説明すると、293T細胞(4 x 106細胞)をポリ-D-リシンでコートした10cmディッシュ(Becton, Dickinson and Co., Franklin Lakes, NJ, USA)にトランスフェクションの24時間前に播種した。トランスフェクションの1時間前に培地を5%ウシ胎仔血清と25μM クロロキンを添加した新鮮培地(ペニシリン及びストレプトマイシンをそれぞれ最終濃度100 U/mL、100 μg/mLで添加したOpti-MEM(Thermo Fisher Scientific Inc.))に交換した。上記で作製したRUNX1遺伝子とピューロマイシン耐性遺伝子を含むレンチウイルス発現プラスミドベクターRUNX1-PuroRを、パッケージングプラスミドpCMV-VSV-G-RSV-Rev及びpCAG-HIVgp(いずれも理研BRCの三好浩之博士から譲渡)と共に、Fugene(登録商標) HDトランスフェクション試薬(Promega Corp., Madison, WI, USA)を用いて293T細胞へとトランスフェクションした。トランスフェクションの24時間後、培地を新鮮培地Opti-MEM(Thermo Fisher Scientific Inc.)に交換した。培地交換の24時間後及び48時間後にパッケージングされた偽型レンチウイルス粒子を含有する上清を回収した。取得した上清(偽型ウイルス原液)を0.45μmシリンジフィルター(NIPPON Genetics Co. Ltd, Tokyo, Japan)を用いてろ過し、20℃で2時間、50,000 x g(Beckman SW28ローターで19400 rpm)にて遠心分離した。ペレット化偽型ウイルス粒子(レンチウイルスベクターRUNX1-puroVP)を100μl HBSS中に再懸濁し、-80℃で保存した。
 上記2)で作製した他のレンチウイルス発現プラスミドベクターTET2/TET3-HygR、TDG-BsdR、及びRUNX1-Venusについても、上記と同様にパッケージングプラスミドと共に293T細胞へとトランスフェクションし、培養後に得られた上清からパッケージングされた偽型ウイルス粒子を取得し、保存した。得られたレンチウイルスベクターをそれぞれTET2-hygVP、TDG-bsdVP、及びRUNX1-venusVPと名付けた。
3)レンチウイルスベクターを用いた細胞への形質導入
 293T細胞(1 x 105細胞)を、ポリ-D-リシンでコートした6ウェル培養ディッシュ(Becton, Dickinson and Co.)にレンチウイルス感染の1日前に播種した。上記で作製したレンチウイルスベクターRUNX1-puroVP、又は空ベクターを、8μg/mLポリブレンを用いて1 MOI(Multiplicity Of Infection)で293T細胞に感染させ、形質導入することにより、293T-RUNX1細胞及び293T-mock細胞をそれぞれ作製した(図2A)。形質導入細胞は2μg/mLのピューロマイシンを添加した培地で7日間培養することにより選択した(図2A)。なお空ベクターは、ピューロマイシン耐性遺伝子を含むがRUNX1遺伝子を含まない点以外は上記と同じレンチウイルス発現プラスミドベクターを、上記パッケージングプラスミドと共に293T細胞へとトランスフェクションして得られたレンチウイルスベクター(偽型ウイルス粒子)である。得られた293T-RUNX1細胞はRUNX1を構成的(恒常的)に過剰発現する。
 同様に、上記で作製したレンチウイルスベクターTET2-hygVP又はTET3-hygVP、及びレンチウイルスベクターTDG-BsdVPの双方を、8μg/mLポリブレンを用いて1 MOI(Multiplicity Of Infection)で293T細胞に感染させ、形質導入することにより293T-TET2-TDG細胞及び293T-TET3-TDG細胞をそれぞれ作製した(図2B)。形質導入細胞は、ハイグロマイシン(最終濃度100μg/mL)及びブラストサイジン(最終濃度20μg/mL)の存在下で7日間培養することにより選択した(図2B)。得られた293T-TET2-TDG細胞及び293T-TET3-TDG細胞はTET2又はTET3とTDGとを構成的(恒常的)に過剰発現する。
 さらに、上記で作製したRUNX1遺伝子とVenus遺伝子とを含むレンチウイルスベクター(RUNX1-Venusレンチウイルスベクター)を、8μg/mLポリブレンを用いて1 MOIで、上記で作製した293T-TET2-TDG細胞又は293T-TET3-TDG細胞に感染させ、形質導入することにより293T-TET2-TDG-RUNX1細胞及び293T-TET3-TDG-RUNX1細胞をそれぞれ作製した(図2B)。形質導入細胞は、感染処理の7日後に、SORP FACSAriaTMIIセルソーター(Becton, Dickinson and Co.)を用いてVenusの蛍光を利用したFACS(登録商標)ソーティングにより、Venus陽性細胞を純化した(図2B)。
 このようにして、導入遺伝子を構成的(恒常的)に発現(過剰発現)する形質導入細胞を作製した。
[実施例2]メチル化アレイ解析
 実施例1で作製した形質導入細胞について、Infinium(登録商標) HumanMethylation450 BeadsChip array(Illumina Inc.)を使用してゲノムワイドなDNAメチル化状態をプロファイルした。形質導入細胞からゲノムDNAを常法により抽出した。EZ DNA Methylation-GoldTM Kit(Zymo Research Corp.)で処理したゲノムDNAを製造業者の指示書に従ってメチル化アレイにハイブリダイズした。得られたメチル化アレイシグナルデータから、Illuminaマイクロアレイデータ処理用のBioconductorパッケージのlumiを用いてメチル化度を示すM値をメチル化アレイ上の各プローブについて算出した。
 RUNX1存在下で脱メチル化されたプローブを同定するため、293T-mock細胞と293T-RUNX1細胞の間、293T-TET2-TDG細胞と293T-TET2-TDG-RUNX1細胞の間、293T-TET3-TDG細胞と293T-TET3-TDG-RUNX1細胞の間で各プローブのM値を比較した。M値に基づくスキャッタープロットを図3に示す。図3中、各プローブ(ドット)のM値の差(ΔM; ΔM=RUNX1を導入した細胞のM値-RUNX1を未導入の細胞のM値)=2(上)又は-2(下)となるラインをそれぞれ点線で示した。ΔM<-2を指標としてRUNX1導入細胞における脱メチル化プローブを同定したところ、293T-mock細胞と293T-RUNX1細胞の間、293T-TET2-TDG細胞と293T-TET2-TDG-RUNX1細胞の間、293T-TET3-TDG細胞と293T-TET3-TDG-RUNX1細胞の間で、それぞれ145個、363個、及び364個の脱メチル化プローブが同定された。293T-TET2-TDG-RUNX1細胞と293T-TET3-TDG-RUNX1細胞の間で274個の脱メチル化プローブが重複していた。この結果から、RUNX1をTET及びTDGと共に過剰発現させることにより、RUNX1単独の過剰発現の場合と比較してDNA脱メチル化が増強されることが示された。
 293T-TET2-TDG-RUNX1細胞で同定された脱メチル化プローブを表1に示す。293T-TET3-TDG-RUNX1細胞で同定された脱メチル化プローブを表2に示す。
Figure JPOXMLDOC01-appb-T000002
Figure JPOXMLDOC01-appb-I000003
Figure JPOXMLDOC01-appb-I000004
Figure JPOXMLDOC01-appb-I000005
Figure JPOXMLDOC01-appb-I000006
Figure JPOXMLDOC01-appb-I000007
Figure JPOXMLDOC01-appb-I000008
Figure JPOXMLDOC01-appb-I000009
Figure JPOXMLDOC01-appb-I000010
Figure JPOXMLDOC01-appb-I000011
Figure JPOXMLDOC01-appb-I000012
Figure JPOXMLDOC01-appb-I000013
Figure JPOXMLDOC01-appb-I000014
Figure JPOXMLDOC01-appb-T000015
Figure JPOXMLDOC01-appb-I000016
Figure JPOXMLDOC01-appb-I000017
Figure JPOXMLDOC01-appb-I000018
Figure JPOXMLDOC01-appb-I000019
Figure JPOXMLDOC01-appb-I000020
Figure JPOXMLDOC01-appb-I000021
Figure JPOXMLDOC01-appb-I000022
Figure JPOXMLDOC01-appb-I000023
Figure JPOXMLDOC01-appb-I000024
Figure JPOXMLDOC01-appb-I000025
Figure JPOXMLDOC01-appb-I000026
Figure JPOXMLDOC01-appb-I000027
 なお表1及び表2中、プローブIDはInfinium(登録商標)HumanMethylation450 BeadsChipのプローブIDの番号である。またCpG位置は、ヒトゲノム参照配列バージョンhg19(UCSC Genome Bioinformatics; http://hgdownload.cse.ucsc.edu/downloads.html)を基準として定められるCの塩基番号である。
 一方、RUNX1の不在下、すなわち293T-TET2-TDG細胞及び293T-TET3-TDG細胞におけるメチル化プローブ及び脱メチル化プローブも同定した。293T-TET2-TDG細胞及び293T-TET3-TDG細胞における各プローブのM値を293T-mock細胞でのM値と比較した。M値に基づくスキャッタープロットを図4に示す。図4中、各プローブ(ドット)のM値の差(ΔM=293T-TET2-TDG細胞又は293T-TET3-TDG細胞のM値-293T-mock細胞のM値)=2(上)又は-2(下)となるラインをそれぞれ点線で示した。ΔM>2を指標として、メチル化プローブが、293T-TET2-TDG細胞-293T-mock細胞間では1548個、293T-TET3-TDG細胞-293T-mock細胞間では1597個同定され、ΔM<-2を指標として、脱メチル化プローブが、293T-TET2-TDG細胞-293T-mock細胞間では1373個、293T-TET3-TDG細胞-293T-mock細胞間では1361個同定された。このように293T-TET2-TDG細胞及び293T-TET3-TDG細胞では、メチル化増強と脱メチル化増強の両方が生じた。
 図3から、RUNX1を過剰発現させることにより脱メチル化が誘導されることが示された。さらに、図3と図4の比較から、RUNX1をTET及びTDGと共に過剰発現させると、TET及びTDGを過剰発現させた場合と比較して、メチル化増強よりも脱メチル化増強にシフトすることが示された。
[実施例3]DNA脱メチル化の部位特異性の解析
 メチル化アレイ解析によるRUNX1媒介脱メチル化誘導の結果を確認し、かつそのDNA脱メチル化の部位特異性を解析するため、293T-RUNX1において脱メチル化された2つのプローブ(PTPN22遺伝子とRUNX3遺伝子にそれぞれ関連する)をランダムに選択し、それらプローブの近傍をバイサルファイトシークエンスによって解析した。
 バイサルファイトシークエンスに用いるゲノムDNAは、293T-mock細胞及び293T-RUNX1細胞から、NucleoSpin(登録商標) Tissue Kit(Macherey-Nagel GmbH & Co. KG, Duren, Germany)を用いて製造業者の説明書に従って単離した。メチル化検出キットであるEZ DNA Mathylation-GoldTM Kit(Zymo Research Corp., Irvine, CA, USA)を用いて、バイサルファイト処理によりゲノムDNAの非メチル化シトシンをウラシルに変換した。次いで変換後のゲノムDNAを鋳型として、標的ゲノム領域を、PPN22遺伝子に対するプライマーペア(フォワード: 5'-TTGTTTTGGGTTTTATTTAGGA-3'(配列番号24)、リバース: 5'-AATAATCTCAATTAAACAAACCACA-3'(配列番号25))、又はRUNX3遺伝子に対するプライマーペア(フォワード: 5'-TTAAGGAAAGTAAGTTTTTGTTTGT-3'(配列番号26); リバース: 5'-ACTAAAAAAACCTAATCCCTCA-3'(配列番号27))を使用し、EpiTaqTMHS(Takara Bio Inc.)を製造業者の説明書に従って用いて増幅した。得られたPCR産物はTArgetTM Clone KIt(Toyobo Co., Ltd.)を用いてpTA2プラスミドにクローン化し、BigDye(登録商標) Terminator Ver3.1 Cycle Sequencing Kit(Thermo Fisher Scientific Inc.)を用いて3730x1 DNA Analyzer(Thermo Fisher Scientific Inc.)でシークエンスを行った。各標的について24個のクローンをシークエンスした。得られた塩基配列においてメチル化CpGの配列はCG、非メチル化CpGの配列はTGとして検出された。図5にその結果を模式的に示す。図5中、黒丸がメチル化CpG、白丸が非メチル化CpGを示し、矢印は顕著に脱メチル化されたプローブのCpGを示す。293T-RUNX1細胞において、293T-mock細胞と比較して、プローブ部位、隣接部位、又はその両方が有意に脱メチル化されたことが示された(PTPN22についてP<10-11、RUNX3についてP<10-17;フィッシャーの正確検定)。
 続いて、実施例2でそれぞれの形質導入細胞について得られた、メチル化アレイ上の脱メチル化プローブ145個及び全プローブからランダムに選択されたプローブ145個のそれぞれのCpG部位から±500bpの領域の塩基配列を、ヒトゲノム参照配列バージョンhg19(UCSC Genome Bioinformatics; http://hgdownload.cse.ucsc.edu/downloads.html)から抽出した。得られた塩基配列について、Cloverプログラム(Frith et al., (2004) Nucleic Acids Res., 32: p.1372-1381)を用いて、JASPAR COREデータベース(ver. 2009)中の転写因子結合モチーフの検索及び統計学的検定を行った。その結果、293T-mock細胞と比較して293T-RUNX1細胞で同定された脱メチル化プローブについて、有意に過剰出現した27個の転写因子結合モチーフが同定された(P< 0.001のカットオフ値)(表3)。
Figure JPOXMLDOC01-appb-T000028
 293T-TET2-TDG細胞と比較して293T-TET2-TDG-RUNX1細胞で同定された脱メチル化プローブについては、有意に過剰出現した55個の転写因子結合モチーフが同定された(P< 0.001のカットオフ値)(表4)。
Figure JPOXMLDOC01-appb-T000029
Figure JPOXMLDOC01-appb-I000030
 293T-TET3-TDG細胞と比較して293T-TET3-TDG-RUNX1細胞で同定された脱メチル化プローブについては、有意に過剰出現した51個の転写因子結合モチーフが同定された(P< 0.001のカットオフ値)(表5)。
Figure JPOXMLDOC01-appb-T000031
Figure JPOXMLDOC01-appb-I000032
 いずれの細胞で同定された脱メチル化CpG部位周辺でも、RUNX1結合モチーフが最も高頻度に出現していた。
 さらにRUNX1結合モチーフの位置分布を調べたところ、293T-RUNX1細胞、293T-TET2-TDG-RUNX1細胞、及び293T-TET3-TDG-RUNX1細胞のいずれにおいても、RUNX1結合モチーフは脱メチル化プローブのCpG部位(脱メチル化CpG)を中心として濃縮されていた(図6実線)。かなり多数のRUNX1結合モチーフが脱メチル化CpGの近傍、特に±200 bpの範囲内に位置していた。対照的に、全プローブからランダムに選択された145個のプローブのCpG部位に対してはRUNX1結合モチーフは均等に分布していた(図6点線)。
 以上の結果から、RUNX1は、RUNX1結合モチーフを含む概ね400bp幅の領域内でRUNX1結合部位特異的なDNA脱メチル化を誘導することが示された。
[実施例4]RUNX1による造血系遺伝子に対する脱メチル化作用の解析
 RUNX1は造血系遺伝子の発現調節において重要な役割を果たす(Zhang et al., (1996) Mol. Cell Biol. 16: p.1231-1240; Uchida et al., (1997) J. Immunol., 158: p.2251-2258; Huang et al., (2008) Nat. Genet. 40: p.51-61)。そこで、造血におけるRUNX1媒介DNA脱メチル化の生物学的意義を明らかにするため、ヒト胚性幹細胞(ESC)と造血系細胞について、上記で同定した脱メチル化部位におけるDNAメチル化状態を調べた。調査対象の脱メチル化部位は、293T-TET2-TDG-RUNX1細胞及び293T-TET3-TDG-RUNX1細胞で同定した451個の脱メチル化プローブ(以下、RUNX1標的プローブと称する)のCpGである。比較のため、アレイ上の全プローブにおけるDNAメチル化状態も調べた。
 ヒト胚性幹細胞(ESC)、CD34+造血幹細胞/前駆細胞(CD34)、CD14+単球(CD14)、及び末梢血単核細胞(PBMC)について、Infinium(登録商標) HumanMethylation450 BeadsChip arrayによるメチル化アレイデータをGEO ID: GSE40790の下でGEO(Gene Expression Omnibus)のデータベースより入手し、上記実施例と同様にしてM値を算出した。ESCとCD34、ESCとCD14、及びESCとPBMCの間で各RUNX1標的プローブのM値を比較した。M値に基づくスキャッタープロットを図7に示す。M値は、非メチル化とメチル化にそれぞれ対応する低いピークと高いピークの明確な二峰性分布を示したため、RUNX1標的プローブを、M<0を指標として非メチル化プローブ、M≧0を指標としてメチル化プローブに分類した。図7では、点線のように4つの領域に分けたとき、ESCと、CD34、CD14、又はPBMCの両方でメチル化されたプローブが右上(M-M)に、ESCでメチル化されたがCD34、CD14、又はPBMCでメチル化されなかったプローブが右下(M-U)にプロットされている。ESCでは451個のRUNX1標的プローブのうち409個(メチル化率: 90.7%)がメチル化され、そのメチル化率は全プローブにおけるメチル化率(60.5%)よりも有意に高かった。一方、ESCよりも分化が進んだCD34、CD14、及びPBMCにおけるRUNX1標的プローブのメチル化率は、それぞれ66.3%、60.6%、及び60.4%であったことから、CD34、CD14、及びPBMCでの脱メチル化誘導が示された。これらの結果はRUNX1媒介DNA脱メチル化が血液細胞の分化において極めて重要な役割を果たすことを示している。特に、脱メチル化が、最終分化したCD14やPBMCではもちろん、その前段階のCD34において既に顕著に誘導されていることは注目に値する。これはすなわち、RUNX1が血液細胞の最終分化というよりはむしろ造血系への運命決定において重要な役割を果たすことを意味している。
 そこでFANTOM5プロジェクト(Forrest et al., (2014) Nature, 507: p.462-470)で取得されたCAGE発現データを用いて、遺伝子発現の変化を比較した。一方、プロモーター領域に位置し、ESCでメチル化された60個のRUNX1標的プローブを選択し、ESCでメチル化されたがCD34でメチル化されなかった(脱メチル化された)群(M-U群)とESCとCD34の両方でメチル化された群(M-M群)に分類した。これらの結果を対応させたところ、ESCと比較したCD34において、M-U群のプローブに対応する遺伝子群の発現が、M-M群の遺伝子群の発現と比較して有意な増加を示すことが明らかとなった。この遺伝子発現の増加は、ESCとCD14、ESCとPBMCの間でも同様であった。したがってRUNX1は、プロモーター領域のCpG部位の脱メチル化により造血の際の遺伝子活性化に直接関与することが示された。
 ESCと比較してCD34、CD14又はPBMCにおいて遺伝子発現の上昇が示されたM-U群のRUNX1標的プローブに対応する遺伝子を表6に示す。
Figure JPOXMLDOC01-appb-T000033
 以上の結果から、RUNX1は、脱メチル化を介した造血系遺伝子の活性化により、造血系細胞の分化に寄与することが示された。
[実施例5]各種転写因子とTET及びTDGの共発現による部位特異的な脱メチル化誘導の促進
 本実施例ではRUNX1以外の転写因子とTET及びTDGの共発現が脱メチル化に及ぼす影響を調べた。RUNX1遺伝子の代わりに他の転写因子をコードする遺伝子(表7)を用いる点、及びTET遺伝子として酵素活性部位を含むTET1部分断片(TET改変体;配列番号15の1402~2136位に相当)をコードするTET遺伝子改変体(塩基配列:配列番号49、アミノ酸配列:配列番号50;配列番号14の4204~6408位に相当)を用いる点以外は実施例1と同様にして、TET遺伝子及びTDG遺伝子を過剰発現する293T細胞(293T-TcdT)、及び各種ヒト転写因子をコードする遺伝子、ヒトTET遺伝子、及びヒトTDG遺伝子を過剰発現する293T細胞を作製した。なお用いたTDG遺伝子は実施例1と同じである。さらに実施例2と同様にしてInfinium(登録商標) HumanMethylation450 BeadsChip arrayを用いてメチル化アレイ解析を行い、各プローブのM値を算出し、上記細胞間でM値を比較することにより、脱メチル化が増強されたことを確認し、脱メチル化プローブを同定した。続いて、実施例3と同様に、各プローブの脱メチル化CpG部位から±5kbpの領域の塩基配列について、転写因子結合モチーフの検索を行った。さらに、各転写因子について、実施例3に記載の方法によって得られた転写因子結合モチーフの検索結果について統計学的解析を行った。具体的には、各転写因子をTDG及びTET若しくはTET改変体とともに293T細胞で過剰発現させた場合の、脱メチル化プローブ中の脱メチル化CpG部位の近傍配列(±5kbp)における転写因子結合モチーフの位置を中心とする標準正規分布を足し合わせた混合分布から、ランダムに選択されたプローブの近傍配列(±5kbp)における転写因子結合モチーフの位置を中心とする標準正規分布を足し合わせた混合分布を差し引いて、混合頻度分布を得た。この混合頻度分布は、脱メチル化プローブの近傍における転写因子結合モチーフのバックグラウンド補正された出現頻度分布である。また実施例3で転写因子結合モチーフの検索を行ったRUNX1についても同様の解析を行った。得られた混合頻度分布を、図8~11に示した。一方、PAX4(NCBI RefSeq proteinアクセッション番号NP_006184)及びNKX2-5(NCBI RefSeq proteinアクセッション番号NP_004378)についても同様の転写因子結合モチーフの検索及び解析を行った。その結果を図12に示す。なお「293T-TcdT」はTET改変体(Tcd; TET catalytic domain)とTDG(T)を過剰発現する293T細胞を表す。また「293T-TcdT-RUNX1」はTET改変体とTDGとRUNX1を過剰発現する293T細胞を表す。他の転写因子遺伝子を過剰発現させた293T細胞も同様に表記する。
 図8~11に示すとおり、部位特異的なDNA脱メチル化を誘導することが示されたRUNX1と同様に、転写因子RUNX3、CEBPB、CEBPA、MAFB、NR4A2、MYOD1及びGATA2についても、混合頻度分布で示される転写因子結合モチーフの出現頻度分布は、脱メチル化CpG部位の位置(X軸の0)付近を頂点としたピークを形成した。なお、部位特異的なDNA脱メチル化を誘導するとされているSPI1も同様の解析で脱メチル化CpG部位の位置(X軸の0)付近を頂点としたピークを形成した(図23)。さらに、得られた出現頻度分布(混合頻度分布)に基づいてピーク最大値を出現頻度全体の四分位範囲×3+第3四分位((IQRx3)+Q3)の値と比較したところ、表7に示すようにピーク最大値が上回っていた。
Figure JPOXMLDOC01-appb-T000034
 これらの結果は、導入した転写因子の結合モチーフが脱メチル化CpG部位を中心に濃縮されていること、すなわち、これらの転写因子が部位特異的なDNA脱メチル化を誘導することを示している。
 また実施例2及び実施例3と同様にして、脱メチル化プローブの近傍をバイサルファイトシークエンスによって解析し、実際に部位特異的に脱メチル化が起こっていることを確認した。バイサルファイトシークエンスに用いた脱メチル化領域増幅用プライマーペアは以下のとおりである。
・RUNX1
フォワードプライマー:5'-GTGATGTTTTTGGATAGGTTAGGAG-3'(配列番号51)
リバースプライマー:5'-ATCACTCAATTTCATCATATTTCTCAA-3'(配列番号52)
・RUNX3
フォワードプライマー:5'-GGGTTAGGGGTTGAAGGAGTTATTA-3'(配列番号53)
リバースプライマー:5'-AAAACCACCACCTTAACAACAAAAA-3'(配列番号54)
・CEBPB
フォワードプライマー:5'-TTTAGTTGTTTGTGTTATTTTTTTTGT-3'(配列番号55)
リバースプライマー:5'-TAAATCATCCATTATTATATCACTCCTTAT-3'(配列番号56)
・CEBPA
フォワードプライマー:5'-AGTTTTTTTGTATGAGGGAAGTTTTTAAAA-3'(配列番号57)
リバースプライマー:5'-CTATATTCCCAAAAAACCTTACCCC-3'(配列番号58)
・MAFB
フォワードプライマー:5'-TGTTAGGTTTTAGATAGAAATATAATTGAG-3'(配列番号59)
リバースプライマー:5'-TCTAAAAATAAAAAAACTACATTCTCATAC-3'(配列番号60)
・NR4A2
フォワードプライマー:5'-GGTGGGTATTGTAAAGGTATTTG-3'(配列番号61)
リバースプライマー:5'-AAATTCACAATAAAAACAATAAAAAACTAA-3'(配列番号62)
・MYOD1
フォワードプライマー:5'-TTTGATAGTTGAGGGGGAAATT-3'(配列番号63)
リバースプライマー:5'-ACCTAACCAAAAACCTCTACAAAAC-3'(配列番号64)
・GATA2
フォワードプライマー:5'-GTTGTTATGGTTTAATATAAGGG-3'(配列番号65)
リバースプライマー:5'-AACCCATTTCACAAATAAAACTATC-3'(配列番号66)
・SPI1
フォワードプライマー:5'-TTGTTTTTATATAAGAGGAGGAAAATAGAG-3'(配列番号67)
リバースプライマー:5'-AAAAAACCAAATTCACAATCCATAC-3'(配列番号68)
 バイサルファイトシークエンス解析の結果を図14~22に示す。
 以上の結果に基づき、TET及びTDGと共に発現させることによって転写因子結合部位特異的に脱メチル化を高効率に誘導することができる転写因子群が同定された。同定された転写因子群を表8に示す。
Figure JPOXMLDOC01-appb-T000035
[実施例6]RUNX1過剰発現によるSPI1遺伝子制御領域の脱メチル化
 RUNX1を過剰発現させた細胞においてゲノムDNAのSPI1遺伝子制御領域の脱メチル化を誘導した。具体的には、実施例1と同様にして、RUNX1を過剰発現する293T細胞及び陰性対照として空のレンチウイルスベクターを導入した293T細胞(形質導入細胞)を作製した。作製した形質導入細胞から実施例3と同様に、SPI1制御領域に対するプライマーペア(フォワード: 5'-GTTGGATATTTTTTTGAGGTTTGG-3'(配列番号69)、リバース: 5'-TAAAACCTAAAACTACTAAACCCA-3'(配列番号70))を用いてバイサルファイトシークエンスによりSPI1制御領域のメチル化状態を解析した。
 得られた結果を図23に示す。図23に示されるように、RUNX1過剰発現により、SPI1遺伝子制御領域の脱メチル化が促進された。さらに、配列解析により、このSPI1遺伝子制御領域はRUNX1結合部位を2つ含むことが示された(図24)。これらの結果は、RUNX1をはじめとする部位特異的なDNA脱メチル化を誘導する転写因子を細胞で過剰発現させることにより、細胞中のDNAにおいて転写因子結合部位特異的な脱メチル化を増強できることをさらに裏付けている。
[実施例7]TBX5による部位特異的な脱メチル化誘導の促進
 転写因子TBX5(GenBankアクセッション番号Q99593)をコードする遺伝子を用いる点以外は、実施例5と同様にして、TET遺伝子及びTDG遺伝子を過剰発現する293T細胞(293T-TcdT)、及びヒトTBX5をコードする遺伝子、ヒトTET遺伝子、及びヒトTDG遺伝子を過剰発現する293T細胞を作製し、脱メチル化プローブを同定し、同定された脱メチル化CpG部位から±5kbpの領域の塩基配列について転写因子結合モチーフの検索を行い、その検索結果について統計学的解析を行った。得られた結果を図25に示す。ピーク最大値は173.200、(IQRx3)+Q3は71.141であった。図25に示されるように、TBX5を用いた場合でも、結合モチーフは脱メチル化CpG部位を中心に濃縮されていた。このことは、TBX5が部位特異的なDNA脱メチル化を誘導することを示している。
[実施例8]造血系における脱メチル化領域中の転写因子結合モチーフの濃縮
 造血発生におけるDNAメチル化を全体的に解析するために、iPS細胞(iPSC)(iPSC-253G1; RIKEN Bio-resource Center(BRC), HPS0002)、CD34+造血前駆細胞(HPC)(Poietics, 2M-101c)、CD14+単球(MON)(Poietics Ltd, 2W-400C)、CD3+ T細胞(TC)(HemaCare BioResearch, PB03C-2)及びCD19+ B細胞(BC)(HemaCare BioResearch, PB19C-2)について、単一塩基分解DNAメチル化解析を行った。
 製造業者の使用説明書に従って、NucleoSpin(登録商標) Tissueキット(Macherey-Nagel)を用いてゲノムDNAを単離し、Infinium(登録商標) HumanMethylation450 BeadsArray(Illumina)によるメチル化解析を行った。lumi Bioconductorパッケージ(Du et al., 2008; Yousefi et al., 2013)を使用し、正規化及びM値(M-value)の算出を行った。
 Bioconductor Biostringsパッケージを用いて、JASPER COREに登録されているヒト及びマウスモチーフをhg19ゲノム配列に基づき、80%ミニマムスコアで示差的にメチル化されたCpG(DMC)から±5 kbpの領域内で転写因子結合モチーフを検索した。50bpずつずらした100bpのスライディングウィンドウ中の転写因子結合モチーフをカウントし、ポアソン分布モデルでの正確検定(p < 0.00001)を用いて同じ個数のランダムに選択されたプローブとの比較を行った。次いで有意に異なるモチーフについて濃縮スコア(enrichment score)を以下の式を用いて算出した。
Figure JPOXMLDOC01-appb-M000036
 上記式中、i及びjはDMC領域及びランダムに選択された対照中で同定された転写因子結合モチーフをそれぞれ表し、χt及びχcはDMC領域及びランダムに選択された対照中の転写因子結合モチーフの位置をそれぞれ表す。平滑パラメーターhは50、Kはガウシアンカーネル関数として算出した。
Figure JPOXMLDOC01-appb-M000037
 最大濃縮スコアが(IQRx3)+Q3を超える場合には、過剰出現モチーフ(overrepresented motif)として選択した。
 メチル化解析によって示されたDNAメチル化状態を、iPS細胞とHPCの間(iPSC-HPC)、並びにHPCと3つの終末分化した造血細胞種のいずれかとの間(HPC-MON、HPC-BC及びHPC-TC)で比較したところ、iPSC-HPC、HPC-MON、HPC-BC、及びHPC-TCにおいてそれぞれ32,434個、12,410個、10,278個及び26,376個の脱メチル化CpGが同定された。
 さらに、JASPAR COREデータベース(Sandelin, A. et al., (2004) Nucleic Acids Res., 32, D91-94)に登録された113個のヒト又はマウス転写因子結合モチーフ(TFBM)のうち、iPSC-HPC、HPC-MON、HPC-BC及びHPC-TCにおいてそれぞれ13個、9個、2個及び8個の過剰出現モチーフが脱メチル化領域中で同定された(図26)。図26では、DMC近傍で見出された過剰出現転写因子結合モチーフの最大濃縮スコアを、脱メチル化領域に対するヒートマップとして可視化した。
 図26の右側に示された転写因子結合モチーフは、iPSC-HPC、HPC-MON、HPC-BC及びHPC-TCのいずれかの細胞分化過程で濃縮されていた。図中、濃縮レベルは濃縮スコアに応じた濃さで示している。濃縮スコアが高いほど、脱メチル化を誘導しやすいと考えられる。図中に示された濃縮は、各細胞分化過程における転写因子結合モチーフの脱メチル化との関連性を示している。例えば、NR4A2は造血前駆細胞(HPC)からT細胞(TC)への分化に関与しており、NFATC2はiPS細胞(iPSC)から造血前駆細胞(HPC)への分化及びHPCから単球(MON)への分化に関与していることが図26から示される。
 造血又は免疫機能に関して著名な主たる系統特異的転写因子結合モチーフ(RUNX1、SPIB、NR4A2、IRF1、IRF2及びAP-1(Liebermann, D.A., et al., (1998) Int. J. Oncol., 12, p.685-700; Lohoff, M., and Mak, T.W. (2005) Nat. Rev. Immunol., 5, p.125-135; Okuda, T., et. al., (2000) Mol. Cell Biol., 20, p.319-328; Schotte et al., (2003) Blood 101, p.1015-1023; Sekiya et al., (2011) Nat. Commun., 2, p.269)がこの試験で同定されたことは重要である。このことは、系統特異的転写因子が造血発生においてトランス活性化活性だけでなくDNA脱メチル化活性を有することを示唆している。
 以上の結果から、図26の右側に示された各転写因子結合モチーフに結合する転写因子は、図26に関連が示された細胞分化過程において脱メチル化活性を有することが示された。
 造血前駆細胞(HPC)は様々な血球系細胞の起源となる細胞である。したがってHPCへの分化、及びHPCから単球(MON)、T細胞(TC)及びB細胞(BC)への分化で濃縮されている転写因子結合モチーフに結合する転写因子は、血液細胞分化において脱メチル化に重要な役割を果たし、血球系細胞のダイレクトリプログラミングや万能細胞(iPS細胞やES細胞)からの分化を促進すると考えられる。また終末分化(HPC-MON、HPC-BC、及びHPC-TC)において濃縮している転写因子結合モチーフは、全体として各分化過程に特異的である。したがって各転写因子結合モチーフに結合する転写因子のHPCへの導入は、HPCからの特異的な終末分化誘導を促進すると考えられる。
 図26に示した転写因子結合モチーフに結合し得る転写因子の代表例を表9に示す。
Figure JPOXMLDOC01-appb-T000038
 なお、転写因子結合モチーフSPIB、IRF1及びIRF1のJasper IDは、それぞれMA0081.1、MA0050.1、MA0051.1である。
 本発明は、転写因子結合部位特異的なDNA脱メチル化を高レベルに誘導する転写因子を取得し、細胞内DNAにおける部位特異的なDNA脱メチル化を増強するためのツールとして用いることができる。本発明はまた、転写因子結合部位特異的なDNA脱メチル化を抑制又は増強する薬剤のスクリーニングや被験物質の脱メチル化活性の検出に用いることができる。本発明は、特定部位に高効率に作用する副作用の少ない抗がん剤の開発や細胞リプログラミング又はダイレクト・リプログラミングの効率向上のために用いることができる。
 配列番号1~10:プライマー
 配列番号11:RUNX1遺伝子の塩基配列
 配列番号12:RUNX1アミノ酸配列
 配列番号13:RUNX1のDNA結合ドメイン
 配列番号14:TET1遺伝子の塩基配列
 配列番号15:TET1アミノ酸配列
 配列番号16:TET2遺伝子の塩基配列
 配列番号17:TET2アミノ酸配列
 配列番号18:TET3遺伝子の塩基配列
 配列番号19:TET3アミノ酸配列
 配列番号20及び21:プライマー
 配列番号22:TDG遺伝子の塩基配列
 配列番号23:TDGアミノ酸配列
 配列番号24~27:プライマー
 配列番号28:RUNX3遺伝子の塩基配列
 配列番号29:RUNX3アミノ酸配列
 配列番号30:RUNX3のDNA結合ドメイン
 配列番号31:MYOD1遺伝子の塩基配列
 配列番号32:MYOD1アミノ酸配列
 配列番号33:MYOD1のDNA結合ドメイン
 配列番号34:CEBPA遺伝子の塩基配列
 配列番号35:CEBPAアミノ酸配列
 配列番号36:CEBPAのDNA結合ドメイン
 配列番号37:CEBPB遺伝子の塩基配列
 配列番号38:CEBPBアミノ酸配列
 配列番号39:CEBPBのDNA結合ドメイン
 配列番号40:GATA2遺伝子の塩基配列
 配列番号41:GATA2アミノ酸配列
 配列番号42:GATA2のDNA結合ドメイン
 配列番号43:MAFB遺伝子の塩基配列
 配列番号44:MAFBアミノ酸配列
 配列番号45:MAFBのDNA結合ドメイン
 配列番号46:NR4A2遺伝子の塩基配列
 配列番号47:NR4A2アミノ酸配列
 配列番号48:NR4A2のDNA結合ドメイン
 配列番号49:酵素活性部位をコードするTET遺伝子改変体の塩基配列
 配列番号50:TET遺伝子改変体にコードされるアミノ酸配列
 配列番号51~70:プライマー
 配列番号71:SPI1遺伝子制御領域の塩基配列
 配列番号72:TBX5遺伝子の塩基配列
 配列番号73:TBX5アミノ酸配列
 配列番号74:TBX5のDNA結合ドメイン
 本明細書で引用した全ての刊行物、特許及び特許出願はそのまま引用により本明細書に組み入れられるものとする。

Claims (15)

  1.  部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子を、細胞中で過剰発現させることを含む、細胞中のDNAにおける転写因子結合部位特異的な脱メチル化を増強する方法。
  2.  前記転写因子が、RUNXファミリー、C/EBPファミリー、MAFファミリー、NR4Aファミリー、MYODファミリー、GATAファミリー、及びTBXファミリーの転写因子からなる群から選択される、請求項1に記載の方法。
  3.  前記転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させることを含む、請求項1又は2に記載の方法。
  4.  前記転写因子が、RUNX1、RUNX3、CEBPA、CEBPB、MAFB、NR4A2、MYOD1、GATA2、及びTBX5からなる群から選択される、請求項1~3のいずれか1項に記載の方法。
  5.  TET遺伝子がTET2遺伝子又はTET3遺伝子である、請求項3に記載の方法。
  6.  TET遺伝子が全長TETタンパク質又は酵素活性部位を含むその断片をコードする、請求項3又は5に記載の方法。
  7.  転写因子をコードする遺伝子を細胞中で過剰発現させ、その細胞中のDNAにおいて脱メチル化された部位を同定し、同定された脱メチル化部位とその上流配列及び下流配列における転写因子結合モチーフの出現頻度分布をその脱メチル化部位からの距離を変数として求め、そこから、ランダムに選択されたメチレーション部位とその上流配列及び下流配列における転写因子結合モチーフの出現頻度分布を差し引き、得られるバックグラウンド補正された出現頻度分布が前記距離X=0付近を頂点としたピークを形成する転写因子を選抜することを含む、部位特異的なDNA脱メチル化を誘導する転写因子をスクリーニングする方法。
  8.  転写因子をコードする遺伝子、並びにTET遺伝子及び/又はTDG遺伝子を細胞中で過剰発現させる、請求項7に記載の方法。
  9.  TET遺伝子が全長TETタンパク質又は酵素活性部位を含むその断片をコードする、請求項8に記載の方法。
  10.  メチル化アレイを用いたメチローム解析により、脱メチル化された部位を同定する、請求項7~9のいずれか1項に記載の方法。
  11.  細胞が哺乳動物細胞である、請求項1~10のいずれか1項に記載の方法。
  12.  哺乳動物細胞がヒト細胞である、請求項11に記載の方法。
  13.  請求項7~10のいずれか1項に記載の方法によって得られる部位特異的なDNA脱メチル化を誘導する転写因子をコードする遺伝子をプロモーターの制御下で導入した、形質転換細胞。
  14.  前記転写因子が、RUNXファミリー、C/EBPファミリー、MAFファミリー、NR4Aファミリー、MYODファミリー、GATAファミリー、及びTBXファミリーの転写因子からなる群から選択される、請求項13に記載の形質転換細胞。
  15.  請求項13又は14に記載の形質転換細胞を被験物質の存在下で培養し、その細胞中のDNAのメチル化状態を評価し、被験物質不在下の細胞と比較したメチル化状態の変動を検出することを含む、被験物質の脱メチル化活性の検出方法。
PCT/JP2016/076669 2015-09-11 2016-09-09 転写因子結合部位特異的なdna脱メチル化方法 WO2017043647A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017538550A JP6937513B2 (ja) 2015-09-11 2016-09-09 転写因子結合部位特異的なdna脱メチル化方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015180184 2015-09-11
JP2015-180184 2015-09-11

Publications (1)

Publication Number Publication Date
WO2017043647A1 true WO2017043647A1 (ja) 2017-03-16

Family

ID=58239999

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/076669 WO2017043647A1 (ja) 2015-09-11 2016-09-09 転写因子結合部位特異的なdna脱メチル化方法

Country Status (2)

Country Link
JP (1) JP6937513B2 (ja)
WO (1) WO2017043647A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403645A (zh) * 2023-03-03 2023-07-07 阿里巴巴(中国)有限公司 转录因子结合位点的预测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008206398A (ja) * 2005-06-07 2008-09-11 Dai Ichi Seiyaku Co Ltd Runxのユビキチン化方法
JP2008211985A (ja) * 2007-02-28 2008-09-18 Japan Health Science Foundation Il−17産生抑制物質及びそのスクリーニング方法
JP2009506778A (ja) * 2005-09-02 2009-02-19 ザ・ユニバーシティ・オブ・トレド 生物学的状態の診断および/または治療に有用なバイオマーカを同定する方法および組成物
JP2014507156A (ja) * 2011-02-23 2014-03-27 アンスティテュ ギュスターブ ルシ (アイジーアール) Runx1不活性化に起因する病理の新規診断マーカーとしてのmyh10
WO2014130770A1 (en) * 2013-02-22 2014-08-28 Cellular Dynamics International, Inc. Hepatocyte production via forward programming by combined genetic and chemical engineering
WO2014160413A1 (en) * 2013-03-14 2014-10-02 Viacyte, Inc. In vitro differentiation of pluripotent stem cells to pancreatic endoderm cells (pec) and endocrine cells
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008206398A (ja) * 2005-06-07 2008-09-11 Dai Ichi Seiyaku Co Ltd Runxのユビキチン化方法
JP2009506778A (ja) * 2005-09-02 2009-02-19 ザ・ユニバーシティ・オブ・トレド 生物学的状態の診断および/または治療に有用なバイオマーカを同定する方法および組成物
JP2008211985A (ja) * 2007-02-28 2008-09-18 Japan Health Science Foundation Il−17産生抑制物質及びそのスクリーニング方法
JP2014507156A (ja) * 2011-02-23 2014-03-27 アンスティテュ ギュスターブ ルシ (アイジーアール) Runx1不活性化に起因する病理の新規診断マーカーとしてのmyh10
WO2014130770A1 (en) * 2013-02-22 2014-08-28 Cellular Dynamics International, Inc. Hepatocyte production via forward programming by combined genetic and chemical engineering
WO2014160413A1 (en) * 2013-03-14 2014-10-02 Viacyte, Inc. In vitro differentiation of pluripotent stem cells to pancreatic endoderm cells (pec) and endocrine cells
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ATSUTAKA KUBOSAKI: "Studies on cell conversion methods by site-specific DNA demethylation", NENDO JISSHI JOKYO HOKOKUSHO (KIKINBUN, 2013, XP055373607, Retrieved from the Internet <URL:https://kaken.nii.ac.jp/report/KAKENHI-PROJECT-24510284/RECORD-245102842013hokoku> [retrieved on 20160930] *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403645A (zh) * 2023-03-03 2023-07-07 阿里巴巴(中国)有限公司 转录因子结合位点的预测方法及装置
CN116403645B (zh) * 2023-03-03 2024-01-09 阿里巴巴(中国)有限公司 转录因子结合位点的预测方法及装置

Also Published As

Publication number Publication date
JP6937513B2 (ja) 2021-09-22
JPWO2017043647A1 (ja) 2018-06-28

Similar Documents

Publication Publication Date Title
Nuñez et al. Genome-wide programmable transcriptional memory by CRISPR-based epigenome editing
US20230042624A1 (en) Crispr/cas transcriptional modulation
Skalsky et al. Reduced expression of brain-enriched microRNAs in glioblastomas permits targeted regulation of a cell death gene
Marina et al. TET‐catalyzed oxidation of intragenic 5‐methylcytosine regulates CTCF‐dependent alternative splicing
Russ et al. Distinct epigenetic signatures delineate transcriptional programs during virus-specific CD8+ T cell differentiation
Yin et al. MicroRNA-155 is an Epstein-Barr virus-induced gene that modulates Epstein-Barr virus-regulated gene expression pathways
Li et al. Transcriptional derepression of the ERVWE1 locus following influenza A virus infection
Neumayr et al. Differential cofactor dependencies define distinct types of human enhancers
Wang The Opening of Pandora's Box: An emerging role of long noncoding RNA in viral infections
Clyde et al. Deep sequencing reveals direct targets of gammaherpesvirus-induced mRNA decay and suggests that multiple mechanisms govern cellular transcript escape
Murata et al. Contribution of myocyte enhancer factor 2 family transcription factors to BZLF1 expression in Epstein-Barr virus reactivation from latency
Moreau et al. Transcriptional profiling of hypoxia-regulated non-coding RNAs in human primary endothelial cells
Adams et al. An optimized lentiviral vector system for conditional RNAi and efficient cloning of microRNA embedded short hairpin RNA libraries
Paschos et al. Core binding factor (CBF) is required for Epstein-Barr virus EBNA3 proteins to regulate target gene expression
Cristinelli et al. HIV modifies the m6A and m5C epitranscriptomic landscape of the host cell
JP6937513B2 (ja) 転写因子結合部位特異的なdna脱メチル化方法
US20210172017A1 (en) Methods of in vivo evaluation of gene function
Rink et al. Concatemeric Broccoli reduces mRNA stability and induces aggregates
Sambasivan et al. A gene-trap strategy identifies quiescence-induced genes in synchronized myoblasts
Wightman et al. Influence of RNA circularity on Target RNA-Directed MicroRNA Degradation
Nemčko et al. Proteome-scale tagging and functional screening in mammalian cells by ORFtag
EP3652347B1 (en) Method of testing a gene therapy vector
Roy Chowdhury et al. KSHV genome harbors both constitutive and lytically induced enhancers
Carrasco-León Characterization of the lncRNA transcriptome in multiple myeloma
Engal et al. SMCHD1 loss triggers DUX4 expression by disrupting splicing in FSHD2

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16844508

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017538550

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16844508

Country of ref document: EP

Kind code of ref document: A1