CN103177196A - 基于小波变换识别基因组核小体占位边界的方法 - Google Patents

基于小波变换识别基因组核小体占位边界的方法 Download PDF

Info

Publication number
CN103177196A
CN103177196A CN 201110435601 CN201110435601A CN103177196A CN 103177196 A CN103177196 A CN 103177196A CN 201110435601 CN201110435601 CN 201110435601 CN 201110435601 A CN201110435601 A CN 201110435601A CN 103177196 A CN103177196 A CN 103177196A
Authority
CN
China
Prior art keywords
genome
nucleosome
wavelet transform
nucleosomes
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110435601
Other languages
English (en)
Inventor
曾华宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI CLUSTER BIOTECH CO Ltd
Original Assignee
SHANGHAI CLUSTER BIOTECH CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CLUSTER BIOTECH CO Ltd filed Critical SHANGHAI CLUSTER BIOTECH CO Ltd
Priority to CN 201110435601 priority Critical patent/CN103177196A/zh
Publication of CN103177196A publication Critical patent/CN103177196A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明旨在提供一种计算机智能识别基因组区域的模型。该模型根据基因组核小体分布水平采用小波变换法把基因组划分成大小不同的区域。基因组中的核小体定位并不是随机的,存在一定的特征。基因组通过核小体不同的分布水平来调节基因的表达,所以研究基因组水平的染色体定位规律对研究基因表达调控机制有重要的意义。本发明通过构建小波变换识别模型,最终将小鼠基因组划分成50个区域,进一步做统计分析证实这种识别方法具有生物学意义。

Description

基于小波变换识别基因组核小体占位边界的方法
技术领域
本发明属于生物信息技术领域,是一种识别基因组核小体占位边界的方法。该发明可以应用于不同物种的核小体占位研究。
背景技术
核小体(nucleosome)是染色体的基本结构单位,由大约146bp的DNA缠绕4种组蛋白(histone)组成的八聚体形成的。核小体的形成及其在染色质上的精确定位,除了导致DNA在组蛋白上缠绕得足够紧密以便于细胞核的包装作用以外,还有其它作用包括:引起染色质结构不均,表现为染色质某些区域核小体占据率高,某些区域核小体缺乏;影响其它的表观现象的发生,比如各种组蛋白修饰、DNA甲基化,进一步为相关调控蛋白提供其在组蛋白上的附着位点,改变染色质结构和活性。所以说核小体在基因组上的组装方式及其定位机制的研究,对于理解转录因子结合和转录调控机制等多种生物学过程具有十分重要的作用。
核小体定位是一个复杂的过程,它涉及DNA、转录因子、组蛋白修饰酶和染色质重塑复合体等分子间相互作用。目前,大部分研究认为,基因组核小体定位受两种机制调控:染色质重塑的调控及DNA序列本身的影响。Kaplan等人通过体外核小体结合实验,发现核小体定位的明显具有GC偏好性即高GC区核小体富集,低GC区核小体匮乏。
通过我们前期研究发现,基因组中的核小体分别水平并不是均衡的,表现为一些区域富集,一些区域稀疏。同时,核小体富集区具有多种特征,比如说GC高、DNA甲基化水平低、转录水平活跃、管家基因聚集等。而核小体稀疏区域表现相反的特征。如果能够根据核小体占位水平,界定出相应的基因组区域,进而从基因组区域分析转录调控,为研究基因转录调控机制提供另一种思路。
发明内容
基因组中的核小体定位并不是随机的,受多种因素控制,比如:DNA、转录因子、组蛋白修饰酶、染色质重塑复合体等等。基因组通过核小体不同的分布水平来调节基因的表达,所以研究基因组水平的染色体定位规律对研究基因表达调控机制有重要的意义。
本研究通过Chip-Seq方法获得全基因组核小体组蛋白H3分布数据。结合NCBI上公开发表的全基因组注释信息,把测序获得的组蛋白H3Tag定位到基因组上。采用小波变换法对全基因组核小体分布数据进行分析,最终将基因组按不同的核小体分布水平分成大小不同的区域,结果如图1所示。进一步对区域内其它生物学特征做统计分析,比如:基因类型、GC含量、DNA甲基化,发现这些因素在不同区域存在显著差别。这一结果验证了通过小波变换法划分的基因组区域具有一定的生物学意义。
附图说明
图1是小鼠1号染色体上小波变换法获得的基因组区域
具体实施方式
1.Chip-Seq实验准备
a)组织提取
b)主要试剂与仪器
Trizol,10bp DNA Ladder,pUC18DNA/Mspl购于TIANGEN,pGEM-T载体、T4连接酶,One Shot Top10Competent Cell购于Promega。其他常见试剂如氯仿(Chloroform)等
2.上机实验
利用新一代DNA测序平台SOLiD进行Chip-Seq实验
3.数据分析
a)SOLiD序列在基因组上的注释
b)小波变换法识别基因组区域
1)首先把基因组划分成若干个等长的片段,统计每个片段内的H3测序tag数
2)对核小体分布数据采用离散小波变换法,具体步骤:
step1:采用‘db1’小波基分解数据信息
step2:提取近似、细节信号
step3:重构信号
step4:图形显示识别的区域
3)对区域内其它生物学特征做统计分析,比如:基因类型、GC含量、DNA甲基化
实验实例
取小鼠大脑组织,用DNA测序平台SOLID做组蛋白H3Chip-seq。把小鼠基因组区域分成100kbp长短的小片段,计算每个区域内的tag数,获得全基因组H3分布的序列数据。进一步用离散小波变换法识别出50个不同核小体分布水平的基因组区域,最后通过对区域内其它生物学特征做统计分析,验证了这种区分基因组区域的方法具有生物学意义。
以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。

Claims (1)

1.一种小波变换法智能识别基因组区域的模型,其特征在于,用小波分析法,根据基因组中核小体分布水平将基因组划分成具备不同生物学意义的区域。
CN 201110435601 2011-12-22 2011-12-22 基于小波变换识别基因组核小体占位边界的方法 Pending CN103177196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110435601 CN103177196A (zh) 2011-12-22 2011-12-22 基于小波变换识别基因组核小体占位边界的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110435601 CN103177196A (zh) 2011-12-22 2011-12-22 基于小波变换识别基因组核小体占位边界的方法

Publications (1)

Publication Number Publication Date
CN103177196A true CN103177196A (zh) 2013-06-26

Family

ID=48637046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110435601 Pending CN103177196A (zh) 2011-12-22 2011-12-22 基于小波变换识别基因组核小体占位边界的方法

Country Status (1)

Country Link
CN (1) CN103177196A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103525939A (zh) * 2013-10-28 2014-01-22 广州爱健生物技术有限公司 无创检测胎儿染色体非整倍体的方法和***
CN103525939B (zh) * 2013-10-28 2015-12-02 博奥生物集团有限公司 无创检测胎儿染色体非整倍体的方法和***

Similar Documents

Publication Publication Date Title
Pradeepa Causal role of histone acetylations in enhancer function
Chan et al. lncRNAMap: a map of putative regulatory functions in the long non-coding transcriptome
Eckardt The plant cell reviews alternative splicing
Li et al. A new framework for identifying cis-regulatory motifs in prokaryotes
Marz et al. Animal snoRNAs and scaRNAs with exceptional structures
Xiong et al. Genome-wide identification and characterization of enhancers across 10 human tissues
Wang et al. Genomic distribution and possible functional roles of putative G-quadruplex motifs in two subspecies of Oryza sativa
Chen et al. AtPAN: an integrated system for reconstructing transcriptional regulatory networks in Arabidopsis thaliana
Videm et al. BlockClust: efficient clustering and classification of non-coding RNAs from short read RNA-seq profiles
Patra et al. plantDARIO: web based quantitative and qualitative analysis of small RNA-seq data in plants
Liu et al. Evaluation of experimental design and computational parameter choices affecting analyses of ChIP-seq and RNA-seq data in undomesticated poplar trees
Darbo et al. Transcriptional and epigenetic signatures of zygotic genome activation during early Drosophila embryogenesis
CN103177196A (zh) 基于小波变换识别基因组核小体占位边界的方法
Martinez et al. A synthetic biology approach to the development of transcriptional regulatory models and custom enhancer design
Bondar et al. Genome-Wide Prediction of Transcription Start Sites in Conifers
Zhang et al. Genome-wide identification and predictive modeling of lincRNAs polyadenylation in cancer genome
Cui et al. A novel mechanism of epigenetic regulation: nucleosome-space occupancy
Yang et al. Drosophila H2A and H2A. Z nucleosome sequences reveal different nucleosome positioning sequence patterns
Wilczynski et al. Fastbill: An improved tool for prediction of cis-regulatory modules
Abugessaisa et al. Genome annotation
Wang et al. Mining distinctive DNA patterns from the upstream of human coding&non-coding genes via class frequency distribution
CN113140255B (zh) 一种预测植物lncRNA-miRNA相互作用的方法
Dai et al. Genome-wide DNA sequence polymorphisms facilitate nucleosome positioning in yeast
Shen et al. Human transcriptome and chromatin modifications: An ENCODE perspective
CN103160573A (zh) 一种多因素结合法研究基因转录调控机制的模型

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C05 Deemed withdrawal (patent law before 1993)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130626