染色质区域的可接近性是特异性反式作用因子和顺式调控元件相互作用的前提,基因表达的异常或者染色质调控因子的改变都将对细胞的命运产生深远的影响,进而导致各种疾病的发生、发展。
ATAC-seq 是通过使用高通量测序对转座酶可接近性核染色质区域进行分析的一种创新表观遗传学研究技术。该技术通过转座酶对某种特定时空下开放的核染色质区域进行切割,获得在该时空下基因组中所有活跃转录的调控序列,再通过聚类分析,挖掘这些开放位点的潜在结合转录因子,结合基因表达水平数据,发现关键的调控转录因子。
ATAC-seq技术路线图
样品要求
1)细胞样本:细胞量≥2*10^5;活性≥80%;
活细胞可直接寄送;细胞样本也可梯度降温冻存后,干冰运输。
2)组织样本:送样量≥200mg;
组织样本采集后立即液氮速冻,干冰运输。
3)样本物种:人、大小鼠,特殊物种详询技术。
4)推荐生物学重复数量:2-4个;
测序方案
测序模式:NovaSeq 6000 PE150
推荐数据量:12-15G
标准流程完成周期为35个工作日
生物信息分析内容
1 原始序列数据
2 测序数据质量评估过滤
3 测序数据比对到参考基因组
4 结合位点peak注释分析
5 MOTIF注释分析
6 结合位点peak关联基因筛选
含分组样本时可添加以下分析
7 组间数据差异peak分析
8 差异结合位点peak识别
9 差异结合位点peak关联基因鉴定
10 差异位点peak靶基因的 GO 功能富集分析
11 差异位点peak靶基因的 KEGG 富集分析
高级分析
转录因子motif足迹分析
案例解析
ATAC-seq + RNA-seq 关联分析
DNA调控元件活性的一个特征就是染色质可接近性,只有活跃的调控元件才能被细胞机制识别表达,因此,染色质的可接近性与转录调控密切相关。ATAC-seq 可以得到某一时空下全基因组染色质开放区域,RNA-seq可以得到同一时空下基因表达信息,通过联合两个组学的数据,可以获得该时空下影响基因表达的的上游调控区域;并且调控元件富集数据与基因表达数据能相互验证。
2016年6月,清华大学的颉伟老师领导的团队在国际顶级学术期刊《Nature》发表了染色质可接近性研究(IF:40.137)[2],可以说是用ATAC-seq寻找关键转录因子的经典教材。该文章联合ATAC-seq和RNA-seq检测了早期胚胎发育过程中各时期染色质结构开放区域的动态变化,发现不同时期的细胞开放区域的动态变化情况,并得到胚胎发育时期关键转录因子,绘制出了小鼠早期胚胎中全基因组易接近性染色质图谱。
Nature, 2016, 534(7609): 652-7.
图1:小鼠着床前胚胎细胞染色质开放性可视图
Nature, 2016, 534(7609): 652-7.
图2:胚胎发育过程各时期关键调控元件及转录因子预测结果
ATAC-seq技术是一种快速和灵敏的表观基因组学研究方法,只需要少量细胞即可捕获全基因组活性调控序列。因此,对于临床上珍贵而稀少的细胞样本(如胚胎细胞)的染色质状态的研究就显得非常有利而重要,并且能够很好的推进染色质可接近性研究在基础研究与临床开发中的应用。