1.文章简介
文章题目 | A promoter-level mammalian expression atlas |
中文题目 | |
期刊名 | Nature IF:38.138 |
作者 | |
发表时间 | 2014 |
实验材料 | |
测序平台 | |
相关产品 | CAGE-seq |
哺乳动物个体包含至少400种细胞类型,这些细胞类型都具有一个相同的基因组,却具有独特的基因表达特征,从而具有不同的形态乃至生物学功能。不同细胞类型的特性是由转录调控决定的。目前为止我们还缺乏对生物体转录调控的全面的了解,直到最近 FANTOM 等几个团队联合发表了题为“A promoter-level mammalian expression atlas”的文章,通过CAGE-seq的方法对人和小鼠的转录起始位点(TSS)和启动子使用、转录因子调控进行了全面的描述。
研究者对涵盖了绝大多数人类细胞类型的包括573份原代细胞、152份组织和250份癌症细胞,以及 399份小鼠的样品进行了CAGE-seq的研究。在对表征潜在的转录起始位点的峰的鉴定之后,研究者在人的样品中共获得了约350万个潜在的转录起始位点,在小鼠中获得了约209万个潜在的转录起始位点。鉴定出的TSS位点附近都有很强的H3K4me3和H2AZ等修饰的富集,一方面证明数据的可靠性,另一方面也确认表观遗传学修饰在基因表达调控中的重要作用。
进而作者对由CAGE-seq数据获得的基因表达进行分析,发现人类中约80%基因的表达是组织特异性的,而严格意义上的持家基因只有约6%;对这些基因启动子的保守型分析发现,持家基因的启动子保守型远大于组织特异性表达的基因。在所有基因的启动子中,lncRNA的启动子保守型最差,但已知的广谱表达的lncRNA的启动子也非常保守,说明lncRNA起重要的调控作用,同时存在一些持家lncRNA。
另外,保守的具有CpG岛和TATA box启动子的基因倾向于广谱表达,而超过92%的不具有CpG岛和TATA box的基因 为组织特异性表达的。另一方面,大约十几个基因编码的RNA的表达量占到了总mRNA表达量的20%以上,这些基因的启动子大都被ETS和YY1这2个启动子结合。
该工作使用CAGE-seq的方法,同时获取了基因的表达量信息、转录起始位点信息和启动子信息;同时使用大量样本,全面勾画出了人类组织的特征性的基因表达,以及转录调控在决定基因表达中的关键作用。
原文出处:
Forrest AR, Kawaji H, Rehli M, Baillie JK, de Hoon MJ, Lassmann T, Itoh M, Summers KM, Suzuki H,Daub CO, et al (2014) A promoter-level mammalian expression atlas. Nature 507:462-470.