1.文章简介

文章题目

Systems genetics identifies a convergent gene network for cognition and neurodevelopmental disease

中文题目

基于系统生物学分析构建脑部认知及脑部疾病的基因调控网络

期刊名

Nature Neuroscience  IF: 16.095

发表时间

2015.12

单位

Imperial College Faculty of Medicine & Duke-NUS Medical School

实验材料

122例癫痫患者手术切除的海马组织样本、63例正常人海马组织样本、100例正常小鼠海马组织样本、102例4个不同区域脑组织样本

测序平台

Illumina BeadArray Reader、Illumina HiSeq 2000

数据类型

转录组、GWAS数据、外显子组数据

相关产品

外显子组测序

2.研究背景

脑的认知功能一直被认为与遗传因素相关,但是这方面的分子机制不清楚;
认知能力包括:学习能力、新建记忆能力以及建立对新事物的判断能力,这三类能力在不同的个体上表现不同,即使在遗传背景类似的双胞胎身上,相似性通常也低于0.6;
人类认知障碍的疾病主要包括以下四类:精神分裂症、自闭症、癫痫和智力发育障碍;
此前的GWAS数据已经积累了非常多的基因影响认知力的证据;

3.研究方法

应用基因组学及分子生物学的方法对脑部组织的芯片数据、GWAS数据、转录组数据以及外显子组数据进行系统分析,准确鉴定与脑部认知相关的表达基因module,后续的分析显示这类module的变异与脑部疾病密切相关。
研究思路
患者脑部组织的基因共表达网络构建
正常人及小鼠脑组织的基因共表达网络构建
鉴定脑部核心基因module
脑部核心module与GWAS数据进行整合,鉴定其与脑部发育及疾病相关的SNP
鉴定疾病相关的基因突变
文章亮点
通过共表达调控网络的构建,建立了脑组织基因表达的module;
采用多套脑组织相关的数据,其数据类型包括芯片、转录组、GWAS、外显子组,通过多套数据的组合分析,鉴定了2类基因modules(共1298个基因)与脑部认知疾病关联;
同时对这1298个基因在不同脑部组织及脑部不同发育时期的基因表达模式也进行了分析;
为GWAS和外显子数据的整合分析提供了很好的思路;

4.研究成果

1.基因共表达调控网络的构建
为了获得遗传因素是如何影响脑部认知的,精确鉴定与脑部认知相关的基因module。作者首先采用WGCNA对122名癫痫患者的新鲜脑组织进行了芯片测序进行了coexpression分析,获得了24个基因modules,基因数目从29-1148个(Fig. 1a)。接下来为了鉴定哪些module是与脑部认知相关的,需要扣除癫痫疾病的影响,因此作者下载了Li 2003年的34名重度抑郁症患者的脑组织芯片数据,采用topological overlap matrix分析对两套WGCNA数据进行比较,根据empirical p值小于等于0.002,筛选出16个保守的module。根据进化的保守性,作者检测了100个正常小鼠的海马组织样本的转录组,比较16个module在小鼠脑组织样本中的保守性,鉴定出4个跨物种保守的module(M1、M3、M11和M19)。为了比较这4个module在脑部不同区域中的保守性,作者下载了UK Brain Expression Consortium数据库中脑部不同区域的数据,结果显示这16个module在不同区域都存在,暗示这些基因应该有更广泛的功能。接下来采用KEGG和GO对24个module分别进行功能富集性分析,结果显示M1和M3在突触相关通路有富集(Fig.1b)。其中M1(1148个基因)富集性最显著的通路包括钙离子信号、轴突导向、增强效应等通路。M3(150个基因)在postsynaptic density、Reelin信号通路有富集。作者进一步比较了M1、M3中基因与突触后复合物蛋白质的相关性,结果显示M1中的基因与突触后复合物有关联(Fig.1c)。

2.基因调控网络与GWAS数据的综合认知
为了进一步检测上述4个保守module(M1、M3、M11和M19)在脑部认知功能中的作用,作者整合GWAS数据。采用的GWAS数据分别来自两个数据集Generation Scotland: Scottish Family Health Study’ (GS:SFHS)和Lothian Birth Cohort 1936 (LBC1936),分析方法选用versatile gene-base association study(VEGAS)中的Z-score enrichment方式,建立module与SNP之间的linkage disequilibrium。校验选用与认知障碍无关的6种疾病表型。结果显示这四类module均与认知通路相关的SNP关联(Table 1)。其中M1和M3与记忆高度相关。
3.M1和M3在脑部不同发育时期及不同区域表达模式有显著区别
为了进一步验证M1和M3在脑不同发育时期中的功能,作者比较了这两类module中的基因在不同发育时期的表达量差异。转录组数据来自Kang课题组2011年的1340份脑组织的转录组数据。结果清楚的显示M1和M3的基因在脑部的不同发育时期及不同组织都存在表达特异性(Fig.1d)。暗示M1和M3在脑部不同区域的认知过程中都行使功能。
4.探讨M1和M3在脑部认知障碍疾病中的功能
为了研究上述4个module在与认知障碍疾病的关联,作者首先计算了4个module中基因变异的显著性,采用variation intolerance score进行筛选,通过全基因组水平的比较,得到M1、M3和M11的显著性最强。为了校验这4个module,作者构建了5738例脑部发育疾病的外显子组数据集,包含4类主要的神经认知疾病,其中自闭症(4186例),精神分裂症(1004例),智力障碍(192例),癫痫(356例),对照为1891例非神经性疾病个体。作者选取了两个计算方式校验4个module与疾病的关联,结果显示M3与多种脑部认知疾病相关,其指数分别为BET P = 3.54 × 10−6, FET P = 9.0 × 10−4, OR = 3.54, 95% CI 1.51−9.74,有趣的是在正常人的数据集中,M3也有显著富集,说明M3对维持正常的脑部功能也起到了关键作用(Fig.2)。
5.进一步深入探讨M3中影响疾病的关键基因
M3中有43个基因非同义突变与疾病关联,采用网络分析,可以看到这些基因关联一些此前不被关注的基因(Fig.3)。将GWAS数据与M3进行整合,最终得到M3在精神分裂症关联最显著)p=0.003,Z=2.76。

原文出处:

Johnson MR, Shkura K, Langley SR, Delahaye-Duriez A, Srivastava P, Hill WD, Rackham OJ, Davies G, Harris SE, Moreno-Moral A, Rotival M, Speed D, Petrovski S, Katz A, Hayward C, Porteous DJ, Smith BH, Padmanabhan S, Hocking LJ, Starr JM et al. (2016)Systems genetics identifies a convergent gene network for cognition and neurodevelopmental disease. Nat Neurosci, 19:223-32.