1.文章基本信息
文章题目 | The 2019-new coronavirus epidemic: evidence for virus evolution |
中文题目 | 2019新型冠状病毒流行病:病毒进化的证据 |
期刊名 | Wiley Online Library |
作者 | Domenico Benvenuto,Marta Giovannetti,Alessandra Ciccozzi,Silvia Spoto,Silvia Angeletti,Massimo Ciccozzi |
发表时间 | 2020.1.29 |
作者单位 | 意大利罗马大学生物医学系医学统计学和分子流行病学系;巴西里约热内卢奥斯瓦尔多·克鲁兹基金会奥斯瓦尔多·克鲁兹研究所黄病毒实验室;意大利罗马大学生物医学部内科;意大利罗马大学生物医学部临床实验室科学部。 |
冠状病毒科由从一些物种中分离的大的单链,正链RNA病毒组成,并且能够引起感冒和腹泻疾病。一种之前未知的重症急性呼吸综合征(SARS)在2002年被发现,并且在接下来的2003年,一种新的冠状病毒(SARS-CoV)被发现与SARS的爆发相关。最近,一种新的冠状病毒(2019-nCoV)在中国武汉地区出现并引起重症呼吸道感染。截至2020年1月22日,根据中国国务院新闻办公室的信息,中国总共有440例肺炎患者被确诊。动物到人的传播被认为是疫情的起因,因为许多病人声称于2019年11月到访过武汉当地一个海产和野生动物市场。最近,已经收集到该病毒从动物到人和人际传播的证据。
虽然快速诊断和病人隔离标志着初步控制这种新疫情,而分子流行病学,进化模型和系统进化分析能够有助于估计遗传变异性和进化速率,这又反过来对病情进展和药物及疫苗开发具有重要影响。在这篇报道中,我们提供了一个新冠病毒的进化树,并且在病毒的不同区域中发现了正向或负向选择压力位点。
15个新冠病毒全基因组序列下载自GISAID(https://www.gisaid.org/)和GenBank (http://www.ncbi.nlm.nih.gov/genbank/)。也建立了由5个高度相似的SARS病毒序列,2个中东呼吸综合症冠状病毒序列和5个蝙蝠SARS样冠状病毒序列组成的数据集。序列相似性百分比通过序列比对检索工具(BLAST;https://blast.ncbi.nlm.nih.gov/Blast.cgi)确定,最终重复的序列被从数据集中排除。该数据集包含的27条序列被用多种序列比对(MAFFT)在线工具比对并用Bioedit program v7.0.5手动编辑。
最大似然(ML)法被用于该分析,因为它们允许通过计算一个产生观察数据的给定的进化模型的概率,以及通过似然比检验比较嵌套模型的概率来检测不同的进化假设。最佳拟合核苷酸替换模型由JModeltest软件选择确定。用MEGA-X通过GTR(广义时间可逆模型)加伽玛分布及不变位点重建了最大似然树作为进化模型。
适应性进化服务器(http://www.datamonkey.org/)被用于发现最终的正向或负向选择位点。出于这个目的使用了如下检验:FUBAR(快速无约束贝叶斯逼近)。这些检验允许推断位点特异性的普遍选择(pervasive selection),感兴趣的区域的偶发性多向选择(episodicdiversifying selection),以及在单个位点上鉴定偶发性选择(episodicselection)。统计学上显著的正或负向选择都基于p值小于0.05。
依赖SwissModel网页建立同源模型。用SwissModel环境下的软件和HHPred搜索和验证了结构模板。同源模型用QMEAN工具进行了验证。用PyMOL 进行了三维结构分析。为了比对病毒N,E,S和M区域的结构变化及其处于选择压力下的位点,同源建模基于新冠病毒的序列。
基于全基因组序列的最大似然进化树,展示在图1中。在进化树中,中东呼吸综合症病毒序列形成了一个明显的分支(分支I),区别于聚集在分支II上的蝙蝠SARS样冠状病毒,SARS病毒和新冠病毒。分支II包含两个不同的簇,IIa中有蝙蝠SARS样冠状病毒和新冠病毒,而IIb中有蝙蝠SARS样冠状病毒和SARS病毒。新冠病毒只显著的与2015年从中国的中华菊头蝠中分离出来的特定的蝙蝠SARS样冠状病毒(MG772934.1)密切相关。
图1 2019-nCoV的最大似然树。沿着分支的星号表示统计学数值 (bootstrap >97%)
考虑到针对N区域的FUBAR分析,显著的普遍偶发性选择(p<0.05)发生在2个不同的位点(第380位和409位核苷酸位置,使用标记为Wuhan-Hu-1 MN908947.3的武汉海鲜市场肺炎病毒分离株的参考序列)。关于分支II上的序列,在武汉冠状病毒序列的第409位核苷酸对应的氨基酸位置上,一个谷氨酰胺替代了天冬酰胺,而在第380位核苷酸对应的氨基酸位置上,一个苏氨酸替换了丙氨酸。同时FUBAR分析发现和确认了6个位点(占14%)上的显著普遍负向选择(p<0.05)。
在S区,显著(p<0.05)的普遍偶发性选择发生在2个不同的位点(536位和644位核苷酸的位置,使用标记为Wuhan-Hu-1 MN908947.3的武汉海鲜市场肺炎病毒分离株的参考序列)。对于分支II上的序列,在武汉冠状病毒序列的第536位核苷酸对应的氨基酸位置上,一个天冬酰胺替换了天冬氨酸,而在第644位核苷酸对应的氨基酸位置上,一个苏氨酸替换了丙氨酸。在1065个位点(占87%)的普遍负向选择显著(p<0.05)被FUBAR分析发现和证实,暗示S区可能高度保守。
在E和M区没有发现正向选择位点。
用SARS冠状病毒核衣壳蛋白结构(2jw8.1) 构建了新冠病毒同源模型的N区域,因为统计检验显示这是所有可能的结构中最稳定和相似的模型。基于同样的原因用SARS冠状病毒刺突蛋白(6acc.1)构建了新冠病毒同源模型的S区域(图3)。
图3 蓝色的2019-nCoV与橘色的SARS冠状病毒(PDB code 2jw8.1)刺突蛋白的同源模型结构叠加的动画模型(PDB code 6acc.1)。
红色的圈标出了2019-nCoV蛋白的起始位置上的一个可变区域,而蓝色的方形标注的是2019‐nCoV上有而SARS冠状病毒结构上没有的两个β-折叠(401:KYR和440:LND)。
SARS,重症急性呼吸综合征
对新冠病毒(MN908947.3)核衣壳区域进一步的结构和分子分析表明,它和蝙蝠SARS样冠状病毒(MG772934.)在309位核苷酸位置附近具有同样的氨基酸序列(SKQLQQ),而SARS参考基因组具有不同的氨基酸序列(SRQLQN)。同样的结果也出现在第380位核苷酸对应的氨基酸位置(新冠病毒和蝙蝠SARS样冠状病毒的氨基酸序列是KADET,而SARS参考基因组是KTDEA),尤其是,这次新冠病毒中该位置上是一个极性氨基酸,而SARS中是一个非极性氨基酸(图2)。
图2 蓝色的2019-nCoV与橘色的SARS冠状病毒(PDB code 2jw8.1)核衣壳蛋白的同源模型结构叠加的动画模型。
红色的圈标注了一个在SARS冠状病毒上才有而在2019-nCoV上没有的α螺旋,以及β-折叠之间的位置差异
考虑到刺突蛋白上发现的正向选择压力位点,结果表明新冠病毒的第536位核苷酸对应的氨基酸位置上是天冬酰胺,蝙蝠SARS样冠状病毒上是谷氨酰胺,而SARS病毒上是天冬氨酸。在新冠病毒的第644位核苷酸对应的氨基酸位置上是苏氨酸,蝙蝠SARS样冠状病毒上是丝氨酸,而SARS病毒上是丙氨酸。上述数据显示,新型新冠病毒显著的与2015年分离的蝙蝠SARS样冠状病毒聚在一起。而且,在进化树中,二者的序列与其他的蝙蝠SARS样冠状病毒序列分开,表明该蝙蝠SARS样冠状病毒与新冠病毒同源,并且它在遗传上相比其他的蝙蝠SARS样冠状病毒与新冠病毒更相似。这支持传播链是从蝙蝠到人的假设。进化树中展示的所有其他的基因组序列,包括SARS和中东呼吸综合症冠状病毒都分别聚类,因而排除了实际造成疫情的新冠病毒可能属于这两个亚属的可能性。两个重要的病毒蛋白——核衣壳和刺突样核蛋白(蛋白S)的结构分析,证实了新型冠状病毒与蝙蝠SARS样冠状病毒之间的显著相似性,以及它有别于其他的冠状病毒。
选择压力和结构分析显示,表面蛋白如刺突蛋白S以及核衣壳N蛋白的突变,赋予了病毒颗粒稳定性。病毒的刺突蛋白使得病毒能够结合到一个细胞受体上并在膜融合后进入细胞,这是病毒感染和发病机制的两个关键步骤。N蛋白是参与病毒颗粒组装的结构蛋白,在病毒转录和组装效率中具有重要功能。这些蛋白的突变能够决定目前新冠病毒疫情中分离到的冠状病毒的两个重要的特性:比蝙蝠SARS冠状病毒更高的稳定性和比SARS冠状病毒更低的致病性。这些特征能够解释新冠病毒的人畜共患传播和其最初比SARS疫情更低的严重性。这些结果并没有排除由疫情演化导致的正向选择压力引起的进一步突变,能够有利于增强这种新型病毒的致病性和传播。
最近,Ji等描述了新冠病毒的刺突蛋白的同源重组有利于跨物种传播,并且表明蛇可能是人类感染的病毒宿主,因为其重采样相似密码子用法偏好性相较其他动物和人类反而更类似于银环蛇[3]。在之前的文章中已经证实了组成特征,突变压力,自然选择,基因表达和二核苷酸会影响环蛇属的密码子使用偏好性。
这些数据与我们研究中的数据一起,使得感染起源于蝙蝠能够阐释新冠病毒的传播动力学,并为目前正在发展中的疫情的感染防控措施提供支持。
译者后记:因为译者能力有限,本文的翻译和解读还有诸多不到位和错误的地方,欢迎各位读者留言讨论、批评和指正。我们会根据读者的讨论和建议及时更新这篇文章的翻译和解读,尽一点微薄之力支持大家的“抗疫”热情和国家的“抗疫”决策。
译者 | 汪雪莲
编辑 | 日月明
免责申明| 仅供学习交流