正文
(SARS)
和中东呼吸综合征
(MERS)
的冠状病毒
[5, 6
]
,而是与2013年从云南蝙蝠身上分离到的蝙蝠冠状病毒RaTG13具有高度的遗传相似性
(96.3%)
,这表明类RaTG13病毒很可能是当前2019-nCoV的源头,但并非直接来源
[7
]
。
由于暂时无法获知2019-nCoV的确切来源,人们开始猜测2019-nCoV可能来源于人为的基因改造,甚至有人认为这可能是一种生物武器。对此,媒体纷纷出来辟谣。然而,最近的一项发表在预印本上的非正式的研究报告表明,与其他冠状病毒相比,在2019-nCoV的刺突糖蛋白中有四个插入片段,而刺突糖蛋白正是病毒进入靶细胞的关键蛋白
[8
]
。该研究声称,这些插入片段与来自三个不同国家
(泰国、肯尼亚和印度)
的某些独特HIV-1毒株的囊膜糖蛋白或Gag蛋白中高度可变 (V)区
(V1、V4和V5)
的基因序列相同或相似。结合蛋白结构模型分析,作者推测这些与HIV-1蛋白相似的插入片段可以增强病毒对宿主细胞上特异性受体的亲和力,并扩大2019-nCoV宿主细胞的范围。这项研究暗示2019-nCoV病毒可能是通过从HIV-1基因组获得特定基因片段而人为产生的。
我们将2019-nCoV病毒、其他冠状病毒和HIV-1病毒的序列与GenBank数据库的序列进行了仔细的比对,并没有发现这四个插入片段是HIV-1所特有的,亦或是2019-nCoV病毒从HIV-1获得了这些插入片段的证据。首先,在GenBank数据库中对这些病毒基因进行序列比对的结果表明,前100个相同或高度同源的序列均来自哺乳动物的宿主基因、昆虫、细菌等
(表1)
。比对结果只有几个显示与冠状病毒同源,但它们均与HIV-1病毒无关。病毒序列数据库的比对结果还显示,这些序列广泛地存在于从噬菌体、流感到巨型真核病毒等不同类型的病毒中
(表1)
。这些结果清楚地表明,插入的基因序列广泛存在于包括病毒在内的各种生物体中,绝不是HIV-1所特有的。当用2019-nCoV病毒的序列在整个数据库中进行检索时,我们发现它与冠状病毒的匹配程度更高,仅有少数与HIV-1相匹配
(表1)
。并且,虽然有19条记录显示插入片段1和2与HIV-1能够完全匹配,但插入片段3和4与HIV-1的匹配率很低
(仅有42%到88%匹配)
。另外,插入片段4能够与HIV-1基因组中的多个不同基因片段
(包括gag、pol和env)
进行模糊匹配,这表明它们之间的同源性太低
(低于42%)
,因此并不可信。此外,在HIV数据库中检索这四个插入片段,我们也能得到相似的结论
(https://www.hiv.lanl.gov/components/sequence/HIV/search/search.html)
。在任何HIV-1中均未发现与插入片段3和4完全匹配的序列,这也说明插入的基因序列广泛的存在于包括病毒在内的各种生物体中,并非HIV-1所特有的。另一方面,HIV-1囊膜蛋白中与之匹配的的区域都具有高度可变性,常常存在大量的插入和缺失突变,这也表明这些片段对于HIV-1囊膜糖蛋白的生物学功能来说并不是必需的。同时,与插入片段1和2完全匹配的序列仅能在少数的HIV-1病毒株中检测到,说明在数以万计的天然HIV-1中同时存在这四个插入突变的序列也是非常罕见甚至并不存在。这也解释了为什么这四个插入片段独立存在于不同的HIV-1基因组中的原因
[8
]
。由于这些插入片段与HIV-1的同源性低,在HIV-1序列中也非常少见,因此我们认为HIV-1并非是2019-nCoV基因组中插入序列的来源。
其次,这些插入片段不仅存在于2019-nCoV病毒中,还存在于其他三个源于蝙蝠的β属冠状病毒中:包括分离自浙江并于2018年上传到GenBank数据库中的ZC45和ZXC21病毒,以及于2013年分离自云南的RaTG13病毒
[7
]
。与ZC45和ZXC21相比,RaTG13与2019-nCoV更为相似
(如图1A所示)
,它们的刺突蛋白的相似性为97.7%。在RaTG13基因组中,其中两个插入片段
(HKNNKS和RSYLTPGDSSSSG)
与2019-nCoV中的插入片段完全相同,第三个插入片段仅有一个丝氨酸
(Threonine,T)
到异亮氨酸
(Isoleucine,I)
的替换
(TNGIKR)
,第四个插入片段的C端缺失4个氨基酸
(QTNS----)(如图1B所示)
。与RaTG13相比,ZC45和ZXC21与2019-nCoV的差异更大,但是这两种病毒也有与插入片段1、2和3类似的序列
(图 1B)
。此外,许多其它的冠状病毒在插入片段1的位点上都有类似的插入仅序列有些许差异。这些结果清楚地表明,在2019-nCoV被发现之前,这四种插入序列中的三种均天然存在于三种蝙蝠的冠状病毒中。这无疑驳斥了2019-nCoV可能是通过人为获得HIV-1基因组中的一些基因片段而产生的“生化武器”这种观点。相反,2019-nCoV更可能来源于类RaTG13的冠状病毒。
第三,2019-nCoV中的插入片段1和2与某些HIV-1 gp120分离株中的V4和V5区域具有相同的6个氨基酸基序,它们在结构上相互接近,由LE loop将二者分隔开
(如图1C所示)
[9