生物信息学
Chinese Journal of Bioinformatics
ISSN 1672-5565,CN 23-1513/Q
《生物信息学》网络首发论文
题目:
武汉 2019 冠状病毒基因组的生物信息学分析
作者:
陈嘉源,施劲松,丘栋安,刘畅,李鑫,赵强,阮吉寿,高山
收稿日期:
2020-01-14
网络首发日期: 2020-01-21
引用格式:
陈嘉源,施劲松,丘栋安,刘畅,李鑫,赵强,阮吉寿,高山.武汉 2019 冠
状病毒基因组的生物信息学分析[J/OL].生物信息学.
http://kns.cnki.net/kcms/detail/23.1513.Q.20200120.0839.002.html
网络首发:在编辑部工作流程中,稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶
段。录用定稿指内容已经确定,且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期
刊特定版式(包括网络呈现版式)排版后的稿件,可暂不确定出版年、卷、期和页码。整期汇编定稿指出
版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合《出
版管理条例》和《期刊出版管理规定》的有关规定;学术研究成果具有创新性、科学性和先进性,符合编
辑部对刊文的录用要求,不存在学术不端行为及其他侵权行为;稿件内容应基本符合国家有关书刊编辑、
出版的技术标准,正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。
为确保录用定稿网络首发的严肃性,录用定稿一经发布,不得修改论文题目、作者、机构名称和学术内容,
只可基于编辑规范进行少量文字的修改。
出版确认:纸质期刊编辑部通过与《中国学术期刊(光盘版)》电子杂志社有限公司签约,在《中国
学术期刊(网络版)》出版传播平台上创办与纸质期刊内容一致的网络版,以单篇或整期出版形式,在印刷
出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为《中国学术期刊(网络版)》是国家新闻出
版广电总局批准的网络连续型出版物(ISSN 2096-4188,CN 11-6037/Z),所以签约期刊的网络版上网络首
发论文视为正式出版。
网络首发时间:2020-01-21 09:34:23
网络首发地址:http://kns.cnki.net/kcms/detail/23.1513.Q.20200120.0839.002.html
生物信息学 Chinese Journal of Bioinformatics
DOI:10.12113/202001007
武汉 2019 冠状病毒基因组的生物信息学分析
陈嘉源 1,施劲松 2,丘栋安 3,刘畅 4,李鑫 1,赵强 1,阮吉寿 5,高山 1*
1 南开大学 生命科学学院, 天津 300071;
2 东部战区总医院, 南京 210016;
3 英国诺丁汉特伦特大学 生物科学系, 诺丁汉 NG11 8NS;
4 南开大学 医学院, 天津 300071;
5 南开大学 数学科学学院, 天津 300071
摘要:2019 年 12 月,中国武汉报道了冠状病毒引起的肺炎,其临床症状与 2003 年爆发的严重急性
呼吸综合征(Severe Acute Respiratory Syndrome, SARS)不同,因此推断该病毒可能是冠状病毒的一
个新变种。不同于简单使用全基因组序列的其它研究,我们于 2018 年在国际上首次提出分子功能与
进化分析相结合的研究思想,并应用于冠状病毒基因组的研究。在这一思想指导下,本研究使用 beta
冠状病毒基因组中的一个互补回文序列(命名为 Nankai complemented palindrome)与其所在的编码
区(命名为 Nankai CDS)对新发布的武汉 2019 冠状病毒基因组(GenBank: MN908947)进行分析
以期准确溯源,并对 beta 冠状病毒的跨物种传播和宿主适应性进行初步研究。溯源分析的结果支持
武汉 2019 冠状病毒源自中华菊头蝠,但与 SARS 冠状病毒差异巨大,这一结果与两者临床症状差异
一致。本研究的最重要发现是 beta 冠状病毒存在大量的可变翻译,从分子水平揭示了该病毒变异快、
多样性高的特点,为 beta 冠状病毒的防控提供了依据。从 beta 冠状病毒可变翻译中获取的信息可应
用于(但不限于)其快速检测、基因分型、疫苗开发以及药物设计。另外,我们推断 beta 冠状病毒
可能通过可变翻译以适应不同宿主。本研究是基于大量基因组数据的实证分析,在国际上首次从分
子水平尝试解释了 beta 冠状病毒变异快、宿主多且具有较强的宿主适应性的原因。
关键词:冠状病毒;SARS;可变翻译;跨物种传播;宿主适应性
中图分类号:Q93 文献标识码:B 文章编号:1672-5565(2020)02-000-00
Bioinformatics analysis of the Wuhan 2019 human
coronavirus genome
CHEN Jiayuan 1, SHI Jinsong 2, YAU Tungon 3, LIU Chang 4
LI Xin 1, ZHAO Qiang 1, RUAN Jishou 5, GAO Shan 1
(1.College of Life Sciences, Nankai University, Tianjin 300071, P.R.China;
2.National Clinical Research Center of Kidney Disease, Jinling Hospital, Nanjing University School of
Medicine, Nanjing 210016, P.R.China;
3.John Van Geest Cancer Research Centre, School of Science and Technology, Nottingham Trent University,
Nottingham, NG11 8NS, United Kingdom;
4. School of Medicine, Nankai University, Tianjin 300071, P.R.China;
5.School of Mathematical Sciences, Nankai University, Tianjin, Tianjin 300071, P.R.China;
收稿日期:2020-01-14;修回日期:2020-01-17.
资助项目:天津市重点研发计划科技支撑重点项目(南开大学,No.19YFZCSY00500).
作者简介:陈嘉源,男,在读本科生,研究方向:生物信息学;E -mail: 1610752@mail.nankai.edu.cn.
*通信作者:高山,男,副教授、硕士生导师,研究方向:生物信息学;E-mail:gao_shan@mail.nankai.edu.cn.
Abstract: In 2019, a human coronavirus has caused the pneumonia outbreak in Wuhan (a city of China).
This virus was predicted as a newly mutated coronavirus (named the Wuhan 2019 human coronavirus), as it
caused clinical symptoms different from Severe Acute Respiratory Syndrome (SARS) in the 2003 outbreak.
Currently, most of the researchers are simply using the complete genome or specific structural gene
sequences to investigate coronavirus (e.g. phylogenetic analysis) without considering the functions of the
products from coronavirus genes. To overcome this shortcoming, we proposed the joint analysis of the
molecular function and phylogeny, and applied it in our previous study of betacoronavirus genomes. In that
study, we identified a 22-bp complemented palindrome from a highly conserved Coding Sequence (CDS).
Both the 22-bp complemented palindrome (named Nankai complemented palindrome) and the CDS
(named Nankai CDS), evolutionary conserved in betacoronavirus genomes, were identified as genomic
features associated to the molecular functions of betacoronavirus. In the present study, we used these two
genomic features to trace the origin of the Wuhan 2019 human coronavirus (GenBank: MN908947) and
conduct a preliminary study of the mechanisms in the cross-species infection and host adaption of
betacoronavirus. Our analytical results show that the Wuhan 2019 human coronavirus with large
differences from the SARS coronavirus, may originate from betacoronaviruses in Chinese horseshoe bats
(Rhinolophus sinicus). The most important finding is that the alternative translation of Nankai CDS could
produce more than 17 putative proteins, which may be responsible for the host adaption. The genotyping of
13 viruses using the 17 putative proteins revealed the high mutation rate and diversity of betacoronavirus.
This provided the basis for the development of strategy to prevent and control the outbreak of
betacoronavirus. Our study, for the first time, aimed to explain the reason for the high host adaptability of
the multi-host betacoronavirus at the molecular level using large amounts of genomic data. The findings in
the present study laid foundations for the rapid detection, genotyping, vaccine development and drug
design of, but not limited to coronavirus.
Keywords: Coronavirus; SARS; Alternative translation; Cross-species infection; Host adaptability
冠状病毒属(Coronavirus)的病毒是具有包膜的正链RNA病毒。由于2003年严重急性呼吸综合
征(Severe Acute Respiratory Syndrome, SARS)和2012年中东呼吸综合征(Middle East Respiratory
Syndrome, MERS)的爆发,冠状病毒逐渐成为病毒学领域的一个研究热点。2019年12月,中国武汉
报道了冠状病毒引起的肺炎,其临床症状与2003年爆发的SARS不同,因此推断该病毒可能是冠状病
毒的一个新变种。当前,冠状病毒溯源相对比较清晰:2003年,Enserink等在国际上首次提出了SARS
冠状病毒(SARS Coronavirus, SARS-CoV)来自蝙蝠,而后通过果子狸传播给人类 [1];再后来的病
毒溯源研究都是根据蝙蝠-果子狸-人途径回溯,并重点研究各种蝙蝠体内的SARS样(SARS-like)冠
状病毒与已知SARS冠状病毒的进化关系;特别是2013年,SARS冠状病毒(GenBank: AY274119.3)
被溯源到中华菊头蝠(Rhinolophus sinicus) [2]。尽管已有足够的冠状病毒基因组数据公开,有关冠
状病毒跨物种传播和宿主适应性方面的研究却一直难以突破,特别是无法解释冠状病毒变异快、宿
主多且具有较强的宿主适应性等特点。其中一个最主要原因就是冠状病毒基因组较大,多个基因功
能未知。例如,SARS冠状病毒基因组(GenBank: AY274119.3)的全长是29,751 bp,比HIV-1病毒全
长三倍还要多。另外,冠状病毒基因组注释中基因命名不统一、且大部分注释的蛋白质序列都来自
预测,无实验验证,难以保证正确性。高通量测序的迅速发展,使大量冠状病毒基因组序列得以公
开。然而,当前大部分的冠状病毒基因组研究都是简单使用全基因组或某个病毒结构基因的序列,
后一种做法主观性较大。简单使用全基因组序列进行进化分析和重要功能或致病位点分析,不仅工
作量巨大,而且大量与研究目的无关的基因组区域会对数据分析产生干扰。因此,不同于简单使用
全基因组序列的其它研究,我们于2018年在国际上首次提出分子功能与进化分析相结合的研究思想,
并应用于冠状病毒基因组的研究。分子功能与进化分析相结合,即仅使用与特定功能相关的基因组
特征对一定变异范围内的序列进行进化分析 [3]。这样不仅可以简化进化分析、提高信噪比,使分析
结果更可靠,而且可以用于指导功能实验。2018年, 南开大学高山等在国际上首次报道了SARS冠状
病毒中存在互补回文小RNA(complemented palindromic Small RNAs, cpsRNAs)的现象,并确定了
beta冠状病毒中与功能相关的两个重要的基因组特征(Genomic feature) [3],即一段22 bp的互补回
文序列(命名为Nankai complemented palindrome)与其所在的编码区(命名为Nankai CDS)。在上
述研究中,对Nankai complemented palindrome进行突变分析的结果与使用Nankai CDS进行进化分析
的结果一致支持SARS冠状病毒的跨物种传播途径是蝙蝠-果子狸-人。在分子功能与进化分析相结合
的研究思想的指导下,本研究使用Nankai complemented palindrome和Nankai CDS对新发布的武汉
2019冠状病毒基因组(GenBank: MN908947)进行分析以期准确溯源,并对beta冠状病毒跨物种传播
和宿主适应性进行初步研究。
1 数据与方法
在前期研究中,通过互补回文小 RNA 的发现从 SARS 冠状病毒 MA-15 株(GenBank: DQ497008)
中确定了 beta 冠状病毒中与功能相关的两个重要的基因组特征,即一段 22 bp 的互补回文序列与其
所在的编码区。这个编码区(DQ497008: 25689-26153)是 beta 冠状病毒基因组中一段高度保守的序
列,在已知 SARS 冠状病毒基因组(如 DQ497008)中只对应一个读码框 ORF 3b;但在其它 beta 冠
状病毒基因组中普遍对应多个读码框,因此 ORF 3b 无法代表其它 beta 冠状病毒基因组中的这段序
列。本研究将 22 bp 的互补回文序列与其所在的编码区(可能是一个或多个读码框)分别命名为 Nankai
complemented palindrome 和 Nankai CDS。DQ497008 和 2003 年爆发的 SARS 冠状病毒基因组
(GenBank: AY274119.3)含有相同的 Nankai complemented palindrome 和 Nankai CDS,因此在本研
究中唯一代表 SARS 冠状病毒基因组。在前期研究中 [3],研究对象仅限于 beta 冠状病毒(本研究亦
是如此),并进行如下操作 [3]:提取 NCBI GenBank 数据库中全部 beta 冠状病毒的完整基因组
(Complete genome)序列(以下简称病毒序列或序列);去除与 Nankai CDS 相似度在 0.999 以上的
序列后,留下 11 条病毒序列(GenBank: JX993987、JX993988、GQ153539、GQ153540、GQ153542、
DQ071615、DQ412042、DQ412043、AY515512、AY572034 和 DQ497008)用于进一步研究。本研
究增加一条新发布的武汉 2019 冠状病毒基因组的序列(GenBank: MN908947)和一条来自中华菊头
蝠的序列(GenBank: MG772934),其 Nankai CDS 与武汉 2019 冠状病毒 Nankai CDS 相似度最高
(92.52%)。另外,由于本论文接收时武汉 2019 冠状病毒基因组序列(GenBank: MN908947)尚未
公开,实际使用的是来自复旦大学张永振教授在互联网公开的序列(见致谢)。在本研究中,13 条
序列根据其宿主分为五组用于进一步研究,这五组命名为 SARS(DQ497008)、果子狸 Civet
(AY515512 和 AY572034)、武汉 2019 冠状病毒 Human(MN908947)、蝙蝠群体 bat2(MG772934)
和蝙蝠群体 bat1(MG772934 之外 8 条来自蝙蝠的序列)。在本研究中,进化分析使用软件 PHYLIP
v3.69,统计与作图使用软件 R v2.15.3 [4]。其它数据处理包括:病毒蛋白质预测和核苷酸三连子分析
只考虑一个起始密码子 ATG、三个终止密码子(TAA、TAG 和 TGA)和正向三个读码框;蛋白质
预测不考虑小于 20 个氨基酸的蛋白质;最后,考虑四个起始密码子(ATG、GTG、CTG 和 TTG)
和三个终止密码子重复蛋白质预测和核苷酸三连子分析以检验结果的可靠性(见结果)。
2 结果
在经典定义中,DNA回文(DNA palindrome)和DNA互补回文(DNA complemented palindrome)
序列都叫做DNA回文序列,而且大多数情况下,DNA回文序列的经典定义与我们新定义中的互补回
文序列相同(例如ATCGCGAT)。根据我们的新定义[3],回文序列(DNA或RNA)要求序列(一条
链)从5’到3’方向与从3’到5’方向的读取结果相同(例如ATCGGCTA)。回文和互补回文序列应该
加以区别,主要基于三个原因: 1)我们的前期研究发现了回文和互补回文序列可能具有不同的生
物学意义; 2)在动物病毒基因组中,回文和互补回文序列具有不同的分布特征; 3)经典定义是
从DNA水平定义的,我们的定义考虑了单链DNA和RNA(特别针对病毒)情况。2004年,Chew等
在国际上首次报道了SARS冠状病毒基因组中较短互补回文序列(新定义)的分布特征[5],其主要发
现包括两点: 1)在所有分析的冠状病毒基因组中,长度为4 bp的互补回文序列出现频率显著较低;
2)长度为6 bp的互补回文序列仅在SARS冠状病毒(而不是所有冠状病毒)基因组中出现频率显著
较低。因此,该研究的结论是SARS冠状病毒基因组含有较少的6 bp互补回文序列有可能利于该病毒
有效规避宿主细胞内的某些防御机制而有利于病毒存活;该研究同时还发现了两个较长(14 bp以上)
的互补回文序列分别是TCTTTAACAAGCTTGTTAAAGA和TAAAATTAATTTTA。但是,仅仅根据
概率模型计算得到的此类回文或互补回文序列数量巨大,绝大部分无法与分子功能关联,因此没有
进一步研究的价值。直到2018年,我们偶然发现了互补回文小RNA恰好来自这个22 bp的互补回文序
列(命名为Nankai complemented palindrome),特别是发现了根据这个序列预测的RNA二级结构在
beta冠状病毒基因组中高度保守(见图1A)。RNA水平的证据是将这个序列与分子功能建立关联的
关键 [3]。在前期研究中,对11个beta冠状病毒(见数据与方法)的Nankai complemented palindrome
进行突变分析的结果与使用其所在的编码区(命名为Nankai CDS)进行进化分析的结果一致支持
SARS冠状病毒的跨物种传播途径是蝙蝠-果子狸-人(见图1B红色方框内)[3]。
图 1 武汉 2019 冠状病毒的起源与可变翻译
Fig1 Origin and alternative translation of the Wuhan 2019 human coronavirus genome
注:A:Nankai CDS 是 beta 冠状病毒基因组中一段高度保守的序列,包括一段 22 bp 的互补回文序列(用*表示)。
Nankai CDS 还包括一个 8 或 11 bp 的可变区,分别属于两种不同长度(是 465 或 468 bp,用#表示)的 Nankai CDS;
B:进化树构建使用 13 条去除可变区的 Nankai CDS。使用多种方法进行进化分析的结果一致,这里只展示邻接
(Neighbor Joining,NJ)法的结果:武汉 2019 冠状病毒源自中华菊头蝠某个群体(蓝色方框内),但与 SARS 冠状病毒
差异巨大(红色方框内);用 P1 到 P17(见图 1C)可以对 13 个 beta 冠状病毒进行基因分型(小括号内),其结果与进
化分析的结果一致。C:可变翻译导致从 Nankai CDS 可以预测出至少 17 个蛋白质,分别命名为 P1 到 P17。这里展
示的是使用一个起始密码子 ATG 和三个终止密码子进行蛋白质预测的结果,使用四个起始密码子(ATG、GTG、CTG
和 TTG)和三个终止密码子会预测更多的蛋白质,但不改变可变翻译相关结论。
A: The 22-bp complemented palindrome (named Nankai complemented palindrome) and the CDS (named Nankai CDS) have
a high degree of evolutionary conservation in betacoronavirus genomes. A 8- or 11-bp long variable region in Nankai CDS
resides in two types of Nankai CDS. The first type has a length of 465 bp, while the second type has a length of 468 bp. B:
Consistent results were obtained by different phylogenetic analysis methods. Here, we only show the result using the NJ
(Neighbor Joining) method. The Wuhan 2019 human coronavirus (in blue box) with large differences from the SARS
coronavirus (in red box), may originate from betacoronaviruses in Chinese horseshoe bats. Phylogenetic analysis and
genotyping (in parentheses) of 13 viruses using 17 putative proteins (Fig 1C) achieved consistent results. C: The putative
proteins (named as P1 to P17) were predicted from the Nankai CDS using ATG as the start codon, and TAA, TAG and TGA
as stop codons. The prediction using ATG, GTG, CTG and TTG as start codons, and TAA, TAG and TGA as stop codons did
not change all conclusions in the present study.
在本研究中,所有13条Nankai CDS(见数据与方法)都含有一个完整的Nankai complemented
palindrome和一个紧邻其3'端的长度为8或11 bp的可变区(variable region)。使用MN908947(武汉2019
冠状病毒)中Nankai complemented palindrome预测的RNA二级结构仍然能形成稳定的茎环(Stem-loop)
结构,再次验证了Nankai complemented palindrome在beta冠状病毒基因组中的保守性 [3]。Nankai CDS
中的可变区导致了长度变异(见图1A):MG772934(来自中华菊头蝠)和MN908947(武汉2019
冠状病毒)的Nankai CDS全长为468 bp(含11 bp可变区);其余11条序列的Nankai CDS全长为465 bp
(含8 bp可变区)。由于无法确定每条Nankai CDS的可变区的变异方式,进行进化分析前,13条Nankai
CDS去除可变区后即可对齐,长度统一到457 bp。使用多种方法(UPGMA、邻接法、最大简约法、
最大似然法和贝叶斯法)对13条Nankai CDS进行进化分析的结果(见图1B)一致支持: 1)MN908947
(武汉2019冠状病毒)与MG772934(来自中华菊头蝠)在进化树的一个分支内(见图1B蓝色方框
内),说明武汉2019冠状病毒源自中华菊头蝠; 2)武汉2019冠状病毒(见图1B蓝色方框内)与SARS
冠状病毒(见图1B红色方框内)在不同分支,而且距离很大,这一结果与两者临床症状差异一致;
3)SARS冠状病毒的跨物种传播途径“蝙蝠-果子狸-人”(见图1B红色方框内)与2018年分析结果
完全相同 [3],证明了该方法的可靠性。
Nankai CDS是beta冠状病毒基因组中一段高度保守的序列(见数据与方法),靠近其3'端的99
个碱基(编码33个氨基酸)极端保守,不仅没有起始或终止密码子突变,也极少有其它突变,具有
重要的研究和应用(如引物设计)价值。Nankai CDS在来自SARS和果子狸的beta冠状病毒基因组中
是一个完整的读码框,编码蛋白P16(见图1C),但在来自其它宿主的冠状病毒基因组中(不包括
3'端的99个碱基)出现了大量的起始或终止密码子突变(见表1),并导致Nankai CDS出现读码框的
多样性,即可变翻译。由于去冗余后的完整基因组数据较少,需要从两个方面排除这些突变是来自
测序错误等导致的假阳性。一方面,用13条Nankai CDS比对到NCBI NT数据库,看是否有其它冠状
病毒序列支持这些突变。比对结果显示,大部分序列上的突变都能得到NT数据库中其它数据支持,
只有三个例外:JX993988在Nankai CDS上的三个突变(C80A、T80A和T254A),MG772934(来自
中华菊头蝠)和MN908947(武汉2019冠状病毒)在Nankai CDS上共有的四个突变(T182A、C182A、
T237A和T236G)没有其它数据支持。JX993988代表的病毒类型比较特殊,与其它来自蝙蝠的病毒
差异较大(见图1B),这里不做进一步研究。另外一方面,统计13条Nankai CDS中核苷酸三连子出
现次数,次数最高的前14位依次是:ATG(123次)、ACT(106次)、AAG(98次)、TTG(83次)、
CAG(77次)、CAA(71次)、GTG(68次)、AAA(66次)、CTA(65次)、ACA(60次)、TTA
(59次)、ATT(58次)、CGA(57次)和CTG(55次)。核苷酸三连子统计结果显示:前14位三
连子出现次数之和超过三连子总数一半以上(1046次/2016次);6个三连子与起始密码子ATG只有0
或1个核苷酸的差异;8个三连子与终止密码子(TAA、TAG和TGA)只有1个核苷酸的差异。统计结
果说明了通过1个核苷酸突变(点突变)导致起始或终止密码子的丢失和获得的概率非常高。根据以
上两个方面的分析结果,基本可以排除Nankai CDS中的大量起始或终止密码子突变是假阳性(见表1)。
可变翻译导致从Nankai CDS可以预测出至少17个蛋白质(Putative Protein),分别命名为P1到P17
(见图1C)。用P1到P17可以对13个病毒进行基因分型(基于可变翻译的基因分型),例如,MN908947
(武汉2019冠状病毒)可以表示为P10P11P12P13P17。我们发现基因分型相同或相近的病毒都在进
化树上的同一个分支内(见图1B)。例如,bat1分支的病毒的基因分型都由三个蛋白质组成;SARS
和果子狸分支都是P16;MN908947(武汉2019冠状病毒)和MG772934(来自中华菊头蝠)都有P10。
根据以上事实,可以得到以下推论: 1)beta冠状病毒(不限于Nankai CDS内)存在大量的可变翻
译; 2)beta冠状病毒变异快、多样性高,仅仅13个病毒即可得到多达9种基因分型(见图1BC); 3)
在SARS冠状病毒从蝙蝠到人传播过程中,Nankai CDS内多个点突变积累才形成P16; 4)在武汉2019
冠状病毒从蝙蝠到人传播过程中,P15只需一个点突变(C355T)即形成P12和P13,P14只需两个点
突变(T170A和T191C)即形成P11和P17; 5)可变翻译可用于(但不限于)beta冠状病毒的基因分
型,用P1到P17进行基因分型的结果与用Nankai CDS进行进化分析的结果一致。 6)beta冠状病毒可
能通过可变翻译以适应不同宿主。
表 1 Nankai CDS 内起始或终止密码子突变
Table 1 Mutations in start or stop codons in Nankai CDS
PP
Start
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
P13
P14
P15
P16
P17
1
190
367
1
178
259
1
1
1
1
97
259
370
97
259
1
155
Allele
ATG
ATA\ATG
ATG
ATG
GTG\ATG
ACG\ATG
ATG
ATG
ATG
ATG
ACG\ATG
ACG\ATG
ATG
ACG\ATG
ACG\ATG
ATG
GTG\TTG\ATG
Mutation
Stop
Allele
Mutation
AA
A192G
G178A
C260T
C98T
C260T
C98T
C260T
G155A\T155A
183
300
465
81
255
345
120
171
345
69
171
357
468
237
468
465
256
TTG\TCG\TAG
T182A\C182A
TGG\TAG
G299A
TAA
TCG\TTG\TAG
TTG\TAG
TTA\TAA
C80A\T80A
T254A
T344A
TCA\TTA\TAA
C119A\T119A
TTA\TAA
TTA\TAA
TCA\TAA
TTA\TAA
CAA\TAA
TAA
TGT\TTA\TGA
TAA
TAA
TCA\AGA\TGA
T170A
T344A
C68A
T170A
C355T
T237A\T236G
C255G\A254T
61
37
33
27
26
29
40
57
115
23
25
33
33
47
70
155
34
注:可变翻译导致从Nankai CDS可以预测出至少17个蛋白质,分别命名为P1到P17(见图1C)。所有突变均来自17个
预测的蛋白质,PP表示预测的蛋白质(Putative Protein)的名称;Start一列记录的是起始密码子的第一个碱基的位置;