酵母是人们熟悉的真菌,是广泛用于制作酒、面包和馒头的发酵。酿酒酵母有16条染色体(单倍体),但在最近发表在《自然》杂志上的一篇论文中,科学家们将16条染色体合并在一起,形成了只有一条染色体的酵母。这是一项划时代的研究,作者是中科院的陈中军研究员(图0)领导的中国科学家小组。因此,主要媒体争相报道,一度在网络上引起了广泛的话题。为了让大家更好地理解这项研究,我在这里做一些深入的解释。为了说明问题,需要在文章内动用专业术语,这可能会让非专业人士头疼。但是,即使跳过这些术语,也能得到有趣的信息。
图0:中军研究员。
第一,什么是染色体
染色体(chromosome)由DNA和蛋白质组成(图1)。人们最初用光学显微镜观察染色体时不知道其功能,容易染上染料,所以取名为染色体。(威廉莎士比亚,染色体、染色体、染色体、染色体、染色体、染色体、染色体、染色体、染色体、染色体)这个名字比较随意。如果当初先贤预想到他们的作用如此重要,就可以起一个更深刻的名字。染色体的DNA是基因组的载体。真核生物的染色质和染色体是同一种物质,在不需要严格区分的情况下,我们统称为染色体。
脱氧核糖核酸(DNA)由脱氧核糖核酸组成。每个脱氧核苷酸都含有脱氧核糖、磷酸和碱。DNA总共含有4个碱基,就是我们常说的ACGT。由于染色体DNA以双链形式存在,我们经常使用代表DNA链大小(或长度)的基本对(basepair,BP)。1000 BP为1 kb,1000 kb为1 Mb,1000 Mb为1 Gb。
我们知道基因组记录了生物生理结构和功能所需的所有信息。如果把基因组比作操作方法,染色体就相当于这《基因组》的几本。例如,我们人类的体核有46条染色体,线粒体有46本厚度不同的书和薄薄的小册子等染色体。
图1:从DNA到染色体。
第二,大大小小的基因组
不同生物基因组的规模各不相同。基因组是生物结构和功能的操作方法,所以复杂的生物必须有更大的基因组——。这个推论是正确的。基因组的大小和生物的复杂性确实有一定的关系(图2)。例如细菌的基因组通常比较小,大肠杆菌的基因组为4.6mb。哺乳动物的基因组很大,人类的单倍体基因组为3.3 Gb。但是也有很多例外。部分植物的基因组超过100 Gb,是人类基因组的几十倍。一些两栖动物和肺鱼的基因组也比哺乳动物的基因组大得多,这些生物显然不比人类复杂。因为不同生物基因组的“精炼”程度不同,字数多的书必然包含很多信息,也可以简单,可以写废话,也可以杂乱无章。(威廉莎士比亚、《哈姆雷特》、《真理报》)大肠杆菌的基因组大部分用于编码蛋白质,但人类基因组的编码区域不到2%。人类基因组的一半左右的序列是转座子(transportation),还有很多其他重复序列,这些序列的作用至今鲜为人知。可以想象,在两栖动物巨大的基因组中,这种不太有用的序列肯定比例很高。一般认为,需要快速繁殖的单细胞生物的基因组比较紧密,可以节省与细菌的基因组相同的能量。作为单细胞真核生物的酵母,有着与细菌相似的生活方式,他们的基因组也比较小。但是总有例外。超过600GB的阿米巴的基因组是已知最大的基因组,但并不妨碍单细胞生活。(大卫亚设,Northern Exposure(美国电视剧),单细胞,单细胞,单细胞)
图2:基因组大小的范围。
第三,有多少染色体
如果基因组操作法是一本很大的书,那么把这本书分成几本书也应该相当用心。原核生物的基因组中只有一条染色体。换句话说,不管大小,都是书。原核生物的染色体是圆形的。这就像书没有封面,头发也没有尽头一样。真核细胞的线粒体和叶绿体起源于细菌,它们的染色体也是环状的。真核细胞核基因组的染色体是线性的,通常不止一本书,每本书都有装订本(丝粒)和封面(端粒)。根据我们的日常经验,只要厚厚地装着一本书,拿着就不舒服,容易受损,如果装很多薄的书,就会很麻烦,所以要在书的厚度和宣传册的数量上取得一定的平衡,书数要有最佳范围。(莎士比亚,莎士比亚。)
图3:大西洋眼睛灰色蝴蝶
染色体不是一成不变的。在一定条件下,一条染色体可以分为两条,两条染色体也可以合并为一条。由于染色体处于动态变化中,理论上它们的数量应该在最佳数量上。
的附近。然而,事实远非如此,染色体的数目看上去好像具有很大的任意性。比如前面提到的酿酒酵母有16条染色体,而生活方式与之相近,基因组稍大的稷酒酵母却只有3条染色体。这还不算太离奇的。家蚕有56条染色体,而同为鳞翅目的大西洋眼灰蝶约有450条染色体,是已知染色体数目最多的二倍体生物(图3)。蜜蜂有 32条染色体,由于雄蜂是单倍体,有16条染色体,而同为膜翅目的生活在澳洲的杰克跳蚁(Myrmecia pilosula)只有一对染色体,它的雄蚁则只有一条染色体,可以说少到不能再少(图4)。我们很难想象大西洋眼灰蝶细胞平时要维护近1000个端粒会不会很麻烦,在有丝分裂的时候把450多条染色体排列在细胞的“赤道平面”上会不会很混乱,也很难想象杰克跳蚁那一条巨大的染色体会不会有些尾大不掉。生物到底如何权衡染色体的长短与多少,有没有最优解,我们至今还不知道。图4:又蛰又咬,异常凶悍的杰克跳蚁只有一对染色体。这真是不以染色体多少论英雄啊。
四、染色体数目易变吗?
作为基因组的载体,染色体的重要性不言而喻。因此,人们容易下意识的认为染色体的数目是个很基本的特征,甚至有人认为人和黑猩猩的亲缘关系不会很近,因为它们的染色体数目不一样多。这其实是个很大的误解。染色体重要的是上面承载的信息,而不是宏观上的大小多少,这就好比对于不识字的人来说一套上下册的《红楼梦》与一套20册的《红楼梦》连环画很不一样,跟一套上下册的《西游记》看上去倒差不多,而识字的人就很容易发现前二者是同源的,跟后一个反而八竿子打不着。尽管人类有46条染色体,黑猩猩和大猩猩都有48条染色体,但黑猩猩与人的亲缘关系比黑猩猩与大猩猩的亲缘关系近。
除了人类,其他的大猿都有48条染色体。人类的祖先在和黑猩猩的祖先分开之后发生过一次染色体融合,现在人类的二号染色体对应其他猿类两条较短的染色体(图5)。
图5:黑猩猩的2A、2B染色体对应人类的2号染色体。
人类和其他大猿都是同科不同属的,而即使同属的生物染色体数目也不一定相同,比如人们熟悉的马和驴就都属于马属,马有64条染色体,驴有62条染色体(图6),马和驴可以杂交生育骡子,但骡子的染色体是奇数,在减数分裂时会发生错误,故而骡子基本都是不育的。当然,马和驴的染色体数目相差还不算多。小麂(Muntiacus reevesi)有46条染色体,而赤麂(Muntiacus muntjak)的雄性有7条染色体,雌性只有6条染色体,是已知哺乳动物中染色体最少的。麂属动物染色体数目巨大的差异作为经典的例子已被写入遗传学教材。
图6:驴和马相差一对染色体。
同属生物的染色体数目的差异说明染色体数目在进化中并不保守,而是个易变的特征。在进化中,越是底层的特征越不容易变化,越是高层的特征越容易变。比如体型、寿命都是一些高层的特征:同属于猫科动物的老虎和猫的体型就相差巨大;同属于豆科的槐树就是能活几百年的参天大树,而大豆就是一年生草本。染色体的长短与数目也属于高层的特征,在进化中是很不保守的。
五、16条染色体合而为一的意义
既然我们知道染色体的长短与数目的变化范围可以很大,而且它们在进化中确实易变,那么理论上把酿酒酵母的16条染色体合而为一就是可行的。酵母的基因组是12 Mb,而一条12 Mb的染色体并不算长。要知道人类最长的1号染色体有近250 Mb,最短的21号染色体(就是三体会造成唐氏综合症的那条)也有近47 Mb,因此12 Mb一点都不算长。既然昆虫都可以只有一条染色体(杰克跳蚁),比昆虫简单得多的酵母为什么不行呢?即便跟生活方式相似的另一种真菌稷酒酵母相比,稷酒酵母的一号染色体也有5.6 Mb。
不过进化中的易变并不意味着在实验室中就容易实现,更何况,即使是易变的特征在进化中的变化往往也是非常缓慢的,比如人类的祖先和黑猩猩的祖先是在约600万年前分开的,而酿酒酵母保持16条染色体的状态可能已经有一两千万年了。
当然事实也证明,这项工作的难度确实非常大。覃重军团队经过四年的攻关,最终有幸获得了满意的结果。这个只有一条染色体的酵母生活得很好,和野生型只有微小的差别,并且这种酵母还可以交配形成二倍体,减数分裂并产生孢子,也就是说,完全是个功能齐全的酵母(图7)。
这项工作的并没有提出什么新理论,但对现有结构的巨大改变以及短时间内完成了进化上需要百万年甚至更长时间的过程本身就具有重大的理论价值。这也是合成生物学的特征,不论克瑞格-文特合成支原体染色体,还是杰夫-布卡合成酵母染色体也都是这样的。而且在生命科学领域,技术革命的意义丝毫不逊于理论革命,我们熟知的PCR、基因测序、克隆哺乳动物、诱导多能干细胞、CRISPR基因编辑都是影响巨大的技术革命。工欲善其事必先利其器,强有力的技术是开启奥秘的钥匙。因此,说覃重军团队这项工作具有里程碑的意义是恰当的。
除了技术上的革命之外,研究本身也相当有价值,比如它显示了之前染色体间的相互作用可能被高估了。染色体上的信息虽然是线性的,但染色体(染色质)并不是像一团乱麻一样随便堆积在细胞核里,而是非常有序的。人们花了很多力气去研究染色体的组装与三维结构,包括不同染色体之间,以及同一染色体不同部位之间的相互作用。然而当16条染色体变成一条,染色体的包装与三维结构发生了巨大变化,基因的转录与细胞的生长变化却很小,这说明维持细胞生理功能的信息基本上就是染色体上的线性信息,而高维的信息作用不大,至少在酵母里应该是这样。
此外,这个只有一条染色体的酵母可能会是一个研究有丝分裂的好模型。原核生物虽然只有一条染色体,但没有有丝分裂;真核生物一般有多条染色体,只有一条染色体的雄性杰克跳蚁也不适合作为模型。现在人们有了一个只有一条染色体的模型生物,曾经的16个着丝粒和32个端粒变成了1个着丝粒和2个端粒,这应该会给有丝分裂、着丝粒、端粒等的研究提供很多便利。
图7:从16到1 的沧桑巨变。
六、覃重军和杰夫-布卡
有趣的是,在同一期《自然》期刊上,还发表了来自合成生物学大佬杰夫-布卡团队的一篇论文,作者们把酿酒酵母的16条染色体合并成了2条染色体。显然,杂志社是故意把日期接近的两篇论文放在同一期中,以便更好地调动媒体与读者的兴趣。
这两项研究的方案并不相同,布卡的方案是先把较短的染色体合并成较长的染色体,再把较长的染色体合并成更长的染色体。他们先做出了12条染色体的酵母,又做出了8条染色体的,然后是4条,最后得到了2条染色体的酵母。而覃的方案是老老实实地一个一个合并(每次都去掉一个着丝粒和两个端粒),因此从15条到1条染色体的酵母每种他们都有。这两种方案事先很难说哪一种更好,不过结果证明覃的方案似乎好得多。当然也可能覃做了更充分的准备,选择了更好的方案,赢在起跑线上了。
布卡不但最终没有得到只有一条染色体的酵母,酵母长得也不如覃的酵母好,而且随着染色体的合并产孢子的能力发生了剧烈的下降。酵母界与合成生物学界大佬的这项研究方方面面都输给了覃重军。本来那也是一篇意义非凡的研究,然而由于覃重军的结果太出色,以致布卡的研究似乎成了一个陪衬,专门来衬托覃的研究如何伟大。
为了满足读者的八卦心理,我们再多说说这两位科学家。
杰夫-布卡(图8)原是酵母界与转座子界的大佬,他最初主要研究酵母中的Ty系列转座子,后来也研究哺乳动物中的LINE-1转座子。他在CNS等顶级期刊上发表过很多高质量的论文,而且他很会培养人,他的很多学生和博士后后来成了名校教授。合成酵母染色体对于布卡来说是一件锦上添花的事,第一条染色体合成结果出来之前他已经是美国科学院院士。当他最初提出合成酵母染色体的想法时,约翰霍普金斯的教授们都觉得他异想天开(大佬也是保守的多啊)。他虽然坚持做了下去,但他当时的主要工作还是转座子;合成染色体很多工作甚至是本科实习生做的,直到第一条染色体合成成功,他才把主要精力转向合成生物学。合成整个的酵母基因组工程巨大,布卡找了很多合作者,其中有不少是中国的,包括华大、天大、深圳先进院等等。这次发表的合并染色体的论文作者只有四个人(包括他自己),看上去这一项工作对他来说可能不太重要,应该是他现在诸多工作中的一小部分,可能他本人也没有时间和精力对这项工作投入太多的思考。
图8:杰夫-布卡(Jef Boeke)。
覃重军以前是做放线菌领域的研究的,几年前才开始做酵母,他也没有发过CNS级别的论文。这次研究是他最主要的工作,为此投入了大量的精力,甚至还欠了研究所经费。这项研究对他来说不是锦上添花,而是志在必得。
由于前两年的韩春雨事件的教训,人们对名不见经传的中国科学家忽然做出一鸣惊人的发现往往有些担心。不过覃重军并不属于这种情况。覃重军世纪初海归进入国内顶级的研究院——中国科学院,并且后来获得了杰出青年基金资助。这些年覃重军一直都有SCI论文发表,尽管不是这次这样重量级的论文,但也都是实打实的工作。即便没有这次的突破,他依然是一位成功的科学家。覃重军这几年的艰辛与承受的巨大压力不言而喻,但他本身不属于那种面壁十年,一朝成名型的科学家。
覃重军目前五十出头,对一个已经打开局面的科学家来说还是年富力强的岁数,有望在今后做出更多重大发现。
图9:覃重军和他的团队。
七、其他问题
① 酵母是单倍体还是二倍体?
酵母既有单倍体,也有二倍体。单倍体可以交配(接合)成为二倍体;二倍体也可以通过减数分裂形成单倍体孢子。这一点很像有胚植物(苔藓、蕨类、种子植物)的世代交替。当然不是任意两个单倍体酵母都可以交配,单倍体酵母有不同的交配型,类似雌雄配子的情形。酿酒酵母的单倍体有16条染色体,在我们讨论点这项研究中被合并成了一条。这样的酵母交配形成二倍体则有一对染色体。酿酒酵母属于芽殖酵母,以出芽的方式繁殖。出芽是一种特殊的有丝分裂(图10)。
图10:酿酒酵母的生活史。
② 一条染色体的酵母是全新的人造生命吗?
这个问题很难回答,因为我们并没有一个满意的定义来描述全新的人造生命。一方面通过改变生物的基因获得一个自然界从前没有的生物都可以说是全新的生命;另一方面,转基因也好,合成染色体、合并染色体也好,都是在之前生命的蓝本上做了微小的改动,改变之后的酵母还是酵母,似乎也很难说是全新的生命。
③ 杰夫-布卡的名字
最近看到很多媒体上对Jef Boeke 名字的音译是“杰夫-博克”。本来音译是不唯一的,但还有一条原则是名从主人,即假如外国人已有自己的译名,我们应该沿用。Boeke自己落款的中文字样是“傑夫 布卡”,因此不宜译作“博克”,除非他自己也使用“博克”这一翻译。一般科学家并不在意外国人怎样翻译自己的名字,而布卡的合成染色体工作量巨大,需要大量合作者,其中有不少就是中国的科研院所。这可能是他同时使用英中文落款的原因。布卡是我的博士后导师的博士后导师,故我跟他有过简短的交流以及e信往来,听说过关于他的故事也比较多。