中国网/中国开发门户网站新合成生物学是利用工程原理改造和创造生命的学科,目前在生物能源、新材料、环境污染治理、肿瘤治疗等方面显示出巨大潜力,在国家科技发展、产业升级过程中可以发挥重大作用,有助于“中国制造2025”。
与传统生物工程相比,合成生物学最大的进步在于对工程设计原理的系统性应用:依据工程设计原理对天然存在的各种酶、调控分子等进行简单化、模块化处理,设计出具有各种基本功能的元件。人工基因线路是利用此类元件,根据类似于电子工程电路编程的思想设计的,对生命的运行过程进行的重新编程。这种对生命的重编程能够针对多样的需求对天然的各种功能进行优化,甚至引入自然界中不存在的人造法则,实现丰富的、可设计的生物学功能,为人类健康和社会发展服务。人工基因线路的起源和研究进展
自然界中存在大量的天然基因线路,是生命体用于收集和处理各种体内生化信号和体外环境变化的动态调控系统,其与物质代谢、能量供给共同构成了生命过程的 3 个基本要素。所有生物体均由物质构成,由能量驱动,并由基因线路控制物质的代谢和能量的流动,以实现多样的生理活动,如细胞分裂、个体形态发育等。同时,生物体对外界环境变化的适应和抗逆反应也依赖于基因线路。例如:人体细胞在血糖浓度升高时对胰岛素的分泌;组织受损时启动组织再生;大量失血时促进造血干细胞分化等。与天然基因线路不同,人工基因线路存在的目的是根据人工生命体的设计目标,进行有针对性的控制,实现特定的控制逻辑,发挥类似于计算机控制芯片的功能。因此,人工基因线路是对生命进行可编程控制的具体体现,是合成生物学的标志性技术。
对生命的编程如同电路编程一样,需要使用大量工程化的元器件,如计数器、脉冲信号产生器、逻辑信号门、信号过滤器等,以实现从低级到高级,由简单到复杂的控制。为了构建出此类元器件,需要在传统生物学多年来对生命调控法则的认识基础上,按照工程化设计原理对生命系统进行简单化处理,再进一步按照不同的方式进行组合而成。尽管人工基因线路与电子线路都是信号采集和处理的信息运算系统,两者在很多方面又是截然不同的。基因线路的工作环境是动态生长的活体细胞,是大量各种分子的混合物,而电子线路的工作环境是固体金属和半导体材料,各个元件之间很容易实现绝缘。这些差异决定了针对基因线路的设计与组装必须要探索新途径,而不是简单地照搬照抄电子线路的成功方案。
在过去 20 年间,合成生物学领域出现了一批奠基性的工作,在人工基因线路设计、调控元件以及组装方法等方面实现了“从 0 到 1”的跃进。相应地,人工基因线路也经历了从基本型到组合型的升级,已经开始具备对高级的生命过程进行模拟和探索的能力。
基本型人工基因线路
基本型的人工基因线路是基于生物学对生命系统的认识,以电子工程的方式设计、模拟并构建的基本生物控制器件,包括遗传开关、生物振荡器、计数器、脉冲信号产生器、逻辑信号门、信号过滤器等。2000 年,波士顿大学的 Collins 课题组设计出了第一个合成生物学功能模块——转录水平的双稳态开关(图 1a)。该模块成功地在大肠杆菌中实现了数学模型预测的双稳态效应,可以作为基本型的遗传开关使用。同年,普林斯顿大学的 Elowitz 和 Leibler 实现了更为复杂的功能模块——基因表达振荡器(图 1b)。该器件利用 3 个基因模块彼此间的抑制和解抑制作用实现了输出信号的规律振荡。以上两项工作在理论和实验层面证明了理性设计生物元器件的可能性,对合成生物学发展有重大指导意义,因此被称为“合成生物学的里程碑”。作为逻辑电路的基本元件,过去 20 年间还出现了各种逻辑门,包括“与门”“非门”“或门”等。例如,一种“与门”利用带有琥珀突变的 T7 噬菌体 RNA 聚合酶和能够拯救琥珀突变的 tRNA 构建的独立输入信号,可以整合处理环境中任意两种信号输入并相应地给出下游输出(图 1c)。类似的逻辑门、基因开关和振荡器等基本型人工基因线路不仅可由原核生物中各种基础调控元件拼装,还能由更复杂的调控元件和信号传导元件构建而成,在真核生物乃至人体细胞中发挥功能。
图 1基本型人工基因线路
(a)具备扳键开关功能的人工基因线路;(b)具备振荡器功能的人工基因线路;(c)具备逻辑“与门”功能的人工基因线路
组合型人工基因线路
利用基本型人工基因线路作为基础器件,可以搭建出复杂的组合型人工基因线路,用于模拟高级的生命过程。2014 年,北京大学欧阳颀课题组设计出了一种具有巴甫洛夫经典条件反射行为的人工基因线路,在大肠杆菌中重现了高等生物的神经网络的学习功能。该基因线路由 2 个逻辑“与门”、2 个逻辑“或门”和 1 个记忆模块组成,能够接收 1 个不引起输出响应的外界信号分子 A 和 1 个可引发输出响应的环境信号 B。此 2 种信号组合的多次共刺激能使大肠杆菌的记忆状态发生改变,最终使信号 A 能够单独引起输出响应(图 2a)。2012 年,麻省理工学院的 Voigt 课题组把 3 个二进制逻辑“与门”组装为 1 个巨大的四进制逻辑“与门”,实现了能够同时感知 4 种不同环境信号的人工基因网络(图 2b)。以上两项工作外,还由很多有用的组合型人工基因线路,如加法器、边界识别器、多输入的逻辑线路等。
为了实现更高级的控制功能,人工基因线路势必变得越来越复杂,随之而来的是设计难度的迅速提升。电子线路设计领域在 20 世纪遇到过类似的问题,其解决方法是基于计算机程序的自动化线路设计和模拟。因此,在 2016 年,Voigt 课题组开发出了一种能用于自动设计组合型复杂人工基因线路的计算机程序“Cello”(意为 “cellular logic”),能根据用户需求自动化地给出可执行布尔逻辑运算的基因线路设计,实现类似于电子工程领域电路设计软件的功能。该程序整合了大量转录调控元件的表征数据,生物元件组装的经验,已知元件的生物学限制条件,以及逻辑线路的自动编译工具等。用户选择输入信号、输出信号、宿主细胞等信息后,程序会从标准化生物元件的表征数据库中挑选合适元件,从动力学区间、生物毒性等问题出发进行模拟和优化,输出线路的 DNA 序列和定量预测结果。最终,研究人员可以直接将 DNA 序列合成、装载到宿主细胞中执行功能。该程序能够大幅提高对人工基因线路的设计效率。
人工基因线路的应用
目前,人工基因线路已经在基础科研和实际应用两方面发挥了重要作用。在基础科研领域,合成生物学对天然的生物系统进行干扰、重建乃至再创的能力已经成为生物学家探索生命的强大工具,能够用于研究复杂生物的运行规律。在实际应用领域,人工基因线路也已经在代谢工程、医学、农业、能源等领域展现出了巨大的应用潜力,极大推动了这些领域的发展。
“建物致知”——人工基因线路在基础科研中的应用
利用人工的基因线路元件,可以实现对天然的基因线路的重编程,构建超越进化法则的人造生命过程,用于探索传统生物学难以研究的一些基本科学问题。这种方法被称为“建物致知”。目前,该方法已经为生命起源、生物进化、生命网络调控等方面的研究开启了更加广阔的空间。
例如,细胞在应激调控中会专一性地利用某种特定的调控拓扑网络。因此,可以通过替换拓扑网络中某些特定的元件对该网络进行重编程,从而深入了解天然基因线路的某些特性。2009 年,美国加州理工大学 Elowitz 课题组在枯草芽孢杆菌中构建了一个“先正后负”的人工负反馈基因线路,替换了天然的“先负后正”的负反馈网络(图 2a)。他们发现,这种人工负反馈网络产生的感受态响应持续时间短、噪声小,而天然负反馈网络的感受态持续时间长短不一,分布特别宽。这一发现揭示了一种生命体在适应环境方面的生存策略,即利用放大基因表达噪声来适应环境的多变和不确定性。
相比于细菌,高等生物的调控网络更加复杂,也存在更多的未知领域,能够赋予“建物致知”研究方法更大的发挥空间。早在 2003 年,美国加州大学旧金山分校的 Lim 课题组在研究酵母细胞对环境信号的响应策略时,通过对两种完全不同的信号通路——有性生殖响应和高渗透压响应的重编程,成功实现了对两种输入信号和输出信号的嫁接,以此证明了 MAPK 信号转导通路的支架蛋白是空间上区域化的信号节点。同时,该工作还证明了只要将基于支架蛋白的层次性信号——蛋白磷酸化反应整合在一起,就能获得完全依赖于蛋白质相互作用的、可重新编程配置的人工信号通路(图 2b)。类似的调控拓扑替换和信号通路嫁接工作还有很多,比如人工改变了调控顺序的 lambda 噬菌体开关,被嫁接了输入和输出信号的双组分调控系统等。这些研究不仅加深了人们对天然基因线路生理学功能的认识,而且为基因线路的从头设计提供了高质量的基本调控元件。
图 2置换型人工基因线路
(a)枯草芽孢杆菌应激感受态调控网路中天然与人工负调控反馈网络与动态响应的比较;(b)酿酒酵母的有性生殖信号网络和高渗透压响应网络经过人工置换,获得了有性生殖信号,从而激活了高渗透压响应的基因表达
人工基因线路的实际应用
计算机芯片是各种电器中不可缺少的核心设备,控制着电器的各种功能,同时带来“智能化”的响应。与之类似,人工基因线路作为各种合成生物学应用的可编程控制组件,往往能够实现一些传统技术难以实现的、“智能化”的控制方式。
在肿瘤治疗领域,CAR-T 技术已经展现出了有目共睹的治疗效果,但也在 T 细胞激活水平调节、靶向特异性、信号通路调控等方面存在提升的空间。针对这些问题,波士顿大学的 Wong 课题组提出了一种新型的 CAR-T 设计方案——“SUPRA CAR”,被诸多科技媒体称为新一代的 CAR-T 疗法,引起了广泛关注。SUPRA CAR 方案通过将 CAR-T 固定式的细胞外 scFV 单链抗体与细胞内 CD3z 信号结构域拆分为由亮氨酸拉链(Leucine-Zipper)这种通用结构连接的两部分,分别实现了对两部分的模块化设计和可编程性,为人工基因线路设计创造了可能。基于该方案设计的人工基因线路能够对多种抗原信号产生逻辑响应,并且调控不同免疫细胞类型的信号通路。通过合适的线路设计,还实现了调节 T 细胞激活反应强度,以减轻治疗的副作用。
此外,在代谢工程领域,人工基因线路也展现出了“智能化”控制的潜力,提供了更好的解决方案。基于细菌群体感应功能设计的人工基因线路能够根据细菌数量对目的基因表达进行动态调节,使对细菌生长有负面影响的基因在细菌达到一定数量之后再表达,规避了传统发酵过程中微生物生长和发酵产物生产的矛盾,实现了对发酵过程“先生长,再生产”的动态调控,同时也避免了使用昂贵的诱导剂。
人工基因线路设计的挑战
使用人工基因线路执行控制功能时,需要将该线路装载到不同的底盘生物中。不同领域的应用对底盘生物需求的多样性要求人工基因线路对底盘生物的适应性。为了达到此目标,需要对人工基因线路进行“模块化”设计。“模块化”是合成生物学元件的核心属性之一,设计目标是将生物系统拆解为功能上相互独立的模块,并保证模块间的拼装不会导致模块功能的改变。模块化设计能使构建的生物系统像电子系统一样进行规模扩展和尺度放大,因此合成生物学领域的大量工作都注重模块化元件的开发。然而,事实远比设想中复杂。基因回路并不能严格地和宿主细胞隔离,而是与细胞的生理状态耦合形成一个整体,人工基因线路会对细胞生理产生一些不可预知的干涉性影响,而这些干涉性影响也使理论上“模块化”的生物元件和基因线路失去了可预测性,不再“模块化”。这就导致在一种生物中精细刻画过的元件性质并不能在另一种生物中直接成立,因为元件一旦脱离了刻画时的细胞生理状态,其行为就有可能偏离预期。如果不能克服这个问题,合成生物元件就不能像电子元件一样使用简单元件逐步搭建复杂线路,而是需要耗费大量时间和精力对单个底盘生物中的元件进行点对点的优化。目前,人工基因线路的设计挑战主要表现在两个方面:①人工基因元件过表达引发细胞生长压力和细胞毒性;②细胞体内存在一些会影响人工基因线路功能的特殊生理机制。
人工基因线路过表达引发细胞生长压力和细胞毒性
细胞利用有限的资源完成营养物质摄取、能量代谢、DNA 复制、细胞分裂等诸多生理过程。为了优化自身的生长,细胞需要根据环境平衡分配这些资源。当人工基因线路的加入打破了这种平衡,就可能引发细胞生长压力(burden),影响细胞的正常生长。细胞的生长压力主要表现在两个方面:①人工基因线路在蛋白表达过程中占用了底盘细胞的 RNA 聚合酶和核糖体,以及相关的辅酶、能量等资源。②过量表达蛋白还可能引起细胞的应激反应,激活一些细胞应激途径如 ppGpp 等。除了生长压力,人工基因线路还可能带来细胞毒性(toxicity)。与生长压力不同,细胞毒性产生的原因是人工基因线路调控过程中的脱靶效应对底盘细胞的正常生理活动产生的干扰,而非由于对细胞内基础资源的占用。
当底盘细胞因为生长压力或细胞毒性而生长减缓时,会反过来对其内部人工基因线路的可预测性和遗传稳定性产生负面影响。例如,基于 TetR 家族阻遏蛋白设计的元件中,一些阻遏蛋白可能会与底盘细胞基因组上非特异靶位点的结合,从而影响底盘细胞的生长,同时也降低了这些元件的可预测性。此外,在细胞培养过程中,人工基因线路的序列可能产生各种随机突变。通常这些突变带来的影响非常小,但如果某种突变体为其所在的细胞带来了生长优势,就会很快占据群落的主体,使人工基因线路在群体层次上失效。例如,一种基于群体感应设计的、控制细胞群体大小的元件在传代培养 3—6 天后,就由于逃脱调控的突变体发生大量增殖而失效。
许多已经广泛使用的优质元件也因为自身的细胞毒性限制了其发挥和推广。例如,CRISPRi-dCas9(CRISPR interference-dCas9)调控系统被认为是优秀的可编程的调控元件,目前已被广泛用于基因线路的构建。然而,随着 dCas9 表达量升高,细胞生长会出现明显的迟滞。一些研究者认为该毒性来源于 CRISPR 的脱靶效应。因而在 CRISPRi-dCas9 的实际使用过程中,研究者需要耗费大量精力来平衡转录调控开关的正面影响与其对细胞生长的负面影响。合成生物学的元件设计最终要针对下游应用问题进行调整,而下游应用需要宿主细胞健康、快速生长,因此元件的细胞毒性将是合成生物学走向应用的瓶颈问题之一。
细胞内的一些特殊生理机制会影响人工基因线路的功能
细胞内存在的一些生理机制也可能会对元件的功能产生意料之外的影响,如排队效应(queueing-up effect)和追溯效力(retroactivity)。合成生物元件和底盘细胞共同利用细胞内的酶、核糖体等有限资源,资源竞争会导致设计上本互不相关的基因线路元件产生功能上的干涉。例如,带有 LAA 蛋白降解标签的黄色荧光蛋白、青色荧光蛋白在同一大肠杆菌中过量表达时,可能过载细胞内的 ClpXP 降解机器,使得两种不同的荧光蛋白不得不排队进入 ClpXP 的降解通道,从而使两种不相关的蛋白降解过程产生干涉。这一机制被称为排队效应。与此类似,细胞内核糖体的数量不足时,mRNA 的翻译也会出现对核糖体的竞争,从而导致不相关的 mRNA 翻译产生排队效应。追溯效力是指信号通路下游的系统给上游系统带来信号反馈,从而影响上游系统功能的效应。具体而言,人工基因线路中一个基因被调控的程度,可能会被其他接受同类调控的基因的个数所影响,类似于一个电阻两端的电压差依赖于其他并联电阻的数目一样。排队效应和追溯效力都会给人工基因线路的功能带来严重影响,但设计时却很难被面面俱到地考虑到,因此为人工基因线路的可预测设计带来挑战。
结论与展望
人工基因线路设计、调控元件工具箱以及组装方法的开发在过去十几年间经历了巨大的发展,然而人工基因线路与底盘细胞的各种相互作用却阻碍了人工设计的生命系统的复杂度进一步提升。为了突破这个瓶颈,需要关注一些合成生物学领域的基本工程科学问题,如细胞生理系统对人工基因线路的影响及相关元件设计原则等,来获得对未来人工基因线路研究方向的启发。我们认为,未来研究应重点关注以下问题:①注重元件在不同培养条件下功能和行为的刻画,并对实验结果表述和定量方式进行标准化,便于数据的整合和分享;②开发基于转录组、蛋白质组等多层次的高通量技术,降低获取合成生物的全局表型数据库的金钱和时间成本,并做针对性的数据挖掘,为理解元件-宿主相互作用的产生机制提供数据支持;③根据需要开发新型的全细胞模型,用于描述资源分配等细胞生理规律,增强人工合成生物系统的预测性;④研发元件-宿主隔离技术和策略,总结消除两者相互作用影响的设计原则。相关方面的深入研究将使我们真正实现人工生命系统设计的精准化,促进合成生物学成果在应用领域的高效转化。(作者:娄春波,中国科学院微生物研究所;杜沛,中国科学院微生物研究所;孟凡康,中国科学院微生物研究所;季翔宇,中国科学院微生物研究所;张益豪,北京大学。《中国科学院院刊》供稿)