1.8.4 超轻量级选手

超轻量级选手

继续我们的问题:靠记录下病毒的遗传信息,细菌为什么就能抵御病毒入侵呢?

为了说清楚这个问题,我们再来回想一下病毒的生命史。我们已经知道,病毒本身并不具备独立生存繁衍的能力。病毒的“生命力”依赖于病毒颗粒能够进入宿主细胞,释放出自身的遗传物质,并且利用宿主细胞的资源帮助其复制繁衍。那么可以想象,对于病毒而言,它们进入宿主细胞后的第一件事就是迫不及待地把自己的遗传物质给释放出来——或者说暴露出来。反过来,对于饱受噬菌体之苦的细菌而言,病毒入侵的第一个标志是不是就是病毒遗传物质在细胞内的出现?既然如此,细菌是不是也可以利用这一点来实现对病毒的精确打击:一旦在细胞内监测到病毒遗传物质的出现,就第一时间启动防御机制?

如果真是这样的话,CRISPR序列的功能也许就可以理解了。既然CRISPR序列中有一部分和病毒遗传物质完全一样,那么是不是可以想象这样一个过程:细菌会把细胞内存在的所有DNA都一一抓来和CRISPR序列仔细比对,一旦发现两者完全一致,就意味着病毒在细胞内出现了,就必须马上启动防御机制?

这种做法听上去很合理。不过,合理的可能性和真实的生物学之间,还间隔着漫长的探索过程。在做酸奶的法国科学家揭示了细菌的免疫功能后,许多实验室立刻开始着手尝试解释CRISPR序列的工作机理(见图4-8)。

科学家发现,和细菌体内正常编码蛋白质的基因一样,CRISPR序列也能被转录成RNA分子。这些短短的RNA分子会和细胞内的某种蛋白质结合(这类蛋白也因此被称为cas蛋白,也就是CRISPR结合蛋白的意思),像哨兵一样在细胞里终日巡逻。这位哨兵寻找的对象,是任何一段能够和CRISPR RNA完美配对的DNA分子。一旦两者相遇并结合,哨兵就会启动cas9蛋白的切割功能,将这段DNA切成一个个小的片段。也就是说,细菌的全套免疫系统,仅仅就是一个自带切割功能的蛋白质,一段自带识别功能的RNA。


如果此时我们再度回想锌手指和“神话”蛋白就会发现,与细菌相比,复杂生物的DNA识别机制竟然是如此低效。我们说过,锌手指识别DNA的效率是1:30,而“神话”蛋白更是低至1:102。而细菌的CRISPR识别DNA的效率是1:1,这是在理论上就无法逾越的识别效率!如此惊人的识别效率,是因为CRISPR完全避免了DNA和氨基酸之间的转换,完全依赖RNA而不是氨基酸序列实现对DNA的识别。由于DNA的每个碱基恰好对应RNA的一个碱基,因此,CRISPR实现了最简洁的DNA识别,堪称超轻量级的基因组GPS。而这个能力也迅速被用于开发新一代的基因编辑技术。

2005年,就在莫西卡从海量CRISPR序列中发现规律,第一次提出细菌免疫可能性的时候,美国加利福尼亚大学伯克利分校的结构生物学家珍妮弗・杜德纳(Jennifer Doudna)也偶然从地球微生物学系的同事吉利恩・班菲尔德(Jillian Banfeld)那里听说了CRISPR。某天在校内的“言论自由运动”咖啡馆小坐闲聊时,班菲尔德告诉杜德纳,她的实验室从附近铁矿中发现的许多细菌,也带有这种神奇的CRISPR序列。

与一心想着解决免疫问题的细菌学家不同,杜德纳是功成名就的结构生物学家,长期利用X射线衍射方法研究蛋白质大分子的三维结构。因此,对CRISPR产生兴趣的杜德纳自然希望利用老本行来探究CRISPR的三维结构,看看它们究竟是怎样实现对病毒DNA分子的识别的。

但杜德纳在几年内都没有取得很好的进展。事后想想,她的探索其实是有点超前的。2005年的时候,人们还不知道CRISPR DNA需要先转录成较短的RNA分子,才能发挥功能(这一点直到2008年才发现),也不知道CRISPR的真实功能是切割病毒DNA(这一点直到2010年才发现),更不知道CRISPR RNA发挥功能需要一系列与之结合的cas蛋白(这一点也是2008年才发现)。实际上,即便是在2010年,人们已经知道细菌的免疫系统是cas蛋白和几段RNA的复合体时,杜德纳都还没有找到合适的入手点。2010年,人们发现CRISPR RNA会结合好多个cas蛋白,而解析一个拥有七八个蛋白质分子、好几段RNA片段的庞大蛋白复合体结构,直到今天在技术层面都还相当困难。

到了2011年,杜德纳终于找到了突破口。或者更准确地说,是突破口找到了她。

当年3月上旬,杜德纳飞往美丽的波多黎各参加一场由美国微生物学会组织的会议。会议的主题是细菌中的RNA分子——这正是杜德纳整个职业生涯一直关注的目标。从浓雾时雨的北加州飞往阳光明媚的加勒比海,杜德纳的心情无疑是轻松愉快的。直到一位表情严肃的女科学家走上前来,轻声问她:“能出去走走顺便请教您几个问题吗?”

这个女科学家是任教于瑞典于默奥大学的法国人艾曼纽・卡朋特(Emmanuelle Charpentier)。这场不期而遇的对话标志着人类基因治疗领域新的起点,毫无异议将被写入当代科学史(见图4-9)。


和杜德纳一样,卡朋特也对CRISPR序列有着特别的兴趣,但两人的研究背景大相径庭。和结构生物学出身的杜德纳不同,卡朋特受过长期的细菌生物学训练,对细菌本身所属的生物学更加熟悉。而在这场海边的对话中,卡朋特提到她自己的实验室在研究一种危险的人类致病菌——化脓链球菌——当中的CRISPR序列。她的实验室发现,细菌中仅仅需要一种cas蛋白(后来大名鼎鼎的cas9,当时的名字还是csn1)和两段RNA分子,就可以识别和切割病毒DNA!

于是,杜德纳和卡朋特顺理成章地开始了她们的合作。对杜德纳而言,研究一个蛋白质的结构和功能显然比研究一大堆蛋白质轻松得多;而对于卡朋特而言,她也非常想从结构生物学的角度,更好地理解cas9到底是如何发挥功能的。两个相隔万里之遥的实验室迅速展开了合作,最终在2014年完美解释了CRISPR/cas9系统的工作原理。我们可以把cas9蛋白想象成有着两个卡槽的接线板,卡槽内能够同时插进一条CRISPR RNA和一条病毒基因组DNA。当插入的CRISPR RNA和病毒DNA的序列一一配对时,cas9蛋白就会发生变形,准确卡住病毒DNA,毫不犹豫地挥起剪刀。这正是细菌免疫系统的工作原理。

在此之前的2012年,两个实验室首先证明了CRISPR/cas9系统能够作为新一代的基因编辑工具。他们对这个系统进行了进一步简化,把系统所需的RNA从两条合并成了一条向导RNA。与此同时,他们抛开病毒免疫的概念范畴,第一次证明了这个双组分系统的完全可编程性:人工设计的向导RNA可以让cas9蛋白指哪打哪,切割任意指定的一段DNA序列。

而这个时候距离“神话”核酸酶技术的出现也不过短短一年而已!当科学家们还在努力改善“神话”蛋白的组装方法,生物技术公司还在跃跃欲试准备用“神话”蛋白展开基因治疗尝试的时候,CRISPR/cas9技术的从天而降,宣示了“神话”技术的终结。毕竟这一次,要定位和切割任意一段人类基因组序列,只需要科学家设计几十个碱基长度的序列即可,这把基因编辑的工作量一下子减少到原来的1/100!