-
1 讲义
-
2 课件
-
3 视频
外源基因在原核细胞中的表达
用原核生物作宿主。原核表达载体具有原核或噬菌体启动子、SD序列(核糖体结合位点)、MCS和终止子序列。
一、原核生物基因表达的特点
1、只有一种RNA聚合酶:可识别原核细胞的所有启动子,催化所有的RNA合成。而真核生物有三种RNA聚合酶。
2、以操纵子为单位:数个相关的结构基因与其调控区结合形成一个表达的协同单位。
3、转录和翻译偶联、连续进行(同时进行)。
4、不含内含子,缺乏转录后的加工系统(不需要加工,直接翻译)。
5、基因的调控主要在转录水平上(见分子生物学教材)。
6、具有mRNA的核糖体结合位点:原核生物mRNA上含有一个起始密码子和一段同核糖体16S rRNA3’末端碱基互补的序列,叫Shine-Dalgarno(S-D)序列(即SD序列是mRNA中5'端富含嘌呤的短核苷酸序列,一般位于mRNA的起始密码AUG的上游8至13个核苷酸处,并且同16S rRNA 3'端的序列互补,长度大约5个核苷酸左右)。
二、外源基因在原核细胞中正确表达的需具备的条件
1、外源基因不能带有间隔序列。
2、必须用cDNA,不能直接用真核基因组DNA。
3、必须利用原核细胞的调控原件来调控外源基因的表达。
4、与表达载体连接后必须形成正确的ORF。
5、能利用宿主菌的酶系统合成目的蛋白。
6、防止外源基因产物对宿主细胞的毒害。
三、原核生物基因表达的调控元件(有些是载体上的,有些是宿主细胞的)
1、启动子:是DNA上的能与RNA聚合酶结合并能起始mRNA合成的序列。
启动子序列:大肠杆菌的所有启动子中都有两段一致顺序,即-35区(RNA聚合酶的识别位点)和-10区(RNA聚合酶的结合位点)
① -35区:RNA聚合酶σ亚基的识别位点。大多数启动子的-35区的共有序列是5'-TTGACA-3',但有些也会有所变化。
② -10区:在-35区下游,距离-35区大约16-19bp,共有序列为5'-TATAAT-3'。其下游是与翻译有关的SD序列和外源基因。
2、RNA聚合酶
大肠杆菌只有一种类型的RNA聚合酶转录tRNA,rRNA和mRNA。
全酶是一个5聚体,含有两个α小亚基,和2两个大亚基(β和β′),一个σ亚基。核心酶不包括σ亚基,σ亚基与转录的起始有关与延伸无关,而核心酶与链的延伸有关。
3、转录终止子:在表达载体克隆位点的下游一般设计一段转录终止子。
载体序列一般为:启动子-操纵子-SD序列-目的基因-转录终止子。
原核生物的终止子有两种,一种是内终止子(不依赖ρ因子的终止子),其促使转录终止的DNA位置有一段反向回文顺序,其后紧接一串A,称为内终止子,形成终止信号。
能使转录终止的原因在于:
① 茎环结构:反向回文序列被转录后,立即在mRNA内部形成一个茎环结构,使转录物mRNA与模板之间配对的碱基数减少,整个减弱了RNA 与DNA的互作
② 多聚A/U: 由于茎环3’段紧接一串A/U的配对(转录后形成U串),稳定性比较差(A/U之间为两个氢键),有利于转录物脱落而不利于转录延续。
载体上的终止子一般都是内终止子,而依赖ρ因子的终止子较少。
4、翻译的起始序列:
(1)Shine-Dalgarno(SD) sequence:
mRNA上与核糖体16sRNA结合的序列,位于起始密码子的上游。S-D序列与16sRNA 结合后才能起始翻译,S-D序列与AUG之间的距离会影响翻译的效率。
(2)起始密码子:位于SD序列下游8-13bp,有三种即AUG、GUG和UUG最多的是AUG。
5、翻译终止密码子:大肠杆菌偏爱UAA。在UAA后加一个U成为UAAU或者安置上全部的三个终止密码(UAA、UAG、UGA)可增强翻译的终止效率。
终止密码子可以存在于载体上,也可以存在于目的基因的末端。
6、翻译增强子:能够显著增强外源基因在大肠杆菌细胞中的表达效率的特殊序列。
如T7噬菌体基因10前导序列(简称g10-L序列)、大肠杆菌atpE基因mRNA5’-UTR(末端重复序列)富含U的区段。
翻译增强子的作用机制还不是很清楚,但确实能增强翻译效率。
7、基因工程常用的原核启动子(P177)
(1)最佳启动子必须具备的条件
① 必须是一种强启动子:能使外源基因的蛋白产量达到细胞总蛋白的10%-30%以上。
② 应呈现低水平的基础转录:便于表达毒性蛋白(防止对宿主的毒性)等。
基础转录即刚刚能够进行转录,没有增强子等元件的转录,只具备转录所必需的基础转录因子。
③应是可诱导型的:用温度(如噬菌体的PL启动子)或化学试剂诱导(如大肠杆菌的Lac启动子)。
(2)乳糖启动子Lac:来自大肠杆菌的乳糖操纵子。
用乳糖或其类似物IPTG充当诱导物,与阻遏蛋白结合,解除抑制。
①乳糖操纵子控制区的结构:(实际上包括启动子区域和操纵子区域)
由阻遏物作用区、CAP作用区、RNA聚合酶作用区、核糖体结合区组成。(乳糖操纵子受到CAP-cAMP的正调控,见分子生物学教材)
长度为203bp的HaeIII片段(两端经过HaeIII切割后形成的片段,其中包括β-半乳糖苷酶的前8个密码)。
②IPTG —异丙基硫代-β-D半乳糖苷:常用的诱导物
(3)色氨酸启动子trp:
来自大肠杆菌的色氨酸操纵子,色氨酸操纵子由trpR、P1、P2、O、a基因以及多种结构基因组成。其中P1是主要启动子,P2的作用只有3%。
没有色氨酸时,辅阻遏蛋白无活性,不能与操纵基因结合,能转录合成色氨酸所需要的酶。有色氨酸时,辅阻遏蛋白与色氨酸结合后才能与操纵基因结合,从而阻止色氨酸合成酶类的转录。另外色氨酸操纵子的转录也受到衰减子的调控,(见P179)。
用于表达载体的trp启动子一般只包含启动基因、操纵基因、和部分trpE基因。含trp启动子的表达载体比含Lac启动子的表达载体表达效率要高。
(4)Tac启动子
由Lac和Trp组成的杂合启动子,为强启动子,含Tac启动子的表达载体其表达效率高于含Lac和Trp启动子的表达载体,可被IPTG诱导。
(5)PL和PR启动子
是从l噬菌体中得到的一类启动子,比Lac启动子的活性高8-10倍,比Trp启动子活性高。
PL为向左转录的启动子,PR为向右转录的启动子。
当cI阻遏蛋白合成后,与OL和OR结合阻止RNA聚合酶,则左右基因的转录都受到抑制。但促进PM使cI进一步转录,进一步合成cI阻遏蛋白,进入噬菌体的溶原周期。
表达载体常用的噬菌体启动子是PL,载体山的调节基因cI 则是选择了一个温度敏感性的突变基因cI857,整合在宿主基因组里,或克隆到载体上。28℃时阻遏PL,外源基因不转录。42℃时阻遏蛋白失活,外源基因大量转录。
除了这些启动子之外还有其他的一些启动子,如T7启动子等。
四、几种类型的原核表达载体
1、非融合型表达载体:载体表达出的外源基因蛋白质不与细菌的任何蛋白质融合在一起。整个外源基因是一个ORF。这种载体的优点在于产物结构接近于真核细胞体内的蛋白质结构,缺点在于表达的蛋白容易被宿主菌的蛋白酶所破坏。
(1)pKK223-3 载体:哈佛大学的Gilbert实验室建立的。表达能力强。
组成结构:① 强启动子,是Tac启动子,是由Trp的-35区和LacUV5启动子的-10区组成。
②操纵基因:来自于乳糖操纵子系统,即Lac操纵基因。
③调节基因:是位于宿主菌染色体上的乳糖操纵子系统的调节基因(即Lac I基因)这种宿主菌常用的是JM系列,如JM105、JM83等。是一种阻遏基因,编码阻遏蛋白。
④终止子:rrnB强终止子(是rRNA的终止子)。
⑤S-D序列和插入位点区:插入位点区来自于pUC8的多克隆位点。
⑥载体的其余部分:来自pBR322质粒,如抗生素抗性基因Ampr和Tetr、复制起始点等。
⑦表达诱导物:IPTG(乳糖的类似物):宿主的LacI基因编码的阻遏蛋白与IPTG结合后失去活性,不能结合在O基因上,因此能转录。
IPTG要想起到诱导物的作用,所用的表达宿主菌必须有lacI基因。
2、分泌型表达载体
载体表达出的外源蛋白质与分泌信号肽连在一起,可被宿主菌分泌到细胞周质中。
(1)组成结构
① 强启动子:Ipp(脂蛋白基因启动子)和lacUV5启动子组成的复合启动子。
②调节基因:lac I(载体本身具有该基因)
③ 操纵基因:lac操纵基因
④S-D序列和起始密码ATG。
⑤分泌信号肽:由大肠杆菌的外膜蛋白基因ompa编码。
⑥插入位点区(多克隆位点)。
如pIN III-comA1质粒是以pBR322为基础构建的,调节基因不必借助于宿主的lacI,因为载体本身含有lacI基因(见PPT图)。
3、融合蛋白表达载体系统----pGEX系列
表达出的外源基因产物蛋白是与质粒载体上的GST蛋白连接在一起的。
(1)优点:便于融合蛋白的分离和纯化。(其他优点见P182)
(2)组成结构:①启动子:tac,②操纵基因:lacP、 lacO;③调节基因:lacI;④S-D序列;⑤ori:pBR322 ori;⑥融合肽:GST(谷胱甘肽巯基转移酶,来自于日本血吸虫);⑦MCS。
(3)产物提纯:GST融合蛋白用Glutathione Sepharose亲和层析柱分离纯化。
(4)产物分离:用凝血酶或Xa因子可以把外源蛋白从GST上切下来。(过程见PPT图)
(5)其他融合蛋白系统:最常用的就是His-tag(组氨酸标签):在外源多肽的N端或C端接上6个组氨酸,His-tag能与Ni2+柱结合,但很容易被EDTA(或咪唑溶液)洗脱下来,可以纯化蛋白质,如pET系列载体。
五、外源蛋白的表达部位
1、细胞质中表达:即形成包涵体。
包涵体:存在于细胞质中的一种不溶性蛋白质聚集折叠而成的晶体结构物。是由于多肽链折叠过程中的错误而形成的。
外源蛋白高水平表达时容易形成包涵体,分子量大的蛋白容易形成包涵体。
① 优点:使重组蛋白易于分离(超声波裂解后通过高速离心即可将包涵体从细胞裂解物中分离出来)、免受蛋白酶降解、不损害寄主细胞
② 缺点:回收的蛋白生物活性差,尤其是构想表位不容易恢复。
如在大肠杆菌细胞内表达人生长激素就是包涵体形式的。
2、周质中表达
(1)周质:宿主菌位于内膜和外膜之间的细胞结构部分。
蛋白质从细胞质转运到周质的复杂机理目前不完全清楚,但至少与信号肽有关。
优点:容易被浓缩和纯化、有利于正确折叠、被降解的少(周质中的蛋白水解酶较少)。
(2)信号肽:能带领蛋白穿过膜到达周质。但以后需要正确切割掉。一般都不长,大约几十到100个碱基。一般位于蛋白的N端。
(3)常用的原核信号肽
①大肠杆菌的信号肽:phoA、OmpA、OmpT、OmpF、LamB、β-内酰胺酶(lactamase)、肠毒素(enterotoxin)ST-II、LT-B等
②金黄色葡萄球菌的蛋白A。
③枯草芽孢杆菌的内切葡聚糖酶
④胡萝卜欧氏杆菌的PelB蛋白
(2)真核信号肽:也能在细菌中起作用(也能起到引导作用)。如鼠源RNase、人生长激素信号肽等。
另外扩增细菌目的基因时也可以连同信号肽序列一起扩增,这样容易得到分泌蛋白。
3、胞外表达:使在大肠杆菌细胞中表达的外源蛋白分泌到细胞外的培养基中,而不是周质中。
由于需要穿过两层膜,大肠杆菌只能分泌极少的蛋白质到培养基中,效果都不太理想。
目前可以用溶血素基因构建分泌性融合蛋白或者与细菌素释放蛋白共表达,这样有利于将蛋白分泌到细胞外。
六、影响外源基因表达效率的因素
1、启动子的结构对表达效率的影响:包括-35区和-10区的保守序列、碱基顺序及两者之间的距离。
2、翻译起始序列对表达效率的影响:包括SD序列及起始密码子AUG左侧的核苷酸。
3、S-D序列与外源基因之间的距离。
4、转录终止区对表达效率的影响
5、载体拷贝数及稳定性对表达效率的影响:增加拷贝数可提高表达效率。
6、外源蛋白在菌体中的稳定性对表达效率的影响。
七、提高表达水平常用的方法
1、选择强启动子序列,如tac 等
2、调整S-D序列与AUG碱的距离:一般为5-9bp,距离过长或过短都影响基因的表达。根据不同的启动子选择不同的距离。
3、改变起始密码左侧(即下游)的几组密码子:能提高翻译的起始效率。(根据密码子的简并性进行改造)
4、增加mRNA的拷贝数和稳定性
在外源基因的下游插入“重复性基因外回文序列”(见PPT及PDF)能防止mRNA受到3’®5’外切酶的攻击。
5、减轻宿主细胞的代谢负荷(指外源基因的表达会影响到宿主细胞的生长和代谢,这就是细胞的代谢负荷)
合理地调节代谢负荷与外源基因高效表达的关系,可提高基因的表达水平。可通过以下几种方法:
(1)诱导表达:
将宿主生长代谢与外源基因表达分开即可减轻宿主的代谢负荷。一般采用温度诱导或药物诱导。
如lPL启动子是温度诱导型:32℃时,cI基因编码的cI857阻遏物有活性,抑制lPL启动子,外源基因不表达,但是宿主可大量生长。42℃时cI857阻遏物失活,PL启动子启动,外源基因高水平表达,宿主生长受到限制。
又如tac启动子是药物诱导型:调节基因lac I(位于宿主基因组内或载体上)始终产生阻遏物。
无IPTG时阻遏物与lac操纵基因结合,抑制外源基因转录,宿主大量生长。有IPTG时,阻遏物与IPTG结合,lac操纵基因解放,外源基因大量转录,宿主生长受抑制。
(2)表达载体诱导复制:将宿主的生长与载体的复制分开。
当需要宿主大量生长时,抑制载体质粒的复制。当宿主大量生长后,再诱导载体制粒的复制,增加拷贝数。如pCI101,25℃时拷贝少,宿主大量生长,37℃时宿主生长缓慢,质粒拷贝数增加。
通过这两种方法即可减轻宿主细胞的代谢负荷,通过目的蛋白的表达效率。
6、提高表达产物的稳定性,即防止被宿主的酶降解。
(1)设计成融合蛋白:这是避免被降解的最好措施。
融合蛋白的N末端是由原核基因编码一段多肽,C末端是完整的外源基因。
插入外源基因是要注意ORF的正确性(与载体蛋白的编码序列连接后目的蛋白的ORF不能改变),如lrZ系列载体提供三种融合插入阅读框(三种载体的阅读框只相差一个碱基,见PPT图)。可根据需要选择载体。
再比如pET30a、b、c也是如此,可以利用该系列载体用体外诱导抗原技术筛选保护性抗原基因。
(2)使用突变菌株,保护外源蛋白不被降解:减少宿主菌本身的蛋白酶的表达。
①使用lon基因缺陷型菌株,减少宿主菌的蛋白酶合成。
②大肠杆菌的htp R基因突变也减少蛋白酶的降解作用。(lon基因和htp R基因分别编码两者蛋白酶)
③T4噬菌体的pin基因产物能抑制细菌的蛋白酶。可把pin增加到载体上。
(3)表达分泌蛋白:周质中的蛋白酶少,有利于表达蛋白的稳定。
细菌蛋白分泌的条件:
① 有信号肽:位于N端,一般为15-30aa 。真核与原核的结构相似, 功能相似,可以互换。(Arg精氨酸;Lys赖氨酸;Leu亮氨酸;Ile异亮氨酸;Ala丙氨酸;Gly甘氨酸;Ser丝氨酸)
② 蛋白质内有与分泌相关的aa 序列:为蛋白指明目的地(是分泌到周质中还是培养基中,如有目的蛋白前溶血素基因编码的蛋白则分泌到细胞外的培养基中)。
③ 细胞内的转运机制:需要信号肽酶I、信号肽酶II等近20多种蛋白质的参与。
一般来说:真核细胞中的分泌蛋白能在大肠杆菌中很好地分泌表达;但非分泌蛋白很难在大肠杆菌中分泌。因此要首先确定所要表达的蛋白的性质。
八、原核细胞表达的缺陷:缺乏蛋白质的加工。(如糖基化、氨基酸修饰等)
原核细胞表达原核基因以及真核细胞表达真核基因较为容易,然而原核细胞表达真核基因则存在一定的困难:
①原核细胞RNA聚合酶不能识别真核基因的启动子。
②由于真核基因为不连续基因,因而必须将内含子切除后才能成为成熟的mRNA,但原核细胞中缺乏真核细胞的转录后加工系统。
③在原核细胞中,mRNA必须含有SD序列才能和核糖核蛋白体结合,从而指导蛋白质的合成。而真核基因转录的mRNA缺少SD序列。
④真核基因在原核细胞表达产生的外源蛋白很不稳定,容易被原核细胞蛋白酶所破坏。
解决办法:
1、将真核基因克隆到原核启动子和S-D下游。
2、所要表达的真核基因选用mRNA反转录后的cDNA。
3、与原核多肽形成融合蛋白。
小结
1、原核表达载体具有原核或噬菌体启动子、SD序列(核糖体结合位点)、MCS和终止子序列。
2、原核生物基因表达具有只有一种RNA聚合酶、转录和翻译偶联、不含内含子,缺乏转录后的加工系统、基因的调控主要在转录水平上、具有mRNA的核糖体结合位点等特点。
3、原核生物基因表达的调控元件有启动子、RNA聚合酶、转录终止子、翻译的起始序列、翻译终止密码子、翻译增强子等。常用的启动子有PL和PR启动子、Tac启动子、色氨酸启动子trp等。
4、外源蛋白在原核细胞中可以在细胞质中表达或在周质中表达,也可以在胞外表达。
5、启动子的结构、翻译起始序列、S-D序列与外源基因之间的距离均对表达效率有影响。可通过选择强启动子序列、减轻宿主细胞的代谢负荷等方式提高表达效率。

