研究者們在分離到某一基因后,要對其編碼蛋白質進行研究最理所當然的工作就是表達——即:有目的性地合成外源基因產物。在重組DNA技術的發展早期,人們認為在基因的前面有一個強啟動子和一個起始密碼子就足以在大腸桿菌中獲得很好的表達。隨后,認識到獲得有效的翻譯所需的條件要復雜得多,除了要有強啟動子和起始密碼子外,良好的表達尚需編碼目的蛋白的mRNA中含有核糖體結合位點,表達水平受密碼子喜好程度的影響,也受編碼序列中其他目前尚未明了的因素影響。通過改變起始密碼子前端的序列,或者在不改變蛋白質序列的條件下利用密碼子的簡并性改變5’末端編碼序列往往有助于解決問題。
通常,兩個基因之間的融合表達能更快地解決這些問題。在這種方式中,目的基因被引入某個高表達蛋白序列(fusion tag)的3’末端,比如大腸桿菌的一段序列,或者任一可在大腸桿菌中高度表達的基因,它提供良好表達所必需的信號,而表達出的融合蛋白的N末端含有由fusion tag編碼的片段。fusion tag所編碼的可能是整個功能蛋白或是其中的部分。比如6x His Tag、β-半乳糖苷酶融合蛋白和trpE融合蛋白、谷胱甘肽S-轉移酶(GST)融合蛋白以及硫氧還蛋白(Trx)融合蛋白等。
由于利用tag的特性通常可以對融合蛋白進行親和層析等分離提純,更多情況下選擇融合表達是為了簡化重組蛋白的純化。因此出現兩種融合表達類型:一是fusion tag位于目的蛋白的N端,這時tag可以提供良好表達所必需的信號,幫助提高目的蛋白的表達,缺點是純化的表達產物中可能會有不完整的目的蛋白,原因是在翻譯過程中意外中斷的少量(C端)不完整的表達產物會一起被純化。另一是fusion tag位于目的蛋白的C端,這可以保證只有完整的表達產物才會被純化。當目的蛋白的功能區位于N端時,fusion tag位于C端可能減少對其功能的影響,反之亦然。
進行融合蛋白的表達經常會遇到三個問題,它們是:表達蛋白的溶解性、穩定性和fusion tag的存在。前兩個問題在融合蛋白表達系統和非融合蛋白表達系統都會遇到,而第三個問題是融合蛋白系統所獨有的。
裂解融合蛋白以除去fusion tag
為了對目的蛋白進行生化及功能分析,通常要從目的蛋白上去除fusion tag部分。早期已建立了數種對融合蛋白進行位點特異性裂解的方法。化學裂解如溴化氰(Met↓)、BNPS-3-甲基吲哚(Trp↓)、羥胺(Asn↓Gly)等,不但便宜且有效,往往還可以在變性條件下進行反應。但由于裂解位點的特異性低和可能對目的蛋白產生的不必要修飾,使該法漸漸被酶解法取代。酶解的方法相對來說反應條件較溫和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特異性。其中有用的酶有:Xa因子、凝血酶、腸激酶、凝乳酶、膠原酶。所有這些酶都具有較長的底物識別序列(如在凝乳酶中為7個氨基酸),從而降低了蛋白質中其他無關部位生斷裂的可能性。而酶解法存在成本高(這些蛋白酶價格一般都相當昂貴),反應時間長等問題,更重要的是蛋白酶本身不可避免地會混入目的蛋白中,造成新的污染,提高純化的復雜性。
IMPACT系統的推出是融合表達系統的一個重大突破。該系統最大的優點是表達的融合蛋白無需蛋白酶裂解即可實現目的蛋白與fusion tag的精確切割。IMPACT(Intein Mediated Purification with an Affinity Chitin-binding Tag)系統利用一個來源于枯草桿菌的5kDa大小的幾丁質結合域(chitin binding domain,用于親和純化)和一個來源于酵母intein蛋白質組成一個雙效的fusion tag,再與克隆到多克隆位點的目的基因融合表達。Intein是一個蛋白質剪接元件,類似于基因組中的內含子intron在RNA的剪接中所起的重要作用,intein在較低的溫度和還原條件下發生自身介導的N端裂解,可以釋放出與之相連的目的蛋白。也就是說融合表達產物在掛上親和層析柱后只需要在低溫(4度)條件下用含DTT,或者巰基乙醇,或者半胱氨酸的溶液洗脫,即可將目的蛋白洗脫,而將fusion tag留在純化柱上。而還原劑的小分子可以非常簡單的去除。該系統的出現是融合表達系統的重大突破,完全避免了蛋白酶的使用,不但可以有效降低成本,提高效率,也避免了蛋白酶與目的蛋白的分離純化的麻煩。
隨后推出的IMPACT-CN系統提供了兩種選擇,即fusion tag可以選擇在目的蛋白的C端或者N端,使克隆或表達都能滿足不同需要。但是這一系統仍然有一個缺陷,那就是含有較多二硫鍵的蛋白不適用這一系統,因為還原劑的存在會破壞/影響蛋白的二級結構。
IMPACT—TWIN的推出為我們帶來了更大的驚喜。在多克隆位點的兩端各有一段intein和幾丁質結合域的fusion tag,提供了三種選擇:1、在克隆時切掉N端的fusion tag 1,插入目的基因,同原來的系統一樣,可以在表達產物掛上親和純化柱后加入還原劑,將目的蛋白從fusion tag上解離并洗脫下來,得到的目的蛋白C端帶有硫酯鍵,可以直接用于連接一個標記物、非編碼氨基酸或者另一個蛋白;2、在克隆時切掉C端的fusion tag 2并插入目的基因,當表達產物掛上親和純化柱時只需要改pH值和溫度(pH7, 25度)即可將目的蛋白從fusion tag上解離并洗脫下來。這不但避免了蛋白酶的使用,更重要的是也避免了還原劑對含豐富二硫鍵的蛋白二級結構的破壞。由于調節緩沖液的pH值非常方便且無需另外去除洗脫產物中的還原劑,這大大地簡化了目的蛋白的純化過程,也擴大了該系統的應用范圍。3、可以將目的基因插入兩個fusion tag之間,這樣表達產物的兩端都含有fusion tag,當產物掛上親和純化柱并經過兩級洗脫后,由于目的蛋白兩端分別有一個硫酯鍵和半胱氨酸,可以自身環化得到環形蛋白。
表達蛋白的可溶性
在大腸桿菌中許多外源蛋白的高水平表達最后都會導致形成包涵體,它是致密的不溶性蛋白和RNA的凝聚體,含有大部分的表達蛋白。蛋白質沉淀形成包涵體有利的一面是可以利用包涵體的不溶性和致密性,通過超聲波破碎、離心就能相對容易地對之進行初級純化。此外,以可溶性蛋白形式表達時往往易被降解的蛋白質,以包涵體形式表達時卻可以很穩定。純化時,可用鹽酸胍或尿素變性溶解包涵體中的蛋白質。透析除去變性劑后,蛋白質可重新折疊復性。然而這種方法亦有其弊端,經變性/復性后正確折疊的蛋白質的產量不穩定,有時會很低,更有些蛋白尤其是大蛋白基本上不能正確進行重折疊。
當包含體復性后的產量太低,而所需表達的是可溶性蛋白時,有多種解決方法可供嘗試。一個重要的變量就是溫度,由于尚未明了的原因,高溫(37℃和42℃)會促進包涵體形成,低溫(30℃)的抑制其形成;另一個變量是表達水平,有時降低表達水平可增加可溶蛋白比例;第三個變量是攜帶表達載體的細胞株背景,不同的受體菌株表達出的特定蛋白的可溶性有顯著的差異,但各株間究竟是何種遺傳差異決定了溶解性的差異仍屬未知;最后,值得注意的是,改變fusion tag往往可以影響所表達的融合蛋白的溶解性。
表達蛋白的穩定性
在大腸桿菌中表達外源蛋白,尤其是真核蛋白時,經常會遇到穩定性的問題。包含體有助于穩定融合蛋白;采用缺失已知蛋白酶的大腸桿菌株作為宿主也是解決的方法之一。比如,缺失數種胞質蛋白酶的lon htpR雙突變株可減少不穩定蛋白質的降解。與之相似的是,degP突變株可穩定胞質中的融合蛋白、ompT突變株被證實在蛋白質的粗提過程中能避免一些非融合蛋白中暴露的堿性氨基酸殘基之間的肽鍵發生斷裂(如Arg-Arg)。最后,對于某一特定融合蛋白來說,在不同的野生型實驗株內其穩定性亦有差異,可能歸因于不同株內蛋白酶的水平不同。