目前應用的兩種快速序列測定技術是Sanger等(1977)提出的酶法及Maxam和Gilbert(1977)提出的化學降解法。雖然其原理大相徑庭,但這兩種方法都是同樣生成互相獨立的若干組帶放射性標記的寡核苷酸,每組寡核苷酸都有固定的起點,但卻隨機終止于特定的一種或者多種殘基上。由于DNA上的每一個堿基出現(xiàn)在可變終止端的機會均等,因些上述每一組產(chǎn)物都是一些寡核苷酸混合物,這些寡核苷酸的長度由某一種特定堿基在原DNA全片段上的位置所決定。然后在可以區(qū)分長度僅差一個核苷酸的不同DNA分子的條件下,對各組寡核苷酸進行電泳分析,只要把幾組寡核苷酸加樣于測序凝膠中若干個相鄰的泳道這上,即可從凝膠的放射自影片上直接讀出DNA上的核苷酸順序。
現(xiàn)行的邏終止法人加減法序列測定技術(Sacger和Coulson,1975)發(fā)展而來的。加減法首次引入了使用特異引物在DNA聚合酶作用下進行延伸反應、堿基特異性的鏈終止,以及采用聚丙烯酰胺凝膠區(qū)分長度差一個核苷酸的單鏈DAN等3種方法。盡管有了這些進展,但加減法仍然太不精確,也太不得法,因此難以廣為接受。直至引入雙氧核苷三磷酸(ddTBP)作為鏈終止劑(Sanger等,1977 ),酶法DNA序列測定技術才得到廣泛應用。2',3'ddNTP與普通dNTP不同之處在同它們在脫氧核糖的3' 位置缺少一個羥基。它們可以在DNA聚合酶作用下通過其5' 三磷酸基團摻入到正在增長的DNA鏈中,但由于沒有3'羥基,它們不能同后續(xù)的dNTP形成磷酸二酯鏈,因此,正在增長的DNA鏈不可能繼續(xù)延伸。這樣,在DNA合成反應混合物的4種普通dNTP中加入少量的一種ddNTP后, 鏈延伸將與偶然發(fā)生但卻十分特異的鏈終止展開競爭,反應產(chǎn)物是一系列的核苷酸鏈,其長度取決于從用以起始DNA合成的引物末端到出現(xiàn)過早鏈終止的位置之間的距離。在4組獨立的酶反應中分別采用4種不同的ddNTP,結果將產(chǎn)生4組寡核苷酸,它們將分別終止于模板鏈的每一個A、每一個G或每一個T的位置上。
Sanger法DNA測序的試劑
1.引物
酶促測序反應中利用一個與模板鏈特定序列互補的合成寡核苷酸作為DNA合成的引物。在許多情況下,可將靶DNA片段克隆于M13噬菌體或噬菌粒載體,以取得單鏈DNA分子作為模板。但也可以采用Sanger 法商定變性雙鏈DNA模板的序列。在以上兩種情況下, 都可以采用能與位于靶DNA側(cè)翼的載體序列相退火的通用引物,而不必取得與未知DNA序列互補的引物。適于M13噬菌體重組克隆的通用測序引物一般長15-29 個核苷酸,并可與緊靠M13mp18噬菌體多克隆位點區(qū)的HindⅢ位點成M13mp19 噬菌體多克隆位點區(qū)的EcoRI位點的序列互補。這些引物同樣也可用于對克隆于pUC質(zhì)粒的DNA進行“雙鏈”測序,并可從許多廠商中購置得到。此外,還有若干家公司出售一些引物,這些引物下為了對通過多種限制酶切位點克隆于不同質(zhì)粒的靶DNA進行測序而設計的。
2.模板
如上所述,有兩類DNA可以用作Sanger 法測序的模板:純單鏈DNA和經(jīng)過熱變性或堿變性的雙鏈DNA。采用通常從重組M13噬菌體顆粒中分離得到的單鏈DNA應中獲得數(shù)百個核苷酸的序列。如用變性雙鏈DNA用模板,則較難獲得這咱質(zhì)量的結果。盡管采用雙鏈DNA模板的方法顯然既簡單又方便(Chen和Seeburg,1985),然而只是在不久前得到改進以后, 這一方法才發(fā)展到能夠獲得明確可信結果的水平。其中有兩個因素是至關重要的,這就是模板DNA的質(zhì)量和所用DNA聚合酶的種類。小量制箅的質(zhì)粒DNA常常被寡脫氧核糖核苷酸小分子、核糖苷酸及DNA聚合酶的抑制劑所污染,其中前兩種污染物可被用作隨機引物。結果,種種“鬼”帶、強終止現(xiàn)象,以及其他假象往往使測序凝膠含混不清、黯然失色。因此采用小量制備的質(zhì)粒NDA來測定未知DNA克隆片段的序列,并不可取。然而,這類DNA?勺鳛閷σ呀(jīng)通過另一方法測定的序列進行進一步的合適模板。采用CsCl-溴化乙錠梯度平衡離心法來純化質(zhì)粒DNA,測序的結果會好得多,但卻要耗費大量的人務和物力。模板鏈的每一個A、每一個G或每一個T的位置上。
3.DNA聚合酶
通常用于雙脫氧法序列測定的有幾種不同的酶,其中包括大腸桿菌DNA聚合酶I的Klenow片段(Sanger等,1977),反轉(zhuǎn)錄酶(見文獻,如Mieredorf和Prfeffer,1987)經(jīng)過修飾消除了3'→5'外節(jié)酶活性的T7噬菌體DNA聚合酶(Sequenase)和測序酶2.0),Tabor和Richardson,1978]惟及從嗜熱水生菌(T'hermus aquaticus)分離的耐熱DNA聚合物(Taq DNA聚合酶)。這些酶的特性差別懸殊,因而可大大影響通過鏈終止反應所獲得的DNA序列的數(shù)量的質(zhì)量。
(1)大腸桿菌DNA聚合酶IKlenow 片段 這種酶是最初用以建立Sanger法的酶,也是至今仍然廣泛用于DNA序列測定的酶。 通常碰到的兩個問題是:1)Koenow片段的持續(xù)合成能力低,以致一些片段并非由于dd NTP的摻入,而是因為聚合酸人模板上隨機解離而終止合成,因而導致背景增高。由于該酶不能沿模板進行長中距離移動,因此利用該酶進行的標準測序反應所得序列的長度有限。通常,這一反應只能得到大約250-350個核苷酸的序列。 如果分兩步進行反應,所得序列的數(shù)目可以翻一番;其中第一步是初始標記步驟,采用低濃度的dNTP,而隨后的第二步是鏈延伸-鏈終止反應,含有ddNTP和高濃度的dNTP(Johoston-Dow等,1987;Stambaugh和Blakesley,1988)。然而即使有了這些改進,用Klenow 酶所測序列的長度通常還是不如持續(xù)合成能力較強的測序酶。2)這種酶對模板中的同聚核苷酸段或其他含牢固二級結構的區(qū)域進行復制的效能很低。將聚合反應的溫度提高到55℃,可以緩解但并不能徹底解決這一問題(Gomer和Firtel,1985)。有時可采用一些dNTP類似物[如dITP或7-脫氮dGTP(7-deaza-dGTP)]來獲取模板中可形成穩(wěn)定二級結構的相應區(qū)段的序列信息,但Kleow酶對這些類似物的作用不如測序酶有效,這也許是因為它們使Klenow酶原已較低的持續(xù)合成能力進一步降低。總而言這,可以選用大腸桿菌DNA聚合酶IKlenow片段測定從引物5'位置起250個堿基以內(nèi)的一段DNA序列, 但不宜用它來測定更長一段DNA序列或者具有二重對稱和(或)同聚核苷酸段的DNA序列。
(2)反轉(zhuǎn)錄酶 盡管日常測序工作并不廣泛使用反轉(zhuǎn)錄酶,但有時用這個酶解決一些由于模板DNA中存在A/T或G/C同聚核苷酸區(qū)而引起的問題。來自禽類和鼠類反轉(zhuǎn)錄病毒的反轉(zhuǎn)錄酶在這一看來要比Klenow酶略勝一籌(Karanthaansis,1982;Graham等,1986 ),盡管它們也許還是比測序酶遜色(Cameron-Mills,1988;Revak等1988)。
(3)測序酶: 測序酶(SequenaseTM)是一種經(jīng)過化學修飾的T7噬菌體DNA聚合酶。這酶原來具有很強的3'→5'外切核酸活性,經(jīng)過修飾后, 這一活性大部分均被消除。測序酶2.0版是測序酶的基因工程產(chǎn)品,它完全缺失了3' →5'外切核酸酶活性,極其穩(wěn)定而經(jīng)活性要比經(jīng)化學修飾的測序酶高2倍。測序酶持續(xù)合成能力很強,聚合速率很高,對諸如dITP和7-脫氮-dGTP等用于提高分子辨率使測序凝膠某些區(qū)段上的壓縮條帶得以分開的核苷酸類似物具有廣泛的耐受性。它是測定長段DNA序列的首選酶。測序酶可以沿模板移動很長的距離,因而一套反應常常就可以測定數(shù)百個核苷酸的DNA序列。實際上,測得序列的長度更多是受聚丙烯酰胺凝膠的分辨能力而不是受該聚合酶的特性所制約。為了充分利用測序酶極高的持續(xù)合成能力,可采用兩步測序反應。第一步首先采用低濃度的dNTP的較低溫度, 以便將合成反應限制在適度之下并確保放射性標記dNTP和較低溫度,以便將合成反應限制在適度之下并確保放射性標記dNTP的有效摻入,這步反應的產(chǎn)物是僅僅延伸了20-30堿基的引物。 再將第一步反應等分于4組1套的標準反應系統(tǒng)中,每組反應中都含有高濃度的d NTP和一種ddNTP。這樣聚合反應就得以繼續(xù),直至造成鏈終止的核革酸摻入正在增長的鏈中。
(4)Taq DNA聚合酶 Taq DNA聚合酶適用于測定在37 ℃形成大段穩(wěn)定十級結構的單鏈DNA模板序列。這是因為Taq DNA聚合酶在70-75℃活性最高,這一溫度下即使GC豐富的模板也無法形成二級結構。按照1nnis 等(1988)介紹的方法使用Taq DNA聚合酶進行測序,在放射自顯影片上得到的測序梯連續(xù)數(shù)百個堿基條帶始終清晰如一,表明這種酶的持續(xù)合成能力甚佳。模板鏈的每一個A、每一個G或每一個T的位置上。模板鏈的每一個A、每一個G或每一個T的位置上。
4.放射性標記的dNTP
直至幾年以前,實際上所有DNA測序反應都用[α-32P]dNTP來進行。然而32P發(fā)射的強β粒子造成兩個問題。首先由于發(fā)生散射,放射自顯影片上的條帶遠比凝膠上的DNA條帶更寬、更為擴散,因此將影響到所讀取的序列(尤其是從放射自顯影片的上部所讀取的序列)的正確性并將制約從單一凝膠上能讀出的核苷酸序列的長度。其次32P的衰變會引起樣品中DNA的輻射分解,因此用32P進行標記的測序反應只能保存一兩天,否則DNA將被嚴重破壞以至測序凝膠上模糊不清、真假莫辨。[35S]dATP的引入(Biggin等,1983)大大緩解了上述兩方面的矛盾。由于35S衰變產(chǎn)生較弱的β粒子,其散射有所減弱,凝膠和放射自顯影片之間在分辨率上相差無幾,因此可以從一套反應中確切測定數(shù)百核苷酸的DNA序列。此外,35S的低能輻射所引起的樣品分解比較輕微,因此,測序反應可在-20℃保存至1周,而分辨率不見下降。這樣,職果聚丙烯酰胺凝膠方面了發(fā)生技術故障,只要對測序反應進行重分析即可。
5.dNTP類似物
二重對稱的DNA區(qū)段(特別是GC含量高者)可以形成鏈內(nèi)二級過程中不能充分變性。因此將引起不規(guī)則遷移,使鄰近的DNA條帶壓縮在一起,以致難以讀出序列。這種壓縮現(xiàn)象歸因于DNA二級結構的存在,而且不可能通過改變測序反應中出序列。這種壓縮現(xiàn)象歸因于DNA二級結構地存在,而且不可能通過改變測序反應中所用DNA聚合酶的種類而得到減輕。但是凝膠中的壓縮區(qū)段往往可以通過采用諸如dITP(2'-脫氧次黃苷15' -三磷酸)或7-脫氮-dGTP(7-脫氮-2'-脫氧鳥苷-5' -三磷酸)等核苷酸類似物進行分辨。這些類似物與普通堿基的配對能力較弱,而且是測序酶和Taq DNA聚合酶等DNA聚合酶的合適底物(Gough和Murray,1983;Mixusawa等,1986;Innis等,1988)。但對某些壓縮條帶,7-脫氮-dGTP無濟于事;同樣,dITP也無補于另一壓縮條帶(尤其是得于GC豐富區(qū)的縮條帶)的分辨。如果需要采用類似物,首先可試用dOTP,如果壓縮條帶用d ITP或7-脫氮-dGTP都無法分辨, 則轉(zhuǎn)而測定另一條鏈的DNA序列幾乎總能如愿以償。如上所述,兩種形式的測序酶和Taq DNA聚合酶對核苷酸類似物的耐受性優(yōu)于大腸桿菌DNA聚合酶IKlenow片段。此外,制造廠商聲稱在測定含穩(wěn)固二結構的模板序列時,測序酶2.0版要優(yōu)于原來的測序酶。測序酶2.0版持續(xù)合成能力強于測序酶,其作用總是一氣呵成,很少半途而廢,因而消除了“鬼”帶。 而且,測序酶2.0版對諸如dITP類核苷酸類惟物的耐受性看來也優(yōu)于原來的測序酶。
二、Maxam-Gilbert DNA化學降解法
與包括合成反應的鏈終止技術不同,Maxam-Gilbert法要對原DNA進行化學降解。這一方法是在體外研究lac阻抑制與lac操縱基因相互作用時醞釀發(fā)展起來的。時至今日,可以探測DNA構象的蛋白質(zhì)-DNA相到作用,仍然是Maxam- Gilbert法獨具的鮮明特點。在這一方法(Maxam和Gilbert,1980)中,一個末端標記的DNA片段在5組互相獨立的的化學反應分別得到部分降解,其中每一組反應特異地針對某于種或某一類堿基。因此生成5組放射性標記的分子,從共同起點(放射性標記末端)延續(xù)到發(fā)生化學降解的位點。每組混合物中均含有長短不一的DNA分子,其長度取決于該組反應所針對的堿基在原DNA全片段上的位置。此后,各組均通過聚丙烯酰胺凝膠電泳進行分離,再通過放射自顯影來檢測末端標記的分子。相對而言,Maxam-Gilbert法自初次提出以來,基本沒有變化。雖然設計了另一些化學降解反應(見綜述:Ambrose和Pless,1987),但這些反應一般只作為Maxam和Gilbert(1977,1980)最早提出的反應的補充。這一方法的成敗,完全取決于上述這些佞兩步進行的降解反應的特異性。第一步先對特定堿基(或特定類型的堿基)進行化學修飾,而第二步修飾堿基從糖環(huán)上脫落,修飾堿基5'和3'的磷酸二酯鏈斷裂。在每種情況下,這些反應都要在精心控制的條件下進行,以確保每一個DNA分子平均只有一個靶堿基被修飾。隨后用哌啶裂解修飾堿基的5'和3'位置,得到一組長度從一到數(shù)百個核苷酸不等的末端標記分子。比較G、A+G、C+T、C和A>C各個泳道, 右從測序凝膠的放射自顯影片上讀出DNA序列。由于種種原因(如采用32P進行放射性標記、末端標記DNA的比活度、裂解位點的統(tǒng)計學分布、凝膠技術方面的局限性等等),Maxam-Gilber法所能測定的長充要比Sanger法短一些,它對放射性標記末端250個核苷酸以內(nèi)的DNA序列效果最佳。在70年代Maxam-Gilbert法和Sanger法剛剛問世時,利用化學降解進行測序不但重現(xiàn)性更高,而且也容易為普通研究人員所掌握。Sanger 法南非要單鏈模板和特異寡核苷酸的,并需獲得大腸桿菌DNA聚合酶IKlenow 片段的高質(zhì)量酶制劑,而Maxam-Gilbert法只需要人所共的簡單化學試劑。但隨著M13 噬菌體和噬菌粒載體的發(fā)展,也由于現(xiàn)成的合成引物唾手可得及測序反應日臻完善,雙脫氧鏈終止法如今遠比Maxam-Gilbert法應用得廣泛。然而,化學降解較之鏈終止法具有一個明顯的優(yōu)點:所測序列來自原DNA分子而不是酶促合成所產(chǎn)生的拷貝。因此,利用Maxam-Gilbert法可對合成的寡核苷酸進行測序,可以分析諸如甲基化等DNA修飾的情況,不可以通過化學保護及修飾干擾實驗來研究DNA二級結構及蛋白質(zhì)與DNA的相互作用。然而,由于Sanger法既簡便又快速,因此是現(xiàn)今的最佳選擇方案。事實上,目前大多數(shù)測序策略都是為Sanger法而設計的。 類核苷酸類惟物的耐受性看來也優(yōu)于原來的測序酶。
三、測序策略
確證性測序
從頭測序
開始測序之前,必須根據(jù)待測序列區(qū)的長度,所要求的測序精確度以現(xiàn)有有設施來制定測序總策略。只有一小部分的研究劃需需分從頭測定大段從測定過和序列,而列多的情況是通過測序?qū)ν蛔儯ㄈ琰c突變和缺失)進行定位和鑒定,并證實構建的重組DNA的方向與結構。用于上述兩種目的的方略大不相同。
(一)確證性測序
確證性測序(例如對利用寡核苷酸倡導的誘變而產(chǎn)生的突變體進行測序)往往只需要僅僅一套反應,以取得雙鏈DNA其中一條鏈上局部區(qū)域的核苷酸序列,通常只須對亞克隆于M13噬菌體或噬菌粒載體上的一段合適的限制酶切片段進行測序,即可如原以償。在許多情況下,等測區(qū)落于通用引物的測序范圍之內(nèi);若不然,最好的方法就是合成一段長度為17-19核苷酸的寡核苷酸引物,與距離待測區(qū)約50-100核苷酸的序列互補。只要可能,應同時測定野生型基因上同源區(qū)的序列和突變的相應序列。直接在同一張放射自顯影片上對照有關序列,極有助于確證變異區(qū)序列并將使突變體與野生型基因之間任何出乎意料之外的其他差異一目了然。
(二)從頭測序
從頭測序的目的是要提供一段DNA的準確核苷酸序列,這一區(qū)段可長達數(shù)千堿基,而其序列從來未經(jīng)測定。由于單套測序反應所能準確測定的靶DNA序列最長可達400堿基左右,因引進行從頭側(cè)序必須經(jīng)過精心策劃。長約400堿基的枝DNA可以按互為相反的方向分別克隆于2種M13噬菌體載體(如M13mp18 和13mp 119)上。然后每條鏈的全序列可以通過利用通用測序引物進行的單套反應得以測定。如果要對更長的靶DNA(如長達數(shù)千堿基)進行測序,則可在兩種通用策略中一而行:
(1)隨機法(或鳥槍測序法) 在隨機法中,序列資料是從含有靶DNA隨機片段的亞克隆中收集而來的。既不須努力確定這些亞克隆在靶DNA中的位置,也不必設法查明究竟測出的是哪一條鏈的序列,只要把積累資料貯存起來,最后可用計算機排列妥當(Staden,1986)。這一方法是由劍橋的醫(yī)學研究委員會(M.R.C.)實驗室率推行的,曾經(jīng)成功地用于測定人線粒體DNA(Anderson 等,1981)、人腺病毒DNA(Gingeras等,1982;Roberts等,1986)、λ噬菌體DNA(Sanger等,1982),以及Epstenin-Barr病毒DNA(Baer等, 1984)的序列。
(2)定向法 在定向法中,靶DNA的測序按計劃有秩序地進行。例如,靶DNA的全序列可以通過測定一系列嵌套的缺失突變體的序列而獲得,這些突變體具有相同的起點(通常在靶DNA的一端)并分別穿入靶序列區(qū)縱深不同距離處,因此它們可以使靶DNA中更遙不可及的區(qū)段漸進地落入可利用通用引物進行測序的范圍之中。另一種方法是,利用一套反應中取得的核苷酸序列設計新的寡核苷酸充當后續(xù)一套反應的引物,從而循序漸進地獲得從示測定過的靶DNA片段的序列。因此在這一方法中。DNA序列的積累是通過沿DNA鏈漸進移動引物結合位點而實現(xiàn)的。盡管對隨機法與定向法的取舍通常由實驗室的物力與專長所決定,但仍有一少其他因素也會影響最終的抉擇,這些將在稍后加以討論。
選擇隨機定向測定策略的影響因素
(1)計算設備 任何大規(guī)模的測序計劃將在很大程度上依賴計算機程序?qū)υ夹蛄匈Y料進行分類、整理和排列(Staden,1986)。在權衡隨機法的利與弊之時,必須將與適當?shù)挠嬎銠C設備進行聯(lián)機的問題放到壓倒一切的位置上來考慮。如果這些設備尚無從適當?shù)挠嬎銠C設備進行聯(lián)機的問題放到壓倒一切的位置上來考慮。如果這些設備尚無從談起,就必須將采用隨機策略的想法束之高閣,轉(zhuǎn)而從前已述及的兩種定向方法中擇一而行。
(2)靶DNA的性質(zhì):如果靶DNA很可能會有散在的重復序列,那么就應當組建嵌套的缺失體用于測序。計算機在區(qū)分重復序列方面可能束手無策,而寡核苷酸引物則會同多個位點發(fā)生退火。
(3)完成測序計劃所需時間:完成一個測序計旬所需工作蜈可通過以下指示進行估計:
1)從單套反應中平均可是300-400核苷酸的序列。
2)一個人一天可以輕松自如地操作24-32套反應。
3)因此一個測序工作周,可以測出15kb核苷酸序列,這一周包括:
a.用一天時間制備單鏈DNA模板。
b.用一天時間測定DNA序列。
c.用一天讀出原始DNA序列并加以排列。
d.再用兩天生物旱生測序、重新進行電泳,以便澄清模棱兩可這處并取得各個克隆之間的重疊區(qū)序列。
采用隨機法,所要測定的序列通常會比靶DNA所具有的實際長度4-6倍。在大多數(shù)情況下,直至雙鏈90%左右的序列測出以后,才能得到單一的一段鄰接不斷的序列。由于進行測序的亞克隆是隨機挑選出來的,因此靶DNA某些區(qū)段的序列在全段序列未能測出前會被重復測定,至于需要多長時間才能找出最后幾個亞克隆并進行測序,從而使序列提以測全,則無法未卜先知。往往會發(fā)現(xiàn),以上亞克隆在文庫中得不到充分反映,因此南非要處用與側(cè)翼序列相應的寡核苷酸探針進行篩選,以分離這些亞克隆。利用限制酶將大分子靶DNA進一步分為大小適中(4-5kb)而易于處理的片段,可以使上述推理上難題得以緩和,每一個這樣的片段都可以用隨機法單獨進行測序。
定向缺失法有時需要投入大量的時間生成并鑒定一整套嵌套的缺失體。然而一旦這上步水到渠成,則可以從靶DNA上早以妥善安排的多個區(qū)段上互為相反的兩端向內(nèi)部延伸,才能測定DNA雙邏的全序列。另一種辦法是用單套缺失突變體來取得靶DNA單鏈的序,然后利用其信息合成一套寡核苷酸引物,以便用于確證DNA互補鏈的序列(見后)。
(4)使用寡核苷酸合成儀的方便程度:如果能夠無拘無束地使用寡核苷酸合成儀,則可快速、廉價地合成由用戶設計的引物。假定要花1-2天時間來合成一個寡核苷酸,那么在最快速度下每周可以由靶DNA的一個特定起點開始從頭測定600-800個核苷酸的序列。如果同時使用幾個起點開始從頭測序; 或者也可以將M13mp18和M13mp19噬菌體載體,利用通用引物同時從兩端開始測序;或者也可以將序列內(nèi)部的限制酶切片段亞克隆循下列原則:設計DNA測序物時,應遵循下列原則:
1)應寡核苷酸與靶DNA的正確主靶DNA中確鑿疑的序列相互補。尤其是利用循序漸進的寡核苷酸法來測定從未測過的DNA序列時,這一點更加重要。盡量讓新設計的寡核苷酸互補于已知序列的最遠端,這是十分自然的人民代表傾向。然而在大多數(shù)情況下,該序列是從測序凝膠頂部間隔緊密的條帶中讀取的,而在此處發(fā)生閱讀錯誤往往司空見慣。因此緊好保守一些,讓所設計的引物與位于樣品泳前沿之后一定距離內(nèi)的序列機互補,在凝膠的這一區(qū)段上讀出的序列可信程度較高。
2)引物的堿基組分比便應勻稱[40-55%(G+C)], 而且長度至少應有18個核苷酸。 如果(G+C)%
在上述閾值之外,應將寡核苷酸長度設計為(18+n/2)個核苷酸,其中對AT豐富區(qū),則n=50-(G+C)%對GC豐富區(qū),則n=(G+C)%-50。
3)檢查新設計二重對稱區(qū),因為可自雜交形在發(fā)夾或莖環(huán)結構的寡核苷酸是低物。效引
a.其中不含二重對稱區(qū),因為可自雜交形成發(fā)夾或莖環(huán)結構地寡核苷酸是低效引物。
b.它既不會同載體DNA也不會同序列已經(jīng)測出的靶DNA區(qū)段相互補,如能保證這一點,將大大減少寡核苷酸從模板DNA的不只一個位置上引導DNA合成的可能性。已商品化的大部分用于DNA分析的計算機程序都能夠從序列中檢索合成寡核苷酸的互補區(qū)。
(5)序列的準確性:如果認真地進行DNA序列測定,錯誤率將小于0.1 %。但要達到這樣高的準確性,必須完整地測定靶DNA兩條鏈的序列并澄清棱兩可及相互矛盾之處。在這一點上隨機測序有其優(yōu)點,因為在該方法中耐需要驟步對豐余的原始序列資料進行累積,從而使最終所排出的序列的準確性大為改觀。然而靶DNA中可能存在一些區(qū)域,無論采用隨機法還是定向法都不能準確測定其序列。解決這些凝難序列往往需要花費意外長的時間,有時還要使用堿基類似物(以消除條帶壓縮現(xiàn)象)或Maxam-Gilbert測序法。
(6)測序計劃的下一步打算:不同的測序策略將會得到不同類型的樣品材料,這些材料可用于以后的實驗。例如,為NDA測序而構建的多套缺失體可用于研究啟動子區(qū)中的結構域,而與靶片段不同區(qū)段互補的多套寡核苷酸,可用于測定靶DNA突變體的序列。為鳥槍法測序而構建可以留作隨后進行定點誘變或制備放射性標記探針的材料。