隨著人類基因組工程的完成,對于低花費的測序技術的需求促進了高通量二代測序技術的發展。這些新的測序平臺允許進行高通量測序,具有廣泛的應用:
-
全基因組從頭測序或者重測序
-
目標序列重測序
-
轉錄組分析
-
微生物組研究
-
基因調控研究
NGS 序列
二代測序儀器有很多種組合,在通量、片段長度、準確度、每一輪測序成本、每百萬堿基對測序成本、初始成本、規格和技術方面存在存在差異。
從規格和初始成本的角度而言,二代測序儀器可輕松地分類為更窄的范圍,也就是所謂的“臺式測序儀”和高通量儀器。
臺式測序儀使得任何實驗室都可以像使用real-time PCR一樣,自己進行測序。這些儀器可以和一些靶標序列富集技術相結合,用在一些臨床的應用中,其中:選定的靶標基因用于深度分析,以檢測稀有的突變,或者檢測多樣樣本中(比如癌癥樣本)中的突變。目前,這些儀器的通量在10 Mb到7.5 Gb之間,但是隨著硬件,軟件和試劑的持續改善,通量也在穩步增加。
高通量測序儀非常適合于大量的,基因組范圍的研究,每次測序能測定600 Gb的序列。一些這樣的高通量和高精度的平臺,能測定的片段長度相對較短,這對于高重復性的序列和未知基因組的從頭測序就可能成為問題。與此相反,也有一些儀器能測序的片段較長(達到2500 bp),但是其精度和測序能力(90 Mb)要低很多。還有一些測序能力位于兩者之間的儀器(~800 bp,700 Mb)。
因此,應用決定了哪一種儀器是最合適的。
有一種新的方法被稱作“納米孔測序”。這種技術中,根據一個DNA鏈通過一個合成的或者蛋白納米孔道所引起的電流的改變,可以確定通過這個孔道的堿基。這理論上可以僅用一步就測序一個完整的染色體,而不需要生成新的DNA鏈。
DNA測序
二代DNA測序的工作流程如下:
-
DNA樣本制備
-
文庫構建和驗證
-
文庫分子大規模平行克隆擴增
-
測序
二代測序DNA樣本的質量控制
首先,評價基因組DNA的質量是非常必要的(完整性和純度)。
凝膠電泳法
基因組DNA的完整性和大小,可以用常規或者脈沖場瓊脂糖凝膠電泳(PFGE)來檢測。常規的凝膠電泳的精確度不高,這是因為大的DNA分子在凝膠中移動的時候,本質上是用一種與尺寸無關的方式一起移動的。但是,它仍然能夠提供完整性(大小范圍)和純度(RNA污染物在凝膠底部形成脫尾條帶)方面的有效信息。因此,它仍然是評價基因組DNA質量的有效方法之一。
注:RNA污染會導致DNA濃度高估,并且抑制一些下游步驟。如果能肯定有RNA污染,則可使用去DNase的RNase I處理樣本。
分光光度測定法
分光光度儀在260 nm和280 nm處讀數的比例(
A260/
A280)可以用來估計DNA相對于一些吸收紫外光的雜質(比如蛋白)的純度。純凈的DNA的
A260/
A280比例大約為1.7–1.9。
注:想要獲得精確的A260/A280值,需要在弱堿性的緩沖溶液中測定吸光度(比如, 10 mM Tris?Cl, pH 7.5)。
第二個步驟是測定基因組DNA的濃度。
分光光度法
DNA的濃度可以通過使用分光光度儀測定其在260 nm波長的吸光度來確定。Nanodrop目前被廣泛使用,因為它需要的樣本量少(1 μl),并且使用方便(不需要比色皿)。為了確保結果的可靠性,讀數應該在0.1到1.0之間。
注:吸光度測定不能區別DNA和RNA。RNA污染物會導致DNA濃度高估。但是,純凈RNA的
A260/
A280比值在2.0左右,而純凈的DNA大約為1.8。因此,如果這個值為1.95,那么說明樣本里面有RNA雜質。
注:苯酚在270–275 nm的波長范圍內有最大的吸光度,非常接近于DNA。因此苯酚能提高樣本在260 nm附近的吸光度,從而導致高估DNA的產量和純度。
熒光法
熒光法使用熒光染料測定DNA的濃度,具有特異性和靈敏性。Hoechst 33258結合到DNA上后,能增大458 nm波長附近的發光強度,除此之外,也可以使用一些更加靈敏的熒光染料,比如PicoGreen染料。基于PicoGreen染料的實驗,比紫外吸光光度法靈敏10,000倍,而比使用Hoechst 33258染料的方法至少靈敏400倍。和紫外吸光光度法不同,PicoGreen實驗對雙鏈DNA的選擇性要遠高于RNA和單鏈DNA。
DNA標準品和樣本與熒光染料混合,并且使用熒光計檢測。將樣本的測定結果與標準品的測定結果相比較,以確定DNA的濃度。
Real-time PCR
可以使用real-time PCR 技術來測定DNA樣本的數量和質量。多重PCR技術使用引物集在多個位點擴增不同大小的片段,是檢測DNA損傷和片段化的有效質控手段。此類技術試驗專門測定可經PCR擴增,適于二代測序的DNA分子。上述提到的這些常規方法,通常不能測定的樣本中擴增得到的DNA的量,或者會高估了DNA的量。與它們相比,real-time PCR更加適用于預測DNA樣本是否適合于二代測序。
文庫制備
對于大多數商業化的二代測序平臺,使用諸如橋式擴增或者乳液PCR方法,對文庫中的DNA片段進行克隆擴增,以產生足夠拷貝數量的測序模板非常必要。通過將平臺特異性的適配子與感興趣的DNA源(比如基因組DNA、雙鏈cDNA或者PCR擴增子等所產生的DNA片段)退火,得到片段文庫。適配子序列的存在,使得我們可以對文庫分子進行選擇性的克隆擴增。因此,這種方法不需要像傳統的方法那樣,在微生物中間體中,對基因組片段進行微生物克隆。另外,適配子序列中,還含有平臺特異性的測序引物的結合位點。
通常情況下,一個常規的DNA文庫構建方案包含四步:
-
片段化DNA
-
對DNA片段進行末端修復
-
連接適配子序列(不適用于單分子測序)
-
對可選的文庫進行擴增
目前有四種方法用于產生基因組DNA碎片:酶消化法、超聲波法、噴霧法和水動力剪切法。這四種方法都可以用于文庫構建,但是每一種方法都有其優點和局限性。核酸內切酶消化的方法快速并且容易,但是難以精確的控制片段長度的分布。另外這種方法可能會對基因組DNA的呈遞引入偏倚。另外三種技術使用物理的方法將DNA的雙鏈打斷,這種斷裂是隨機的,因此能在文庫中對DNA進行無偏的呈遞。可以使用瓊脂糖凝膠電泳或者自動化的DNA分析方法,對DNA片段的尺寸分布進行控制。
片段化DNA之后,需要將DNA修復,產生5’磷酸化的平末端DNA,以便能夠和測序平臺特異性的適配子相連接。文庫構建的效率直接依賴于DNA末端修復的效率和準確性。
末端修復混合溶液將5’或者3’的粘性末端轉變成5’磷酸化的平末端DNA。在大多數情況下,末端修復通過T4 DNA聚合酶的5’—3’聚合酶活性和3’—5’的核酸外切酶活性完成。而T4多聚核苷酸激酶確保平末端的DNA片段5’端的磷酸化,以便進行后續的適配子連接。
根據所使用的測序平臺,平末端DNA片段可以直接與適配子連接,或者需要在其片段的3’端增加一個單獨的突出的腺苷酸A,以便與平臺特異性適配子上突出的胸苷酸T相互配對。通常情況下,使用Klenow片段(具有最低的3’到5’端的核酸外切酶活性),或者使用其它具有末端轉移酶活性的聚合酶催化這一步驟。
T4 DNA連接酶將雙鏈的適配子與文庫片段修復過的末端相連,然后使用回收反應或者根據DNA的尺寸,選擇性去除文庫中未連接的適配子和適配子二聚體。大小篩選方法包括使用瓊脂糖凝膠電泳分離,使用磁珠或者使用高等的基于柱的純化方法。在連接過程中可能出現適配子的二聚體,它們會和與適配子連接的文庫片段共同擴增,從而降低測序平臺對真正文庫片段測序的能力并且降低測序的質量,因此在測序之前,必須將它們從文庫中除去。一些測序平臺要求文庫片段的長度分布在比較窄的范圍內,以得到最佳的結果,很多時候,這只能通過去除凝膠電泳上的相應的片段條帶實現。這種方法也可以用來去除適配子二聚體。
完成這一步驟之后,應該對DNA片段文庫的質量進行檢測,并進行定量檢測。根據濃度和測序文庫的適配子設計,既可以直接稀釋溶液并用于測序,也可以對文庫進行選擇性擴增。在文庫擴增階段,使用高保真的DNA聚合酶,合成完整的適配子序列,通過與PCR引物的重疊,用于后續的克隆擴增和與測序引物結合,或者提高DNA文庫的產量。為了得到最佳的文庫擴增結果,要求DNA聚合酶具有高保真性和最小的序列偏倚。
文庫質量評估方法,參見NGS文庫質控。
為了充分利用測序能力,不同樣本得到的測序文庫可以放在一起,在同一輪實驗中一同測序。通過將DNA片段與具有不同特征的適配子相連接,可以實現這一過程,即對于每一個樣本使用不同的短核苷酸序列作為適配子。
有一些其它的方法可以用于簡化文庫構建。有一種新方法使用轉位酶/DNA的復合物進行體外轉座,以便在同一個試管中同時將DNA片段化并標記。通過對所標記的DNA片段進行有限次數的PCR擴增,可以構建完整的測序文庫,這節省了操作步驟和時間。但是,使用體外轉座構建的文庫,與傳統方法構建的文庫相比,具有更高的序列偏倚。
NGS文庫質控
高質量的文庫是成功進行第二代測序的關鍵。文庫構建包含復雜的步驟,比如片段化樣本、修復末端、將末端腺苷酰化、連接適配子和擴增文庫。根據使用的平臺和文庫類型,這些步驟也會發生變化。監控每一個步驟非常必要,包括在片段化樣本之后檢查片段的尺寸,以及連接適配子之后檢查片段的大小和濃度。文庫驗證過程中,需要分析文庫中片段的大小和數量,這是質控的最后步驟。
評估文庫中片段的大小
瓊脂糖和PAGE凝膠電泳是傳統的檢測片段大小的方法,它們比較耗時。
最近,基于微流技術的電泳或者毛細管電泳越來越廣泛的用于檢測片段的大小和濃度。即買即用的芯片和膠盒省去了配置凝膠的步驟,使用方便。它們具有更高的通量,并且省去了很多的手動操作時間。除此之外,它們的靈敏度更高(對于檢測的限制更少),并且能完全自動化的獲取數據和輸出電子化的數據資料。這些儀器能同時檢測片段的大小和濃度。
-
測定文庫中的片段數量
-
分光光度法和熒光法
-
參見分光光度法和熒光法
電泳設備
如前所述,基于微流技術的電泳和毛細管電泳除了提供片段大小的信息之外,還提供了定量檢測數據。但是,電泳、分光光度法和熒光法的一個共同的局限性是,都只檢測總的核苷酸的濃度,而非與適配子連接的分子的濃度。
Real-time PCR
將適配子連接到文庫分子的兩端,使得可以在平行的PCR擴增步驟中擴增上百萬個獨立的DNA分子(乳液PCR或者橋式PCR)。在有些儀器中,乳液PCR可以將一個DNA分子擴增到數百萬個相同序列的拷貝,并全都結合在同一個珠子上。在另一種平臺上,橋式PCR能夠將一個DNA分子轉變成一個包含相同序列的多個拷貝的DNA簇。因此,兩端連接了適配子的擴增之后的分子,決定了乳液PCR中模板和珠子的比例以及橋式PCR中產生的最佳DNA簇。
對擴增后的文庫中的分子進行精確的定量檢測,對于確保片段的質量和高效的獲得數據是非常重要的。低估擴增文庫中的分子數量,會導致混雜的信號以及難以解析的數據;相反地,高估分子的數量會降低結合模板的珠子或者DNA簇的產量,并且沒有充分利用測序能力。
Real-time PCR能夠特異性的定量檢測兩端結合有適配子的DNA分子,因此能夠對擴增文庫中的分子進行高度精確的定量檢測。Real-time PCR的靈敏性非常高,可以對濃度非常低的文庫分子進行定量檢測,即使其濃度低于傳統方法可以檢測的閾值。因此,這種方法能盡量減少對文庫的擴增,降低可能的偏倚。
用于決對定量檢測的數字PCR
數字PCR能夠對二代測序的文庫進行絕對定量檢測,而不需要標準品。這個技術對文庫進行有限的稀釋,并進行大量獨立的PCR反應;因此,大多數反應沒有模板,得到陰性的結果。一個單獨的陽性PCR反應統計為一個單獨的模板分子。通過統計所有陽性PCR的數量,能夠確定文庫分子的絕對數目。數字PCR的主要優點在于:
-
單分子的敏感性
-
與PCR擴增的效率無關,因為成功的擴增被統計為一個分子,而與最終產物的數量無關
但是,這種技術需要特殊的儀器,并且花費較高,因此尚未廣泛用于文庫定量檢測。
宏基因組學Metagenomics
DNA測序的應用領域之一是宏基因組領域,即從環境樣本中直接回收的遺傳物質的非培養研究。宏基因組學是指一個環境樣本中所包含的所有微生物基因組的功能和序列分析。這個詞匯起源于“meta”(在這里指對于基因多樣性的系統性理解)和“genomics”(對一個物種的遺傳物質的綜合分析)。
宏基因組不是一個新的學科,但由于二代測序技術所帶了的諸多可能性,宏基因組的應用經歷了巨大的提升。
據估計,微生物中僅有1%左右是可培養的,因此宏基因組學的研究能極大的拓展我們對于環境的認識。
很多年以來,“宏基因組”這個詞匯僅與環境樣本的分析有關,比如,分析從極端的生存環境下分離得到的DNA,以便發現能用于工業的新的生物催化劑。但是,通量的極大提高,以及所花費的費用和時間的降低,將這個領域的應用擴展到了很多其他方面。
宏基因組學可分成幾個領域,包括:
-
病理基因組學/感染基因組學
-
微生物組分析
-
環境宏基因組學
注:這并不是全面的分類,研究者可以選擇其他的分類標準。
病理基因組學/感染基因組學和疾病的診斷相關,用于確定有疾病癥狀的患者體內未知的病原體。這通常是極具挑戰性的過程,因為微生物的數量可能非常少(每毫升血液中大概有1–10個細胞)。
與之相反,微生物組分析則涉及到數量巨大的微生物,比如口腔或者直腸拭子中的微生物。此時,我們的目標是分析這些菌群的組成。考慮到人體僅包含1%的人類細胞而其它99%都是微生物細胞,微生物組分析在未來的診斷技術中有潛在的巨大應用。更多細節,請見人類微生物組工程(
www.hmpdacc.org)。
環境宏基因組學的目標除了包括傳統的尋找新的生物催化劑之外,還包括研究和鑒定棲息環境。
從理論上來講,環境宏基因組學有兩種不同的研究方法:
-
全基因組分析:對所有存在的DNA進行測序
-
16S分析:僅對16S rRNA DNA進行測序
第一種方法只是簡單的對樣本中存在的所有DNA進行測序。這可以完整地描繪所有出現過的微生物,并且可能發現新的酶或者酶家族,以及抗生素的抗性。另一方面,這種方法需要較高的測序能力,因而,相對于第二種方法,其通量較低并且花費較高。與此相關的進一步的方法正在研發。
在宏基因組的應用中,通常需要能提供較高的片段長度的測序儀,這是因為通常沒有參考序列可供參照。對于16S rRNA分析而言,測序儀的讀長需要覆蓋整個區域(另請參照二代測序儀)。
RNA 測序
RNA測序(RNA-seq)是使用深度測序技術來研究生物體轉錄組的方法。此方法在構建合適的文庫之后,對樣本中的RNA直接測序,得到豐富的數據集以進行分析。這項技術的高靈敏度和高分辨率使得它成為研究整個轉錄情形的有價值的工具。數據的定量性以及測序技術的高動態范圍使得其對基因表達的分析具有高度的靈敏性。數據的單個堿基的分辨率提供了關于單核苷酸多態性(SNP)、選擇性剪接、外顯子/內含子邊界、非翻譯區及其它元件的詳細信息。除此之外,RNA-seq不需要預先知道參考序列,這使得從頭的轉錄組分析和新的變異體和突變體的檢測成為可能。RNA-seq是研究轉錄組的強大、革命性方法,但是使用這種技術需要非常仔細以獲得最高質量的數據。
RNA-seq中需要考慮的因素
第一個需要考慮的因素是樣本富集。總RNA通常只包含比例很少的編碼RNA或者功能RNA;樣本中大部分RNA是核糖體RNA(rRNA:大約占到了總RNA的80–90%)和較少的轉運RNA (tRNA)。為了避免將80–90%的測序資源用在重復的rRNA序列上,通常在測序之前,需要從樣本中去除rRNA。這通常可以通過特定的消耗rRNA實現,也可以通過使用寡聚胸腺嘧啶富集技術選擇性富集Poly A實現。消耗rRNA的方法可以同時保留編碼RNA和非編碼RNA(一項非常重要的研究內容)的信息,而Poly A富集則僅保留了編碼mRNA。Poly A富集可能會丟掉特定的RNA和具有高轉換率的RNA。
有一些其他的方法可以避免rRNA的影響,比如選擇性降解大量轉錄物,或者不擴增rRNA的擴增技術。但是這些方法不像rRNA消耗或者poly A富集那么常見,并且可能扭曲轉錄物表征的正常水平。
另外一個需要考慮的因素是要研究的RNA的大小。RNA轉錄物跨越比較大的大小范圍;與常規的RNA分析相比,關注小RNA的實驗(比如microRNA或者長度范圍在15–35bp的RNA),需要特別的純化和文庫構建方案。大多數其他大小的RNA片段可以同時測序(RNA測序的常用步驟之一是將RNA分割成普通長度,比如200–300 nt長度的片段)。
RNA-seq測序操作步驟
一旦確定了移除核糖體的方法和要研究的片段大小,就可以將RNA構建成一個文庫。對于大多數測序儀器而言,這包括首先將RNA打碎成片段,其次通過逆轉錄方法構建雙鏈cDNA。在后續的文庫構建過程中,這些雙鏈的cDNA被當作普通的基因組DNA來對待。如果想要保留RNA的直接信息(鏈型),必須使用修改過的文庫構建方案,比如將mRNA與連接適配子直接相連,或者標記cDNA的一條鏈以便在測序之前移除。
在進行測序計劃過程中,需要考慮三個主要的因:測序深度、讀長和是否使用雙端測序數據。測序深度可以提供RNA轉錄物的豐度信息,并且較大的測序深度使得對于稀有轉錄物的檢測更加靈敏。讀長也很重要,因為較長的讀段對于檢測剪接事件更加靈敏(內含子–外顯子邊界,外顯子–外顯子邊界)。雙端測序數據能提供更多關于轉錄物結構的信息,特別是相互分隔的較遠的外顯子。一般而言,從頭分析以及尋找新的結構變異要求較高的測序深度和讀長,并且會得益于雙端測序數據。典型的測序應用包含100–200 M片段,長度為2 x 50–100 bp。與之相反,表達分析得益于較高的測序深度,但是讀長和雙端測序數據則對結果的改善作用較小。這方面應用的一個典型實驗包含10–30 M片段,讀長為1 x 35–100 bp。
基因調控研究
二代測序技術也是研究基因調控網絡的強有力的工具。比如ChIP-seq技術(染色質免疫共沉淀測序)可以用于分析蛋白-DNA的相互作用。二代測序技術也能用于確定基因組的全局甲基化模式。
ChIP-Seq
染色質免疫共沉淀技術(ChIP)是用于研究轉錄因子和修飾組蛋白基因調控機制的強大、多功能方法。這種技術用于確定活細胞中染色質上那些與轉錄因子、共調節因子、修飾組氨酸、染色質重塑蛋白或者其它的核因子相互結合的區域。
整個操作過程非常耗時,包含了很多步驟和變量,每一個步驟都需要研究者根據自己的模型體系進行優化。將細胞與甲醛交聯之后,將染色質中共價相連的基因組DNA和核因子復合物分離出來,然后經過超聲波處理,剪切成可以處理的大小。抗體與目標核蛋白特異性免疫共沉淀時,也將與這些核蛋白特異性結合的基因組DNA也沉淀下來了。去除化學交聯并經過核酸純化處理的這些DNA可用于測序、基于微陣列的基因組雜交或者PCR擴增。ChIP與二代測序技術聯用(ChIP-Seq)可研究與感興趣蛋白相結合的位點在基因組的范圍內的分布。與微陣列分析(ChIP-Chip)相比,ChIP-Seq技術提供了較高的空間分辨率,動態范圍和基因組覆蓋度,因而它對于DNA結合位點的檢測具有超級的靈敏度和準確度。另外,ChIP-Seq技術通常只要很少的起始樣本輸入量,并且不需要雜交探針,具有較高的靈活性,任何測序過基因組的物種都可以使用這種方法進行研究。
高效的ChIP-Seq過程需要優化幾個關鍵的變量。首先,甲醛交聯的溫度和時間需要優化。如果蛋白和DNA交聯的過于緊密,則在測序之前無法將染色質有效地打碎成片段,并且去除交聯也會遇到困難。通常情況下,最好以在37°C下與1%的甲醛共培育10分鐘起始,然后在此基礎上進一步優化。
有幾種不同的方法可以將染色質打成碎片,比如超聲波和酶消化(比如使用微球菌核酸酶)。如果使用二代測序技術來分析免疫共沉淀的DNA,染色質碎片的大小應在大約100–300核苷酸長度范圍內,并且每一個測試系統中(細胞的類型、組織的類型),將染色質打碎成片段的參數也需要嚴格優化。
ChIP實驗的成功與否取決于所使用的抗體的量和特異性。最好選用能從多家抗體廠商處獲得的,經過ChIP實驗驗證的抗體。為了確定抗體能特異性地沉淀目標蛋白,可以使用蛋白印跡技術檢測核提取物。如果在結果中,僅能觀察到一條特定大小的條帶,則可認為該抗體是特異性的。使用選定的抗體進行免疫共沉淀,然后通過蛋白印跡分析技術確定抗體是否能特異性的沉淀目標蛋白。如果這樣的實驗失敗了,那么還可以將選定的抗體與培養的細胞進行免疫熒光試驗。如果僅有細胞核顯色,則說明抗體至少能特異性的識別一種位于細胞核內并可結合到DNA上面的蛋白。
根據目標蛋白的豐度,經過驗證的抗體的量以及用于免疫共沉淀的染色質的量必須經過優化,以便獲得足夠的DNA進行測序。對于識別組蛋白和組蛋白修飾的抗體而言,每一次免疫共沉淀反應大概需要100,000到1百萬個細胞中的染色質。如果轉錄因子與DNA結合的動態性較高或者與組蛋白相比,僅在有限的基因組位點上結合,那么實驗就需要更多的染色質。為避免多余的抗體與非目標蛋白和染色質的非特異性結合,同時保證能沉淀足夠多的目標蛋白,每一次免疫共沉淀反應使用的抗體的數量也非常重要。通常而言,1–10 μg的抗體即可得到合理的結果。
可以用對照反應來比對ChIP反應的特異性。在平行的ChIP反應中,使用同樣數量的染色質,可以使用同型的對照抗體或者沒有抗體的珠子用來比照抗體和珠子與蛋白和染色質的非特異性的結合。通過比較陰性對照樣本和ChIP樣本中在特定位點沉淀的DNA的量,能計算這個位點的富集因子。但是,在這種免疫共沉淀對照實驗中得到的沉淀物的量通常很少,不足以提供足夠的片段進行二代測序。因此,ChIP-Seq實驗通常使用輸入對照樣本作比對。在這種情況下,每個ChIP反應中通常有1%交聯并且打碎的染色質被用來去除交聯并且與沉淀的樣本一同純化并進行后續的深度測序。這使得我們可以比對由于打碎染色質所引起的偏移,這些偏移表現在染色質的局部結構,DNA擴增,測序,拷貝數量的變化,以及測定基因組區域的能力。
在沉淀的DNA碎片去除交聯和純化之后,建議使用real-time PCR技術確認與目標蛋白結合的基因組位點的回收和富集效果。通過比較輸入對照組與ChIP樣本的qPCR結果,可以計算出輸入物質的回收比例(ΔC
T方法)。如果使用了同型對照抗體樣本(或者空白珠子的對照樣本),則可以與ChIP樣本相互比對,以進一步對qPCR技術檢測到的位點的富集進行定量分析(ΔΔC
T方法)。
為了能穩定地構建二代測序文庫,至少需要10 ng的ChIP DNA。因此,必須仔細的定量免疫共沉淀得到的DNA。但由于每一次ChIP反應得到的總的DNA量通常很低,因此需要比吸光光度定量法更加靈敏的方法。熒光測定方法(比如使用PicoGreen)在定量ChIP DNA時具有較高的靈敏度和動態范圍。如果仍然沒有得到足夠的DNA,可將從幾次ChIP反應所得到的所有物質可以放到一起,用來構建一個測序文庫。
由于用于構建文庫的起始材料的數量非常低,因此在片段與測序適配子連接之后對其進行擴增很有必要。這通常需要16–18輪PCR。太多輪的擴增會降低文庫的復雜性,因此需要確定得到足夠材料所需的最少PCR輪數。
在確定文庫的品質(使用一些商業化的儀器,比如QIAxcel或者Bioanalyzer)和濃度(比如使用qPCR技術)之后,需要使用乳液PCR(emulsion PCR, Ion Torrent)或者橋式PCR技術(bridge PCR, illumina)對文庫進行進一步的擴增,然后才能用于最后的深度測序。通常而言,較短的25–36核苷酸長度的單個讀段對于定位目標蛋白在基因組上的結合位點就已經足夠了。但是,為了能夠定位更困難的區域(比如重復區域),也可以使用雙末端測序方法(2 x 25的核苷酸長度或者2 x 36的核苷酸長度)。所需要的總的測序讀段取決于與因子結合的基因組位點的數目。對于轉錄因子而言,它們僅僅和基因組上有限的幾個位點相結合,5百萬–1千2百萬讀段可能足夠了。而如果要分析修飾后的組蛋白,由于它們結合在基因組更廣泛的區域上,因此需要更多的測序讀段。通過增加測序讀段的數量,能夠改進分析的靈敏性,從而確定親和力更弱的位點。一些免費的軟件(比如MACS)能用來確定比統計水平具有更多讀段的基因組區域(與局部本底相比或者與單獨測序的輸入對照樣本相比)。對于這樣的數據,上述的軟件能夠產生一個列表,顯示那些顯著增加的目標蛋白的結合位點。
細胞收集,超聲波參數和ChIP富集得到的基因組DNA的real-time PCR分析的優化都需要通過實驗來確定。
基于序列的甲基化分析請參考關于表觀遺傳學的試驗方案和應用指南部分。
參考文獻
Mortazavi, A., Williams, B.A., McCue, K., et al. (2008) Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat. Methods.
5, 621.
Marioni, J.C, Mason, C.E., Mane,S.M., et al. (2008) RNA-seq: An assessment of technical reproducibility and comparison with gene expression arrays Genome Res.
18, 1509.
Pickrell, J.K., et al. (2010) Understanding mechanisms underlying human gene expression variation with RNA sequencing. Nature.
464, 768.
The ENCODE Consortium. (2001) Standards, Guidelines and Best Practices for RNA-Seq.V1.0. (June 2011).
Wang, Z., Gerstein, M., Snyder, M. (2009) RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet.
10, 57.