IDT NGS二代測序甲基化測序捕獲解決方案
——DNA甲基化文庫構建試劑盒、定制化Panel雜交捕獲探針組
北京澤(ze)平(ping)代理(li)的(de)美國IDT NGS二代測序產品,通(tong)過(guo)基(ji)于(yu)PostBS單鏈(lian)建庫(ku)原(yuan)理(li)的(de)IDT xGen Methyl-Seq 甲基(ji)化文庫(ku)建庫(ku)試劑盒(he)、用于(yu)雜交捕獲靶向富集(ji)的(de)IDT xGen Custom Hyb Panel 定制探(tan)針組,實(shi)現從低起(qi)始(shi)量DNA樣本(ben)(ben)獲得高質量的(de)甲基(ji)化檢(jian)測結果,同(tong)時提高目(mu)標(biao)區域覆蓋度并降(jiang)低檢(jian)測成本(ben)(ben),為生命科(ke)學實(shi)驗室基(ji)礎研究提供強大(da)助力。
摘要
在(zai)哺乳動物表觀遺傳學研究(jiu)中(zhong), DNA甲(jia)基(ji)化是研究(jiu)最為深入(ru)的(de)修飾(shi)之一(yi)。在(zai)正(zheng)常(chang)細胞中(zhong), DNA甲(jia)基(ji)化可(ke)以有效(xiao)調控基(ji)因表達(da)水平(ping)(ping)。但與此同時,啟動子區域的(de)高甲(jia)基(ji)化會引起某些抑癌(ai)基(ji)因的(de)失(shi)活,已有大量(liang)實驗研究(jiu)表明,DNA甲(jia)基(ji)化在(zai)多(duo)類癌(ai)癥中(zhong)會導致大范(fan)圍(wei)基(ji)因沉默。當(dang)然,甲(jia)基(ji)化水平(ping)(ping)的(de)改變不僅會出現在(zai)啟動子區域和(he)DNA重復序列中(zhong),它(ta)還與非編碼RNA(如腫瘤抑制作用(yong)相(xiang)關的(de)microRNA)的(de)表達(da)調控有關。
DNA甲(jia)基(ji)化水(shui)平與腫(zhong)(zhong)瘤(liu)(liu)發生與發展(zhan)過(guo)程息(xi)息(xi)相關,這驅動著人類表(biao)觀基(ji)因(yin)組(zu)(zu)學的(de)(de)進步。甲(jia)基(ji)化測(ce)序(xu)(xu)是(shi)研(yan)究不同生命過(guo)程中(zhong)基(ji)因(yin)調控(kong)的(de)(de)重要工具之一(例如(ru)細胞(bao)分(fen)化和疾病(bing)進展(zhan)),并且在(zai)包括腫(zhong)(zhong)瘤(liu)(liu)早篩和診斷(duan)在(zai)內的(de)(de)臨床檢(jian)測(ce)中(zhong)展(zhan)現出(chu)越(yue)來越(yue)大的(de)(de)應(ying)用價值。全基(ji)因(yin)組(zu)(zu)甲(jia)基(ji)化測(ce)序(xu)(xu)(WGBS)允許無偏好(hao)性(xing)地(di)進行(xing)單堿基(ji)分(fen)辨率檢(jian)測(ce),是(shi)檢(jian)測(ce)目標區域(yu)的(de)(de)理(li)(li)想方(fang)法。在(zai)有明確目標基(ji)因(yin)組(zu)(zu)區域(yu)存(cun)在(zai)的(de)(de)情(qing)況下,經(jing)過(guo)雜(za)交(jiao)(jiao)捕獲后再(zai)測(ce)序(xu)(xu)會使測(ce)序(xu)(xu)實(shi)驗(yan)更(geng)(geng)有針對性(xing),成本更(geng)(geng)為可控(kong)。在(zai)評估(gu)具有低水(shui)平甲(jia)基(ji)化特(te)征的(de)(de)復雜(za)樣本時(如(ru)液體活(huo)檢(jian)中(zhong)的(de)(de)游離(li)DNA),測(ce)序(xu)(xu)深度需(xu)求一般比常規全基(ji)因(yin)組(zu)(zu)甲(jia)基(ji)化測(ce)序(xu)(xu)更(geng)(geng)高,因(yin)而,在(zai)這類樣本的(de)(de)檢(jian)測(ce)中(zhong)雜(za)交(jiao)(jiao)捕獲是(shi)更(geng)(geng)為理(li)(li)想的(de)(de)實(shi)驗(yan)方(fang)案(an)。
在本(ben)應用(yong)方(fang)案中,通過結合使用(yong)IDT xGen Methyl-Seq 建庫試劑盒及IDT xGen Custom Hyb Panel 雜(za)交捕獲系統,打造了(le)兼(jian)具高靈(ling)活性及高準確度的(de)(de)甲基化靶(ba)向測序工(gong)作流(liu)程(cheng)。該(gai)(gai)流(liu)程(cheng)在實驗端結合了(le)IDT的(de)(de)單鏈文庫制備技術(shu)和高效(xiao)(xiao)穩定的(de)(de)雜(za)交捕獲體(ti)系,在生(sheng)信(xin)設(she)計(ji)端則采用(yong)了(le)IDT獨特的(de)(de)探針設(she)計(ji)算法對探針的(de)(de)表現(xian)進行逐(zhu)條評(ping)估;在本(ben)文中展(zhan)示的(de)(de)測試數據證明(ming)了(le)該(gai)(gai)工(gong)作流(liu)程(cheng)可(ke)應對不同甲基化水平(ping)的(de)(de)復雜(za)樣(yang)本(ben),并可(ke)高效(xiao)(xiao)準確地還原樣(yang)本(ben)的(de)(de)原始(shi)甲基化特征。
主要特點
·實驗設計中(zhong),同(tong)時測試并平(ping)行比(bi)較了不同(tong)甲基化水平(ping)的樣本,且panel本身探針數目較少,相(xiang)比(bi)常規實驗更(geng)加(jia)考驗探針性能;
·不同甲基化水平文庫都有著(zhu)較(jiao)高的比對率;
·不同甲基化水平文庫(ku)有著近似的中靶(ba)率、覆蓋度以及(ji)覆蓋均一性;
·在120個堿基(ji)(ji)的長度(du)區間內,即便(bian)對于CpG高度(du)密集的目標區域(yu),不(bu)同甲基(ji)(ji)化水平下的覆蓋(gai)程度(du)也近乎一(yi)致。
一、背景介紹
在(zai)哺乳動物細胞(bao)中(zhong), DNA甲基(ji)化(hua)修(xiu)飾(shi)過(guo)程為:胞(bao)嘧(mi)啶(ding)的(de)(de)嘧(mi)啶(ding)環(huan)第5位(wei)(wei)碳原子(zi)(zi)在(zai)DNA甲基(ji)轉(zhuan)移(yi)酶的(de)(de)作用下添加甲基(ji)基(ji)團。這類甲基(ji)的(de)(de)共價(jia)修(xiu)飾(shi)通常(chang)(chang)(chang)發生在(zai)CpG二(er)核苷(gan)酸(suan)(dinucleotide)中(zhong)的(de)(de)胞(bao)嘧(mi)啶(ding)中(zhong),該(gai)二(er)核苷(gan)酸(suan)集中(zhong)在(zai)稱為CpG島的(de)(de)基(ji)因組(zu)區(qu)域中(zhong),并(bing)且CpG位(wei)(wei)點(dian)(dian)常(chang)(chang)(chang)在(zai)CpG島上成簇出現。人(ren)類基(ji)因組(zu)中(zhong)約有(you)2800萬個CpG位(wei)(wei)點(dian)(dian),正(zheng)常(chang)(chang)(chang)體細胞(bao)中(zhong)約70%的(de)(de)CpG位(wei)(wei)點(dian)(dian)為甲基(ji)化(hua),但(dan)是這些CpG位(wei)(wei)點(dian)(dian)的(de)(de)分布并(bing)不均勻。大多數CpG島的(de)(de)長度為500~1000個堿基(ji)對(bp),通常(chang)(chang)(chang)集中(zhong)在(zai)啟動子(zi)(zi)區(qu)域。
二代(dai)測(ce)(ce)(ce)序(xu)技術(Next-generation sequencing, NGS)的(de)(de)(de)(de)(de)(de)快速發展使得快速繪制任意物種的(de)(de)(de)(de)(de)(de)DNA甲(jia)(jia)基(ji)化(hua)圖譜成(cheng)(cheng)(cheng)為可(ke)能(neng)。全基(ji)因(yin)組重(zhong)亞硫酸氫鹽測(ce)(ce)(ce)序(xu)(WGBS)已(yi)成(cheng)(cheng)(cheng)為在(zai)全基(ji)因(yin)組范(fan)圍內(nei)檢測(ce)(ce)(ce)甲(jia)(jia)基(ji)化(hua)水平(ping)的(de)(de)(de)(de)(de)(de)金標準,并且對于(yu)不同(tong)類(lei)型(xing)樣(yang)本的(de)(de)(de)(de)(de)(de)適(shi)配程度很高(gao)(gao)。但(dan)如果(guo)想同(tong)時針對大量樣(yang)本的(de)(de)(de)(de)(de)(de)特定區域進行甲(jia)(jia)基(ji)化(hua)檢測(ce)(ce)(ce),WGBS無(wu)疑是一個(ge)成(cheng)(cheng)(cheng)本相對較高(gao)(gao)的(de)(de)(de)(de)(de)(de)技術方案(an)。幸(xing)運的(de)(de)(de)(de)(de)(de)是,雜交(jiao)捕獲技術可(ke)以(yi)在(zai)一次反(fan)應(ying)中(zhong)檢測(ce)(ce)(ce)成(cheng)(cheng)(cheng)千至上百萬個(ge)目標基(ji)因(yin)組序(xu)列,因(yin)此成(cheng)(cheng)(cheng)為了一種性價(jia)比非常高(gao)(gao)的(de)(de)(de)(de)(de)(de)解(jie)決方案(an),在(zai)成(cheng)(cheng)(cheng)本允許的(de)(de)(de)(de)(de)(de)情(qing)況下(xia)可(ke)以(yi)實現更高(gao)(gao)的(de)(de)(de)(de)(de)(de)測(ce)(ce)(ce)序(xu)深度,賦(fu)能(neng)多(duo)位點甲(jia)(jia)基(ji)化(hua)研(yan)究。
二、建庫方案-PostBS單鏈建庫方法——IDT xGen Methyl-Seq 建庫試劑盒
傳統甲基化(hua)建庫(ku)流(liu)程,也(ye)稱作PreBS(Pre-Bisulfite)方法(fa),即(ji)對PCR擴增(zeng)前的文(wen)(wen)庫(ku)(已(yi)連接上(shang)測(ce)序(xu)接頭)進(jin)行重亞(ya)硫酸(suan)氫(qing)鹽處(chu)理(li)。重亞(ya)硫酸(suan)氫(qing)鹽處(chu)理(li)會(hui)破壞DNA雙(shuang)鏈結構并(bing)產生片段(duan)化(hua)文(wen)(wen)庫(ku),大(da)大(da)降低文(wen)(wen)庫(ku)的分子復(fu)雜度,影響最終的測(ce)序(xu)質量(liang)(如產生較高的冗(rong)余率)。為(wei)了解決上(shang)述難題,重亞(ya)硫酸(suan)氫(qing)鹽處(chu)理(li)后再進(jin)行建庫(ku)的技術方案(an)(Post-Bisulfite, PostBS)逐漸成(cheng)為(wei)主流(liu)。在該(gai)技術路線中,以重亞(ya)硫酸(suan)氫(qing)鹽處(chu)理(li)后的單鏈或(huo)片段(duan)化(hua)的DNA為(wei)初始模板,進(jin)而轉化(hua)成(cheng)可以用于后續測(ce)序(xu)的文(wen)(wen)庫(ku)。
IDT xGen Methyl-Seq 建庫試劑(ji)盒基于(yu)Adaptase技(ji)術,該技(ji)術是一種(zhong)高(gao)效且不依賴于(yu)模板(ban)的(de)單鏈(lian)DNA接(jie)頭連接(jie)方(fang)法(fa),通過這種(zhong)高(gao)效率(lv)的(de)連接(jie)方(fang)式,可(ke)以(yi)利用重亞硫酸氫鹽轉化(hua)處(chu)理后(hou)的(de)單鏈(lian)及損傷DNA進(jin)行文庫構建。借助于(yu)無偏好性的(de)接(jie)頭連接(jie),研究者可(ke)獲(huo)得更(geng)(geng)完(wan)整(zheng)、偏好性更(geng)(geng)低的(de)甲基化(hua)測序(xu)(xu)文庫。成本(ben)允許的(de)情況下可(ke)以(yi)實現更(geng)(geng)高(gao)的(de)測序(xu)(xu)深度,賦能多位點(dian)甲基化(hua)研究。
圖. 實(shi)(shi)驗(yan)流程(cheng)示(shi)意圖。物理打斷(duan)后的基(ji)因組(zu)DNA經過(guo)重亞硫酸氫鹽轉(zhuan)化(hua),使用IDT xGen Methyl-Seq 建庫試劑盒進(jin)行文庫制(zhi)(zhi)備。根據目標(biao)區域進(jin)行探針定(ding)制(zhi)(zhi)化(hua)設計,在設計時(shi)充(chong)分考慮了甲基(ji)化(hua)測序過(guo)程(cheng)中的序列復雜性;捕獲實(shi)(shi)驗(yan)中用到的DNA探針為IDT xGen Custom Hyb Panels 探針。
圖. 甲基化建(jian)(jian)庫(ku)(ku)(ku)流程示意圖。物理(li)打斷后的(de)基因組DNA經過重(zhong)亞(ya)硫(liu)酸氫鹽轉化,使用IDT xGen Methyl-Seq 建(jian)(jian)庫(ku)(ku)(ku)試劑盒進行(xing)文(wen)(wen)庫(ku)(ku)(ku)構建(jian)(jian)。首(shou)先, Adaptase反(fan)應可不依賴于模板而(er)在單鏈DNA 3'末端高效(xiao)加入(ru)截短型測序(xu)接頭1(P7端),再(zai)通過延伸反(fan)應,可生成雙鏈并(bing)含有部(bu)分(fen)P7測序(xu)接頭的(de)文(wen)(wen)庫(ku)(ku)(ku)。在下一步的(de)連接反(fan)應中,加入(ru)截短型測序(xu)接頭2( P5端),再(zai)通過Indexing PCR反(fan)應加入(ru)樣本標(biao)簽(qian)(sample index),并(bing)擴增得(de)到完整長度的(de)文(wen)(wen)庫(ku)(ku)(ku),該文(wen)(wen)庫(ku)(ku)(ku)可用于后續的(de)WGBS或(huo)雜交捕獲反(fan)應。
三、雜交捕獲方案——IDT xGen Custom Hyb Panel 探針
IDT xGen Custom Hyb Panel 探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)中(zhong)(zhong)的(de)(de)寡(gua)核苷(gan)酸探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)在(zai)5'端帶有(you)生物素修飾。依托于在(zai)工藝(yi)中(zhong)(zhong)使用(yong)的(de)(de)特(te)殊DNA合(he)成(cheng)(cheng)設(she)備,以(yi)(yi)及在(zai)核酸合(he)成(cheng)(cheng)領域超過30年(nian)的(de)(de)技術積淀,IDT可以(yi)(yi)快速、高(gao)質量(liang)地合(he)成(cheng)(cheng)捕獲反應中(zhong)(zhong)所需要的(de)(de)長鏈寡(gua)核苷(gan)酸探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)。以(yi)(yi)其中(zhong)(zhong)的(de)(de)IDT xGen Custom Hyb Panel-Production 探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)為例,該(gai)panel中(zhong)(zhong)的(de)(de)每條(tiao)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)都單獨(du)合(he)成(cheng)(cheng)且經過單獨(du)質檢(jian),在(zai)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)混合(he)之前,IDT會對每條(tiao)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)進行電噴霧(wu)電離(li)質譜(ESI-MS)分(fen)析和兩(liang)次定量(liang),以(yi)(yi)保證每條(tiao)高(gao)保真(zhen)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)在(zai)panel內的(de)(de)濃度相同。相較于傳統(tong)的(de)(de)芯片合(he)成(cheng)(cheng)結(jie)合(he)PCR擴(kuo)增(zeng)的(de)(de)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)合(he)成(cheng)(cheng)方(fang)法, IDT的(de)(de)單條(tiao)合(he)成(cheng)(cheng)、單條(tiao)質檢(jian)的(de)(de)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)合(he)成(cheng)(cheng)工藝(yi)在(zai)減(jian)少批(pi)次間差異、提高(gao)探(tan)(tan)針(zhen)(zhen)(zhen)(zhen)(zhen)(zhen)性能穩定性方(fang)面具有(you)明顯優勢。
常(chang)規的雜交(jiao)捕獲設計在一定程度上允許(xu)探針與目標位點之間的序列差異,即通常(chang)所說(shuo)的錯(cuo)配容忍度。然而,在捕獲未(wei)知甲基化狀(zhuang)態(tai)的DNA模板分子時,實(shi)驗設計面臨(lin)如下特殊挑戰(zhan):
①針對特定(ding)的目標區域,需要更(geng)多的探針序列來應對可能存(cun)在的高度復雜度甲基化狀態。
②在經過堿基轉化后,GC含量改(gai)變,可能影響探針(zhen)與靶點結合能力。
③胞嘧(mi)啶脫氨反應后(hou),基(ji)因組序列(lie)的(de)復雜性(xing)也(ye)顯著降低(di),對探針結合的(de)特異(yi)性(xing)要(yao)求更高。
與常規的DNA探針設(she)計不同(tong),甲基化檢(jian)測設(she)計策略需要考慮到(dao)不同(tong)樣本中(zhong)目標區域的甲基化水平差異,這是(shi)因為(wei)需要捕(bu)獲(huo)的文庫分子在經(jing)過重亞硫酸(suan)氫(qing)鹽轉(zhuan)化后,從根本上改變了原(yuan)有的DNA序(xu)列。下圖展示了IDT通常推薦使用的甲基化捕(bu)獲(huo)探針設(she)計策略。
圖. 甲基(ji)(ji)(ji)化(hua)雜交(jiao)捕(bu)獲探(tan)(tan)針(zhen)(zhen)設(she)(she)(she)(she)計(ji)策略。首先,針(zhen)(zhen)對目標區域OT(Original top strand,正義鏈(lian))及(ji)(ji)OB(Original bottom strand,反義鏈(lian)),假設(she)(she)(she)(she)都為(wei)(wei)非甲基(ji)(ji)(ji)化(hua)狀態,經(jing)(jing)過(guo)重鹽(yan)硫(liu)酸(suan)(suan)(suan)氫(qing)(qing)鹽(yan)處理及(ji)(ji)PCR后,OT序(xu)(xu)(xu)列(lie)變(bian)成(cheng)Conv-OT(Converted top strand),其(qi)中(zhong)非甲基(ji)(ji)(ji)化(hua)的(de)C堿(jian)基(ji)(ji)(ji)變(bian)成(cheng)T堿(jian)基(ji)(ji)(ji),RCOT(Reverse complement strands of OT)即為(wei)(wei)捕(bu)獲OT鏈(lian)的(de)探(tan)(tan)針(zhen)(zhen)設(she)(she)(she)(she)計(ji)序(xu)(xu)(xu)列(lie)(5'TACACAAT 3')。反之(zhi),經(jing)(jing)過(guo)重鹽(yan)硫(liu)酸(suan)(suan)(suan)鹽(yan)處理及(ji)(ji)PCR后,OB序(xu)(xu)(xu)列(lie)變(bian)成(cheng)Conv-OB(Converted bottom strand) ,其(qi)中(zhong)ROCB(Reverse complement strands of OB)序(xu)(xu)(xu)列(lie)即為(wei)(wei)OB鏈(lian)的(de)探(tan)(tan)針(zhen)(zhen)設(she)(she)(she)(she)計(ji)序(xu)(xu)(xu)列(lie)(5'ATCACATA 3')。同樣原理,假設(she)(she)(she)(she)OT及(ji)(ji)OB序(xu)(xu)(xu)列(lie)都為(wei)(wei)甲基(ji)(ji)(ji)化(hua)狀態,經(jing)(jing)過(guo)重亞(ya)硫(liu)酸(suan)(suan)(suan)氫(qing)(qing)鹽(yan)處理及(ji)(ji)PCR后,OT序(xu)(xu)(xu)列(lie)變(bian)成(cheng)Conv-OT(Converted top strand) ,并且甲基(ji)(ji)(ji)化(hua)的(de)C堿(jian)基(ji)(ji)(ji)仍保持不(bu)變(bian),ROCT(Reverse complement strands of OT)序(xu)(xu)(xu)列(lie)即為(wei)(wei)捕(bu)獲OT鏈(lian)的(de)探(tan)(tan)針(zhen)(zhen)設(she)(she)(she)(she)計(ji)序(xu)(xu)(xu)列(lie)(5'TACGCGAT 3')。反之(zhi),經(jing)(jing)過(guo)重亞(ya)硫(liu)酸(suan)(suan)(suan)氫(qing)(qing)鹽(yan)處理及(ji)(ji)PCR后,OB序(xu)(xu)(xu)列(lie)變(bian)成(cheng)Conv-OB(Converted bottom strand),其(qi)中(zhong)RCOB(Reverse complement strands of OB)序(xu)(xu)(xu)列(lie)即為(wei)(wei)捕(bu)獲OB鏈(lian)的(de)探(tan)(tan)針(zhen)(zhen)設(she)(she)(she)(she)計(ji)序(xu)(xu)(xu)列(lie)(5'ATCGCGTA 3')。
四、案例研究——不同探針設計策略對于關鍵測序指標參數的影響
為(wei)(wei)(wei)了評估不(bu)同探(tan)針(zhen)設計方案(僅針(zhen)對(dui)正義鏈(lian)或同時針(zhen)對(dui)正義鏈(lian)和反義鏈(lian)設計探(tan)針(zhen))和針(zhen)對(dui)目標(biao)區域(yu)不(bu)同tiling覆蓋層數(1×、2×或者(zhe)4×)對(dui)于整(zheng)體檢測(ce)結果的影響(xiang),用起(qi)始量(liang)統一(yi)為(wei)(wei)(wei)50ng人(ren)基(ji)因組(zu)DNA,制備兩個(ge)梯度(du)的甲(jia)基(ji)化(hua)樣本(ben)來(lai)模擬不(bu)同甲(jia)基(ji)化(hua)水平(ping)的樣本(ben)情況。該兩個(ge)梯度(du)文庫(ku)使(shi)用來(lai)自完全甲(jia)基(ji)化(hua)和完全非(fei)甲(jia)基(ji)化(hua)的DNA標(biao)準(zhun)品組(zu)合(Zymo Cat. No.D5014-2,D5014-1),模擬分別(bie)為(wei)(wei)(wei)15%及85%的全基(ji)因組(zu)甲(jia)基(ji)化(hua)水平(ping)。DNA樣本(ben)經(jing)過物理打斷后,使(shi)用Zymo EZ DNA Methylation Gold Kit (Zymo Cat. No. D5005)進行(xing)重亞硫酸氫鹽(yan)處理,該試劑盒(he)將未甲(jia)基(ji)化(hua)的胞嘧啶轉換為(wei)(wei)(wei)尿嘧啶,得(de)到長度(du)為(wei)(wei)(wei)170~200bp且以(yi)單鏈(lian)為(wei)(wei)(wei)主的DNA片段(duan)。文庫(ku)制備使(shi)用IDT xGen Methyl-Seq 建庫(ku)試劑盒(he)(IDT Cat. No.10009824),之后每個(ge)文庫(ku)取500ng用于雜交(jiao)捕獲(huo)(3-plex),并且按照(zhao)IDT xGen Custom Hyb Panels 探(tan)針(zhen)說明書標(biao)準(zhun)流(liu)程(cheng)進行(xing)實(shi)驗(yan)操作(65℃過夜雜交(jiao))。上(shang)機(ji)測(ce)序平(ping)臺為(wei)(wei)(wei)Illumina NextSeq(2×75bp讀長,混入10% phiX)。去(qu)除10bp Adaptase反應所(suo)產(chan)生的“tail“后,使(shi)用Bismark(v0.22.3)和Picard (v2.18.9)進行(xing)數據比對(dui)及甲(jia)基(ji)化(hua)水平(ping)分析。數據量(liang)均(jun)一(yi)化(hua)至2M reads/樣本(ben)進行(xing)分析。
比較四(si)種不(bu)同(tong)探針(zhen)設(she)計(ji)(ji)方式對(dui)相同(tong)128kb目標區(qu)域(yu)的捕(bu)獲(huo)效果,如(ru)表所示,“Panel 1T”及(ji)“Panel 2T”代表只(zhi)針(zhen)對(dui)目標區(qu)域(yu)DNA序列(lie)的正義鏈(lian)進(jin)行設(she)計(ji)(ji),并且分(fen)別(bie)(bie)使用1×平(ping)鋪(pu)或者2×高(gao)密度設(she)計(ji)(ji);“Panel 1T1B”及(ji)“Panel 2T2B”代表針(zhen)對(dui)目標區(qu)域(yu)DNA序列(lie)的正義鏈(lian)及(ji)反義鏈(lian)同(tong)時進(jin)行設(she)計(ji)(ji),并且分(fen)別(bie)(bie)使用2×平(ping)鋪(pu)(正義鏈(lian)及(ji)反義鏈(lian)各為(wei)1×平(ping)鋪(pu))及(ji)4×高(gao)密度設(she)計(ji)(ji)(正義鏈(lian)及(ji)反義鏈(lian)各為(wei)2×高(gao)密度設(she)計(ji)(ji))。
表(biao). 針對相同(tong)目標區域(yu)的不同(tong)探針設(she)計策(ce)略
數據分析結(jie)果(guo)顯(xian)示上述四種Panel設(she)(she)計(ji)有著近(jin)似的(de)比對(dui)(dui)率、中靶率、Fold-80、轉化效率值。其(qi)中,提高探(tan)針(zhen)(zhen)覆(fu)蓋密度(du)對(dui)(dui)于關鍵(jian)測序指標的(de)提升影響并(bing)不顯(xian)著(“Panel 1T”vs“Panel 2T”或者“Panel 1T1B”vs“Panel 2T2B”);同樣(yang)的(de),僅針(zhen)(zhen)對(dui)(dui)正義(yi)鏈設(she)(she)計(ji)1×探(tan)針(zhen)(zhen)覆(fu)蓋即可達(da)到與同時設(she)(she)計(ji)正反義(yi)鏈探(tan)針(zhen)(zhen)近(jin)似的(de)結(jie)果(guo)。
表. 四種(zhong)Panel設計策略的(de)性能比較(jiao)
五、IDT甲基化方案驗證——材料與方法
為了檢測IDT靶向甲(jia)基化測序方案在(zai)(zai)不(bu)同(tong)基因(yin)組(zu)位點(dian)、不(bu)同(tong)甲(jia)基化狀態下(xia)對甲(jia)基化區域的(de)捕獲效果(guo),IDT仍然(ran)選擇(ze)較小的(de)目標區間進行探針(zhen)設計(ji)(ji)和(he)測試(總目標區域大小約為100kb)。在(zai)(zai)本文(wen)第4部(bu)分“案例研究——不(bu)同(tong)探針(zhen)設計(ji)(ji)策(ce)略對于關鍵測序指(zhi)標參(can)數影響”的(de)實(shi)驗結果(guo)中,不(bu)同(tong)探針(zhen)平鋪密(mi)度(du)的(de)Panel 1T1B (正(zheng)義(yi)(yi)鏈及(ji)反義(yi)(yi)鏈名為1×平鋪)及(ji)Panel 2T2B(正(zheng)義(yi)(yi)鏈及(ji)反義(yi)(yi)鏈各為2×高密(mi)度(du)設計(ji)(ji))有著(zhu)近似的(de)測序指(zhi)標,因(yin)此在(zai)(zai)進一步(bu)實(shi)驗驗證中采用“Panel 1T1B”探針(zhen)設計(ji)(ji)策(ce)略。
在實(shi)驗(yan)中(zhong),人基(ji)(ji)因(yin)組DNA的(de)(de)起(qi)始量統一為50ng,并使(shi)用相同的(de)(de)完(wan)全(quan)甲基(ji)(ji)化(hua)和完(wan)全(quan)非甲基(ji)(ji)化(hua)的(de)(de)DNA標準品(pin)組合,制(zhi)(zhi)備以低甲基(ji)(ji)化(hua)水(shui)(shui)平為主的(de)(de)五個(ge)甲基(ji)(ji)化(hua)水(shui)(shui)平的(de)(de)模擬樣(yang)本(0%、5%、10%、50%、90%)。樣(yang)本制(zhi)(zhi)備過(guo)程中(zhong),使(shi)用Covaris M220將(jiang)不同甲基(ji)(ji)化(hua)水(shui)(shui)平(均為50ng)的(de)(de)DNA樣(yang)本打斷至320bp,經過(guo)重亞硫酸氫(qing)鹽處理(Zymo EZ DNA Methylation-Gold Kit),文庫(ku)制(zhi)(zhi)備使(shi)用IDT xGen Methyl-Seq 建庫(ku)試劑(ji)盒(IDT Cat. No.10009824),按照(zhao)該試劑(ji)盒說(shuo)明書(shu)中(zhong)“Appendix A: Protocol adjustments for targeted hybridization capture”部分所述,調整磁珠純化(hua)比(bi)例及(ji)PCR循環(huan)數(13個(ge)循環(huan)),最終得(de)到1.5~2ug文庫(ku)產量。之后,每個(ge)文庫(ku)取500ng用于雜交捕獲(5-plex),并且按照(zhao)說(shuo)明書(shu)標準流程進行實(shi)驗(yan)操(cao)作(65℃過(guo)夜雜交)。在NovaSeq平臺采用PE150進行測序,測序數據(ju)均一化(hua)到單樣(yang)本約1Gb數據(ju)量。
在(zai)數據分析方面,使(shi)用Fastp去除原始reads中的(de)接頭序列和低質量的(de)堿基,并按(an)照說明書建議使(shi)用cutadapt針對(dui)read 2的(de)5'端去除15nt,以去掉(diao)Adaptase反(fan)應過程中加入的(de)“tail”序列。使(shi)用Bsmap默認參數,將處理后的(de)reads與人(ren)類基因(yin)組(hg19)進行比對(dui),并使(shi)用Bsmap自帶腳本計算(suan)甲基化水平。
六、IDT甲基化方案驗證——結果
為了驗證IDT甲(jia)基(ji)化(hua)測序方案的整體性(xing)(xing)能,針對所(suo)有(you)測試樣(yang)本的測序性(xing)(xing)能指標(biao)進行逐一(yi)評估,包(bao)括比對率(mapping rate)、覆蓋均(jun)一(yi)性(xing)(xing)、甲(jia)基(ji)化(hua)水平等。
6.1文庫質控結果
使(shi)用樣(yang)本起始量均為50ng的(de)基因組DNA標準品(pin)(物(wu)理打(da)斷前),經(jing)重亞硫酸氫鹽處理后,使(shi)用IDT xGen Methyl-Seq 建(jian)(jian)庫(ku)試(shi)劑(ji)盒(he)(he)進(jin)行文庫(ku)構建(jian)(jian),根據該(gai)試(shi)劑(ji)盒(he)(he)說(shuo)明書"Appendix A: Protocol adjustments for targeted hybridization capture"部分中的(de)建(jian)(jian)議(yi),捕獲前PCR循(xun)環數設置(zhi)為13個循(xun)環,文庫(ku)產量及濃度結果見(jian)表(使(shi)用Qubit進(jin)行DNA定量):
表(biao). 捕獲(huo)前文(wen)庫濃度及產量結果
文(wen)庫(ku)大小分(fen)(fen)布(bu)(bu)(bu)影響最終關鍵測序指標的評(ping)估,因此需保(bao)證有(you)著不同甲(jia)基化(hua)水平的五(wu)個模擬文(wen)庫(ku)有(you)著近似的文(wen)庫(ku)大小分(fen)(fen)布(bu)(bu)(bu)(309~328bp)。下(xia)圖中(zhong),A-E分(fen)(fen)別對應甲(jia)基化(hua)水平為0%、5%、10%、50%、90%的五(wu)個雜交(jiao)捕獲前(Pre-hyb)文(wen)庫(ku)大小分(fen)(fen)布(bu)(bu)(bu)結果,F則展示了在雜交(jiao)捕獲后(hou)的文(wen)庫(ku)大小分(fen)(fen)布(bu)(bu)(bu)(5-plex)。如(ru)下(xia)圖所示,在捕獲前后(hou)文(wen)庫(ku)(Post-Hyb)中(zhong)均沒有(you)明顯(xian)的非特異峰(feng),與預期(qi)相符。
圖. Pre-Hyb及Post-Hyb文(wen)庫大小分布圖
6.2 數據分析結果(比對率、目標甲基化水平、覆蓋均一性)
比對率(lv)
比對率(lv)反映了樣本的測(ce)序數據和參考(kao)基因組(zu)(zu)之間的相關性,可以(yi)衡量測(ce)序的整體準確性以(yi)及(ji)是否在實驗中引入DNA污染,比對率(lv)越高則代表準確性越好。如下(xia)圖所(suo)示,即(ji)便是理(li)論上低甲基化(hua)水平的樣本,基因組(zu)(zu)比對率(lv)也(ye)高于92%。
圖. 不同甲(jia)基化水平文庫比對(dui)率結果
不同(tong)樣(yang)本不同(tong)位點的(de)(de)甲(jia)基化(hua)(hua)水平(ping)(ping)可(ke)(ke)能千差萬別,為了評估甲(jia)基化(hua)(hua)雜交捕獲方(fang)案是否可(ke)(ke)以正確(que)體現不同(tong)的(de)(de)甲(jia)基化(hua)(hua)水平(ping)(ping),對模擬不同(tong)甲(jia)基化(hua)(hua)水平(ping)(ping)的(de)(de)標準品文庫予以進一步(bu)分析(xi),實際檢測(ce)到(dao)的(de)(de)甲(jia)基化(hua)(hua)水平(ping)(ping)符合預(yu)期。
覆蓋均一性
覆(fu)蓋(gai)(gai)均(jun)(jun)(jun)(jun)一(yi)性是靶向測序(xu)(xu)(xu)中(zhong)最(zui)重要的(de)(de)性能參(can)數(shu)(shu)之一(yi),顯示了(le)測序(xu)(xu)(xu)數(shu)(shu)據針(zhen)剛目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)的(de)(de)覆(fu)蓋(gai)(gai)度(du)(du)(du)分布(bu)情(qing)況。其體現(xian)出(chu)有多少目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)可(ke)以達(da)到(dao)所(suo)需的(de)(de)分析(xi)要求(qiu),覆(fu)蓋(gai)(gai)度(du)(du)(du)越(yue)(yue)均(jun)(jun)(jun)(jun)一(yi),意(yi)味著測序(xu)(xu)(xu)數(shu)(shu)據在(zai)(zai)目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)上(shang)分配的(de)(de)更平(ping)(ping)均(jun)(jun)(jun)(jun),從而(er)節省了(le)測序(xu)(xu)(xu)數(shu)(shu)據量。常用于(yu)(yu)評(ping)估覆(fu)蓋(gai)(gai)均(jun)(jun)(jun)(jun)一(yi)性的(de)(de)指標(biao)包(bao)括: Fold-80,即(ji)為保證80%的(de)(de)目(mu)(mu)(mu)標(biao)堿基(ji)達(da)到(dao)平(ping)(ping)均(jun)(jun)(jun)(jun)深(shen)(shen)(shen)度(du)(du)(du)所(suo)需的(de)(de)額(e)外測序(xu)(xu)(xu)倍(bei)數(shu)(shu),計算公式為:Fold-80=平(ping)(ping)均(jun)(jun)(jun)(jun)深(shen)(shen)(shen)度(du)(du)(du)/80%以上(shang)的(de)(de)目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)覆(fu)蓋(gai)(gai)深(shen)(shen)(shen)度(du)(du)(du)。在(zai)(zai)相同的(de)(de)捕獲效率下(xia), Fold-80越(yue)(yue)低(di),則測序(xu)(xu)(xu)數(shu)(shu)據浪費(fei)越(yue)(yue)少。0.2×平(ping)(ping)均(jun)(jun)(jun)(jun)測序(xu)(xu)(xu)深(shen)(shen)(shen)度(du)(du)(du)比例(li)(0.2×mean coverage),即(ji)為高于(yu)(yu)0.2×平(ping)(ping)均(jun)(jun)(jun)(jun)測序(xu)(xu)(xu)深(shen)(shen)(shen)度(du)(du)(du)的(de)(de)目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)測序(xu)(xu)(xu)覆(fu)蓋(gai)(gai)度(du)(du)(du)占比。在(zai)(zai)相同的(de)(de)目(mu)(mu)(mu)標(biao)區(qu)(qu)域(yu)(yu)及(ji)測序(xu)(xu)(xu)數(shu)(shu)據量下(xia),覆(fu)蓋(gai)(gai)度(du)(du)(du)越(yue)(yue)均(jun)(jun)(jun)(jun)勻,高于(yu)(yu)0.2×平(ping)(ping)均(jun)(jun)(jun)(jun)測序(xu)(xu)(xu)深(shen)(shen)(shen)度(du)(du)(du)的(de)(de)比例(li)越(yue)(yue)高越(yue)(yue)好。如下(xia)圖所(suo)示,不同甲基(ji)化(hua)水(shui)平(ping)(ping)樣本有著近似(si)的(de)(de)Fold-80及(ji)高于(yu)(yu)0.2×平(ping)(ping)均(jun)(jun)(jun)(jun)測序(xu)(xu)(xu)深(shen)(shen)(shen)度(du)(du)(du)的(de)(de)比例(li)。
圖. 不(bu)同甲基化水平文庫Fold-80及0.2×平均測序(xu)深度(du)比例圖
對于覆(fu)蓋(gai)困難區域(yu),可以通過IGV軟件可視化(hua)(hua)地查看(kan)及比(bi)較(jiao)不同區域(yu)覆(fu)蓋(gai)度情(qing)況(kuang),這對比(bi)較(jiao)不同甲(jia)基(ji)化(hua)(hua)水(shui)(shui)平樣(yang)本的(de)表現尤為必要。下圖展示(shi)了FAM135B基(ji)因(yin)的(de)部(bu)分區域(yu)覆(fu)蓋(gai)情(qing)況(kuang)。FAM135B基(ji)因(yin)是頭頸部(bu)鱗癌(HNSCC)的(de)常(chang)用甲(jia)基(ji)化(hua)(hua)分子標記物,如圖所示(shi),在不同甲(jia)基(ji)化(hua)(hua)水(shui)(shui)平下(從上至下依次為:5%、50%、90%),多(duo)個(ge)(ge)樣(yang)本在7條探(tan)針(zhen)所覆(fu)蓋(gai)區域(yu)中有著近似的(de)覆(fu)蓋(gai)深度。除此之外,在7條探(tan)針(zhen)所對應(ying)的(de)120bp目標序列窗口中,其包含的(de)CpG位點數量眾多(duo),分別(bie)為12個(ge)(ge)、14個(ge)(ge)、14個(ge)(ge)、16個(ge)(ge)、21個(ge)(ge)、19個(ge)(ge)和12個(ge)(ge),但即便在高(gao)CpG密度和高(gao)GC含量的(de)情(qing)況(kuang)下,依然獲得了理想的(de)覆(fu)蓋(gai)均一(yi)度。
圖. IGV軟件顯示位于FAM13B基因(yin)的(de)7根(gen)探針(zhen),其所對應區(qu)域(yu)中有著近似(si)的(de)覆蓋深度
七、總結
基(ji)(ji)(ji)于(yu)IDT xGen Methyl-Seq 建(jian)庫試(shi)劑(ji)盒與IDT xGen 定(ding)制甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)捕(bu)獲(huo)panel, IDT提供了(le)高性價比(bi)的(de)(de)(de)(de)精確靶向(xiang)甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)測(ce)(ce)(ce)序(xu)(xu)解(jie)決方案。靶向(xiang)富(fu)集技術的(de)(de)(de)(de)引入,在提升(sheng)目標(biao)區域(yu)測(ce)(ce)(ce)序(xu)(xu)深度的(de)(de)(de)(de)同(tong)時(shi)減少了(le)測(ce)(ce)(ce)序(xu)(xu)成本(ben),使(shi)得甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)定(ding)向(xiang)分(fen)析的(de)(de)(de)(de)效率大幅(fu)提高。在分(fen)享的(de)(de)(de)(de)兩個(ge)實(shi)驗(yan)案例中,使(shi)用(yong)了(le)更具(ju)挑戰性的(de)(de)(de)(de)小區域(yu)(~100kb)進行驗(yan)證(zheng)。分(fen)析結果證(zheng)明,該(gai)實(shi)驗(yan)方案能(neng)準(zhun)確地檢測(ce)(ce)(ce)目標(biao)區域(yu)的(de)(de)(de)(de)DNA甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)水平,對(dui)于(yu)模(mo)擬不(bu)同(tong)甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)水平的(de)(de)(de)(de)標(biao)準(zhun)品樣本(ben),其測(ce)(ce)(ce)序(xu)(xu)數據的(de)(de)(de)(de)比(bi)對(dui)率、覆蓋均(jun)一性等(deng)關(guan)鍵指標(biao)均(jun)展(zhan)現(xian)出穩定(ding)且(qie)優異的(de)(de)(de)(de)性能(neng)。IDT甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)靶向(xiang)捕(bu)獲(huo)方案覆蓋了(le)甲(jia)(jia)(jia)基(ji)(ji)(ji)化(hua)測(ce)(ce)(ce)序(xu)(xu)實(shi)驗(yan)中關(guan)鍵的(de)(de)(de)(de)建(jian)庫和捕(bu)獲(huo)步驟,是表(biao)觀遺傳學(xue)研究(jiu)和生物標(biao)志物發現(xian)的(de)(de)(de)(de)有力工具(ju)。
北京澤平代理的IDT NGS甲基化測序相關產品
產品類型(xing) |
貨(huo)號 |
產品(pin)名稱(cheng) |
反應數 |
IDT xGen Methyl-Seq建庫試劑盒 |
IDT建庫試劑盒 |
10009860 |
IDT xGen Methyl-Seq Library Prep |
16 |
10009824 |
96 |
Unique Dual Indexing Primers Plates (UDI引物) |
10005975 |
IDT xGen UDl Primer Pairs, Index 1-16 |
16 |
10005922 |
IDT xGen UDl Primer Pairs, Index 1-96 |
96 |
10009816 |
IDT xGen UDl Primers Plate 2, 8nt |
96 |
10009795 |
IDT xGen Normalase UDl Primers Set 1 |
384 |
10009796 |
IDT xGen Normalase UDl Primers Plate 1 |
96 |
10009797 |
IDT xGen Normalase UDI Primers Plate 2 |
96 |
10009798 |
IDT xGen Normalase UDl Primers Plate 3 |
96 |
10009799 |
IDT xGen Normalase UDl Primers Plate 4 |
96 |
IDT xGen Custom Hyb Panels探針 |
IDT xGen定制(zhi)化捕獲探針 |
定制(zhi) |
IDT xGen Custom Hyb Panel |
16 |
IDT xGen Custom Hyb Panel-Accel |
96 |
IDT xGen Custom l lyb Panel-Production |
定制(zhi) |
IDT xGen Custom Hyb Panels配套(tao)試劑 |
IDT xGen通用(yong)封閉劑-TS混合物 |
1075474 |
IDT xGen Universal Blockers TS |
16 |
1075475 |
96 |
1075476 |
384 |
IDT xGen雜交和洗滌(di)試劑盒 |
1080577 |
IDT xGen Hybridization and Wash Kit |
16 |
1080584 |
96 |
IDT通用型(xing)擴增引物 |
1077675 |
IDT xGen Library Amplification Primer Mix |
16 |
1077676 |
96 |
1077677 |
192 |
更多IDT NGS二代(dai)測序產品,歡迎點擊右側(ce)在線咨詢
——IDT一級代(dai)理(li)商,北京澤平