摘 要:為建立口蹄疫病毒(Foot-and-mouth diseasevirus,FMDV)不同血清型與基因型的基因芯片檢測方法,設計針對O型8個基因型、A型3個基因型和亞洲1型的特異性探針。從美國GenBank與英國世界口蹄疫參考實驗室基因庫下載了O型、A型和亞洲1型FMDV的VP1基因序列547條。對每一血清型序列用DNAStar軟件ClastalW程序進行多重比對,做系統發育分析并進行基因分型。用生物學軟件Bio Sun2.0建立基因型數據庫,設計每一基因型的特異性探針。共設計出104條候選探針,通過芯片試驗篩選出12條特異性探針。以各型特異性探針所對應的靶序列模板做10倍系列稀釋進行PCR擴增,擴增產物與探針雜交,驗證各探針的靈敏度。對O型SEA、Euro-SA、ME-SA、WA4個基因型的各條探針的靈敏度進行了檢驗,結果這些探針能夠檢測到102數量級拷貝數的陽性靶標。
關鍵詞:口蹄疫病毒;血清型;基因型;VP1基因;基因芯片;寡核苷酸探針
基因芯片又稱DNA微陣列,是專門用于核酸檢測的生物芯片,也是近年來應用最廣泛的微陣列芯片。它是指在固相載體上按照特定的排列方式固定上大量序列已知的DNA片段,形成DNA微矩陣,固定于固相載體上的DNA片段稱為探針。將樣品基因組DNA/RNA通過PCR/RT-PCR擴增等技術摻入標記分子后,與位于微陣列上的已知探針序列雜交,用于雜交的樣品稱為靶序列,通過激光共聚焦熒光檢測系統對芯片進行掃描,檢測雜交信號強度,經計算機軟件進行數據比較和綜合分析后,即可獲得樣品中大量基因序列特征或基因表達特征的信息[1]。
口蹄疫病毒(Foot-and-mouth diseasevirus,FMDV)可侵染豬、牛、羊等畜種及其他70多種家養和野生偶蹄動物,是一種烈性傳染病。FMDV屬于小RNA病毒科(Picornaviridae)、口蹄疫病毒屬(Aphthovirus),含有約8500個核苷酸的單股RNA病毒。FMDV有7個不同的血清型,即A、O、C、Asia1、SAT1、SAT2和SAT3型。劃分同一血清型的FMDV株普遍采用基因型[2]。以15%的核酸序列差異率為臨界值,對105株血清O型毒株VP1基因3′端核苷酸序列進行了同源性分析,使用不加權配對組算法(unweightedpair-group method using arithmeticaverages,UPGMA)繪制了系統發育樹,經過分析,對O型FMDV確定了8個主要基因型[3-4]。由于這些基因型與特定的地域有關,故又稱為拓撲型,即中國型(Cathay)、中東-南亞型(ME-SA)、東南亞型(SEA)、歐洲-南美型(Euro-SA)、印尼-1型(ISA-1)、印尼-2型(ISA-2)、東非型(EA)和西非型(WA)。A型病毒株可以分為3個基因型,即歐洲南美型(Euro-SA)、亞洲(Asia)和非洲型(Africa)。亞洲1型核苷酸序列差異比其他血清型小很多,不能將其分為1個以上的基因型[1]。本試驗旨在設計口蹄疫病毒O型內8個基因型、A型內3個基因型和亞洲1型的特異性探針,為口蹄疫病毒分型診斷芯片的研究奠定基礎。
1 材料與方法
1.1 材料
1.1.1 種毒和樣品 O、A、亞洲1型FMDV滅活細胞培養物各1份,由中國農業科學院蘭州獸醫研究所提供。經賽百盛基因技術公司合成代表6個基因型的6條核苷酸序列(每條約100bp)。
1.1.2 序列來源 從美國GenBank(http://www.ncbi.nlm.nih.gov)與英國世界口蹄疫參考實驗室(WRLFMD)基因庫(htt://www.iah.bbsrc.ac.uk)下載的547條VP1基因序列。
1.1.3 生物學軟件 軍事醫學科學院開發的生物學軟件Bio Sun 2.0,生物信息學處理軟件DNAStar,引物設計軟件Primer Premier 5.0。
1.1.4 儀器與試劑 iCyclerPCR儀為BIO-Rad公司產品,GenePix4000B掃描儀為Axon公司產品,PixSys5000點樣儀為Cartesian公司產品,DU640紫外分光光度計為Beckman公司產品,基因芯片購自CELAssociates公司,Cy3熒光染料購自Amersham公司,PCR試劑、瓊脂糖凝膠DNA回收試劑盒、普通質粒小提試劑盒、感受態細胞(TOP10)均購自天根生化科技有限公司,TrlzolReagent購自上海英駿生物技術公司,Takara one step RT-PCR Kit(AMV)和PMD18-TVector購自寶生物工程(大連)有限公司。
1.2 方法
1.2.1 FMDV的VP1基因區序列系統發育樹分型 從美國GenBank與英國世界口蹄疫參考實驗室基因庫下載FMDV的VP1基因序列547條,其中O型FMDV210條,A型FMDV 113條,亞洲1型FMDV 224條。對每一個血清型應用DNA Star軟件ClastalW程序進行多重比對,然后用Tree View程序繪制系統發育樹,對所下載序列進行基因型劃分[4-6]。
1.2.2 FMDV分型探針設計 應用生物學軟件Bio Sun2.0對每個基因型內的序列設計探針[7]。將所要進行基因型探針設計的該基因型所有序列轉化集成為一個數據庫,導入Datebase forTargets數據庫,將該數據庫和除該基因型序列以外的所有其他序列做成另一個數據庫,導入Datebase for Targets& non-Targets數據庫,在相應的對話框內選擇探針參數進行探針設計。
通過軟件自帶的BLAST工具搜索該基因型數據庫的其他序列,篩選出能覆蓋盡可能多序列的該基因型的通用探針。
1.2.3 探針的篩選 為了減少非特異性雜交,保證芯片雜交的敏感度和精確度,探針設計還要遵循以下原則:探針的Tm值應該接近整個基因組的平均Tm值,上下波動不超過5℃;重復的堿基連續不超過6個;G+C含量在40%~60%;BLAST與其他序列的相似性小于75%,若相似性在75%以上則可能會出現交叉反應;探針連續同源的堿基數不應超過20個[3,8-9]。或在進行探針篩選時,將同一基因型的探針一起點制芯片,然后將芯片與靶序列雜交,從而篩選出特異性最好、雜交信號最強的探針。
1.2.4 病毒陽性質粒的構建 用Trizol Reagent提取病毒RNA,一步法RT-PCR進行目的片段的擴增,PCR產物經回收純化、連接、轉化、質粒提取和測序,構建陽性質粒[10-11]。
1.2.5 靶序列的擴增 將Baxi M K等[2]設計的引物修改為,上游 5′-GCT CGG TAC TAC ACACAG-3′, 下游 5′-GGT TGG ACT CAA TGTCTT-3′,并且在1.1.1中合成的核苷酸序列兩端也加上該對引物,擴增片段分別為1 070 bp與100 bp。
PCR反應體系為,無菌去離子水 18 μL,10×PCR buffer 2.5 μL,2.5 mmol/L dNTP 2 μL,2.5U/μL Taq DNA聚合酶0.5 μL,5 μmol上游引物0.5 μL,100 μmol下游引物(熒光標記) 0.5μL,質粒模板DNA 1 μL,總反應體積25 μL。PCR程序為94 ℃ 2 min;94 ℃ 30 s,50 ℃ 1 min,68℃ 1 min,進行35個循環;68 ℃ 5 min,4℃保存。
1.2.6 探針的特異性與靈敏度初步驗證 將設計出的探針5′端氨基酸修飾后合成,通過點樣儀點到醛基化玻片上(每個探針作2個重復)。對陽性質粒采用不對稱PCR進行擴增,PCR體系中的一條引物采用Cy3熒光標記。將PCR擴增產物與探針在42℃條件下進行雜交,驗證探針的特異性。將陽性質粒作101~107系列稀釋,用稀釋后的質粒為模板,PCR擴增產物與探針雜交驗證探針的靈敏度。
2 結果
2.1 FMDV基因分型與探針設計
分別應用DNA Star軟件中的Clasta l W程序多重比對后,通過TreeView構建系統發育樹進行基因分型,并對每一個基因型用Bio Sun2.0設計特異性探針。對O型8個基因型共設計出55條探針,對A型3個基因型共設計出40條探針,亞洲1型FMDV只有一個基因型,設計出了9條特異性探針。共設計出候選探針104條(表1)。
表1 O型和A型FMDV基因分型序列數和設計出的探針數
Table 1 Type O and A FMDV sequence numbers genotyped and probenumbers designed
血清型 Serumtype | 基因型 Genotype | 序列數/條 Number of sequences | 探針數/條 Number of probes |
O | Cathay | 74 | 12 |
ME-SA | 68 | 15 | |
Euro-SA | 21 | 4 | |
SEA | 24 | 13 | |
WA | 4 | 3 | |
EA | 4 | 3 | |
ISA-Ⅰ | 3 | 3 | |
ISA-Ⅱ | 2 | 2 | |
A | Asia | 35 | 18 |
Euro-SA | 24 | 15 | |
Africa | 20 | 7 |
表2列出了本試驗中篩選出的12條基因型探針的序列,這些探針的特性見表3。
表2 篩選出的12條FMDV探針序列
Table 2 Twelve FMDV probe sequences screened
探針編號 Probe | 基因型 Genotype | 探針序列 Probe sequence |
1 | Cathay | 5′-GCAAGTACGGTGACACCAGCACTAACAACGTGAGAGGC-3′ |
2 | ME-SA | 5′-TGCAAGTATGGCAGAGCCCCGTGACCAATGT-3′ |
3 | Euro-SA | 5′-TCCAAGGCCTTGCTGGCAATCCACCCACTGAAGCC-3′ |
4 | SEA | 5′-CTGGTGGGTGCGCTCCTCCGTACTGCCACTTACT-3′ |
5 | WA | 5′-CCTTCAAGTTCTGGCCCGGAGGGCGGCGCCGATGCT-3′ |
6 | EA | 5′-TCCGCGGCCTCTTTTGGCCACCCACCCGAG-3′ |
7 | ISA-Ⅰ | 5′-AATGCAGGTACGGTACACACACCACGACCAACGTGA-3′ |
8 | ISA-Ⅱ | 5′-ACACTGGTAGGAGGGCTCGTGCGCGCCGCCACTTA-3′ |
9 | Asia | 5′-ACAAGTACTCCGCGGCCAGTGAGCGCACACGGGGT-3′ |
10 | Euro-SA | 5′-ACCCACCAACACGGTCTAGTGGGTACGTTG-3′ |
11 | Africa | 5′-CGCAGACACCCCAGCACACACTTGTAGGTGCCTTG-3′ |
12 | AsiaⅠ | 5′-GCCTTTGCTAGCTCTTGACACCACTCAGGACCGCCG-3′ |
Table 3 The characteristics of 12 FMDV probes screened
探針編號 Probe | 基因型 Genotype | 探針長度/bp Probe length | 探針VP1位置/bp Probe position in VP1 | Tm/℃ | GC/% | △G |
1 | Cathay | 38 | 401~438 | 78.094 6 | 0.552 63 | -0.08 |
2 | ME-SA | 32 | 402~433 | 77.371 88 | 0.593 75 | -0.48 |
3 | Euro-SA | 37 | 561~597 | 81.340 37 | 0.594 59 | -0.53 |
4 | SEA | 34 | 181~214 | 79.688 86 | 0.617 65 | 0.63 |
5 | WA | 36 | 441~476 | 84.419 85 | 0.666 67 | -2.72 |
6 | EA | 30 | 561~590 | 82.237 47 | 0.7 | -1.52 |
7 | ISA-Ⅰ | 36 | 401~436 | 77.949 19 | 0.527 78 | -1.07 |
8 | ISA-Ⅱ | 35 | 181~215 | 83.444 46 | 0.657 14 | -1.21 |
9 | Asia | 35 | 401~435 | 83.709 61 | 0.657 14 | -1.21 |
10 | Euro-SA | 30 | 166~195 | 75.138 49 | 0.566 67 | -2.83 |
11 | Africa | 35 | 161~195 | 79.271 37 | 0.6 | -0.24 |
12 | AsiaⅠ | 36 | 561~596 | 79.864 93 | 0.611 11 | -0.05 |
2.3 探針的特異性與靈敏度驗證
已經驗證了部分探針的特異性與靈敏度,以ME-SA特異性探針的靈敏度為例(圖2)。
圖1 特異性探針篩選
Fig.1 Specific probe selection
A.空白;B.質粒拷貝數為102數量級;C.質粒拷貝數為103數量級;D.質粒拷貝數為104數量級;E.質粒拷貝數為105數量級;F.質粒拷貝數為106數量級
A.Blank;B.102 plasmid copy numbers;C.103 plasmid copy numbers;D.104plasmid copy numbers;E.105 plasmid copy numbers;F.106 plasmid copynumbers
圖2 ME-SA特異性探針的靈敏度
Fig.2 The sensitivity of the ME-SA genotype probe
3 討論
基因芯片技術從產生到現在才不過短短十幾年的時間,但它在生命科學各個領域的應用已經展示出了其蓬勃的生命力。它的主要特點是高通量、微型化和自動化。基因芯片上可以高度集成成千上萬密集排列的探針,能夠在很短時間內分析大量的生物分子,使人們能夠快速準確地獲取樣品中的生物信息,檢測效率是傳統檢測手段的成百上千倍。因此,以基因芯片為手段的研究將會有巨大的商業價值和良好的發展前景。
FMDV開放閱讀框(ORF)中編碼著4種結構蛋白,該4種結構蛋白的基因區稱為P1區,依次編碼1A(VP4)、1B(VP2)、1C(VP3)和1D(VP1)。FMDV7個血清型的結構蛋白氨基酸組成數不同,在4種結構蛋白中,差異最大的是VP1,其次為VP3和VP2[1]。根據FMDV7個血清型編碼衣殼表面基因VP1的3′末端序列的系統發育分析,得到了與7個血清型相對應的7個基因世系,證明了這些基因世系與血清型密切相關,而衣殼編碼區以外的基因組任意一端都與血清型無關[2]。因此,在進行FMDV分型診斷芯片的探針設計過程中,選擇用VP1基因序列設計探針。
用生物學軟件Bio Sun2.0進行探針設計,能夠將許多需要進行探針設計的序列組建成數據庫,從而針對數據庫進行探針設計,這就比單純對一條序列進行探針設計的軟件具有方便、快捷和高通量處理的優點。BioSun2.0雖然能夠對所要設計探針的序列根據需要進行組庫(如Cathy基因型數據庫),方便快捷地設計出探針,但是它所設計出的探針只與Targets數據庫中相應的序列是一一對應的,即特異的。要檢驗該探針能否探測到其他序列,還要通過軟件自帶的BLAST工具搜索該基因型數據庫的其他序列,篩選出能覆蓋盡可能多序列的基因型的通用探針,并盡量減少探針的數目,以便簡化試驗和降低成本。根據常規的探針設計參數,我們把探針的長度控制在30bp~38 bp之間,探針的Tm值控制在75 ℃~85 ℃之間。經過Bio Sun2.0設計出的探針再用其BLAST程序對下載的所有口蹄疫病毒序列數據庫進行搜索,從理論上排除探針的非特異性雜交。
將設計出來的探針合成后通過點樣儀點至醛基化的玻片上,將陽性樣品用熒光標記的引物進行PCR擴增。PCR產物與芯片進行雜交,驗證探針的特異性和敏感性。已經確定了12條探針的基因型特異性,檢驗了O型SEA、Euro-SA、ME-SA、WA4個基因型的各條探針的靈敏度。下一步工作將驗證更多探針的特異性與靈敏度,并結合臨床樣本確定每一條探針的cut off值。