摘 要:模式生物在生命科學的研究中有著重要的意義,特別是隨著功能基因組計劃的開展,數種生物的基因組序列已獲得,這對基因功能的深入研究打下了堅實的基礎。文章簡要介紹了幾種經典模式生物的概況。
關鍵詞:模式生物;基因組;分子生物學
模式生物是人們研究生命現象過程中長期和反復作為研究材料的物種,如海膽、果蠅、線蟲、擬南芥等。早在20世紀最初的20年中,人們就發現,如果把關注的焦點集中在相對簡單的生物上,則發育現象難題可以得到部分解答。因為這些生物的細胞數量少,分布相對單一,變化也較好觀察。由于進化的原因,細胞生命在發育的基本模式方面具有相當大的同一性,所以利用位于生物復雜性階梯較低級位置上的物種,來研究發育共同規律是可能的。尤其是當在有不同發育特點的生物中發現共同形態形成和變化特征時,發育的普遍原理也就得以建立。因為對這些生物的研究具有幫助我們理解生命世界一般規律的意義,所以它們被稱為“模式生物”。隨著科學的發展,其范圍也在不斷的擴大。
1987年美國國立衛生院研究所(National Institute of Health,NIH)和美國能源部(Departmentof Energy,DOE)聯合提出了“人類基因組計劃”(Human GenomeProject,HGP),并于1990年10月1日正式啟動,同時包括已經完成基因組測序的黑猩猩、小鼠、大鼠和河豚魚等,以及獼猴、豬、牛、狗、兔、荷蘭豬、大象、小袋鼠、負鼠、鴨嘴獸、九帶犰狳、刺猬、刺頭猬、香鼠、雞、斑馬魚、三刺魚、文昌魚、八目鰻、蝸牛、海鞘、海膽、蜜蜂、甲蟲、珊瑚蟲、淡水纖毛蟲、旋毛蟲、十幾種果蠅、數種線蟲、30余種真菌等。這些重要代表物種不僅涵蓋了生命進化過程中的各個主要環節,也包括了與人類生物醫學研究相關的幾乎所有物種。而且這個物種范圍還在不斷增加,各個計劃完成的時間也在不斷加快。由于模式生物在現代生命科學舞臺上扮演著舉足輕重的角色,已經成為各國生物學家關注的焦點。目前HGP已揭開了新的一頁,從基因組與環境相互作用的高度闡明基因組的功能,亦即功能基因組學,其內容包括建立單核苷酸多態性(SNP)為代表的DNA系列變異的系統目錄,通過對進化不同階段的生物體基因組序列的比較,發現基因組結構組成和功能調節的規律,并利用模式生物體的基因敲除和轉基因來揭示基因的功能[1]。為了順利完成人類基因組計劃特別是功能基因組計劃,開展一些模式生物基因組的研究是必要的,于是相繼啟動了模式生物基因組計劃(modelorganism genome project,MOGP)如大腸埃希菌(Escherichiacoli)、流感嗜血桿菌(Haemophilusinfluenzae)、釀酒酵母(Saccharomycescerevisiae)、秀麗線蟲(Caenorhabditiselegans)、果蠅(Drosophilamelanogaster)、擬南芥(Arabidopsisthaliana)、小鼠(Musmusculus)等的基因組研究計劃[2]。2000年6月26日,HGP與Celera公司的負責人共同宣布了人類基因組工作框架圖的完成;2001年2月并分別將自己測定的框架圖發表在Nature和Science[3]。發表的工作框架圖已能覆蓋人類基因組的97%,其中至少92%的序列已組裝得準確無誤,并認為編碼蛋白質的為3萬~4萬多個,不是以前估計的10萬~14萬個。模式生物基因組計劃作為HGP的重要組成部分,在HGP特別是比較基因組學研究和完成過程中扮演了重要的角色,對提前完成HGP的主要目標起到前所未有的作用。現通過介紹模式生物基因組研究進展情況,來揭示生物體間的本質聯系。
1 幾種經典模式生物的概況
模式生物的種類較多,以下簡要介紹幾種經典的模式生物,其基因組學的基本概況見表1。
1.1 海膽
海膽(Echinoidea)是棘皮動物門海膽綱的通稱,分2亞綱,22目,化石種5000種,現生種800種,分隸于225個屬。中國已知約100種。海膽(seaurchin)是生物科學史上最早被使用的模式生物,它的卵細胞和胚胎對早期發育生物學的發展有舉足輕重的作用。早在1875年,OscerHertiwig(1849年-1922年)就開始以海膽為材料研究受精過程中細胞核的作用。1891年,HansDriesh(1876年-1941年)在顯微鏡下把剛剛完成第一次卵裂的海膽胚胎一分為二,結果發現,分開后的兩個細胞各自形成了一個完整的幼蟲。證明了胚胎具有調整發育的能力,為現代發育生物學奠定了第一個觀念里程碑。
1.2 大腸埃希菌
大腸埃希菌(Escherichiacoli)是Escherich在1885年發現的,在相當長的一段時間內,一直被當作正常腸道菌群的組成部分,認為是非致病菌。直到20世紀中葉,才認識到一些特殊血清型的大腸埃希菌對人和動物有致病性。大腸埃希菌作為外源基因表達的宿主,遺傳背景清楚,技術操作簡單,培養條件簡單,大規模發酵經濟,倍受遺傳工程專家的重視。目前大腸埃希菌是應用最廣泛、最成功的表達體系,常作為高效表達的首選體系。20世紀70年代,通過對大腸埃希菌的研究發現了操縱子學說并且繪制成了完整基因圖譜,基因組全序列完成,全長為5Mb,共有4 288個基因,同時也搞清了所有基因的氨基酸序列。62%的基因功能已經闡明,仍有38%基因功能尚未完全搞清[4]。
1.3 流感嗜血桿菌
1995年7月,流感嗜血桿菌(Haemophilusinfluenzae)第一個細菌基因組全序列發表,大小為1.8 Mb,1703個基因或開放閱讀框(ORF)。從其DAN全序列中鑒定出76個基因,其中32個(與其他病原菌同源)均表達細胞表面蛋白[5]。389種無已知蛋白質可比,347種與推導的蛋白質相符,已知作用的有1007種。富含G-C的區域是6個rRNA操縱子和Mu樣原噬菌體區,G-C含量超過40 %。這是微生物以至整個生物學領域的一個里程碑。
1.4 釀酒酵母
釀酒酵母(Sacharomycescerevisiae)是一種單細胞生物,能夠在基本培養基上生長,使得實驗者能夠通過改變環境控制其生長。因為釀酒酵母與同為真核生物的動物和植物細胞具有很多相同的結構,又容易培養,酵母被用作研究真核生物的模式生物,也是目前被人們了解最多的生物之一。在人體中重要的蛋白質很多都是在酵母中先被發現其同源物的,其中包括有關細胞周期的蛋白、信號蛋白和蛋白質加工酶。酵母在單倍體和二倍體的狀態下均能生長,并能在實驗條件下相互轉換,對其基因功能的研究十分有利。酵母的生命周期短,適合經典的遺傳學分析,使得在酵母16條染色體上構建精細的遺傳圖譜成為可能。酵母是最簡單的真核生物,個體小,生長快,生長周期僅為70min左右,易培養,易操作,對人體無毒害作用。遺傳基因結構研究得比較清楚。1996年4月國際互聯網的公共數據庫中公布,基因組為15Mb。將所有的酵母基因同GenBank數據庫中的哺乳動物基因進行比較(不包括EST順序),發現有將近31%編碼蛋白質的酵母基因或者開放閱讀框與哺乳動物編碼蛋白質的基因有高度的同源性[3]。通過對酵母蛋白質間的相互作用的研究,初步繪制了6 000種蛋白質之間的互作圖譜。有關酵母的基因組和蛋白質組數據可登錄SGD、YPD[6]。
1.5 秀麗線蟲
秀麗線蟲(Caenorhabditiselegans)是醫學研究中的一種重要模式生物。2002年諾貝爾生理醫學獎得主布瑞納、蘇斯頓及霍維茲的重要貢獻有二,一是建立了線蟲的模式生物系統,他們運用對線蟲優越及完善的遺傳分析技術,發現了許多影響線蟲發育的基因,其中包括作用于計劃性細胞死亡的一些重要基因,這讓研究者有機會一窺計劃性細胞死亡的機制。另一貢獻是將牽涉到細胞死亡的重要基因,在人類基因體中找到同源基因,而讓細胞死亡機制能在人類基因中進行進一步研究。這些重要成就不僅讓大家了解線蟲,又因線蟲及人類基因體之間的保守性,將這些研究應用在人類的疾病及醫學上有卓越貢獻。秀麗線蟲是了解的最清楚的模式生物之一,線蟲蟲體長1.5mm,容易培養和保存,一次雜交僅需3d時間,突變體性狀特征明顯。成蟲個體有959個體細胞組成302個神經元構成神經網絡。1990年進行基因組計劃的研究,于1998年12月完成了基因組測序,基因組大小100Mb,分布于6條染色體,預測有19 099基因[7]。秀麗線蟲的數據庫有NEX-TIDB,秀麗線蟲收入SWISS - PROT的蛋白質已超過1 000個[8]。細胞程序性死亡的遺傳調控機制,RNAi及其遺傳機制的發現是秀麗線蟲對當代生命科學發展的又一重要貢獻。
1.6 果蠅
果蠅(Drosophilamelanogaster)曾三度飛進卡羅林斯卡醫學院的頒獎大廳,為主人領回諾貝爾生物醫學獎桂冠(1933年摩根,1946年繆勒,1995年劉易斯、尼爾森-沃哈德和維斯郝斯)。摩根1933年因發現了果蠅白眼突變的性連鎖遺傳,提出了基因在染色體上直線排列以及連鎖互換定律被授予諾貝爾獎。1946年,摩根的學生,被譽為“果蠅的突變大師”的繆勒,證明X射線能使果蠅的突變率提高150倍,因而成為諾貝爾獎獲得者。在近代發育生物學研究領域中,果蠅的發生遺傳學獨領風騷。1995年,諾貝爾獎再次授予三位在果蠅研究中辛勤耕耘的科學家。果蠅為進一步闡明基因-神經(腦)-行為之間關系的研究提供了理想的動物模型[9]。果蠅世代周期短,一般10 d~12d,體小容易飼養,培養費用低廉,繁殖力強,分布廣泛。染色體數目少,黑腹果蠅只有4對染色體,幼蟲唾液腺中有巨大的唾液腺染色體,其上的橫紋和間帶區分地十分清楚,2000年3月宣布了基因組全序列為180Mb。有13 601基因,其中一半的基因功能還沒有搞清楚,有1600個堿基跨度區仍未能完全測序。果蠅基因組的完成使人們確信“全基因組鳥槍法”(Whole genomeshotgun)和“片段處理法”的結合將成為解譯大基因組最有效的方法。同時,其他生物的“遺傳圖”也可以建立在果蠅研究的經驗基礎上[10]。果蠅的基因組數據庫可參看Fly Base[11]。
1.7 擬南芥
擬南芥(Arabidopsisthaliana)是典型的十字花科植物,雖然沒有任何經濟價值,但因為具有一些獨特的生物學特性而成為當今分子生物學家、遺傳學家和發育生物學家的寵兒。其個體小,成熟個體只有約15cm高,大量的植株可以種在一塊很小的地方,而且也可在培養皿中生長。生長周期短,播種后2 d~3 d就開始萌發,20d左右植株就開始開花結果,40d左右種子成熟并且每株能產生上萬粒種子。1996年擬南芥基因組國際合作項目啟動,至2000年12月,第一個植物基因組——擬南芥基因組被全部測序,遺傳圖譜、物理圖譜建立,序列大小為125Mb。基因組測序區段覆蓋了全基因組的115. 4Mb,分析共含有25 498個基因,編碼蛋白來自11 000個家族。
1.8 小鼠
自1979年Mintz等人將SV40病毒DNA導入小鼠(Musmusculus)早期胚胎的囊胚腔,得到了第一個承載有人工導入的外源基因的嵌合體小鼠以來,小鼠已成為生物學、醫學、分子生物學、分子遺傳學、免疫學等廣泛領域的模式動物,是人類的近緣親戚的哺乳動物,只有幾億年的進化距離,基因組與人類的差不多,大小為3000 Mb,基因的數目與人的也差不多,已經發現的人類基因,小鼠不僅都有,而且都很相似[12]。現已育成千余個獨立的遠交群和近交系,是生物醫學研究中廣泛使用的模式生物。因此,小鼠是人類基因組研究主要模式生物之一。
1.9 河豚魚
河豚魚(Globefish fish)是一種新的模式生物。其基因組特點是大小只有300 Mb~400Mb(為人類基因組的1/7~1/8),重復序列少且成簇排列,基因間序列少而小,內含子普遍比人的小,基因數目卻與人的大致相當。河豚魚作為脊椎動物基因組研究的模式生物,在比較測序、基因分離、基因結構功能的研究、基因轉移等方面有著極高的科學價值和廣泛的應用前景。
1.10 斑馬魚
斑馬魚(Daniorerio)為一種熱帶硬骨魚,是研究脊椎動物器官發育和人類疾病的重要遺傳學模型之一[13],其顯著優勢在于體積小(3 cm~4 cm),可在較小的空間大量繁殖;產卵量高(每周200多個);發育快,許多組織在受精后24h開始形成;成熟周期短;體外受精且胚胎透明,可在體視解剖鏡下觀察。斑馬魚的基因組中大約含有30000個基因,這個數目與人類差不多,而且它的許多基因與人類存在一一對應的關系。它個體小,周期產卵,產卵周期短,產卵量多,卵大;胚胎在體外發育,胚胎發育速度快,早期胚胎完全透明;單倍體、雌核發育二倍體的制作和突變體的獲得均較容易;精子可以冷凍保存,所有這些特點使斑馬魚非常適合于遺傳學的研究[14]。其透明狀態的胚胎是在體外發育生長,它的神經中樞系統、內臟器官、血液以及視覺系統,在分子水平上85%與人相同,尤其是心血管系統,早期發育與人類極為相似,在胚胎發育過程中可以全程觀察和研究其心臟發育及血液流動狀態。借助顯微鏡,甚至可看到每個心肌細胞和血液細胞。而且斑馬魚一生可產卵數千枚,24h胚胎發育成熟。高速繁殖有利于基因篩選,早期發育與人類極為相似,目前斑馬魚成為研究人類疾病及動物胚胎發育的最佳模式生物[15]。特別在母體產生的因子(如蛋白質和mRNA)對啟動胚胎發育的影響[16]、體軸的形成機制[17]、胚層的誘導與分化[18]、胚胎中細胞的運動機制[19]、器官的形成、左右不對稱發育[20]、原始生殖細胞的起源等方面做出巨大貢獻。
表1 幾種經典模式生物基因組學的基本概況
Table 1 General situation of genomics inseveral kinds of classicModel Organisms
名稱 Name | 分類 Classification | 測序完成期 Sequencing date | 基因組長度 Genome length |
大腸埃希菌 Escherichiacoli | 細菌 Bacteria | 1997 | 5 Mb |
流感嗜血桿菌 Haemophilusinfluenzae | 細菌 Bacteria | 1995 | 1. 8Mb |
釀酒酵母 Sacharomycescerevisiae | 真核生物 Eukaryotes | 1996 | 15 Mb |
秀麗線蟲 Caenorhabditiselegans | 蠕蟲 Worms | 1998 | 100 Mb |
果蠅 Drosophilamelanogaster | 昆蟲綱雙翅目 Insecta Diptera | 2000 | 180 Mb |
擬南芥 Arabidopsisthaliana | 十字花科 Cruciferae | 2000 | 125 Mb |
小鼠 Musmusculus | 哺乳綱 Mammalia | 1999 | 3 000 Mb |
河豚魚 Globefishfish | 節枝動物門甲殼綱 Arthropoda Crustacea | 1999 | 300 Mb~400 Mb |
斑馬魚 Daniorerio | 脊椎動物 Vertebrate | 正在完成中 In completing | 約30 000個基因 Approximately 30 000 genes |
在人類基因組研究中十分注重模式生物的研究,這是由于要認識人體基因的功能,直接用人體作為實驗對象非常困難。但是,生物是從共同祖先演化而來的,所以對生命活動有重要功能的基因在進化上是保守的,也就是說,這些基因的結構和功能,在低等生物和高等生物中是相似的。因此,可以用比較容易研究的生物作為模型來研究其基因的結構和生物學功能,由此獲得的信息可以使用于其他比較難以研究的生物,特別是推測相似的人體基因的功能。模式生物中很多基因與人類具有很高的同源性,通過對模式生物基因結構和功能的研究可以推測人類相應基因的功能。模式生物基因組研究最直接的應用體現在生物信息學領域。當人們發現了一個功能未知的人類新基因時,可以迅速地在模式生物基因組數據庫中,檢索得到與之同源且功能已知的模式生物基因,并獲得其功能方面的相關信息,從而加快對該人類基因的功能研究。
2 小結
綜上所述,在短短的幾十年期間,以這些模式生物為研究對象的重大科學發現層出不窮,模式生物已經在現代生命科學基礎研究中具有不可替代的重要地位。但是,模式生物在我國的研究才剛剛起步,與國際領先研究水平差距還很大。好在全世界的研究者始終堅持材料、資源、信息和數據的無償共享,使這一領域的研究得以飛速發展。2002年,我國啟動了家蠶模式生物的研究計劃,試圖建立另具特色的新模式生物,并以此為契機,推動我國特有模式生物的研究。隨著越來越多的研究者的加入,也隨著分子生物學的飛速發展,以及越來越多物種的基因組被測序,許多生物都有可能成為很好的模式生物。經典模式生物的數據庫不斷的完善將會加快對分子生物學的研究進展。我們堅信,有關模式生物的研究必將繼續為人類探索生命規律的調控機制做出更大貢獻。最終使我們真正了解我們最關心的模式生物——人類。