WELLCOME more value for less?mobil:0930~933~379 & ?http://tobehealth.blogspot.com
人類基因體計劃(The human genome project)與人類基因圖譜的繪製
前言
自古以來人類就力圖窮究人類的起源與與之伴隨而起的生、老、病、死、思維、意識、與行為的奧妙,人類的文明可以說是建立在人類追求自我的認知上;科學也是起源於滿足人類企圖探索自然之神奇與奧妙而來,從一粒蘋果秋落,二種物質組成,三角關係對比,到四肢調和運作,物理、化學、數學及生物等四種學門漸次成形。當科學從基礎延伸至應用時,種種新技術也蛻變為生產工具。從五0到六0年代這二十年間,藉由分子生物學家的基礎研究,我們得以明瞭基因的結構、遺傳密碼、與基因的表現等生命現象;七0年代開創出「基因工程」的技術,使我們有辦法去追蹤、鑑定我們體內基因的來龍去脈;到了八0年代,分子生物學家開始踏入遺傳疾病的研究,帶領我們朝向遺傳疾病的基因摸索前進;到了近十年間,生命科學的研究邁進了革命性的新紀元,國際間如火如荼推展的基因體研究(Genomic research)正是主導這個轉變之原動力。基因體的研究是從推動國際人類基因體計劃(Human Genome Project;HGP)開始,這是一個被科學界視為是生物學界可以與曼哈坦原子彈計劃(Manhattan Project)和阿波羅登月計劃(Apollo Project)媲美的一個計畫。從1990年十月一日正式展開,最終目的在於解讀基因體核甘酸序列,並鑑別所有人類基因之功能,預訂以十五年的時間完成,耗資三十億美金。這個計畫的成果可以想見的是,會如同過往其它科學領域之研究,帶給全體人類知識性的改變,更甚者,由於其解讀的對象就是人類自己, 她可能帶給整個社會的衝擊將會是前所未有的。基因體 (Genome)是指每種生物體內所有基因整體之總稱。在真核細胞生物裡,這些基因分佈於染色體上,人類細胞核內共有二十三對染色體(一組來自父系,一組來自母系),據人類基因體計畫2001年的報導,估計有近乎三到四萬個基因分佈在這23對約有三十億對核甘酸所組成的染色體上。
人類基因體計劃歷史回顧
西元1953年,James Watson and Francis Crick 提出DNA雙股螺旋結構,不僅解開了基因的化學結構之謎,同時也揭示了DNA所攜帶的遺傳訊息如何完成遺傳訊息的複製與表現的機制。在1953年以後,生物化學、分子遺傳學與生物技術的快速成長,使生物學家可以針對不同的基因進行分子層面的解析與研究。人類基因體計劃就在這種時代背景下漸漸萌芽。1984年美國分子生物學家Robert Sinsheimer提出生物學界應該效法物理學和天文學的研究,成立大型的研究計劃,專門從事人類基因的解序工作。初始他的提議雖然沒有被採納也未爭取到經費,但是Robert Sinsheimer的構想開始引起遺傳學家與分子生物學家的廣泛討論。1986年五月,有關人類基因體計劃的正式討論在冷泉港(Cold Spring Harbor)研究所每年例行的研討會上公開露面。第一次公開的討論,可以想見的是,科學家們的立即反應是相當分歧的。反對者擔心龐大的研究經費所換得的可能只是一堆無用的資訊(因為90﹪的人類核甘酸序列可能是沒有作用的),要不就是擔心,如果知道太多有關人類基因資訊將可能導致納粹式的優生主義的抬頭,再次為人類帶來空前的浩劫;除這些反對的理由外,還有些人從生物學研究特色為其考量的重點,因為生物學從未曾是大科學(Big Science),所以已經長期習慣於個人化的研究環境的科學家,是否會願意投入大型研究室從事枯燥、瑣碎的解序活動呢?當然在與會的生物學家中也不乏贊成者,James Watson就是其中之一,他稍後也成為美國NIH 的HGP的第一任Associate Director。1985-1988年間,生物學家間除了廣泛討論HGP的可行性外,美國國家能源部門(the Department of Energy, DOE)也開始顯露其對人類基因體研究的興趣,因為這個部門的主要的研究任務之一,就是想了解核能的放射線對人類染色體的影響。1986年,Charles DeLisi(是DOE部門中健康和環境研究室的負責人)主張DOE應該積極參與分子遺傳學的研究,也就是說DOE應該提供HGP所需的龐大研究經費。據Walter Gilbert的估計,如果解開一對遺傳密碼要1美元,人類基因體約有30億對鹼基的話,總共要的花費是30億美元以及十五年的時間將人類的基因體完全解碼。針對是否該由DOE來全權主持HGP,Watson則認為不妥,理由是應該由以一群受科學實質需要所驅使的科學家來領導,而不是公務機構中的官僚來領導。所以正當科學家們對HGP爭議不休、難有定論之際,最具科學權威性的美國國家研究委員會(the National Research Council, NRC)決定深入研討這個課題。討論的結論是正面肯定了HGP的益處,但卻也強調HGP的工作重心應在於先完成遺傳圖譜(genetic map),然後才來談各個基因上的DNA序列的解碼,也就是所謂的終極物理圖譜(physical map)的完成;再者,NRC的研究報告還建議擴大HGP的研究範圍,指出研究其他生物物種基因體(如細菌、果蠅、老鼠等等)對人類基因研究的重要性。NRC的研究報告平息了很多科學家的疑慮,並促使美國國家健康總暑(the National Institutes of Health, NlH)願意積極投入並主導HGP。1988年人類基因體計劃組織(the Human Genome Project Organization;HGPO)正式成立,由美國遺傳學家Victor Mckusick出任第一任負責人。同年的十月一號,,James Watson被任命為是NIH下的人類基因體研究國家中心(National Center for Human Genome Research,NCHGR)的Associate Director,也在同日,NIH和DOE聯合簽署以NIH為主導的基因體研究的合作計劃。
美國的人類基因體計劃基本上包括三大部分:壹、人類和一些模型生物(model organisms)基因組的輿圖和定序工作,並配合以發展和新創與此工作相關所需的實驗技術、研究系統和儀器設備為主題之研究部分;貳、主要是電腦科學在基因組研究中的應用,含括數據的收集、處理和分配等之研究部分;參、對於與人類基因體計劃相關的社會、倫理、道德、法律、商業等方面的問題,提出因應對策的研究部分。在第一部份的研究中,基因組的分析分兩階段完成,一是完成生物的遺傳圖譜,即是以2到5 centimorgans( 1 centimorgan相當於1百萬DNA鹼基對的長度)的距離來畫出基因間的相對位置,據估計為了完成這部分的工作,科學家就必須要有約3000個標誌才能將人類的遺傳圖譜完成;另一階段的目標是物理圖譜的完成,這部分的工作就是定出人類所有染色體中DNA鹼基序列,這將是一長串(約30億對)類似ATCGCGATAT---------的核甘酸序列。除了這兩個重點外,美國HGP也努力於改進現有的基因操作技術,期望能降低解析一個鹼基對的成本(由5美元一對降低到0.50元一對)。為了能夠有效率的進行上述這麼龐大的研究計畫,並為了能避免一切不必要的重疊研究,美國成立了一個專責的中心,進行HGP項下所有研究工作的溝通、整合與指導。美國HGP的成立,使其它西歐工業先進國家倍感威脅,為了不在基因科技上遠遠的落後於美國,也為了防止萬一美國不願意讓其他各國分享其研究成果並壟斷基因科技與資訊,英國、法國、丹麥、義大利、德國等也紛紛先後成立研究人類基因的專責機構:英國的the Advisory Council on Science and Technology(ACOST)於1988成立英國所屬HGP、法國是由the Centre dEtude du Polymorphisme(GEPH)和Généthon兩機構分頭研究。雖說這些國家的研究經費遠遠不如美國龐大,發表的研究成果也不如美國多,但是配合著有限的經費,歐洲國家的基因研究的共同特色就是集中分析那些能製造蛋白質的基因為主,也就是說其研究的重點是在所謂的互補去氧核糖核酸(complementary DNA;cDNA)分析與定序上。這種研究的方向不同於美國的HGP的研究,因為在美國HGP的研究中可能將要花費巨資來解析人體中近90%的所謂的垃圾DNA(junk DNA,指和蛋白質生成無關的DNA片段)的序列。但是為了彌補忽略垃圾DNA可能有的生物功能,英國就以解讀線蟲的基因體序列做為了解更複雜生物體基因體的基本模式。這項圖解線蟲的全部基因體序列的計劃是和美國HGP合作,由劍橋John Sulston和華盛頓大學Bob Watersone共同領導。
1990年NIH與DOE推出第一個五年計劃,其中包括三大目的:期望在五年內完成基因圖譜、每100 Kb就含有一標誌(Marker)的物理圖譜、並且期望於二00五年能將幾種模型生物其所有已解序的DNA序列聚集起來。同年十月NIH開始大規模解序下列四種模型生物:Mycoplasma capricolum, Escherichia coli, Caenorhabditis elegans, Saccharomyces cerevisiae,期望在三年內完成。1991年J. Craig Venter 發表利用ESTs (expressed sequence taq)的策略尋找被表現(expressed)的基因,同年十月,日本致力於策動水稻基因體計劃(International Rice Genome Sequencing Project;IRGSP),期望整合多國國家共同合作,將水稻十二條染色體早日解序完成,做為植物基因體計畫的模型。1992年9月,Mel Simon發表利用BACs (Bacterial Artificial Chromosome Vector)進行基因大片段的選殖(cloning)技術,此種選殖技術可插入約100-200 Kb的DNA,選殖效率高、穩定,為人類基因體計畫中基因技術的改進又往前邁進了一大步 。1992年10月美、法團隊提前完成人類與老鼠的基因圖譜(genetic map),其中老鼠基因間的平均距離為4.3 cm (centimorgan);而人類基因間的平均距離為5 cm。1993年HGP改由密西根大學分子生物學家亦是CFTR基因(cystic fibrosis transmembrane conductance regulator;纖維囊腫患者所具有的突變基因)的發現者之一柯林斯先生( Francis Collins)接掌。該年,NIH與DOE修改了1990年推出的五年計劃,期望至1998年年底人類的DNA解序可完成80 Mb,並且於2005年完成人類基因體完全的解序(人類生命天書)。1994年Jeffrey Murray、Cohen 發表完整的人類基因體之基因聯鎖性圖譜(genetic linkage map),其基因間的平均位置為0.7 cM。西元1995年Lander 、Thomas Hudson發表內含15,000個標誌(Marker)點的人類物理圖譜。1996年,參與HGP的各國同意將人類基因序列資料庫全天候的開放使用。同年四月,NIH找到六個團隊,進行大規模人類基因體解碼的工作。1997年National Center for Human Genome Research(NCHGR)推動成為國際人類基因體研究組織(National Human Genome Research Institute);DOE亦是其中一要員。該年基因解序速度因Molecular Dynamics公司推出第一部毛細管解序儀( capillary sequencing machine)—MegaBACE而大大提升。1998年Venter成立美國民間第一個從事人類基因體計劃的私人公司—賽雷拉(Celera),Venter也大膽宣稱人類DNA序列將在三年內耗資3億美元而完全解碼。另一方面NIH與DOE共同發表宣言,期望提前至西元2001年完成人類基因體草圖(working draft),而在2003年,也就是在James Watson and Francis Crick (1953年) 提出DNA雙股螺旋結構的五十年後,完成人類基因體的完全解序,除了將以此誌謝二位學者對遺傳學的貢獻,也將向世人宣布遺傳學新世紀的來臨。西元1999年NIH再次將人類基因體草圖完成日期提前至2000年春季。同年十一月,英國、日本、美國三國的研究團隊首度共同發表第一條完全解碼的人類第二十二號染色體。同年日本與德國研究團隊的科學家們也共同發表完全解碼的人類第二十一號染色體。2000年6月在美國白宮例行會議上,「人類基因體計劃」團隊與美國Celera公司這兩個DNA定序團隊,發表他們「人類基因體」的研究成果。自從1953年Watson與Crick發表DNA結構以後,與基因有關的研究一路走來,始終處在競爭激烈的狀態中。雖然從十幾年前開始,跨國多實驗室的「人類基因體計畫」團隊,以穩健的方法進行人類基因體的解碼工作,然而直到三年前由Dr. J.C. Venter 成立Celera公司投入戰場後,人類基因體才成為科學家以外,社會大眾矚目的焦點,他們都在問「到底誰先完成基因體的解碼呢?」。
人類基因體計劃研究技術的背景資料
遺傳學的發展始自孟德爾(1865年)的碗豆實驗,但是真正開始受重視並且用在人類本身的遺傳研究則始自1902年英國醫師Archibald Garrod,他觀察黑尿病(Alkaptonuria),並提出此病的病因為一種先天性代謝錯誤。迄至1991年,據Victor Mukusick編輯的”Mendelian Inheritance in man”一書的統計,已有超過五千六百個基因的改變被發現與人類的疾病有關,這些病變大都是由於變異基因所造成的代謝阻礙所引起的。遺傳學的發展在1970年以前鮮少有關人類的研究,主要是由於生物上及倫理上的限制。由於人類的平均壽命較長,族譜的觀察不易,再加上當時的遺傳學家不可能進行人工的人類胚胎培養,所以至1967年為止也僅有9個基因連鎖群( linkage group)被鑑定出來。不過在這同時,許多遺傳工程的工具已經漸次的被發現,新的技術也陸續的被設計完成,這些新的技術包括:
1.
DNA重組技術
2.
哺乳動物的細胞培養(Mammnalian-cell-culture)
3.
限制酶(restriction enzyme;可以精確的剪貼DNA片斷)、DNA修補酶(repair enzymne)與反轉錄酶(reverse-setranscriptase;可以反讀RNA為DNA)的發現、應用與生產
4.
細菌質體(plasmid)轉殖基因技術的發展
5.
1967年Mary Weiss和Howard Green在體細胞雜合技術( somatic-cell hybridization)上突破性的發展,他們利用仙台病毒(Sendai )加入含人類和老鼠細胞的培養液中,使人類的細胞與老鼠的細胞發生融合的現象,形成含有兩個細胞核的融合細胞(亦可稱為雙核體;dikaryon),兩個細胞核又可能融合而產生含有兩個親代細胞的染色體的單核細胞即合核體(synkaryon)。可是,由於某些未知的原因,人類的染色體在細胞分裂的連續世代中會逐漸丟失,但是總有一兩個人類染色體留下。人、鼠的染色體大小差異極大故極易分辨,在經由觀察合核體蛋白質的分析可知確定這些蛋白質基因可能位於幾號的染色體上而能將人類的基因加以定位。
6.
1970年Torbjoru Caspersson等發明的人類(和哺乳類)染色體螢光染色法染色技術與流體細胞儀(Hoechst 33258)的完成
這些技術上的成功發展等都成為七0年代研究人類染色體與基因的重要研究工具。這些新的技術促使人類遺傳學家能於1973年召開第一屆人類基因圖解會議(the humnan-gene mapping conference)。除了上述的技術發展外,在1973年後更新的技術發展使得人類基因的解碼成為可能,這些技術包括有:
1.
DNA的定序
1975年Fred Sanger以未知序列的單股DNA當模版加入放射線標定的引子(primer)、DNA聚合酶(polymerase)、dNTP、及四種人工合成雙去氧核甘酸(dideoxynucleotide;ddATP、ddGTP、ddCTP、ddTTP)之任何一種進行DNA合成,若合成時是dNTP被加入新合成的一股DNA時則新股的DNA會繼續合成,但若加入新股的是雙去氧核甘酸,新股的DNA 合成即會停止。這種結果會製出長短不一的DNA片段,經由電泳及放射線自動顯影技術(autoradiogram)就可解讀核甘酸的序列(sequence)。
2.
RFLP分析技術的建立
1978年,David Botstein發現對不同來源的DNA進行限制酶的切割,可以得到不同長度的DNA片段。由特別的探針(probe)去偵測限制酶切割所產生的大小不同的DNA片段時,發現在正常人與帶有某遺傳性特徵的研究對象間探針的雜和訊號會有所不同。遺傳學家即利用此種分析法做為研究基因變異的工具。此分析技術稱為限制片段長度多型性技術( restriction fragmnent length polymorphisms, RFLPs)。利用這種方法追蹤疾病基因最有名的例子之一是在Venezuela家族的Huntingon舞蹈症(chorea)的研究,發現此家族成員DNA片段長度的特異性。類似的研究也已用在許多其他疾病上,如cystic fibrosis,adult polycystic kidney disease,Duchenne muscular dystrophy等。同樣的技術可以找出造成疾病的基因,解讀它的DNA序列 ,再來就是找出它的基因產物予以治療,這種直接由基因為其研究對象的研究方向就是所謂的反向遺傳技術。
3.
1980 年原位雜合技術(in stiu hybridization)的建立。此技術乃直接選取一段基因的DNA以放射線標定,以此為探針(probe)與展開的染色體進行雜和反應,這些探針只能選取與之配對的序列成對,然後再經放射線自動顯影技術,即可確定該基因在染色體上的位置。
4.
1980年代後仍然有許多有關DNA合成與定序技術的改進。其中包括1980年早期,Marvin Carruthers的人工DNA化學合成技術。1982年,Akiyoshi Wada 與日本日立(Hitachi)公司合作期望發展出自動定序儀。1984年,David Schwartz的膠體電解分析(gel electrophoresis),他發現突然改變電場方向會導致DNA分子conformation 重組更易區分不同的DNA分子。1986年,Hood發明自動DNA螢光序列解讀技術,將四種核酸以不同的螢光顏色標定,並利用電腦自動化的儀器,一天可以解讀超過一萬兩千個鹼基對(base pair)。
5.
1987年Maynard 0lson利用酵母菌系統建立的Yeast Artificial Chromosome(YAC)選殖載體使分子生物學家可以進行大片段DNA的選殖工作。
6.
1987年Kary Mullis則發明聚合脢連鎖反應技術( polymerase chain reaction;PCR),將DNA加熱後融解,靠氫鍵連接的雙股DNA鏈則分成單鏈,冷卻後單鏈DNA則與外加的引子(primer)結合再各自以高度的準確度合成其對等的互補DNA鏈,重覆數次即可大量複製DNA。這種複製DNA技術在試管中就可進行,不再需要植入細胞中來大量複製。
7.
1990年Lloyd Smith、Barry Karger、Norman Dovichi發展出毛細管電泳(capillary electrophoresis),使分子遺傳學家可以更快的將DNA加以定序。
8.
但是由於人類的基因序列的多樣性遠超過地球上的其他任何生物物種,基因圖解的複雜度也遠超過想像,而且尚在演化中。再加上基因之間的交互作用與基因的調節作用,要全盤瞭解人類遺傳基因的全貌,就算有上述的技術突破,也是一件相當棘手與困難的工作。
人類染色體基因圖譜(Genetic map & Physical map)的繪製
基因體計劃首要工作就是繪製每一號染色體之遺傳及物理(實距)圖譜。遺傳圖譜(Genetic map)之製作是根據不同基因間發生基因重組交換機會大小所定出的基因相對位置圖譜。細胞在進行減數分裂(Meiosis)過程中,剛完成複製的同號染色體間能經由重組步驟相互交換長短不定的DNA片段。距離愈近的基因其重組機率愈小。反之,同號染色體上相間距愈遠的基因則有較高的重組機率。但由於遺傳學家所掌控的基因不多,所以在人類的遺傳圖譜的建立上,人類遺傳學家利用染色體上的多型性遺傳標誌(Polymorphic Genetic Marker)序列當成重組的標的。一般說來,兩個遺傳標誌距百分之一(1cM)重組交換機率的間隔約為一百萬對核甘酸(1Mbp)。例如染色體的長度為一億三千萬對DNA (130Mbp),為了完成遺傳圖譜就必須有一百三十個個個間距為1Mbp之遺傳標誌。擁有總共五千多個多型遺傳標誌之遺傳圖譜已於1994年繪製完成(較預定間提早一年)。圖中每一個遺傳標誌在染色體上的位置都加以確定。因為染色體遺傳圖譜廣泛的被應用於追蹤遺傳病變之致病基因,所以為了配合日後大量核甘酸定序工作,每一號染色體又必須有標誌較近的物理圖譜(Physical map)。這些長度約500bp之實距標誌不須具遺傳多型性,但必須在基因體內只出現一次。繪製物理圖譜之進展非常迅速。在1995年即完成標誌間距二十萬對核甘酸之物理圖譜。人類基因組輿圖已獲很大進展。1994年9月Science 雜誌上發表的人類基因組連鎖圖。圖上的界標共5,840個基因座,覆蓋性別平均連鎖圖(Sex-averaged map)上4,000cM的範圍;其中3617個基因座是可以用PCR技術加以驗證的短串連重複多型態位置(STRP, short tandem repeat polymorphism),其中427個是基因。連鎖圖上標誌的密度為0.7cM,即每隔0.7cM(相當於約700kb)有一個界標。分辨率已超過了預定於1995年前完成的2~5cM的指標。人的基因總數如按通常估計的10萬個計算(這是當年對人類基因數目的估計值),人類基因組應是平均每隔30kb有一個基因:按照目前已完成的連鎖圖的分辨率推算,兩個界標之間平均有約20個基因,這對選殖基因將是很有利的。
遺傳圖距cM與物理圖距kb之間的換算不是一個常數,其受各種因素的影響,不同物種有不同的數值,小鼠基因組1cM相當於1800kb,斑馬魚基因組1kb相當於625kb。即使是同一物種的不同性別個體的基因連鎖圖上的圖距也不相同。這就是取不同性別的交換值平均數構築性別平均連鎖圖的緣故。輿圖時用的界標有基因、限制內切酶位置、限制性片段長度多型態位置(RFLPs)、序列標貼位置(sequence tagged site;STS)和表現序列標貼(expressed sequence tag ;EST)等。其中STS是最常用的界標,這是指其位置及核甘酸序列均屬已知的單一序列,一般的長度約為200~500bp,很容易用PCR加以驗證。當各個實驗室發表有關基因定位、輿圖和某一DNA片段的序列等數據時,STS可用來驗證這些數據的可信度,協助各實驗室輿圖、定序數據的整理。Contig是基因組輿圖的基本單位,這是指可以透過末端相同序列而彼此疊合連接的若干個選殖株(clone)。例如YAC-contig即若干個YAC載體中的人類基因組插入片段,彼此可透過末端的重疊序列而連接成很長一段DNA。因此。一個contig覆蓋的DNA片段愈長,則愈利於基因組輿圖的完成。整條染色體的輿圖就是把一個個contig連接起來,把一段段輿圖連成整條染色體圖。但是,contig之間無法避免的會有間隙(gap)存在,即兩個contig的數據資料,因有間隙而無法連成一線。為了解決這個問題發展出一種稱為專一的選殖間隙片段的方法RARE (RecA assistant restriction enzyme)。這個方法是將間隙兩側的STS序列與基因組DNA混合,加入RecA使STS與基因組發生同源重組,形成一定的空間結構。此時,加入甲基化酶,STS區因出現同源重組結構而阻礙了甲基化酶的作用,兩個STSs之間的gap則被甲基化修飾。然後,在有限制內切酶的作用下,兩個外端的STSs被酶切割,而中間的間隙則因甲基化而受到保護不被切斷,這樣就可選殖出完整的、介於兩個STSs之間的間隙,使兩個contig的數據可以連接起來。由此可見,contig中每個選殖株的插入片段愈長,則完成輿圖的效率會愈高。YAC是理想的載體,因為YAC最大的乘載量可達1000kb以上。可是,YAC也有其缺點,最大的問題是嵌合性(chimerism)。國際上最常用的兩個YAC基因庫,其嵌合率高達50%左右,這是因為在製備YAC基因庫時,人類基因組DNA經限制酶部份切割後,不同染色體的DNA短片段,或同條染色體上本來不是相互連接的DNA短片段,會因有相同的粘性末端而彼此連接成一個DNA長片段,進而選殖進YAC分子,這樣造成的嵌合片段,勢必大大干擾基因組輿圖和定序的準確性,影響基因的定位選殖(positional cloning)。因此,構築新一代的YAC基因庫,也是基因組研究的最基礎工作。
人類基因圖譜建構步驟綱要:
目前各個實驗室繪製染色體基因圖譜的五種方法:
1.
減數分裂的輿圖法:此乃透過遺傳重組,分析子代中性狀交換重組值來繪製遺傳連鎖圖。
2.
放射線雜合細胞法(radiation hybrid):利用放射線處理人類/齧齒動物雜合細胞,將雜合細胞中的人類染色體打成小片段,收集含有長度不等的人類染色體片段的雜合細胞株,用以確定基因或某個遺傳標記在該染色體上精確的位置,繪製出梁色體圖。
3.
原位雜合技術(in stiu hybridization):直接將基因或遺傳標記定位在染色體上。
4.
STS容量:篩選出更多個STS,排定它們彼此間排列次序,作為輿圖時的界標。
製作STS content mapping之步驟:
*
把染色體切割(例如利用限制酶),形成小片段DNA
*
利用適當的載體系統分離與純化各個小片段的DNA。載體系統(cloning system)方面,yeast artificial chromosome(YAC)為一個有力的載體工具,與細菌(Bacterial artificial chromosome;BAC)比較,其優點在於可以插入較大的DNA片段(大約100-1000 kb),所以非常適用於大範圍的基因圖譜建立。
*
利用landmark(為sequence tagged sites)對各片段DNA進行分析
*
利用landmark所分析出的結果,進行DNA片段相對位置的排列與建立基因圖譜。
STS content mapping的角色:
*
可以隨意的選取STS為固定位置的標地(landmark)
*
接近contig尾端的STS,可當作surrogate end,作為chromosome walking時的標地,繼而擴大contig
*
利用STS來篩選有重疊序列的YAC,進而建立基因圖譜
步驟一:
設定一個有興趣的區域,在此區域中,利用PCR技術產生特異性標誌序列點,再由標誌序列點去篩選YAC 基因庫,在步驟一中,篩選出含有PCR技術產生的STS的序列,收集後群組形成一個特異性YACs(specific YAC panel),而當一個個群組的特異性YAC逐漸被建立出時,偵測到含有先前STS的YAC機率增加,當此機率增加到一定的比例時,則進入步驟二。
步驟二:
每一個新偵測出的STS被用來篩選特異性YAC,如果為正反應,表示含有STS的YAC可用來組成contig與進行圖譜的建立;如果為負反應,則表示YAC library中的STS已經全被偵測出。
步驟三:
步驟一、二都是隨意設定區域進行chromosome walking,而步驟三目的在於(a)分離與鑑定任何有重疊序列而未被偵測的YAC clone(b)把有重疊序列的YAC進行相對位置的分析與延長contig的動作。結果分析方面:STS content mapping的初步結果可得知YAC基因庫是否含有STS序列、YAC基因庫的大小並可由這些資料推斷YAC的相對順序、STS序列間的距離。
5.
選殖株的指紋疊接(fingerprint clone contigs):將每個選殖株中的插入片段用微衛星DNA為探針,得到DNA 指紋圖,兩個選殖株的插入片段兩端的指紋圖如果重合,則這兩個插入片段可以連接起來。
以21號染色體為例,一個完整的染色體圖譜包含:
*
fluorescence in situ hybridization (Fish) position
*
Fish probe
*
YAC contigs
*
Marker order
*
Genetic maps
*
Radiation Hybrid Map
*
Hbrid bins
基因連鎖性圖譜(Genetic linkage map ):
Total Markers On Chromosome: 107
Region Displayed: 0.00-57.77 cM marsh
Markers Labeled: 20 Total Markers in Region: 107
002.gif (18002 個位元組)
物理(實距)圖譜(Physical map)
Total Markers On Chromosome: 156
Region Displayed: 0.00-1646.00 cR10000|st
Markers Labeled: 20 Total Markers in Region: 156
003.gif (19902 個位元組)
後語:基因組定序研究與基因組引發的省思
在2000年6月底國際人類基因體計劃所公佈的資料中,百分之97已經完成定序,而其中的百分之85也已重組連接好了。定序的工程非常浩大,用以往的生物技術來看此問題更是遠不可及。然而最近的電腦科技發展,資訊的傳輸方便,以往可能花上數天到幾個星期的資訊交換與訊息獲得,在今日網路的快速發展之下,數秒之內即可完成。身為生物醫學的研究者,這種感受更是深刻。當然定序的工作是由國際上數個國家同心協力完成的,包括法國、日本、德國、中國大陸、英國及美國的16個機構,各不同的實驗室負責不同的部分。以一天24小時一星期七天的方式,如接力賽跑的方式進行,並且保持百分之99.9的精確性。
定序重組完成的結果立即公諸於世,並且無條件的讓世界各機構自由取得此資訊,當然商業上生物科技公司也享有同等資源。當定序的資料有了,進一步要了解其意義,即在生物上的功能。比方說有10頁的密碼,翻開一看全都是1.2.3.4.5.6……9.0的數字組合。外行人無法了解其中意義,同時有些可能是無意義的密碼,但是有一些片段的數字組合就具有意義,具有意義的部分即是基因的單位了。因此定序出來的結果,研究人員就如同翻譯密碼的專業人員先唸出其所傳達的訊息,進而將其與實際生活疾病的產生連接在一起,以便根本了解遺傳疾病的原因。
美國官方主導的國際「人類基因體計劃」與美國民間「賽雷拉」公司,在2001年1月全球五大城市共同發佈他們解讀人類基因體的最新成果,而兩者含括人類基因體定序初稿與其解析的研究報告也將分別刊載於最新一期的「自然」(Nature)與「科學」(Science)雜誌。自認為是「好的一方」的「人類基因體計劃」科學家,為了對抗商業勢力支持的Celera,緊緊抱著「公開分享」這塊從事科學研究者應該堅持的基本原則,要求Celera公布其完成的人類基因體草圖。由於Celera為了省錢趕時間,的確參考了對方公開的序列資料,因此只好以合開記者會宣佈,將兩方的研究結果分別發表在兩大主流科學雜誌Nature和Science上。目前根據染色體一號的排序結果(人類染色體有22對加上X、 Y染色體,一號染色體最長),似乎以Celera提供的版本比較好,不過Celera公司以營利為目的,為了避免其他廠商佔便宜,Celera只提供資料庫給學術與非營利機構使用,並且禁止研究人員分析的結果公佈出去供大家使用,也就是說傳統生物學家還是得花錢向Celera公司購買分析的結果。這兩份研究報告雖然運用的方法不同,但結論大致相近,其中有幾項發現最受矚目:人類基因的數目遠少於以往科學界的預估(十萬個),大約只有三萬到四萬個,僅僅是果蠅、線蟲等低等生物的兩倍多。而且與老鼠比較,人類只有三百餘個基因是老鼠身上找不到的。「人類基因體計劃」的領導人柯林斯說:「這對我們人類的自尊是個打擊,不過這也顯示了人類的複雜性來自其他源頭,我們必須開始搜尋。」科學家推測,人類之所以能夠憑藉這麼少的基因就演化成這麼複雜的生物體,原因在於人類基因主導蛋白質合成的功能遠比其他生物高強,因此能夠以少勝多。科學家還發現,在人類的DNA中,只有1% 到1.5% 有主導人體合成蛋白質的指令;佔人類基因體大部份的「重複性DNA」,以往被科學界認定是毫無作用,但是新研究卻認為這些「垃圾」成份可能足以影響人類的演化,有必要深入研究。這些神秘的「重複性DNA」片段行徑有如寄生蟲,不時會改換它們在基因體中的位置,而且其中一種會連帶移動許多其他的DNA片段,因此可能有助於基因的重組與變異。 同時基因在DNA上的分佈也極不均勻,有些地方密集如城市,有些地方卻稀疏如荒漠,科學家對這種現象尚無法提出解釋。基因是了解人類演化過程的鎖鑰,「人類基因體計劃」的科學家發現,有二百廿餘個人類基因是演化中的不速之客,可能是在數百萬年前由某種細菌傳給人類的遠祖,這種說法如果進一步證實,將是演化學上一大突破。而且這些基因中至少有一個與憂鬱症相關,更引起科學家興趣。 有意思的是,男性身體產生可遺傳性基因突變的比例是女性的兩倍,這結果略低於醫學界先前的估計,但仍顯示男性對演化影響應高於女性,對於因遺傳突變而引發的病症,男性恐怕也要多負一些責任。
1991波斯灣戰爭時,美國商業部就抵制非美國盟邦取得建立在國際基因資料庫( the International Genome Database)中的電腦資料,理由是怕被對方用來發展生物戰用途。雖然NIH認為這樣的作法違背了HGP的宗旨--是純為科學與生物醫學技術的需要,但是說什麼都不能使美國商業部徹消禁令。緊接著,1991年中,NIH開始對其研究的基因序列申請專利權,這件事不僅在美國國內引起廣泛爭議,也引起國際的不滿,法國強調人類基因是不應被專利的,英國則是站在折衷立場主張如果所發現的基因功能是確定的可以申請專利,如該基因無可見的功能則不可申請專利。有關人類基因的專利權問題會是決定未來各國HGP是走向惡性競爭還是可以合作的關鍵,不得不注意其發展。HGP不可能再僅只是國際間科學社群的問題,還牽涉到跟私人企業密不可分的關係,要走向國際間科技交流也將更困難。HGP所造成的倫理、道德問題將更值得深思.
相關網站
http://vschool.scu.edu.tw/biology/
http://www.genome.org/
http://www.ncbi.nlm.nih.gov/SCIENCE96/
http://www.ncbi.nlm.nih.gov/PMGifs/Genomes/humansearch.html
http://www.ornl.gov/TechResources/Human_Genome/home.html
http://www.nature.com/ng/
http://www.nature.com/genomics/human/
http://www.sciencemag.org/content/vol291/issue5507/
參考文獻
1.
吳秀瑾。1997。人類基因組圖解計畫的倫理課題。國立中央大學哲學研究所應用倫理學區域會議,收入《倫理與生死:亞洲應用倫理學論集》。
2.
趙壽元。2000。生命科學新知:遺傳學與基因組研究。九州圖書文物有限公司。
3.
Robert Pollack, 楊玉齡譯,周成功審訂。1997。DNA語言。天下文化。
4.
Celera research group, 2001. The sequence of the Human Genome. Science 291:No 5507 p1304-1351
5.
David R Bentley and Ian Dunham, 1995. Mapping human chromosomes. Current opinion in genetics and development 5:328-334
6.
E Solomon and W F Bodmer, 1991. HGM 10 at Yale in 1989. Cytogenet cell genet 58:1 1152-2184
7.
Elke Jordan and Francis S.Collins, 1996. A march of genetic maps. Nature 380:111-112
8.
Eric D.Green and Philip Green, 1991. Sequence tagged site content mapping of human chromosomes: theoretical considerations and early experiences. PCR methods and applications 1:77-90.
9.
Gabor Gyapay et al, 1994. The 1993-1994 Généthon human genetic linkage map. Nature Genetics 7:246-249
10.
G.D.Schuler et al, 1996. A gene Map of the Human Genome. Science 207:540-546
11.
International human genome sequencing consortium, 2001. Initial sequencing and analysis of the human genome. Nature 409:824-955
12.
John H Edwards, 1994. Comparative genome mapping in mammals. Current opinion in genetics and development 4:861-867
13.
Louise Sefton and Peter N.Goodfellow, 1992. The human genetic map. Current opinion in genetics and development 2:387-392
14.
Leslie Roberts, R. John Davenport, Elizabeth Pennisi, and Eliot Marshall, 2001. A History of the Human Genome Project. Science Feb 9: 1195-1206
15.
P. Deloukas et al, 1998. A physical map of 30,000 human genes. Science 282:744-746
16.
Wilkie Tom Perilous Knowledge:the human genome project and its implications, 1993.Chapter 5 The Human Genome Project Berkeley : University of California Press UP, p73-96
17.
Ya-ping Yang and James E.Womack, 1998. Parallel radiation hybrid mapping: a powerful tool for high-resolution genomic comparison. Genome research 8:731-736