關(guān)于我們
經(jīng)典重讀丨Xenobiotica代謝組學(xué)開山之作
1999年,來自英國帝國理工學(xué)院的J.K. Nicholson教授在Xenobiotica雜志上發(fā)表了一篇綜述性文章,文章標(biāo)題是“'Metabonomics': understanding the metabolic responses of living systems to pathophysiological stimuli via multivariate statistical analysis of biological NMR spectroscopic data”,對其實(shí)驗(yàn)室多年來應(yīng)用磁共振(NMR)方法研究藥物毒性的成果進(jìn)行總結(jié)和展望,首次提出了代謝組學(xué)(Metabonomics)的概念。
經(jīng)過20多年的發(fā)展,隨著檢測技術(shù)的發(fā)展、分析儀器和軟件性能的不斷提升,代謝組學(xué)被廣泛地應(yīng)用于生物醫(yī)學(xué)研究,逐漸成為當(dāng)代生命醫(yī)學(xué)研究中非常重要的技術(shù)方法。Jeremy Nicholson教授因其建立了系統(tǒng)的代謝組學(xué)研究方法,開辟了全新的研究領(lǐng)域,當(dāng)選英國皇家醫(yī)學(xué)科學(xué)院院士,更是著作等身獲獎無數(shù),在國際上享有"代謝組學(xué)之父"的稱號。而這篇文章,更是達(dá)到了驚人4547次(截止日期:2022.06.09,數(shù)據(jù)來源google學(xué)術(shù)),成為代謝組學(xué)領(lǐng)域必引文獻(xiàn)。今天,筆者帶大家重新回顧一下見證代謝組學(xué)誕生的這篇經(jīng)典論文。
![]() |
引言
隨著基于組合文庫合成方案的應(yīng)用,藥物研發(fā)的快速發(fā)展給藥物安全性評估過程帶來了巨大壓力。一旦有潛力的藥物已經(jīng)通過了初步生物篩選,需要在后續(xù)的研發(fā)流程中盡量降低候選藥物的淘汰率。因此,發(fā)展新的兼顧有效性與安全性的分析技術(shù)將極大提高藥物篩選的效率,從而有效降低淘汰率。目前的生物分析方法主要包括測量生命系統(tǒng)在遺傳水平或者細(xì)胞蛋白表達(dá)水平對藥物的反應(yīng),即所謂的基因組學(xué)和蛋白質(zhì)組學(xué)方法。雖然現(xiàn)階段基因組學(xué)和蛋白質(zhì)組學(xué)方法價格昂貴且費(fèi)時費(fèi)力,但仍然是研究生物體對外源性化合物多層次應(yīng)答的潛在有利工具。但是,即使整合基因組學(xué)和蛋白質(zhì)組學(xué)仍然不能為理解生命體整體的細(xì)胞功能提供足夠的信息,因?yàn)槎卟⒉话ㄉw的動態(tài)代謝特征。因此,基于磁共振(NMR)的代謝組學(xué)方法的提出可以豐富和補(bǔ)充從遺傳學(xué)和蛋白質(zhì)組學(xué)層面所提供的有關(guān)生命體對外源化合物應(yīng)答的信息。代謝組學(xué)(metabonomics)定義為“生命系統(tǒng)對病理生理刺激或者遺傳改變的多參數(shù)動態(tài)代謝應(yīng)答的定量測量”。這一概念的提出主要是基于過去二十多年來應(yīng)用1H-NMR譜來研究生物體液、細(xì)胞和組織代謝物組成的相關(guān)研究(比如以下一些參考文獻(xiàn):Nicholson et al. 1983, 1985, Bales et al. 1984, Gartland et al. 1989, Nicholson and Wilson 1989, Moka et al. 1998)。另外,代謝組學(xué)研究中還使用模式識別(pattern recognition)、專家系統(tǒng)分析(expert system analysis)和相關(guān)的生物信息學(xué)工具來對復(fù)雜的基于NMR的代謝數(shù)據(jù)集進(jìn)行解釋和分類(Gartlandet al. 1991, Holmeset al. 1992, 1994, 1998a, b, Anthonyet al. 1994, Spraulet al. 1997, Beckwith-Hallet al. 1998)。代謝組學(xué)在代謝調(diào)控分析以及其他研究領(lǐng)域也有重要應(yīng)用價值(Kacser and Burns 1973, Kacser 1993, Goodacreet al. 1996),需要說明的是有另外一個與代謝組學(xué)相關(guān)的概念,稱為“代謝物組/metabolome”,其代表一個細(xì)胞內(nèi)的全部小分子代謝物。相比之下,代謝組學(xué)側(cè)重于檢測、鑒定、定量和分類在整合生物系統(tǒng)中而不是單個細(xì)胞中代謝改變的動態(tài)變化過程。如此多維度的代謝軌跡才能真正反映在病理生理過程中正在發(fā)生的生物事件。在此,我們對基于NMR的代謝組學(xué)數(shù)據(jù)特點(diǎn)、毒理學(xué)分類和體內(nèi)生物標(biāo)志物的鑒定等方面的應(yīng)用進(jìn)行簡要介紹。
藥物毒性評估的基因組學(xué)和蛋白質(zhì)組學(xué)方法
新的結(jié)構(gòu)分子生物學(xué)工具的發(fā)展已經(jīng)使得我們能更加深入地了解基因組的構(gòu)成。隨著基因測序和鑒定能力的提高,目前超過20種原核生物和線蟲的全基因組測序已經(jīng)完成。人類基因組包括大約8萬個基因在未來幾年內(nèi)測序也會全部完成!盎蚪M學(xué)”(genomics)已成為分子生物學(xué)發(fā)生質(zhì)變的重要概念之一,其本質(zhì)是一種測量基因表達(dá)的半定量方法,這種方法在藥物發(fā)現(xiàn)和毒理學(xué)評估中可以檢測藥物暴露后基因表達(dá)的變化。
目前應(yīng)用比較廣泛的基因芯片(gene chips)技術(shù)雖然價格昂貴,但是可以快速檢測外源化合物暴露后很多基因表達(dá)的改變。然而基因表達(dá)與功能基因組學(xué)的關(guān)系仍然不是十分清楚,即使人類全基因組測序完成后仍然有很長的路要走,因?yàn)橛写罅康姆蔷幋aDNA,復(fù)雜的基因之間以及基因和非編碼DNA之間的相互作用。由于我們對基因表達(dá)變化所導(dǎo)致的生物功能變化還知之甚少,蛋白質(zhì)組學(xué)(proteomics)應(yīng)運(yùn)而生。蛋白質(zhì)組學(xué)研究主要半定量分析細(xì)胞蛋白對藥物暴露和其他病理生理過程的響應(yīng)(Anderson et al. 1996, Aicher et al. 1998, Geisow 1998)。多種方法可以用于蛋白質(zhì)組分析,但是都需要將蛋白分離(比如二維膠電泳)和化學(xué)鑒定方法(主要是質(zhì)譜)相結(jié)合。雖然蛋白質(zhì)組學(xué)方法比基因組學(xué)方法成本要低,但是現(xiàn)階段仍費(fèi)時耗力。更為重要的是,雖然基因組學(xué)和蛋白質(zhì)組學(xué)研究最后可能為毒理學(xué)機(jī)制研究提供新的見解,為新的潛在疾病生物標(biāo)志物的發(fā)現(xiàn)提供幫助,但是現(xiàn)階段將基因組和蛋白質(zhì)組的研究發(fā)現(xiàn)直接和毒性分類指數(shù)相聯(lián)系還十分困難。一個簡單的原因就是現(xiàn)有的方法和技術(shù)并沒有測量藥物暴露后詳細(xì)的隨時間變化和多器官系統(tǒng)的反應(yīng),這對通過代謝改變來評價化合物的毒性來說至關(guān)重要,尤其當(dāng)化合物的初級代謝發(fā)生在靶器官以外的其他位置時。比如一類化合物會在肝臟內(nèi)形成谷胱甘肽的共軛化合物,接下來被β-裂解酶處理后生成活性中間體,而活性中間體最后的毒性靶器官是近端腎小管(Elfarraet al. 1986)。因此,發(fā)展新的方法可以對在體內(nèi)、多器官的整體功能實(shí)時檢測非常有必要;贜MR的代謝組學(xué)方法恰好可以滿足上述需求。
基于NMR的代謝組學(xué)
外源化合物可以與組織和細(xì)胞外成分發(fā)生復(fù)雜的相互作用,從基因表達(dá)到蛋白翻譯甚至整個細(xì)胞的生化調(diào)控。在這種情況下,生物分子的組成會在多水平發(fā)生可以檢測到的變化,“生物組/bionomics”是對所有這些變化的完整描述。有很多藥物通過直接與遺傳物質(zhì)相互作用或者誘導(dǎo)藥物代謝酶的合成產(chǎn)生毒性產(chǎn)物來發(fā)揮其毒性作用。在這種情況下,基因組和蛋白質(zhì)組研究對藥物毒性評估是有幫助的。但是,外源化合物可以只在藥理水平發(fā)揮作用,并不影響基因的調(diào)控和表達(dá),顯著的毒理效應(yīng)也可能與基因表達(dá)和蛋白質(zhì)合成完全不相關(guān)。
飲酒可以在體內(nèi)啟動很多基因的表達(dá),但是這并不能解釋醉酒的原因。因此,在很多時候只考慮基因組和蛋白質(zhì)組變化并不能有效地預(yù)測藥物的毒性。但是所有藥物誘導(dǎo)的病理生理紊亂可以導(dǎo)致內(nèi)源性生化分子物質(zhì)比例、濃度、結(jié)合力和通量失衡。如果失衡的強(qiáng)調(diào)足夠大,毒性效應(yīng)就會影響整個生命體的正常功能。代謝物在體液與細(xì)胞和組織內(nèi)保持動態(tài)平衡,當(dāng)有毒物質(zhì)或者代謝刺激導(dǎo)致生命體組織內(nèi)細(xì)胞過程異常時,就會影響生物體液的構(gòu)成比例。在含有多種潛在干擾物的復(fù)雜基質(zhì)中檢測痕量的分析物是所有分析方法都會遇到的難題。因此,在生物樣品中,比如血液、血漿、尿液、膽汁或器官樣品,針對感興趣的特定類型的分析物選擇合適的分析方法至關(guān)重要。高分辨率1H-NMR波譜技術(shù)用于研究體液成分異常就非常合適,因?yàn)樗梢圆挥米鰳悠贩蛛x,不用做預(yù)判就可以同時定量多種代謝物。其他技術(shù)比如質(zhì)譜也可以用于產(chǎn)生代謝數(shù)據(jù),但是復(fù)雜樣品中不同物質(zhì)離子化效率的差異會影響檢測和定量的準(zhǔn)確性。NMR波譜還可以用于有效地篩選組織提取物和細(xì)胞懸液的代謝物輪廓異常。同時也有研究已經(jīng)成功使用高分辨率魔角旋轉(zhuǎn)1H-NMR波譜技術(shù)研究完整組織(intact tissue)的代謝物組成(Moka et al, 1998)。
Figure 1.大鼠尿液的600 MHz1H-NMR譜圖。
1H-NMR波譜技術(shù)檢測內(nèi)源性代謝物在體液內(nèi)的精確分布模式受毒素類型和受試動物影響很大(Nicholsonet al. 1983, 1985, Baleset al. 1984, Gartlandet al. 1989, Nicholson and Wilson 1989)。不同類型的毒素會對體液中內(nèi)源性代謝物的濃度和組成比產(chǎn)生特異性改變,這可以為研究毒理過程發(fā)生位置和基本機(jī)制提供信息。圖一中所示的為有代表性的毒素處理后的大鼠尿液譜圖。從生物分析方面考慮,產(chǎn)生這樣的信息是非常高效的,每個樣品只需要幾分鐘,不需要或只需要非常少的樣品前處理。對照組的譜圖看起來非常相似,但是不同毒素導(dǎo)致的代謝變化是不同的。因?yàn)閹缀跛写箢惖拇x中間產(chǎn)物都有特異性的NMR譜圖,所以該技術(shù)對指紋識別毒素導(dǎo)致的代謝紊亂非常有幫助。
因此,生物體液的1H-NMR波譜分析已經(jīng)成功在大鼠研究中揭示了大量的器官特異性的代謝生物標(biāo)志物,NMR作為分析生物化學(xué)技術(shù)在探索性方面表現(xiàn)卓越。比如氧化三甲胺、二甲基甘氨酸、二甲胺和琥珀酸可以提示腎乳頭損傷,而在之前并沒有有關(guān)腎乳頭損傷的生化標(biāo)志物(Gartland et al. 1989, 1991)。其他通過1H-NMR揭示的尿液標(biāo)志物包括;撬岷图∷岱謩e與急性肝損傷和睪丸毒性相關(guān)(Nicholsonet al. 1989,Grayet al. 1990, Saninset al. 1990)。相似的方法還包括二維磁共振譜。生物體液NMR譜圖中的生物標(biāo)志物信息遠(yuǎn)比上述的要微妙和豐富,因?yàn)閿?shù)以百計(jì)的化合物代表的很多代謝途徑可以同時被測量,其代表對毒性刺激的整體代謝組學(xué)反應(yīng),可以更好的刻畫病變特征。研究這些復(fù)雜的多參數(shù)數(shù)據(jù)最有效的方法就是將一維和二維NMR譜與模式識別方法相結(jié)合。
NMR代謝組學(xué)數(shù)據(jù)的模式識別和專家系統(tǒng)分析
組織和生物體液一維和二維NMR譜的復(fù)雜性是理解其中生化信息的一個限制性因素,即使生物體液的一維1H-NMR譜圖(600MHz或者更高場強(qiáng))就包含幾千個信號。在研究中一個樣品的NMR譜圖可以被看作是多維的物體,每一個維度代表不同代謝物的濃度(也可以稱為譜峰強(qiáng)調(diào)的分布)。因此,組織和生物體液的NMR譜圖可以提供生命體的多維代謝指紋信息,并且由于疾病和毒性過程的不同代謝輪廓會有特異性的變化;诖,計(jì)算機(jī)輔助的模式識別和專家分析系統(tǒng)已經(jīng)成功被用于解釋在多種毒理學(xué)實(shí)驗(yàn)狀態(tài)下獲得的NMR數(shù)據(jù)(Gartlandet al. 1991, Holmeset al. 1992, 1994, 1998a, b, Anthonyet al. 1994, Spraulet al. 1997, Beckwith-Hallet al. 1998)。這些統(tǒng)計(jì)學(xué)工具與目前在基因組學(xué)和蛋白質(zhì)組學(xué)研究中使用的方法非常相似。最簡單的方法就是將NMR信號強(qiáng)度數(shù)據(jù)看作代謝物濃度或者分泌速率的多樣品矩陣。現(xiàn)階段沒有必要進(jìn)行譜圖歸屬,因?yàn)橹皇菍⑺鳛榻y(tǒng)計(jì)對象來處理。
模式識別通常是指在數(shù)學(xué)上減低多參數(shù)維度來進(jìn)行科學(xué)假設(shè)和假設(shè)檢驗(yàn)的一種數(shù)據(jù)分析方法,主成份分析就是其中最簡單的一種。主成份是由多個原始變量經(jīng)過加權(quán)后進(jìn)行線性組合生成的新的變量。主成份有如下特征:(1)每個主成份之間相互正交;(2)第一主成份包含最多的數(shù)據(jù)方差信息,其它依次遞減。因此,前兩個或者三個主成份就代表了數(shù)據(jù)中所含的主要的生化信息的改變,這樣的主成份圖可以用于藥物和毒素在不同器官中根據(jù)其毒理學(xué)機(jī)制聚類分析的可視化(Nicholson and Wilson 1989, Gartlandet al. 1991)。主成份分析不需要提前對樣品進(jìn)行分組,是一種非監(jiān)督的分析方法,有時候聚類信息也可能在較小的主成份中體現(xiàn)。使用這種簡單的代謝組學(xué)方法我們可以將來自于未知毒性化合物處理后的動物樣品與NMR產(chǎn)生的代謝數(shù)據(jù)進(jìn)行比較,進(jìn)而確定它在模式識別圖中的相似擬合度(Holmeset al. 1998a, b)。
Figure 2. (a)不同毒素處理后的大鼠尿液譜圖主成份分析得分圖。(b) Cooman殘差圖
然而在真實(shí)情況下,毒理學(xué)數(shù)據(jù)會更為復(fù)雜,因?yàn)椴∽兊陌l(fā)展和自愈過程是實(shí)時變化的。因此,NMR檢測的代謝輪廓是隨時間變化的(Holmeset al. 1992, Beckwith-Hallet al. 1998)。另外,在原始多維NMR代謝組空間比較外源化合物的效應(yīng)會更為嚴(yán)格。作為一種可選和自動化毒性分類方法,NMR數(shù)據(jù)的監(jiān)督分析已經(jīng)被證明是有效的。監(jiān)督模式下的數(shù)據(jù)分析,首先使用NMR代謝組學(xué)數(shù)據(jù)(稱為訓(xùn)練集/training set)來構(gòu)建一個數(shù)學(xué)模型可以準(zhǔn)確預(yù)測每個樣品的分類。接下來使用獨(dú)立數(shù)據(jù)對根據(jù)訓(xùn)練集所建的計(jì)算模型的預(yù)測能力進(jìn)行檢驗(yàn)。這些模型也被人們稱為專家系統(tǒng),它們可以包括不同的數(shù)學(xué)程序,比如主成份、人工神經(jīng)網(wǎng)絡(luò)和規(guī)則歸納法等。所有情況下這些方法都允許定量描述多變量邊界用以區(qū)分不同外源化合物的代謝效應(yīng)。某些監(jiān)督分析方法,比如SIMICA可以估算擬合相似性的可信度,使用類似的方法可以將樣品歸屬為某一特定類型、多種類型的毒性或者不分類。
目前我們研究組構(gòu)建的代謝組學(xué)專家系統(tǒng)主要具備以下三個不同水平的病理生理特征:
1)根據(jù)使用對照組數(shù)據(jù)建立起來的代謝組標(biāo)準(zhǔn)對樣品進(jìn)行二元分類(正常和異常)。
2)根據(jù)毒性和組織內(nèi)發(fā)揮毒性的位置對靶器官進(jìn)行分類。
3)鑒定所研究化合物毒理效應(yīng)的生物標(biāo)志物和毒性機(jī)制分類。
非常有趣的是,這些水平的分類也適用于基因組學(xué)和蛋白質(zhì)組學(xué)研究,甚至臨床診斷篩選過程。隨著毒理學(xué)數(shù)據(jù)庫數(shù)量的不斷增長以及快速高通量NMR采樣技術(shù)的提高,有必要采用像“模糊邏輯”類似的方法建立更精妙的專家系統(tǒng),以滿足分組之間邊界決定更好的靈活性要求。上述代謝組學(xué)方法使開發(fā)專家系統(tǒng)原型用于在第一和第二水平對一系列毒理學(xué)終點(diǎn)事件和靶器官進(jìn)行分類成為可能。第三水平的分類會有更為復(fù)雜的問題,具體的生物標(biāo)志物信息可以從主成份載荷圖中獲。℉olmeset al. 1998b)。
總而言之,大量的生化、毒理學(xué)和臨床化學(xué)問題可以使用高分辨率1H-NMR波譜技術(shù)分析生物樣品來解決。目前簡單的生物體液1H-NMR實(shí)驗(yàn)就可以為整個生命體的生化過程和毒理學(xué)生物標(biāo)志物的種屬差異提供意想不到的見解。隨著儀器設(shè)備和技術(shù)的發(fā)展,代謝組學(xué)的應(yīng)用越來越廣泛。計(jì)算機(jī)輔助的模式識別和專家系統(tǒng)數(shù)據(jù)分析對促進(jìn)基于NMR的代謝研究起到了至關(guān)重要的作用。代謝組學(xué)研究適用的其他重要領(lǐng)域包括基因修飾導(dǎo)致的生化改變、環(huán)境污染物的影響、藥物治療和效果的臨床評估和特異質(zhì)毒性等。最后,可以預(yù)見在不久的將來,可以整合基因組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)數(shù)據(jù)形成更全面的生物組系統(tǒng)來整體評價體內(nèi)功能紊亂。
筆者注釋
在科學(xué)實(shí)驗(yàn)研究中,大家通常把大規(guī)模檢測生物樣品中的多種代謝物水平的研究都稱為代謝組學(xué)研究。也有人把代謝組學(xué)分為非靶向代謝組學(xué)、靶向代謝組學(xué)及擬靶向代謝組學(xué)等,這些概念對理解檢測分析方法的異同點(diǎn)會有幫助,但是其本身對科學(xué)研究的貢獻(xiàn)其實(shí)并沒有本質(zhì)區(qū)別。研究人員可以根據(jù)具體的實(shí)驗(yàn)?zāi)康撵`活選擇。筆者更傾向于將代謝組學(xué)理解為結(jié)合儀器分析和化學(xué)計(jì)量學(xué)方法來同時研究多個小分子代謝物在生物樣品中實(shí)時變化水平的方法技術(shù)學(xué)科。