王瓊萍 上海交通大學(xué)
長久以來,分子生物學(xué)的研究都是以單基因為研究對象,而這種研究方法往往是基于一定的先驗知識。如上所述,生物體是以一個整體存在,生命現(xiàn)象的發(fā)生和發(fā)展都存在一定的關(guān)聯(lián)性。基于單基因的研究并不能闡釋生物體內(nèi)部的相互作用以及相互間的調(diào)控關(guān)系。系統(tǒng)生物學(xué)的涌現(xiàn)為解決細(xì)胞信號傳導(dǎo)和基因調(diào)控網(wǎng)路、生物系統(tǒng)組成之間相互關(guān)系的結(jié)構(gòu)和系統(tǒng)功能提供了新的理論支持。KEGG以及 BIOCART是目前運(yùn)用得比較廣泛也是相對比較全面的關(guān)于通路的數(shù)據(jù)庫。
KEGG (Kyoto Encyclopedia of Genes and Genomes)數(shù)據(jù)庫是由日本京都大學(xué)生物信息中心開發(fā)的,是一個在網(wǎng)絡(luò)水平和分子水平系統(tǒng)研究基因功能的數(shù)據(jù)庫。KEGG 數(shù)據(jù)庫的主要組成部分是各種調(diào)控通路的圖表。KEGG 數(shù)據(jù)庫主要以通路的形式儲存關(guān)于基因組,生物化學(xué)、分子以及細(xì)胞生物學(xué)的一些研究,并且體現(xiàn)在分子水平或者基因水平的調(diào)控關(guān)系。另外,KEGG 也儲存了大量物種的基因目錄以及全基因組序列信息。更重要的是,KEGG 數(shù)據(jù)庫除了提供一些數(shù)據(jù)信息外,也提供一些計算軟件,例如利用全基因組序列進(jìn)行生物學(xué)通路的重新組建和通過表達(dá)譜信息預(yù)測基因調(diào)控網(wǎng)絡(luò)。這個數(shù)據(jù)庫每日更新并且是開源的。
根據(jù) KEGG 以網(wǎng)絡(luò)形式提供的生物學(xué)通路,可以從中獲得各個基因間的上下游調(diào)控關(guān)系,基因的在各物種的同源信息、位置信息,通路的基因數(shù)信息、文章發(fā)表信息等。KEGG 中代謝通路占了很大一部分。Biocarta主要是一個為生命科學(xué)服務(wù)的在線資源,主要可以分為三個部分:基因功能、蛋白質(zhì)生物學(xué)通路、反應(yīng)試劑互變。Biocarta 的主要特點(diǎn)在于它是一個開源的在線平臺,科研工作者可以在線上自主交流,自行繪制所涉及的通路。在 Biocarta的通路頁面,基因間的相互關(guān)系也以生動的圖表表示出來。與 KEGG 不同的是,Biocarta 以信號轉(zhuǎn)導(dǎo)通路占主要部分。
生物芯片數(shù)據(jù)分析應(yīng)用離不開高速發(fā)展的計算軟件。目前應(yīng)用較多的主要有運(yùn)行于 R環(huán)境的 bioconductor、由法國國家信息和自動化研究院的科學(xué)家們開發(fā)的 Scilab 以及由美國MathWorks 公司出品的 Matlab。
Bioconductor 項目是為計算生物學(xué)和生物信息學(xué)的計算而開發(fā)的。目前,這個項目已經(jīng)有 516 個軟件包(R packages)。通過編輯 R 語言,可以很方便地進(jìn)行芯片數(shù)據(jù)的分析。如Affy 包是用于 Affymetrix 寡核苷酸芯片分析的數(shù)據(jù)包,分析探針?biāo)降臄?shù)據(jù)。Category包結(jié)合其他如 KEGG.db 等可以分析出基因間表達(dá)中的互相協(xié)調(diào)關(guān)系而不是一般簡單的基因集分析;Annotate 則是實(shí)現(xiàn)基因功能的注釋;Cluster 以及 Class 數(shù)據(jù)包可以進(jìn)行聚類。另外,在 R 語言環(huán)境下,還可以作直方圖、散點(diǎn)圖、盒圖等。MATLAB 是一種用于算法開發(fā)、數(shù)據(jù)分析、數(shù)據(jù)可視化以及數(shù)值計算的高級技術(shù)計算語言和交互式環(huán)境,它提供了強(qiáng)大的矩陣處理和繪圖功能,利用其軟件包可以方便地調(diào)用其中的函數(shù)完成芯片的聚類分析,并且可以從層級聚類結(jié)果中生成熱圖和樹狀圖,也可以根據(jù)個人需要編寫新的程序。與 MATLAB 類似,SCILAB 也是計算工具軟件,其中集合了數(shù)以百計的數(shù)學(xué)函數(shù)、高級程序語言和 2-維、3-維圖形高級數(shù)據(jù)結(jié)構(gòu)及用戶自定義數(shù)據(jù)類型。另外,SCILAB 提供的語言轉(zhuǎn)換函數(shù)可以自動將用 MATLAB 語言編寫的程序翻譯為 SCILAB 語言,實(shí)現(xiàn)了與 MATLAB 的交互使用。
