系統生物學
系統生物學
研究生物系統組成成分的構成與相互關係的結構、動態與發生,以系統論和實驗、計算方法整合研究為特徵的生物學。20世紀中葉貝塔朗菲定義“機體生物學”的“機體”為“整體”或“系統”概念,並闡述以開放系統論研究生物學的理論、數學模型與應用計算機方法等。系統生物學不同於以往僅僅關心個別的基因和蛋白質的分子生物學,在於研究細胞信號傳導和基因調控網路、生物系統組成之間相互關係的結構和系統功能的湧現。
systems biology(貝塔郎菲稱為“有機生物學”,不同於“systematic biology”生物系統學-過去也譯為系統生物學)
“系統生物學” (systems biology)一詞在美國NIH的PubMed文獻庫最早可檢索到Zieglgansberger W和Tolle TR於1993年發表的一篇神經系統疾病研究的論文摘要中,根據1968年國際系統理論與生物學(systems theory and biology)會議上Mesarovic D.提出systems biology辭彙(術語)的定義為採用系統論方法研究生物學,1989年在美國召開的生物化學系統論與生物數學國際會議探討了生物學的系統論與計算生物學模型研究。
系統理論和系統思想對於中國知識分子並不陌生,1980 年代在中國學術界曾經流行過“三論”——系統論、資訊理論和控制論與系統科學。美籍奧地利科學家貝塔朗菲(L. Bertalanffy) 在1970年代創立的“一般系統論”(general system theory),儘管貝塔朗菲是以生物學家的身份思考、研究,並不僅適用於生命科學,而且廣泛應用於物理學、心理學、經濟學和社會科學等各門學科;因而,過去所談論的主要是在理論生物學層面上和普適性強的一般系統論,本文所要介紹的系統生物學(systems biology),則是生命科學研究領域的一門組學、計算和轉基因系統生物技術等成熟的迅速發展學科。1924~1928年貝塔郎菲多次發表系統論的文章,闡述生物學中有機體概念,提出把有機體當作一個整體或系統來研究,1950年發表生物學與物理學中的系統論和1952年發表抗體系統論等開創了系統生物學,第10屆國際分子系統生物學會議稱貝塔郎菲為第一個系統生物學家(理論層面),貝塔郎菲開創的系統生物學模型至今仍然很現代。自20世紀60年代系統生物學概念和辭彙的提出和60-80年代系統生態學、系統生理學的進展,90年代系統生物醫學、系統醫學、系統生物工程與系統遺傳學的概念發表,20世紀未細胞信號傳導與基因調控的研究與系統論方法的結合,進入了分子細胞層次的系統生物學(實驗與理論結合)研究與發展時期。
作為人類基因組計劃的發起人之一,美國科學家萊諾伊·胡德(Leroy Hood)也是組學(omics)生物技術開創者之一、在胡德看來,系統生物學的重新提出和人類基因組計劃有著密切的關係。正是在基因組學、蛋白質組學等新型大科學發展的基礎上,孕育了系統生物學的高通量生物技術和生物信息技術。反之,系統生物學的誕生進一步提升了后基因組時代的生命科學研究能力。1996年在北京舉辦的第1屆國際轉基因動物學術研討會,中科院曾邦哲(曾傑)闡述了系統論與生物遺傳學、轉基因研究等,1999年元月於德國建立了系統生物科學與工程網(英文),表述生物系統結構論(structurity theory)的結構整合(integrative)、調適穩態(stability)與層級建構(constructive) 等綜合(synthetic)系統理論規律,並定義實驗、計算系統研究,同系統科學、計算機科學、納米科學和生物醫學、生物工程等領域國際科學家廣泛通訊,倡導分子生物技術和計算機科學-實驗生物學家與計算生物學家結合研究生物系統,喚起了一大批生物學研究領域以外的專家的關注。
正如1994年曾傑(曾邦哲)“論系統生物工程範疇”等表述的21世紀將進入“系統生命科學與生物工程的時代”,1999-2000年系統生物學與工程(合成生物學)領域論文大量湧現。也如胡德所說,“系統生物學將是21世紀醫學和生物學的核心驅動力”,基於這一信念,在系統生物學已經就要成為新的學術潮流時,1992年建立華盛頓大學分子生物技術系的胡德,在1999年年底辭去了美國西雅圖市華盛頓大學的教職,與另外兩名志同道合的科學家一起2000年創立了世界上第一個系統生物學研究所(Institute for Systems Biology)。與此同時或1999年更早的中期不少科學家開始了論述,2000年日本舉辦了國際系統生物學會議,2000年美國E. Kool重新提出合成生物學-基於系統生物學的基因工程。隨後,系統生物學便逐漸重新得到了生物科學界的認同。2002年03月,美國《科學》周刊登載了系統生物學專集,該專集導論中的第一句話這樣寫道:“如果對當前流行的、時髦的關鍵詞進行一番分析,那麼人們會發現,‘系統’高居在排行榜上。”
系統生物學的基本工作流程有這樣四個階段。首先是對選定的某一生物系統的所有組分進行了解和確定,描繪出該系統的結構,包括基因相互作用網路和代謝途徑,以及細胞內和細胞間的作用機理,以此構造出一個初步的系統模型。第二步是系統地改變被研究對象的內部組成成分(如基因突變)或外部生長條件,然後觀測在這些情況下系統組分或結構所發生的相應變化,包括基因表達、蛋白質表達和相互作用、代謝途徑等的變化,並把得到的有關信息進行整合。第三步是把通過實驗得到的數據與根據模型預測的情況進行比較,並對初始模型進行修訂。第四階段是根據修正後的模型的預測或假設,設定和實施新的改變系統狀態的實驗,重複第二步和第三步,不斷地通過實驗數據對模型進行修訂和精練。第一到第三階段,也就是以下的“整合”-系統理論、“干涉”-實驗生物學和“信息”-計算生物學等研究,即系統論和實驗(experimental)、計算(computational)方法整合的系統生物學概念,目標就是要得到一個理想的模型,使其理論預測能夠反映出生物系統的真實性。
——整合
作為後基因組時代的新秀,系統生物學與基因組學、蛋白質組學等各種“組學”的不同之處在於,它是一種整合型大科學。首先,它要把系統內不同性質的構成要素(基因、mRNA、蛋白質、生物小分子等)整合在一起進行研究。系統生物學研究所的第一篇研究論文,就是整合酵母的基因組分析和蛋白質組分析,研究酵母的代謝網路[2]。由於不同生物分子的研究難度不一樣,技術發展程度不一樣,對它們的研究水平有較大的差距。例如,基因組和基因表達方面的研究已經比較完善,而蛋白質研究就較為困難,至於涉及生物小分子的代謝組分的研究就更不成熟。因此,要真正實現這種整合還有很長的路要走。
對於多細胞生物而言,系統生物學要實現從基因到細胞、到組織、到個體的各個層次的整合。《科學》周刊系統生物學專集中一篇題為“心臟的模型化——從基因到細胞、到整個器官”的論文,很好地體現了這種整合性[3]。我們知道,系統科學的核心思想是:“整體大於部分之和”;系統特性是不同組成部分、不同層次間相互作用而“湧現”的新性質;對組成部分或低層次的分析並不能真正地預測高層次的行為。如何通過研究和整合去發現和理解湧現的系統性質,是系統生物學面臨的一個帶根本性的挑戰。
系統生物學整合性的第三層含義是指研究思路和方法的整合。經典的分子生物學研究是一種垂直型的研究,即採用多種手段研究個別的基因和蛋白質。首先是在DNA水平上尋找特定的基因,然後通過基因突變、基因剔除等手段研究基因的功能;在基因研究的基礎上,研究蛋白質的空間結構,蛋白質的修飾以及蛋白質間的相互作用等等。基因組學、蛋白質組學和其他各種“組學”則是水平型研究,即以單一的手段同時研究成千上萬個基因或蛋白質。而系統生物學的特點,則是要把水平型研究和垂直型研究整合起來,成為一種“三維”的研究。此外,系統生物學還是典型的多學科交叉研究,它需要生命科學、信息科學、數學、計算機科學等各種學科的共同參與。
系統生物學的整合性可以體現在兩種不同的策略上。第一種就是切奇(Church)和後來胡德(Hood)的系統生物學研究所採用的方式,選定一個較為簡單的系統,如單細胞生物酵母,然後分析儘可能多的構成成分——基因組、轉錄組、蛋白質組、相互作用組,以揭示整個系統的行為。另外一種策略是吉爾曼(A. G. Gilman)領導的“信號轉導聯軍”採用的,以一個較為複雜的系統(G 蛋白介導的和與其相關的細胞信號轉導系統)為研究對象,採用儘可能多的研究手段去進行分析。
——信息
在前分子生物學時代,生物學家把生命視為具有特殊“活力”的有機體,遵循著無機界不存在的法則進行生命活動。在分子生物學時代,研究者們把生命視為一架精密的機器,由基因和蛋白質根據物理、化學的規律來運轉。系統科學和非平衡熱物理學,將生命是開放和能量耗散的信息化過程,控制論研究生物通訊與調控作信息系統,艾根提出生物信息進化的分子超循環理論,在後基因組時代,功能基因組學研究細胞信號與基因調控等信息的分子相互作用網路等,像胡德這種類型的科學家,也把生命視為信息的載體,一切特性都可以從信息的流動中得到實現。
胡德提出,應該把生物學視為一門信息科學,也就是生物信息學與計算生物學。這個觀點包含有三層意思。首先,生物學研究的核心——基因組,是數字化的(digital)。生物學與所有其他學科,如物理學、化學、地理學,是完全不一樣的科學,因為生物學以外的學科都只能通過類比的方式(analog)進行分析。既然生物學研究的核心是數字化的,因此生物學可以被完全破譯。從理論上說,我們對生物學的把握應該超過其他任何一門學科。其次,生命的數字化核心表現為兩大類型的信息,第一類信息是指編碼蛋白質的基因,第二類信息是指控制基因行為的調控網路。顯然,由一段DNA序列組成的基因是數字化的。值得強調的是,基因調控網路的信息從本質上說也是數字化的,因為控制基因表達的轉錄因子結合位點也是核苷酸序列。生物學是信息科學的第三層意思是,生物信息是有等級次序的,而且沿著不同的層次流動。一般說來,生物信息以這樣的方向進行流動:DNA→mRNA→蛋白質→蛋白質相互作用網路→細胞→器官→個體→群體。這裡要注意的是,每個層次信息都對理解生命系統的運行提供有用的視角。因此,系統生物學的重要任務就是要儘可能地獲得每個層次的信息並將它們進行整合。
根據系統論的觀點,構成系統的關鍵不是其組成的物質,而是組成部分的相互作用或部分之間的關係。這些相互作用或者關係,從本質上說就是信息。換一個角度來說,生命是遠離平衡態的開放系統,為了維持其有序性,生命系統必須不斷地與外部環境交換能量,以抵消其熵增過程。奧地利物理學家薛定諤(E. Schrödinger)早在1940年代發表的著作《生命是什麼?》(What is Life?)中就已指出,生命以“負熵流”為食,熱物理學家布里淵提出“負熵”是信息的概念,而“負熵”其實就是信息的另一種表示方法。因此,我們可以這樣說,生命系統是一個信息流的過程,系統生物學就是要研究並揭示這種信息的運行規律。
——干涉
系統生物學一方面要了解生物系統的結構組成,另一方面是要揭示系統的行為方式。相比之下,后一個任務更為重要。也就是說,系統生物學研究的並非一種靜態的結構,而是要在人為控制的狀態下,揭示出特定的生命系統在不同的條件下和不同的時間裡具有什麼樣的動力學特徵。
凡是實驗科學都有這樣一種特徵:人為地設定某種或某些條件去作用於被實驗的對象,從而達到實驗的目的。這種對實驗對象的人為影響就是干涉(perturbation)。傳統生物學採用非干涉方法如形態觀察或分類研究生物體。20世紀形成的分子生物學等實驗生物學的特點就是,科學家可以在實驗室內利用各種手段干涉生物學材料,如通過誘導基因突變或修飾蛋白質,由此研究其性質和功能。系統生物學同樣也是一門實驗性科學,也離不開干涉這一重要的工具。
系統生物學中的干涉有這樣一些特點。首先,這些干涉應該是有系統性的。例如人為誘導基因突變,過去大多是隨機的;而在進行系統生物學研究時,應該採用的是定向的突變技術。果蠅從受精開始到形成成熟個體一共有66個典型的發育階段,80年代諾獎獲得者Christiane Nslein-Volhard等開展了系統的基因突變與規模的篩選,不久前科學家利用基因晶元技術,對每一個發育階段的基因表達譜進行了系統的研究。上面所提到的對酵母的系統生物學研究,胡德等人就是把已知的參與果糖代謝的9個基因逐一進行突變,研究在每一個基因突變下的系統變化。這也是一類系統性的干涉方式。其次,系統生物學需要高通量的干涉能力,如高通量的遺傳變異。現有技術已經能做到在短時間內,把酵母的全部6000多個基因逐一進行突變。對於較為複雜的多細胞生物,可以通過RNA干涉新技術來實現大規模的基因定向突變。隨著研究技術的發展,一定還會有許多新的干涉技術應用於系統生物學。
需要提請人們注意的是,以測定基因組全序列或全部蛋白質組成的基因組研究或蛋白質組研究等“規模型大科學”,並不屬於經典的實驗科學。這類工作中並不需要干涉,其目標只是把系統的全部元素測定清楚,以便得到一個含有所有信息的資料庫。胡德把這種類型的研究稱為“發現的科學”(discovery science),而把上述依賴於干涉的實驗科學稱為“假設驅動的科學”(hypothesis-driven science),因為選擇干涉就是在做出假設。系統生物學不同於一般的實驗生物學就在於,它既需要“發現的科學”,也需要“假設驅動的科學”。首先要選擇一種條件(干涉),然後利用“發現的科學”的方法,對系統在該條件下的所有元素進行測定和分析;在此基礎上做出新的假設,然後再利用“發現的科學”研究手段進行新研究。這兩種不同研究策略和方法的互動和整合,是系統生物學成功的保證。
系統生物學
筆者還要再強調一點,在注重這兩類研究手段的同時,不應該忽略系統生物學的另一個特點——對理論的依賴和建立模型的需求。在本文一開始介紹系統生物學的概況時,特別指出過,系統生物學的理想就是要得到一個儘可能接近真正生物系統的理論模型;建模過程貫穿在系統生物學研究的每一個階段。1999年初系統生物科學與工程網(genbrain biosystem network)表述生物系統的研究方法為基於系統論的實驗、計算機與工程等方法。離開了數學和計算機科學,就不會有系統生物學。也許正是基於這一考慮,科學家把系統生物學分為“濕”的實驗部分(實驗室內的研究)和“干”的實驗部分(計算機模擬和理論分析)。“濕”、“干”實驗的完美整合-也就是1999年曾邦哲倡導的實驗生物學家和計算生物學家合作研究,才是真正的系統生物學。隨著化學生物學、計算生物學、合成生物學的發展,高通量生物晶元、計算機數學建模和基因人工合成等構成了系統生物學的技術基礎。
從某種意義上說,系統生物學在中國有很好的基礎。1990年代中西醫學與哲學、系統學探討中,已經提出了系統醫學(Zeng BJ,1992)等概念。我們的傳統醫學就是把人體視為一個系統,通過測定和改變系統的輸入和輸出來調節系統的狀態。傳統科學的缺點在於,它只能進行“黑箱操作”,不能解釋系統的內部組成成分和動力學過程。而系統生物學則把生物系統化為“白箱”,不僅要了解系統的結構和功能,而且還要揭示出系統內部各組成成分的相互作用和運行規律。
20世紀中貝塔朗菲(L. Von. Bertalanffy)創立了一般系統論和理論生物學,並闡述了抗體系統論和系統、整體方法和計算機方法數學建模的方法研究生物開放系統的“機體生物學”概念。1929發表Edward B. Titchener的“systematic psychology”(系統心理學),最早出現“systems psychology”名詞是1958年Parry J. B.有關個性心理學的工業文稿,Maelzer DA.在“Environment,semantics,and system theory in ecology”(J Theor Biol. 1965 May;8⑶:395-402)闡述應用系統論方法研究生態學。
一、基礎學科:1)、系統生物學 (systems biology,Zieglgansberger W,Tolle TR. 1993年提出以前的systems biology方法可用於神經疾病研究,最早systems biology的提出是1968年美國召開的學術會議論文集 - 見WolkenhauerO.的2004年論著);2)、系統生態學 (systems ecology,Van Dyne GM. 1966);3)、系統生理學 (systems physiology,Sagawa K. 1973);4)、系統遺傳學* (system genetics,Zeng BJ. 1994 年)。
二、應用學科:5)、系統生物醫學 (system biomedicine,Kamada T.,1992) 或系統醫藥學* (systems medicine & pharmacy,Zeng BJ. 1992 年);6)、系統生物工程* (system bio-engineering/biotechnology,Zeng BJ. 1994 年)。
三、學科總論:1994 -1996 年中科院《轉基因動物通訊》轉載了1994 年5月曾(傑)邦哲 (Zeng BJ)的“結構論-泛進化論”(又稱自組織系統結構理論)。1995-2000年組織和籌備國際會議與協會時期,曾邦哲闡述了生物系統的結構論和實驗、計算與工程方法整合的生物系統與人工生物系統研究 - 提出從分子、細胞到器官、生態的生物系統層次研究,總稱以上各學科為系統生物科學(包括biosystem medicine,engineering of biosystem等),1999 年元月(其實始於1998年10月以色列)在德國創建了系統生物科學與工程網(genbrain biosystem network)等並刊登於國際刊物和網際網路媒體。2000-2003年 [5] 國際學術界迅速興起並終於形成了細胞、分子層次生物系統(biosystem)的系統論和實驗、計算方法整合研究的現代系統生物學與合成生物學(即artificial biosystem和engineering of biosystem)等概念。
實驗方法與系統方法構成科學研究的基該方法,19世紀是實驗生物學(生態、生理、遺傳與醫學等)範式建立,20世紀是實驗生物學迅速發展和系統生物學(生態、生理、遺傳與醫學等)範式形成。系統科學(包括控制論、資訊理論)根源於生命科學,發展了計算機科學而又應用於生物科學,將開發出生物計算機。維納與香農從動物與通訊行為的研究中提出控制論與資訊理論,整個系統科學根植於有機體哲學思維。系統生物學,最初開創於貝塔郎菲的一般系統理論與理論生物學,艾根的超循環理論發展了細胞、生物化學與分子層次的系統論。20世紀70年代國際召開了“系統論與生物學” (systems theory and biology) 會議,80年代召開了生物化學系統論、生物系統的計算機模型等探討的國際會議(第11屆國際分子系統生物學會議2009年6月於中科院上海召開)。系統生物學的概念在20世紀中葉已經提出,合成生物學的概念提出於基因重組技術的產生,進化理論、有機分子合成可以說是最早的探索。
系統生物學的發展經歷了三個歷史時期:第一期,生態系統,系統生態學與行為、心理學,開始於20世紀60~70年代;第二期,生理系統,系統生理學與神經、內分泌、免疫學,開始於20世紀70~80年代;第三期,遺傳系統,系統遺傳學與胚胎、發育生物學,系統遺傳學的概念與辭彙於20世紀90年代中科院曾邦哲(曾傑)發表,並於1996年主辦第1屆國際轉基因動物學術研討會(秘書長)闡述了系統論與生物工程、輸卵管生物反應器及基因組進化與生物體發育自組織系統理論,遺傳學從染色體行為的細胞遺傳學、基因表達信息流的分子遺傳學,發展到了系統遺傳學的細胞發生信號傳導與基因調控網路研究,並重新於第19屆國際遺傳學大會闡述(包括指出C. Nuslein-Volhard、S. Brenner等是較早以systematic方法研究遺傳學的科學家)。2008年3月美國加州舉辦了整合與系統遺傳學會議,2009年1月荷蘭召開了系統遺傳學研討會。
1999年初於德國建立系統生物科學與工程網及籌備聯合協會、國際會議等(1999年10月Nature和12月Kybernetes),曾邦哲(ZengBJ)定義生物系統理論與實驗、計算(computational)、工程方法的生物系統分析與人工生物系統研究,並闡述其自組織系統結構理論基礎,1999-2000年將籌備通知發送到系統科學、計算機科學、納米科學、生物醫學、生物工程等廣泛領域的國際科學家(包括邀請C. Nuslein-Volhard、Tomita等著名科學家),細胞是由大規模生物分子(納米)構成的複雜生物系統,基因組是可以重編程序的智能系統,生命系統人工設計與改造,可以開發出細胞生物機器。
2000年同期,日本Kitnano 和Tomita 舉辦國際系統生物學會議,美國Hood 建立系統生物學研究所,美國 Kool 重新提出合成生物學的概念。2001年WolkenhauerO.6月(9月出版)、Ideker T & Hood L9月和Kitano H.10月(MIT出版2000年會議論文集)等發表文章論述系統生物學的系統論、組學和計算方法等,2002年日本北野宏明(Kitano H.)、2003年美國胡德(Hood L.)也論述了系統生物學是實驗與計算方法整合的生物系統研究,2008年Nature文章則論述了系統生物學與合成生物學的結構理論。2005年Ideker贊同是如同Kitnano的分子水平的系統生物學概念,2007年Kinano闡釋系統生物學是在分子生物學層次的重新提出。計算生物技術、組學 (omics) 生物技術與合成生物技術,構成系統生物學發展的技術基礎-系統生物技術 (systems biotechnology),現代系統生物學是生物系統的理論與技術整合的研究體系。21世紀伊始,權威刊物 Nature、Science 發表系統生物學、合成生物學等專刊,終於進入了系統生物科學(簡稱系統生物學)全球化迅速發展時代。