DISCOVERY STUDIO

DISCOVERY STUDIO

Discovery Studio™ (簡稱DS),是個人電腦上的全新分子建模環境,專業的生命科學分子模擬軟體,DS的伺服器-客戶端模式使得科研人員能夠最方便且最大限度地實現計算資源共享。

簡介


Discovery Studio™ (簡稱DS), 基於Windows/Linux系統和個人電腦、面向生命科學領域的新一代分子建模和模擬環境。它服務於生命科學領域的實驗生物學家、藥物化學家、結構生物學家、計算生物學家和計算化學家,應用於蛋白質結構功能研究,以及藥物發現。為科學家提供易用的蛋白質模擬、優化和藥物設計工具。通過高質量的圖形、多年驗證的技術以及集成的環境,DS將實驗數據的保存、管理與專業水準的建模、模擬工具集成在一起,為研究隊伍的合作與信息共享提供平台。
建立在最新的流程管理平台Pipeline Pilot基礎上的DS讓數據的共享和交流變得更為方便和簡潔。DS中的部分功能流程(protocols)可以在Pipeline Pilot中進行編輯和組合,編輯組合而得的新流程可以導入 Discovery Studio中使用,這樣使得科研流程的方便共享成為可能。同時,Pipeline Pilot這個開放平台技術還為使用者整合自己的或第三方的軟體工具提供了介面。科研人員可以在一個統一的平台上完成從基因到先導化合物設計的一系列工作,並且可以通過web形式共享研究成果。
DS目前的主要功能包括:蛋白質的表徵(包括蛋白-蛋白相互作用)、同源建模、分子力學計算和分子動力學模擬、基於結構藥物設計工具(包括配體-蛋白質相互作用、全新藥物設計和分子對接)、基於小分子的藥物設計工具(包括定量構效關係、藥效團、資料庫篩選、ADMET)和組合庫的設計與分析等。DS可以應用於生命科學以下研究領域:新葯發現,生物信息學,結構生物學,酶學,免疫學,病毒學,遺傳與發育生物學,腫瘤研究。

Discovery Studio功能模塊簡介


概述

- 基本界面和顯示模塊
Discovery Studio Standalone
Discovery Studio Visualizer Client
- 蛋白質模擬模塊
DS MODELER
DS Protein Refine
DS Protein Health
DS Protein Families
DS Sequence Analysis
- 基於結構的藥物發現和設計模塊
DS Flexible Docking
DS LigandFit
DS LigandScore
DS LibDock
DS CDOCKER
DS Protein Docking
DS Ludi
DS De Novo Evolution
DS LigandFit CAP/ DS Ludi CAP
DS GOLD interface
- 基於藥效團的藥物發現和設計模塊
DS Catalyst Conformation
DS Catalyst Hypothesis
DS Catalyst SBP
DS Catalyst Score
DS Catalyst Shape
DS Catalyst DB Build
DS Catalyst DB Search
DS De Novo Ligand Builder
HypoDB
PCDB (PharmaCoreDB)
- 基於小分子的藥物發現和設計模塊
DS QSAR
GFA Component
VAMP Descriptors Component/ DMol3 Descriptors Component
DS Library Design
DS ADMET
DS TOPKAT
- 分子力學和分子動力學計算模塊
DS CHARMm
DS CHARMm Lite
DS CFF (高級II類力場)
DS MMFF (Merck Molecular Force Field)
- 分析模塊
DS Biopolymer
DS Analysis

基本界面和顯示模塊

·Discovery Studio Standalone
可視化界面,是利用Discovery Studio軟體進行分子設計和模擬的基礎,支持伺服器-客戶端安裝在同一台機器上的運行模式。與Pipeline Pilot Server結合在一起,提供化學/生物學數據顯示、模擬/分析、構建三維分子、展示動態變化、三維作圖及許多其它功能。
·Discovery Studio Visualizer Client
是伺服器-客戶端運行模式中、客戶端的可視化界面,用於訪問和使用伺服器端的Discovery Studio軟體。必須與伺服器端配置的Pipeline Pilot Server協同工作,為用戶提供無與倫比的數據、工作流程和計算資源共享。

蛋白質模擬模塊

·DS MODELER
只要給出未知結構序列與另一個已知三維結構蛋白的比對,利用工業標準的快速同源模建方法,便可自動並快速產生優化的蛋白同源模型。對於靶標發現及蛋白家族功能結構分析,MODELER是一個理想的解決方案。用MODELER還可以模擬蛋白突變,進行loop區模建及基於結構的比對並構建有配體結合的蛋白結構模型。結合Sequence Analysis模塊,可以全自動完成抗體Loop區模建。結合Discovery Studio里模擬及以結構為基礎的藥物設計的功能模塊,用MODELER還可以深入研究蛋白結構及功能的關係。
·DS Protein Refine
利用CHARMm對模建好的蛋白質進行側鏈和loop區的優化,提高蛋白質模型的準確性。
·DS Protein Health
蛋白質三維結構合理性評價工具。Protein Health模塊運用Profiles 3D方法,通過將三維結構的結構環境與特定氨基酸殘基的優先外界環境相比較,獲得相關結構性質與氨基酸序列信息之間的關係。通過Protein Health模塊的分析,用戶可以方便快速地找到蛋白質結構中不合理的區域。
·DS Protein Families
通過分析某一蛋白家族蛋白序列的保守模式以及在三維結構上的保守殘基的位置,可以在分子水平上更好地了解到蛋白功能機制。Protein Families的簡單易用的流程(protocols),也可一步步地引導用戶進行分析,從蛋白家族的序列或者結構比對,到進化蹤跡分析。而進化蹤跡分析包括用分層聚類的方法來建立蛋白家族系統樹圖以及把這些得到的功能註釋信息畫到你的三維結構上去。進行序列比對時,允許根據需要對比對結果添加約束,提高活性部位關鍵殘基的比對效果。
·DS Sequence Analysis
與功能已知的其它蛋白的序列進行比對,是確定某一蛋白生物功能的第一步。用Sequence Analysis也可以讓用戶通過通用的BLAST及PSI-BLAST演演算法來搜索本地資料庫或者NCBI網上資料庫,確定蛋白序列的同源區域。結果在交互的報告格式裡面顯示以方便進行進一步的分析及在其它Discovery Studio模塊裡面的使用。使用Blast搜索PDB或PDB_nr95資料庫時,結果文件中可以顯示輸出蛋白質的SCOP ID, Ligand ID以及X射線解析度等信息。

基於結構的藥物發現和設計模塊

·DS Flexible Docking
受體柔性對接工具(Induced-Fit對接工具),可以實現配體-受體雙柔性對接,模擬配體與受體結合時的誘導-契合效應(induced-fit)。Flexible Docking模塊先對蛋白活性口袋的側鏈產生多個構象,然後將配體對接到受體的活性口袋當中,最後對得到的配體-受體複合物結構進行優化。Flexible Docking最大的優勢在於準確,可以精細地研究配體-受體的相互作用信息,適合於作用機理研究。需要DS CHARMm, DS LibDock, DS Catalyst Conformation, DS Protein Refine模塊支持。
·DS LigandFit
LigandFit模塊可以方便快速地將小分子化合物對接到生物大分子的活性位點中,是一個快速、靈活的分子對接程序,可以考慮配體結合取向、結合構象以及形狀匹配等多種因素。LigandFit在高通量虛擬篩選時可并行計算。同時具有設置interaction filter的功能。
·DS LigandScore
採用經過驗證的打分函數以及特定的描述符,評價受體-配體間的相互作用。通過對LigandFit對接結果的分析,可幫助用戶確定結合模式方面可能存在的問題,區分正確或錯誤的結合構象,把不同結合構象的配體依次排序以供篩選或合成使用。可自定義參數,可將所有設置保存並與其他使用者共享。LigandScore在高通量的虛擬篩選時也可并行計算。
·DS LibDock
快速的分子對接工具,適用於對大規模資料庫進行快速精確的虛擬篩選。LibDock根據小分子構象與受體相互作用熱區(Hotspot)匹配的原理將這些構象剛性對接到受體的結合口袋當中,其最大的優勢在於速度快,可以并行運算,適合於進行大規模虛擬篩選,如與DS Catalyst Conformation中的CAESAR等快速生成構象的方法結合使用更佳。
·DS CDOCKER
是基於CHARMm的柔性對接程序,採用soft-core potentials以及optional grid representation將配體分子與受體活性位點進行對接。首先採用動力學的方法隨機搜索小分子構象,隨後採用模擬退火的方法將各個構象在受體活性位點區域進行優化,從而使對接結果更加準確。Dock Ligands (Pharmacophore Restraints and CHARMm)方法還可以在使用CHARMm力場進行對接的過程中考慮藥效團的限制,這一功能的實現需要DS CHARMm和DS Catalyst Score的支持。
·DS Protein Docking
快速而準確的蛋白-蛋白複合物結構預測工具。該模塊主要移植自InsightII的ZDOCK/RDOCK,ZDOCK用於蛋白-蛋白剛性對接,RDOCK則基於CHARMm能量極小化方法優化ZDOCK得到的結構。Discovery Studio中還提供了新的Process Pose (ZDOCK) protocol等強大的分析工具,實現對ZDOCK結果進行包括聚類分析在內的分析功能,幫助用戶方便快速地縮小範圍,鎖定感興趣的複合物結構。
·DS Ludi
全新配體設計工具。使用Ludi來發現新的具有潛在活性的化合物,可節省研究者大量的時間。Ludi強大的設計工具允許使用者在實驗分析之前模擬篩選,並允許對已有的化合物進行改造。Ludi易於操作,它包含有drug-like片段庫,同時也允許用戶將自己的分子片段加入到片段庫中。
·DS De Novo Evolution
在Ludi連接模式基礎上發展而來的基於受體的小分子藥物從頭設計方法。在給定母核結構的情況下,DS De Novo Evolution可以自動地為研究人員設計潛在的與受體有高親和力的小分子化合物,大大縮短了全新小分子藥物發現及改造的周期。DS De Novo Evolution能夠在一定分子骨架的基礎上發現與受體結合位點結構和化學特徵互補的全新小分子,並可以進行不同層次的優化,包括分子水平和片段水平,是設計Me-Better類藥物分子的有力工具。同時使用者可以用試劑價格或象藥性等原則來限定所設計連接點上的取代基,通過這種方法設計得到的分子可以是易於實驗合成的或者是具有更好的葯代動力學性質的。
·DS LigandFit CAP/ DS Ludi CAP
在從頭藥物設計中一個普遍存在的問題是,並不是所有設計出的分子都能很快的合成出來或者有些分子根本無法合成。CAP (Chemicals Available for Purchase) 提供了超過65,000種可購買獲得的分子結構,這些分子結構是用於藥物篩選的第一選擇,可以結合LigandFit或者Ludi使用。
·DS GOLD interface
DS提供了GOLD程序的介面,並提供了設置interaction filter的功能。需要用戶有GOLD軟體才能使用。

基於藥效團的藥物發現和設計模塊

·DS Catalyst Conformation
多樣、完全且快速的構象模型生成工具,可以選擇採用Polling或CAESAR演演算法生成構象,生成的構象用於產生藥效團模型或進行資料庫搜索。
·DS Catalyst Hypothesis
對一組化合物進行基於特性結構的比對並自動生成藥效團模型的工具。這些特性結構包括親疏水性基團、氫鍵給體/受體和正/負電荷基團等。產生藥效團模型時如果提供具體的活性數據,可以產生3D-QSAR藥效團並用之來預測新化合物的活性,如果在產生藥效團的過程中考慮排除體積,從而引入受體佔有空間位阻的信息,精修后得到的藥效團模型可以提高預測能力;產生藥效團模型時如果不提供具體的活性數據,可根據化合物和藥效團疊合、匹配的情況對候選分子或三維資料庫搜尋結果的活性進行定性的評價。
·DS Catalyst SBP
基於受體結構產生精準的藥效團模型。SBP從受體位點的特性直接得到相互作用位點圖,並且將這個信息轉化成適用於快速三維資料庫檢索的藥效團模型。這些相互作用位點圖還可以進行編輯、分類,以確保只有最重要的信息會被保留下來用於虛擬篩選。同時SBP中還可考慮受體活性位點處氨基酸殘基的空間排布,使得通過虛擬篩選得到的分子不僅滿足和受體結合位點化學特徵上的互補,還可以在空間上地結合在活性位點空腔處。SBP引入了那些使用受體結構信息的最佳方法,這些方法已經在高通量篩選的實驗環境中所使用。Catalyst SBP模塊還可以將配體分子一次與多個藥效團模型同時進行匹配,從而為配體分子尋找可能的作用靶標或預測其選擇性及可能的毒副作用。用戶可以使用HypoDB或PCDB中的藥效團模型,也可以用Catalyst SBP模塊很方便地構建屬於自己的藥效團資料庫。
·DS Catalyst Score
提供了分子和藥效團之間比較、疊合的工具,快速地評價或排序實驗得到的或資料庫中的化合物。
·DS Catalyst Shape
用一個特定化合物的形狀作模板,確定可能與此模板具有相似形狀的化合物。該模塊是對基於化學特徵藥效團搜尋方法的一個有效補充。
·DS Catalyst DB Build
建立及管理化合物的三維結構資料庫,它可以與MDL ISIS資料庫建立聯繫。
·DS Catalyst DB Search
基於藥效團進行資料庫搜索的工具,可以幫助科研人員查找到可能的先導化合物。這些可檢索的藥效團中包含了結合特徵、形狀以及特性約束等信息,將這樣的藥效團作為一個資料庫的檢索條件,在包含了成千上萬個分子結構的商業或內部資料庫中進行查詢。DS Catalyst DB Search在檢索時還考慮了分子三維結構的柔性。DS Catalyst DB Search模塊除了提供檢索引擎外,還免費提供Maybridge和NCI的資料庫。
·DS De Novo Ligand Builder
藥效團指導的全新配體構建工具。它採用一種新穎而獨特的基於片段的藥物設計方法(FBDD),片段放置的位置受藥效團支配。這樣產生的化合物不僅與蛋白活性位點互補,而且化合物之間的互補性有利於產生新的先導化合物。這個有力的工具能用於迅速產生許多包含與特定靶標結合必需特徵的化合物。
·HypoDB
藥效團資料庫,包含分屬於187個獨立靶標的1846個藥效團模型,HypoDB可被完全整合於Discovery Studio環境下,可被搜索和選擇性地給出模型。HypoDB與Discovery Studio結合,可以應用於化合物毒副作用評價或虛擬篩選。
·PCDB (PharmaCoreDB)
PCDB是由北京大學聯合上海藥物所、創騰科技有限公司和中國醫學科學院藥物所、四川大學及華東理工大學,共同推出的一個具有自主知識產權的,面向生命科學和藥物研發領域的藥效團資料庫(該資料庫的研發得到了國家863課題的資助)。PCDB 1.0版本提供了超過1700個基於靶標結構的藥效團(包含排斥體積)和近3000條相關的文本信息,並按照靶標類型、蛋白來源、相關疾病、治療領域、生化類型等方面進行了分類,其中的大多數藥效團都經過檢查並根據需要進行手工修正,具有很高的可靠性。相關研究結果表明該藥效團資料庫可以地應用於活性分子的篩選、多靶標多配體結合研究、中藥多組分協同作用機理研究等藥物研究的熱點領域,同時在發現現有藥物的新用途方面也有的應用前景。

基於小分子的藥物發現和設計模塊

·DS QSAR
定量構效關係研究工具。可以計算幾百種與生物活性或ADME/T性質相關的描述符,包括分子拓撲描述符、分子指紋在內的一系列基本性質。還提供了多種統計工具,如Bayesian模型、多元線形回歸、最小二乘法等,用於對各種複雜數據進行建模和數據挖掘。
·GFA Component
遺傳演演算法建模組件,可通過DS QSAR或Pipeline Pilot調用。
·VAMP Descriptors Component/ DMol3 Descriptors Component
使用半經驗量子力學程序VAMP及DFT量子力學程序DMol3進行化合物性質描述符計算的組件。
·DS Library Design
大規模組合化學庫的構建和分析工具。Library Design模塊提供了一整套專為化學庫設計而定製的分子相似性和多樣性聚類分析方法。用戶可以快速地構建各種組合化學庫,應用強大的統計學分析和顯示工具對組合化學庫的各種性質進行分析和比較,在化學庫設計過程中使用Pareto優化方法優化多種性質等,以達到用戶按實際需要對化合物庫進行整理和改造的目的。
·DS ADMET
提供了從化學結構預測吸收、分佈、代謝、排泄(ADME)和毒理性質的6個計算模型。優化ADME/T性質在藥物研發過程中是非常關鍵的,因為據統計超過80%的新化學實體在新葯研究的後期被淘汰。初步估計這些失敗的原因有一半是由於ADME/T性質不符合要求。ADMET模塊提供了計算ADME/T預測值的工具,能夠在藥物發現的早期階段就對可能有問題的新化學實體進行預測。運用這些模塊將顯著地降低藥物發現的費用,同時節省了成功候選藥物發展和評估的時間。DS ADMET現在包含了血漿蛋白結合、肝毒性、人細胞色素P450 2D6酶結合、被動的腸內吸收性、血腦屏障穿透性、250C下的水溶性等6個模塊。建立這些模塊的數據來源於大量文獻報道和實驗的數據,同時這些模型都得到了廣泛的驗證。它們可以用來分析和設計虛擬組合庫,也可以用來分析單個分子。
·DS TOPKAT
化合物毒理性質預測工具。通過化合物的二維結構信息構建高質量的QSTR(定量結構-毒性關係)模型,並對各類有機化合物的諸如急性毒性、慢性毒性、誘變性、再生性等毒理性質進行預測,同時還可以考慮化合物對環境毒性的影響,大大節省實驗的時間和投入。DS TOPKAT的專利技術——“最佳預測空間”評估驗證技術(OPS – Optimum Prediction Space),以及高效的批處理預測能力,使得它可以對大批量的有機化合物的毒理性質進行快速而準確的預測,滿足各類企業和研究機構對化合物進行毒理研究的需求。

分子力學和分子動力學計算模塊

·DS CHARMm
利用這個工業標準的分子力學及動力學程序,研究多種分子(從小分子配體到多組分的複合物)的熱力學及動力學特性。基於哈佛的CHARMM模擬引擎,CHARMm不斷開發升級並增加最新的功能。另外,因為CHARMm也可在同一界面用於Discovery Studio里基於結構的藥物設計模塊中,因此很容易進行蛋白、配體、蛋白和配體複合物的計算及分析,也可以更加靈活地利用CHARMm的編程功能,加快藥物發現。基於CHARMm的對接演演算法CDOCKER用於柔性分子對接,在此基礎上,利用CHARMm還可以進行考慮藥效團限制的分子對接。同時通過熵的計算可以進一步提高MM-GBSA和MM-PBSA受體-配體結合自由能計算的準確性。CHARMm帶有的stand-alone輸入工具,可讓用戶在批處理模式下利用CHARMm力場及自動參數預測功能確定整個化合物庫中化合物的力場類型。合適的力場,PME靜電模型和溶劑化時添加對應離子的能力確保準確的核酸模擬研究。用戶可以使用CHARMm組件定製複雜的模擬流程,也可以將該流程與其它計算應用軟體整合在一起使用。
·DS CHARMm Lite
用CHARMm Lite預測配體與受體親合力,可得到配體更加精確的打分及排序。CHARMm Lite也可用經過驗證的CHARMm、CFF或MMFF力場及其它幾個優化演演算法進行原位的配體優化,它的應用還可擴展到大量配體的高通量分析。所有的工作都可以在後台并行計算。
·DS CFF (高級II類力場)
優化DNA、RNA、糖類、脂質、蛋白、多肽及小分子模型得到一個較高可信度的模型以進行下一步的計算。在CFF里的力場參數是通過計算1768個不同分子,19432個分子結構得來的,得到的健壯及多樣的參數集可以應用於大部分的生物分子及小分子計算。
·DS MMFF (Merck Molecular Force Field)
來自於從頭算和實驗數據的第二類力場,專門為準確處理構象能和非鍵相互作用而設計,用於配體或有機小分子的模擬研究。

分析模塊

·DS Biopolymer
DS Biopolymer模塊整合了Delphi功能,為用戶提供操作簡單易學而且實用的模型搭建以及靜電勢分析工具。DS Biopolymer可用於搭建和修飾蛋白質和小肽分子、將蛋白質複合物分成不同的組分、快速產生肽類或蛋白質分子的性質分析報告、計算大分子和小分子的靜電勢分佈和溶劑化能以及蛋白氨基酸殘基pK值的計算等方面。DS Biopolymer產生的小分子以及生物大分子模型可以在Discovery Studio其他模塊中進行進一步的分析。
·DS Analysis
結果分析和顯示模塊。能夠分析和顯示蛋白質、蛋白質與配體複合物的分子動力學軌跡文件,包括對軌跡進行主成分分析,計算徑向分佈函數等。可以將蛋白質、蛋白質-配體複合物的軌跡文件以動態、曲線圖和表格的方式表現出來。Analysis模塊可以幫助用戶地理解酶催化機制、受體激活以及細胞信號轉導過程中分子構象與能量間的相互影響。在研究受體-配體相互作用時,能夠對分子對接的結果進行快速聚類分析。

Discovery Studio可以運行的硬體平台


Windows

x86 (32-bit, Intel CPU安裝32-bit操作系統)
Microsoft® Windows® 2000, SP4 Rollup 1
Microsoft Windows XP Professional, SP2
Microsoft Windows 2003 Server, SP1
Microsoft Windows Vista, Business and Enterprise Editions

Linux

x86 (32-bit, Intel CPU安裝32-bit操作系統)
Red Hat® Enterprise Linux 3.0, Updates 6-9
Red Hat Enterprise Linux 4.0, Updates 2-5
x64-86 (64-bit, Intel Xeon CPU安裝64-bit操作系統)
Red Hat Enterprise Linux 5
SUSE® Linux Enterprise 10
GNOME desktop on Linux

l 圖形卡

Nvidia: Quadro FX 540, Quadro FX 1100, Quadro FX 1400, Quadro FX 3450
ATI: FireGL V3400, FireGL V5100, FireGL V7200, FireGL Mobility V5200