owl

蛋白質序列資料庫

目錄

正文


OWL是一個非冗餘的蛋白質序列資料庫,是由Leeds大學和Warrington的Daresbury實驗室合作開發的(Bleasby等,1994)。OWL資料庫由四個主要的一級序列資料庫複合而成,即SWISS-PROT、PIR、GenBank(由其編碼序列翻譯而成的氨基酸序列)和NRL-3D。在構建OWL資料庫的過程中,考慮到每個資料庫所包含序列信息的情況,賦予它們不同的優先順序,SWISS-PROT資料庫的優先順序最高。在對數據的處理上,不僅刪除與某一序列完全相同的序列條目,也剔除與某一序列相差個別氨基酸殘基的序列條目。因此,OWL資料庫是一個具有較小冗餘度的蛋白質序列資料庫。儘管如此,與NRDB相同,OWL資料庫也會有一些錯誤,即在該資料庫中仍然包括來自一次資料庫的錯誤序列,例如由GenBank中錯誤序列翻譯而得的錯誤的氨基酸序列。此外,OWL資料庫更新較慢。英國的EMBnet國家節點上提供有針對於OWL的BLAST搜索服務。