序列資料庫

序列資料庫

序列資料庫是分子生物信息資料庫中最基本的資料庫,包括核酸和“蛋白質”兩類,以核苷酸鹼基順序或氨基酸殘基順序為基本內容,並附有註釋信息。

數據內容


序列資料庫的註釋信息包括兩部分,一部分由計算機程序經過序列分析由計算機程序生成,另一部分則依靠生物學家通過查閱文獻資料而獲得。

數據來源


早期

序列資料庫早期的數據主要由數據錄入人員通過查閱文獻雜誌搜集,或者由科研人員用磁碟、電子郵件方式向國際生物信息資料庫中心遞交。數據中心對搜集到的序列數據進行整理、維護,並定期通過磁碟、磁帶和光碟方式向全世界發布。

現狀

序列資料庫的序列數據來自核酸和蛋白質序列測定,隨著基因組大規模測序計劃的迅速開展,序列資料庫特別是核酸序列資料庫的數據量迅速增長,數據來源主要集中於國際上幾大著名的測序中心,如位於英國劍橋南郊基因組園區的Sanger Centre,華盛頓大學基因組研究中心等。
1999年我國參加國際人類基因組研究項目,已經于于2000年4月按計劃完成人類基因組1%序列的測定。