序列資料庫

序列資料庫

序列資料庫是分子生物信息資料庫中最基本的資料庫，包括核酸和“蛋白質”兩類，以核苷酸鹼基順序或氨基酸殘基順序為基本內容，並附有註釋信息。

目錄

1數據內容 2數據來源早期

數據內容

序列資料庫的註釋信息包括兩部分，一部分由計算機程序經過序列分析由計算機程序生成，另一部分則依靠生物學家通過查閱文獻資料而獲得。

數據來源

早期

序列資料庫早期的數據主要由數據錄入人員通過查閱文獻雜誌搜集，或者由科研人員用磁碟、電子郵件方式向國際生物信息資料庫中心遞交。數據中心對搜集到的序列數據進行整理、維護，並定期通過磁碟、磁帶和光碟方式向全世界發布。

現狀

序列資料庫的序列數據來自核酸和蛋白質序列測定，隨著基因組大規模測序計劃的迅速開展，序列資料庫特別是核酸序列資料庫的數據量迅速增長，數據來源主要集中於國際上幾大著名的測序中心，如位於英國劍橋南郊基因組園區的Sanger Centre，華盛頓大學基因組研究中心等。

1999年我國參加國際人類基因組研究項目，已經于于2000年4月按計劃完成人類基因組1%序列的測定。

目錄