序列資料庫
序列資料庫
序列資料庫的註釋信息包括兩部分,一部分由計算機程序經過序列分析由計算機程序生成,另一部分則依靠生物學家通過查閱文獻資料而獲得。
序列資料庫早期的數據主要由數據錄入人員通過查閱文獻雜誌搜集,或者由科研人員用磁碟、電子郵件方式向國際生物信息資料庫中心遞交。數據中心對搜集到的序列數據進行整理、維護,並定期通過磁碟、磁帶和光碟方式向全世界發布。
序列資料庫的序列數據來自核酸和蛋白質序列測定,隨著基因組大規模測序計劃的迅速開展,序列資料庫特別是核酸序列資料庫的數據量迅速增長,數據來源主要集中於國際上幾大著名的測序中心,如位於英國劍橋南郊基因組園區的Sanger Centre,華盛頓大學基因組研究中心等。
1999年我國參加國際人類基因組研究項目,已經于于2000年4月按計劃完成人類基因組1%序列的測定。