Entrez
Entrez
Entrez 是美國國家生物技術信息中心所提供的在線資源檢索器。該資源將GenBank序列與其原始文獻出處鏈接在一起。 Entrez 是由NCBI主持的一個資料庫檢索系統。
它包括核酸,蛋白以及Medline文摘資料庫,在這三個資料庫中建立了非常完善的聯繫。因此,可以從一個DNA序列查詢到蛋白產物以及相關文獻,而且,每個條目均有一個類鄰(neighboring)信息,給出與查詢條目接近的信息。
Entrez中核酸資料庫為:GenBank,EMBL,DDBJ
蛋白質資料庫為:Swiss-Prot,PIR,PFR,PDB
PubMed
基因組和染色體圖譜資料
檢索領域:(Search Fields)
在WWW Entrez檢索系統中,檢索內容被分為許多小的領域,每一個檢索領域包含以下信息:
進入(Accession):包含進入號
相關性(Affiliation):包括該檢索領域建立時的相關信息,原作者地址,有時亦有其他作者地址
作者姓名(Author Name):包含文章作者清單。
E.C號(E.C.Number):是酶學委員會命名的酶的編號
特徵詞(Feature Key):描述DNA特徵的關鍵詞
基因符號(Gene Symbol):基因的標準名稱。
雜誌名(Journal Title):為檢索條目第一次發表時的雜誌名,該雜誌名是以縮寫形式儲存於資料庫中,如果不清楚雜誌是如何縮寫的可採用List Terms來查看。
關鍵詞(Keywords):可以使用較特定的索引條目來檢索以上資料庫。類似於醫學光碟檢索。
Medline UID :是Medline對每一個條目給出的唯一識別標記。
MeSH主題詞(MeSH Terms):包括 MeSH的主題詞,下級主題詞。
MeSH主要關鍵詞 (MeSH Major Topic):為檢索條目十分重要的MeSH詞目。
修改日期(Modification Date):包含該條目進入Entrez的日期,與出版日期一樣,以年/月/日形式出現
頁數(Page Number):該文章所在雜誌的頁碼。
特性(Property):一個或幾個關鍵詞,用來描述該序列的類型。
出版日期(Publication Date):包含文章出版日期以及序列錄入GenBank的日期。
PubMed ID:PubMed對每一個條目給出的識別標記。
物種(Organism):包含與該蛋白或核酸序列相關物種的學名和俗名。
蛋白質名稱(Protein name):
Seq Id: 與FASTA識別標記類似,為序列的一種識別標記
物質(Substance):與該條目相關的化學物質名稱。
文字檢索詞(Text Words):包含文章中的所有詞,其中:
Medline詞目:標題和文摘
蛋白質詞目:定義,評論,蛋白名稱,蛋白描述
核酸條目:定義,評論,基因名稱,基因名稱
標題檢索詞(Title Words):在標題中出現的詞,或在描述該條目時出現的詞。
卷(Volume):刊登該文章雜誌所在卷
使用Medline UID,PubMed ID和 Seq ID進行檢索時,在欄目框中要輸入數字。如要輸入多個數字,中間要用空格或逗號隔開。並選擇相對應的檢索領域。
檢索模式(Search Modes)
www Entrez可以採用幾種不同途徑的檢索方式
名詞列表格式(list term):當輸入一檢索詞后,Entrez將列出與此相關的該領域中所有標準的檢索詞名稱,此時,可選擇一或多個標準名詞去檢索。
自動格式(automatic):當輸入一個檢索詞后,即自動檢索,如果輸入的檢索詞超過一個,則Entrez會自動將之組合起來,如果無結果,則可嘗試將這多個檢索詞用“ ”括起來。
閱讀文獻(Viewing Document)
每一個文件都可以有數種閱讀方式,目的各不相同。一般來說,“引文格式(citation)”最適合於閱讀Medline形式的文件;“GenPept”格式適用於閱讀蛋白質文件;“GenBank”格式用來閱讀核酸文件。
閱讀方式
可單一閱讀,亦可成批閱讀
對於PubMed文章:
引文(citation)格式:包含題目,文摘,MeSH主題詞等
文摘格式:包含題目,文摘
ASN.1格式:文章以ASN.1格式出現
MEDLINE格式:文章以MEDLINE格式出現
對於蛋白和核酸文件:
GenBank/GenPept格式:標準的GenBank或GenPept格式
Report格式:GenBank格式
ASN.1格式
FASTA格式
圖形格式(Graphic View)
對於結構文件:
結構總結格式:結構的基本信息,可以看三維結構
ASN.1格式:
對於基因組文件:
圖形格式
ASN.1格式