檢索式

搜索引擎理解和運算的查詞串

檢索式是檢索者向計算機發布的指令,也是人機對話的語言,檢索式表達了檢索者的檢索意圖。檢索式通常由檢索詞、邏輯算符、通配符等組成。

檢索方式


TI是英文title:題名的意思。如你所寫的是:包括關鍵詞其實我們還可用一些簡單的方法:
1.文獻類型選擇
在文獻查詢頁面,“文獻類型選擇”列出了本系統中可提供用戶查詢的各類型文獻資料庫。這是一個必選項目,可以單選,也可以多選或全選。系統具有跨庫檢索功能,可同時在多個資料庫中查詢文獻。
2.查詢範圍選擇
這是一個單選項目。可在作者、標題、文摘、關鍵詞、分類號或全文檢索等項目中任選一項,確定系統對資料庫中相應欄位進行檢索。其中“全文檢索”選項可對資料庫中的所有欄位進行查找。
3.查詢年限選擇
用於選擇欲查文獻的出版年份。所選擇的年份相當於當年的1月1日至12月31日,默認時間為全部年。
4.輸入檢索詞
可以輸入與查詢主題密切相關的單個詞進行檢索,也可以通過“and”(與)、“or ”(或)、“not”(非)進行組配,構成比較複雜的邏輯檢索式。例如,欲查找有關計算機輔助設計的論文,可以用中文片語“計算機輔助設計”或英文縮寫“CAD”來表達,通過“或”的關係連綴起來,可以構成這樣一個檢索式:計算機輔助設計 or CAD 輸入完檢索條件后,按“查詢”按鈕,就可查詢到相關文獻的題錄列表。

基本搜索


1. 鍵入一個或多個檢索詞(可以為任意詞),如protein disulfide isomerase ,也可以輸入縮略名如pdi等;
2.輸入多個詞時,可自動識別成片語;但詞數太多時,則以邏輯與的方式識別,如可以將protein disulfide isomerase識別成一個詞,也有可能將其識別成“protein AND disulfide AND isomerase”尤其是出現數字等符號時不易識別成片語;
3.對不能識別檢索的片語,需加引號強調,如鍵入: “Insight II”以文獻作者方式檢索,作者名的輸入格式為:姓+名 如輸入:Freesman DJ ,其中“姓”為全稱,“名”則為首字母簡寫形式( “名”可以省略);
4.鍵入的雜誌名稱可以是全名,也可以是雜誌名的MedLine縮寫格式 或ISSN雜誌號(見期刊瀏覽)。
5. 檢索時可在詞尾加“*”號檢索所有具有同樣詞頭的詞。如鍵入:biolog* 可查得biology或biological等詞。
6.也可將多個詞以片語形式查詢,對不能識別檢索的片語,需加引號強調,如鍵入:“Insight II”將識別成片語“Insight II”以方式查詢,若鍵入: Insight II則有可能分開識別成“Insight”和“II”兩個詞,以邏輯與“Insight AND II”的方式進行檢索。
7.詞與詞間可用AND、OR或NOT邏輯進行連詞檢索。
8. 鍵入檢索詞后,別忘了選擇檢索年限(30天,10年不等)及選擇文獻的頁面顯示數目。
9.按Enter回車鍵或滑鼠擊話界面中的“Search”按鈕可得到查詢文獻提要(document summary page)。

高級檢索


與基本檢索方式不同的是增加了檢索範圍(search fields).和檢索模式(search mode)的選擇框。
(一)在檢索範圍 Search Fields 選擇條框中,包含了All fields[ALL],指所有檢索範圍;
1.Affiliation[AD,AFFL],指聯繫地址,包含第一作者(主要作者,Primary author)或其他作者的研究所和聯繫地址;
2.Author Name[AU,AUTH],包含文章的所有作者,格式為“姓+名(首字母大寫)”;
3. E.C. Number[RN,ECNO],指酶學委員會統一規定的對每一個酶的特定的編號,同時也包括CAS登記號;
4.Journal Title[TA,JOUR] 指文獻出版雜誌的名稱;
5.Language [LA,LANG]指文獻語種;
6.MeSH Major Topic[MAJR] 包含MEDLINE檢索系統認為最重要的MeSH醫學主題詞表;
7.MeSH Terms[MH,MESH], 包含所有用來檢索MELINE的醫學主題詞(Medical Subject Headings);
8. Modification Date[MDAT],指文獻收入的日期(年-月-日,如97-Jul-26);Page Number[PAGE]指文獻在雜誌中的起始頁;
9.Publication Date[DP,PDAT],指文章出版日期(年-月-日);
10.Substance[NM,SUBS],指與文獻相關的化學物質在化學文摘檢索(Chemical Abstract Service, CAS)中登記的名字和在MEDLINE庫中的物質名稱;
11.Text words[TW,WORD],包括文章標題目,摘要中出現的所有述詞以及MeSh詞表和化學物質名稱中的個別詞;
12.Title words[TI,TITL],僅包括文獻記錄標題中的詞;
13.Volume[VI,VOL] 指文獻所在雜誌的出版卷次;
14.Medline ID[UI,MUID]指MedLine給每條引錄文獻的特定標識號;最好採用Entrez檢索系統作進一步精細查詢
(二)在檢索模式(Search Mode)選擇框中,包含自動檢索累計(Automatic)和檢索詞列表(List Terms)檢索模式:
1.“Automatic”模式:將對檢索框中鍵入的詞按邏輯與(AND)的方式檢索,不僅自動顯示檢索到的符合文獻數,而且在“修寫當前查詢內容(Modify Current Query)”顯示框中分別顯示單個詞的累計文獻數。可進行查詢修改,以邏輯或(OR)、邏輯否(NOT,BUTNOT)等方式檢索。亦可在“添加限制查詢述詞(Add Terms to Query)”的欄目中鍵入其他限制述詞。
2.“List terms”檢索詞列表式檢索:在檢索框中鍵入一個或多個文本述詞(text words)、關鍵詞(key words)或文章作者,將檢索到所有以給定詞開頭的詞或片語的文獻數目。選定其中的詞或滾動條框框外詞(scroll list up/down)作進一步的檢索結果顯示,選擇多個詞的話,則會顯示各個詞相應的文獻數累加結果。顯示檢索數目后,與“Automatic”模式一樣,可作“增添限制述詞檢索(Add Terms to Query)”或“修改當前檢索內容(Modify Current Query)”。
3.顯示檢索文獻 (Retrieving Documents) 當檢索結果的文獻數目較少,且能滿足需要時,按“Retrieve(檢索)”按鈕即顯示檢索到的文獻內容列表,包括文獻的標題(title),作者(author)及出版雜誌、頁碼及日期(年),這個列表稱為文獻摘引列表(Document Summary Page)。可根據需要顯示詳細內容,每條文獻均有好幾種顯示格式:
Citation report(引錄格式)包含引錄雜誌,文章標題,作者聯繫地址,摘要
②Abstract report(摘要格式)包含引錄雜誌,標題,作者,地址或聯繫處以及摘要。
③MEDLINE report(MEDLINE經典格式)可用來下載並收入目錄型資料庫(bibliographic database)。
④ASN.1 report (ASN.1格式) 指文獻整個的結構格式,顯示相關蛋白質核苷酸的相關文獻。在某些文獻還能連接到提供全文的雜誌。

組成部分


檢索詞是檢索者檢索意圖的集中體現,也是檢索語言的構成主體。檢索詞是一個泛稱,在主題檢索時,檢索詞類別包括自由詞、關鍵詞、主題詞等。
自由詞也稱任意詞,它可以是隨機選取的詞,也可以是一句自然語句。有些資料庫可以用自然語句(即以問話的方式提問),但系統後台會針對語句自動抽取關鍵詞。
2)關鍵詞
關鍵詞也稱專業詞、非受控詞,在主題檢索中是指那些帶有實際意義的詞。關鍵詞具有一詞多義現象,即一個關鍵詞會出現多個同義詞或拼寫方式不同的詞,如一種化學物質,它有學名、有俗稱,可以用分子式表示,也可以用登記號表示,還可以用結構式表示。因此.用關鍵詞作檢索詞時,必須要考慮到它的同義詞和不同二恬寫形式的問題,否則就會漏檢。關鍵詞被稱之為非受控詞,以示它與主題詞的區別。
(2)邏輯算符
當用兩個以上檢索詞進行檢索時,詞與詞之間的關係要用邏輯算符連接、以表達檢索者的檢索意圖。資料庫中的邏輯運算通常採用布爾邏輯,即用“或”、“與”、“非”表示檢索詞之間的關係。
1)邏輯“與”運算
當兩個檢索詞用“A與B”方式進行組配時,其檢索結果將包括所有同時帶有A和B兩個檢索詞的記錄。例如,查找數字圖書館技術方面的文章,檢索式可以寫為“數字圖書館”and“技術”。邏輯“與”的使用可以提高查准率,增加專指性。邏輯“與”的運算符為“and”或“*"。
2)邏輯“或”運算
當兩個檢索詞用“A或B”方式進行組配時,其檢索結果將包含所有帶有A和B兩個檢索詞中任意一個檢索詞的記錄。例如,查找計算機方面的文獻,檢索式可以寫為“計算機”or“電腦”。邏輯“或”的使用可以提高查全率,擴大檢索範圍。邏輯“或”的運算符為“or”或“+”。
3)邏輯“非”運算
當兩個檢索詞用“A非B’’方式進行組配時,其檢索結果將包括所有帶A檢索詞而不帶B檢索詞的記錄。例如,想了解自行車方面的內容,而不要電動車方面的文獻時,檢索式可以寫為“自行車”not“電動車”。邏輯“非”的使用有助於縮小檢索範圍,增強檢索的準確性。邏輯“非”的運算符為“not”或“一”。
三種邏輯算符還可以根據檢索需求再進行組配,形成複雜的檢索式。
4)優先順序
優先順序的符號是“()”(括弧)。檢索式中含有括弧,表示括弧內的組合先運算。例如,查找山楂食品加工方面的文獻,檢索式可以用:(山楂+紅果+山裡紅)4食品加工。在不帶有優先順序的檢索式中,有些檢索系統按詞序由左往右執行運算,也有的系統用優先順序人為規定運算順序。要了解某個資料庫的具體運算規定,請細讀資料庫“幫助”。
(3)通配符在檢索中的運用
1)截詞符
截詞符用””或“?”來表示。檢索時在詞幹的不同位置添加截詞符,以代表詞的可變部位,從而減少相同詞幹檢索詞的輸入,同時也提高查全率。截詞符分為前截詞、后截詞、有限截詞等。每個資料庫都有截詞符使用規定,所以檢索者不能想當然隨便使用截詞符。
2)替代符
英文辭彙常因英式拼寫與美式拼寫不同,而造成一詞多字現象,而這些變化僅僅是因為發音不同造成的。為使檢索詞不漏檢.在變化的位置打上一個替代符,替代變化了的字母。替代符分為強制替代和選擇替代。
3)位置算符
位置算符又稱鄰近算符,其作用是表明兩個檢索詞的位置關係。位置算符與邏輯“與”運算很相似,但比它更具體。邏輯“與”運算僅僅規定了檢索詞的同時可見.但沒有規定檢索詞以什麼位置同時出現。位置算符按照兩個檢索詞出現的順序和距離可分為有序插入詞檢索、無序插入詞檢索和限定距離檢索。

構建策略


檢索式的構建策略,比較有影響的有以下幾種。
①最專指面優先,或者稱為最少記錄面優先,是指在檢索時,首先選擇最專指的概念組面進行檢索,如果檢索命中的文獻相當少,那麼其他概念組面就不再加到檢索式中去;如果檢索命中的文獻較多,就把其他概念組合到檢索提問式中,以提高查准率。
②引文珠形增長策略。這種策略從直接檢索課題中最專指的概念組面開始,以便至少檢出一篇命中文獻。檢索人員從這一條或數條記錄中找到新的規範詞或自由詞,補充到檢索式中去,然後再檢索就能重新查出更多的文獻。
③逐次分餾策略。逐次分餾是指先確定一個較大的、範圍較廣的初始文獻集,然後逐步提高檢索式的專指度,從而逐步縮小命中文獻集,直到得到數量適宜、用戶滿意的文獻集合為止。
④積木型概念組面策略。積木型概念組面策略是把檢索課題分解成若干個概念組面,並分別先對這幾個概念組面進行檢索,在每個概念組面中儘可能全地列舉同義詞、相關詞、近義詞,並用布爾算符“OR”連接成子檢索式,然後再用布爾算符“AND”把所有概念組面的子檢索式連接起來構成一個總檢索式。

構建步驟


為了組構一個最佳檢索式,達到檢索式的質量標準,通常要經過下列5個步驟。
(1)首先要充分地了解讀者的需求。只有在此基礎上,才有可能選擇合適的文獻庫;才有可能正確地選定檢索範圍及科學的組織檢索策略。
(2)用自然語言詳細地表述對文獻的需求。表述中所用語彙應採用常用的科技術語。
(3)在自然語言表述的基礎上,要對檢索的主題加以分析,選擇相應的檢索詞,並確定它們之間的邏輯關係。
(4用邏輯算符將所選擇的檢索詞進行邏輯組配。要注意用位置算符調整檢索詞與文獻摩關鍵詞的匹配關係,形成一個“切題”與“匹配”兼容,具有高經濟性的檢索式。
(5)檢出後由讀者提出意見,屬“噪音”信息,要給出負反饋,修正檢索策略。