查准率
查准率
查准率的數學表達:Precision=#(Retrieved∩Relevant)╱#Retrieved.
Retrieved:待評測檢索系統處理查詢樣例返回結果集合。
Relevant:正確答案集合。
查全率(召回率),是衡量某一檢索系統從文獻集合中檢出相關文獻成功度的一項指標,即檢出的相關文獻與全部相關文獻的百分比。普遍表示為:查全率=(檢索出的相關信息量/系統中的相關信息總量)x100%
關係:查全率與查准率為互逆相關性,查全率一般為60%~70%,查准率約為40%~50%,當查全率超過70%時,若想再提高查全率就必然降低查准率。
衡量某一類文獻檢索系統的信號雜訊比的一種指標。它的數值等於w/m,式中w是用戶鑒別檢出的m篇文獻時,認為實際對口徑的文獻篇數。這一指標最初是1956年由J.W.佩里、A.肯特等人提出的。F.W.蘭開斯特1979年在《情報檢索系統──特性、試驗與評價》(第二版)一書中將某一系統所擁有的文獻總篇數表述為a+b+c+d之和,並列出2×2表格。上述的w篇文獻即為a ,m篇文獻即為a+b,這樣查准率即為a/(a+b),a值是經過一次檢索后,即可由用戶判定的,a+b即經過一次檢索所檢出的全部文獻。例如在某一次檢索過程中共檢出了50篇文獻,用戶判定其中有 10 篇文獻是相關的,則查准率即為10/50=20%。查准率主要取決於檢索語言的專指性和所擬定的檢索策略能否準確表達用戶真正的情報需求。若檢索策略擬訂得較寬泛,參與組配的檢索詞較少,主題詞的概念比用戶的情報需求寬泛,則查准率將降低,而查全率將增加,因為二者一般呈互逆相關關係。查准率標誌某一檢索系統運行過程中拒絕無關文獻、選出有關文獻的能力,同時也是用戶從檢出文獻中進一步篩選出相關文獻所需時間的一種間接測度。為達到相同查全率,高的查准率意味著用戶鑒別檢索結果時只需用較少時間,不過這種測度主要適用於評價情報工作人員代替用戶檢索的情況。