文檔分類

文檔分類是圖書館學，信息學和計算機科學中的一個問題。其任務是將一個文檔分配到一個或者多個類別中。它可以是通過人工分類完成的，也可以是通過計算機演演算法實現的。多數通過人工的文檔分類問題一直屬於圖書館學的領域，而通過演演算法實現的文檔分類問題則多屬於信息學和計算機科學的領域。這些問題之間是有相同的部分的，所以有一些對文檔分類的跨學科研究。

需要被分類的文檔有可能是純文本，圖片，音樂等等。每一種文檔都有其獨特分類問題。根據特殊的文檔做研究，文檔分類可以細分成文本分類，圖片分類等等。

可以根據主題來進行文檔分類，也可以根據它的屬性（例如文檔的類型，作者，出版的時間等）進行分類。下文只包含主題分類的問題。主要由兩種方法來做根據主題的文檔分類：基於內容的方法以及基於請求的方法。