特徵選擇

特徵選擇

特徵選擇( Feature Selection )也稱特徵子集選擇( Feature Subset Selection , FSS ),或屬性選擇( Attribute Selection )。是指從已有的M個特徵(Feature)中選擇N個特徵使得系統的特定指標最優化,是從原始特徵中選擇出一些最有效特徵以降低數據集維度的過程,是提高學習演演算法性能的一個重要手段,也是模式識別中關鍵的數據預處理步驟。對於一個學習演演算法來說,好的學習樣本是訓練模型的關鍵。

此外,需要區分特徵選擇與特徵提取。特徵提取 ( Feature extraction )是指利用已有的特徵計算出一個抽象程度更高的特徵集,也指計算得到某個特徵的演演算法。

特徵選擇過程一般包括產生過程,評價函數,停止準則,驗證過程,這4個部分。

基本介紹


特徵選擇也叫特徵子集選擇 ( FSS , Feature Subset Selection ) 。是指從已有的M個特徵(Feature)中選擇N個特徵使得系統的特定指標最優化。