IRIS

IRIS數據集

Iris數據集是常用的分類實驗數據集,由Fisher, 1936收集整理。Iris也稱鳶尾花卉數據集,是一類多重變數分析的數據集。數據集包含150個數據集,分為3類,每類50個數據,每個數據包含4個屬性。可通過花萼長度,花萼寬度,花瓣長度,花瓣寬度4個屬性預測鳶尾花卉屬於(Setosa,Versicolour,Virginica)三個種類中的哪一類。其它比較流行的數據集還有Adult,Wine,Car Evaluation等。

目錄

正文


iris以鳶尾花的特徵作為數據來源,常用在分類操作中。該數據集由3種不同類型的鳶尾花的50個樣本數據構成。其中的一個種類與另外兩個種類是線性可分離的,后兩個種類是非線性可分離的。
該數據集包含了5個屬性:
& Sepal.Length(花萼長度),單位是cm;
& Sepal.Width(花萼寬度),單位是cm;
& Petal.Length(花瓣長度),單位是cm;
& Petal.Width(花瓣寬度),單位是cm;
& 種類:Iris Setosa(山鳶尾)、Iris Versicolour(雜色鳶尾),以及Iris Virginica(維吉尼亞鳶尾)。