pmml
pmml
全稱預測模型標記語言(Predictive Model Markup Language),利用XML描述和存儲數據挖掘模型,是一個已經被W3C所接受的標準。MML是一種基於XML的語言,用來定義預測模型。
PMML全稱預測模型標記語言(Predictive Model Markup Language),它為各個公司定義預測模型和在不同的應用程序之間共享模型提供了一種快速並且簡單的方式。通過使用標準的XML解析器對PMML進行解析,應用程序能夠決定模型輸入和輸出的數據類型,模型詳細的格式,並且按照標準的數據挖掘術語來解釋模型的結果。 PMML提供了一個靈活機制來定義預測模型的模式,同時支持涉及多個預測模型的模型選擇和模型平衡(model averaging)。對於那些需要全部學習(ensemble learning)、部分學習(partitioned learning)和分散式學習(distributed learning)的應用程序,這種語言被證明是非常有用的。另外,它使得在不同的應用程序和系統之間移動預測模型變得容易、方便。特別地,PMML非常適合部分學習、元學習、分散式學習、以及相關領域。
PMML的模型定義由以下幾部分組成:
頭文件
數據模式
數據挖掘模式
預言模型模式
預言模型定義
全體模型定義
選擇與聯合模型和全體模型的規則
異常處理規則
其中,預言模型的模式和預言模型定義組件是必需的,其他可選。
數據挖掘模型包括預言模型和描述模型,因此,PMML並不是全面的數據挖掘模型定義語言。