Pentaho Data Mining 資料探勘架構於
Weka 開放原始碼機器學習軟體套件之上。
Pentaho資料探勘是一組複雜的工具可進行機器學習與資料探勘。
大量的分類、回歸、關聯規則與叢集演算法能用以幫助更好地分析、理解企業,並進一步經由預測分析改善效能。
Weka Explorer
Weka 是提供資料探勘工作的機器學習演算法的組合,演算法可以是Data set或Java程式碼。
Weka 也適合發展新的Machine Learning Schemes。
Weka 主要使用者介面是 Explorer,提供了幾種主要操作工具:
- Preprocess Panel
- Classify Panel
- Associate Panel
- Cluster Panel
- Select Attributes Panel
- Visualize Panel
Data Integration Plugins
- Weka Scoring Plugin
Weka Scoring Plugin 讓在Weka所製作的Classification、Clustering模型可以在Kettle Transform中可進行評分。
- ARFF Output Plugin
ARFF Output Plugin 讓您可以從Kettle輸出資料到檔案,使用ARFF(WEKA's Attribute Relation File Format)格式。
Package Manager
Weka 封包是加值功能的組合,從核心系統所拆開。
一個 Package 封包包含一些 .jar檔案、文件、Metadata,也可能有程式碼。
Weka 包含一個封包管理工具與動態載入機制,包含command-line和GUI package manager。
|