延伸資訊
解決方案
商業智慧 BI
建置建議與相關服務請參考
BI / ETL 服務

Pentaho Data Mining 資料探勘

Pentaho Data Mining 資料探勘架構於 Weka 開放原始碼機器學習軟體套件之上。 Pentaho資料探勘是一組複雜的工具可進行機器學習與資料探勘。 大量的分類、回歸、關聯規則與叢集演算法能用以幫助更好地分析、理解企業,並進一步經由預測分析改善效能。

Weka Explorer
Weka 是提供資料探勘工作的機器學習演算法的組合,演算法可以是Data set或Java程式碼。
Weka 也適合發展新的Machine Learning Schemes。
Weka 主要使用者介面是 Explorer,提供了幾種主要操作工具:
  • Preprocess Panel
  • Classify Panel
  • Associate Panel
  • Cluster Panel
  • Select Attributes Panel
  • Visualize Panel

Data Integration Plugins
  • Weka Scoring Plugin
    Weka Scoring Plugin 讓在Weka所製作的Classification、Clustering模型可以在Kettle Transform中可進行評分。
  • ARFF Output Plugin
    ARFF Output Plugin 讓您可以從Kettle輸出資料到檔案,使用ARFF(WEKA's Attribute Relation File Format)格式。

Package Manager
Weka 封包是加值功能的組合,從核心系統所拆開。 一個 Package 封包包含一些 .jar檔案、文件、Metadata,也可能有程式碼。
Weka 包含一個封包管理工具與動態載入機制,包含command-line和GUI package manager。

更多Weka畫面請參考這裡