beverage-sales

created Open Notebook Open Notebook LinkedIn Dicoding Profile


Beverage Sales (Clustering & Classification)

beverage-sales

Proyek ini bertujuan untuk menerapkan teknik unsupervised learning dan supervised learning dalam mengeksplorasi dan memprediksi pola dari suatu dataset. Dua pendekatan utama yang digunakan adalah Clustering (dengan PCA sebagai teknik reduksi dimensi) dan Classification menggunakan tiga model yang berbeda.

Clustering

Metode

Langkah-langkah

  1. Preprocessing Data: Normalisasi dan encoding data numerik dan kategorikal.
  2. Dimensionality Reduction: Menggunakan PCA untuk mengurangi kompleksitas dan memudahkan visualisasi.
  3. Clustering: Menerapkan K-Means dan menentukan jumlah cluster optimal dengan Elbow Method dan Silhouette Score.
  4. Interpretasi: Analisis karakteristik dari masing-masing cluster setelah dilakukan inverse transform ke data asli.

Classification

Model yang Digunakan

Langkah-langkah

  1. Preprocessing:
    • Encoding data kategorikal (One-Hot atau Label Encoding)
    • Normalisasi fitur numerik
    • Pembagian data menjadi training dan testing
  2. Training Model: Melatih ketiga model klasifikasi di atas dengan data training.
  3. Evaluasi:
    • Evaluasi dilakukan menggunakan metrik Accuracy, Precision, Recall, dan F1-Score pada data training dan testing.

Hasil

Ketiga model klasifikasi menunjukkan performa yang sangat tinggi dengan hasil evaluasi sebagai berikut: