Materi 22 - Programming dan Data Science

Supervised Learning

Algoritma yang belajar dari data berlabel. Klasifikasi dan regresi.

Durasi 32 Menit Level intermediate Kurikulum 30 Materi

1. Apa Itu Supervised Learning

Algoritma belajar dari data dengan label (jawaban yang benar). Tujuan: prediksi label untuk data baru. Dua tipe: klasifikasi (label kategori) dan regresi (label numerik).

2. Klasifikasi

Prediksi kategori. Contoh: spam atau bukan, customer churn atau tidak, diagnosa penyakit. Algoritma: Logistic Regression, Decision Tree, Random Forest, SVM, Neural Network.

3. Regresi

Prediksi nilai kontinu. Contoh: harga rumah, suhu, sales bulan depan. Algoritma: Linear Regression, Ridge, Lasso, Random Forest Regressor, Gradient Boosting.

4. Train Test Split

Bagi data jadi training set (60-80 persen) untuk train model dan test set (20-40 persen) untuk evaluasi. Jangan pernah evaluate di training data, hasilnya akan over-optimistic.

5. Evaluation Metric

Klasifikasi: accuracy, precision, recall, F1, ROC AUC. Regresi: MSE, RMSE, MAE, R-squared. Pilih metric yang relevan dengan business goal, bukan asal default.

Tugas Praktik

  1. Praktek Logistic Regression untuk klasifikasi binary
  2. Linear Regression untuk prediksi harga
  3. Bandingkan 3 algoritma di dataset yang sama
  4. Hitung confusion matrix dan interpretasikan
  5. Tune hyperparameter dengan GridSearch

Rangkuman