Algoritma yang belajar dari data berlabel. Klasifikasi dan regresi.
Algoritma belajar dari data dengan label (jawaban yang benar). Tujuan: prediksi label untuk data baru. Dua tipe: klasifikasi (label kategori) dan regresi (label numerik).
Prediksi kategori. Contoh: spam atau bukan, customer churn atau tidak, diagnosa penyakit. Algoritma: Logistic Regression, Decision Tree, Random Forest, SVM, Neural Network.
Prediksi nilai kontinu. Contoh: harga rumah, suhu, sales bulan depan. Algoritma: Linear Regression, Ridge, Lasso, Random Forest Regressor, Gradient Boosting.
Bagi data jadi training set (60-80 persen) untuk train model dan test set (20-40 persen) untuk evaluasi. Jangan pernah evaluate di training data, hasilnya akan over-optimistic.
Klasifikasi: accuracy, precision, recall, F1, ROC AUC. Regresi: MSE, RMSE, MAE, R-squared. Pilih metric yang relevan dengan business goal, bukan asal default.