Pondasi yang sering dilewati. Descriptive, inferential, hypothesis testing.
Mean, median, mode (central tendency). Variance, standard deviation (spread). Quartile, percentile (posisi). Wajib pahami distribusi sebelum modeling.
Normal (bell curve). Uniform (semua sama). Binomial (binary outcome). Poisson (count of events). Mengenali distribusi membantu pilih analytics tepat.
Null hypothesis (H0) vs alternative (H1). p-value untuk decide reject atau tidak. Significance level alpha biasanya 0.05. Type I error (false positive) vs Type II (false negative).
Range yang kemungkinan mengandung nilai population sebenarnya. Lebih informatif dari point estimate tunggal. 95 persen confidence umum dipakai.
p-hacking (test banyak sampai ada yang significant). Korelasi vs kausalitas. Sample size kecil. Cherry-picking data. Simpsons paradox. Kenali sebelum buat decision dari data.