Statistik bukan untuk akademisi saja. BA wajib paham descriptive vs inferential, hypothesis testing, correlation vs causation, dan distribution untuk decision yang scientifically defensible.
Descriptive: mendeskripsikan data yang ada. Mean, median, std, distribution. Pertanyaan: "apa yang terjadi?"
Inferential: simpulkan tentang population dari sample. Hypothesis test, confidence interval. Pertanyaan: "apakah hasil ini significant?"
μ = Σx / nNilai tengah setelah sortNilai yang paling sering munculUntuk income/revenue/price, median lebih representative dari mean. Mean Indonesia per kapita Rp 70 juta — median jauh di bawah karena distribusi tidak normal.
σ² = Σ(x − μ)² / n // varianceσ = √σ² // std deviation| Distribution | Karakter | Use Case |
|---|---|---|
| Normal (Gaussian) | Bell curve symmetric | Tinggi badan, IQ, error noise |
| Skewed Right | Long tail kanan | Income, price, sales |
| Skewed Left | Long tail kiri | Test score (test mudah) |
| Uniform | Equal probability | Random number, lottery |
| Bernoulli | Binary outcome | Conversion, click/no-click |
| Poisson | Count of events | Customer arrivals/hour, defects |
r = Σ(x−μx)(y−μy) / √(Σ(x−μx)² × Σ(y−μy)²)Range: -1 to +1+1 = perfect positive | -1 = perfect negative | 0 = no linear
Penjualan es krim & tenggelam pantai sama-sama naik di musim panas. Bukan berarti es krim sebabkan orang tenggelam. Correlation sangat kuat, tapi cuaca panas adalah hidden variable. Selalu cari mekanisme kausal.
1. State H₀ (null) & H₁ (alternative). H₀: tidak ada efek. H₁: ada efek.
2. Pilih significance level α (biasanya 0.05).
3. Hitung test statistic (z, t, chi-square).
4. Hitung p-value. Jika p < α, reject H₀.
5. Interpretasikan. "Statistically significant" ≠ "important".
z-test: sample size besar (>30), σ diketahuit-test: sample kecil atau σ tidak diketahuichi-square: categorical data independenceANOVA: compare 3+ groupsMann-Whitney: non-parametric (data tidak normal)
CI = x̄ ± z × (σ/√n)Saat report metric, jangan hanya angka — sertai confidence interval. "Conversion rate 4.2% (95% CI: 3.8% - 4.6%)". Ini menjawab "seberapa yakin kamu dengan angka itu?"
Sebelum experiment, hitung sample size minimum. Tools: Evan Miller, statsmodels Python.
Sample size n bergantung pada:- Baseline rate (p)- MDE (minimum detectable effect)- Power (1-β, biasanya 0.80)- Significance α (biasanya 0.05)