Materi 17 - Programming dan Data Science

Python untuk Data Science

Bahasa de facto data science. Setup, library, dan workflow notebook.

Durasi 26 Menit Level beginner Kurikulum 30 Materi

1. Kenapa Python

Syntax mudah dibaca. Library data science matang (NumPy, Pandas, scikit-learn). Komunitas besar. Cocok untuk prototyping cepat. Hampir semua bootcamp dan course pakai Python.

2. Setup Environment

Install Anaconda untuk all-in-one Python plus library. Atau virtual environment dengan venv. Jupyter Notebook untuk eksperimen interaktif. VS Code dengan Python extension untuk project.

3. Library Wajib

NumPy (numerical computing). Pandas (data manipulation). Matplotlib dan Seaborn (visualisasi). Scikit-learn (machine learning). Plus lainnya: requests, BeautifulSoup, pytest.

4. Notebook Workflow

Jupyter Notebook bagus untuk eksplorasi: code plus markdown plus output di 1 dokumen. Tapi jangan pakai untuk production. Convert ke .py file kalau sudah stabil.

5. Best Practices

Virtual environment per project. Requirements.txt untuk reproducibility. Type hints untuk readability. Docstrings untuk function. Linter dan formatter (Black, Ruff) konsisten.

Tugas Praktik

  1. Install Anaconda atau Miniconda
  2. Setup virtual environment dan install 5 library wajib
  3. Jalankan first Jupyter notebook
  4. Praktek import dan basic operation
  5. Buat data analysis sederhana dari dataset CSV

Rangkuman