Materi 18 - Programming dan Data Science

NumPy dan Pandas Mastery

Senjata utama data scientist Python. Array, DataFrame, manipulasi data efisien.

Durasi 32 Menit Level intermediate Kurikulum 30 Materi

1. NumPy Array

Multidimensional array yang sangat efisien. 100x lebih cepat dari Python list untuk operasi numeric. Pondasi semua library data science. Operasi vectorized: hindari loop, pakai array operation.

2. Pandas DataFrame

Tabel yang powerful. Anggap seperti spreadsheet di Python. Akses row dan kolom, filter, group, agregasi. Method ribuan, fokus pelajari yang sering pakai.

3. Data Loading

Read dari CSV, Excel, JSON, database, API. Method read_csv, read_excel, read_sql. Argument penting: dtype, parse_dates, na_values, index_col. Selalu cek df.info() setelah load.

4. Filter dan Selection

Boolean indexing untuk filter row. loc dan iloc untuk selection presisi. Conditional dengan multiple kriteria pakai operator and atau.

5. GroupBy dan Aggregation

GroupBy adalah split-apply-combine. Group by kolom, apply fungsi (sum, mean, count), combine hasilnya. Powerful untuk analisis kategorikal. Pivot table juga sering dipakai.

Tugas Praktik

  1. Load dataset CSV besar dengan Pandas
  2. Praktek 10 method Pandas paling sering
  3. Filter data dengan multiple kriteria
  4. GroupBy customer dan hitung total spend
  5. Bandingkan kecepatan loop Python vs NumPy vectorized

Rangkuman