Senjata utama data scientist Python. Array, DataFrame, manipulasi data efisien.
Multidimensional array yang sangat efisien. 100x lebih cepat dari Python list untuk operasi numeric. Pondasi semua library data science. Operasi vectorized: hindari loop, pakai array operation.
Tabel yang powerful. Anggap seperti spreadsheet di Python. Akses row dan kolom, filter, group, agregasi. Method ribuan, fokus pelajari yang sering pakai.
Read dari CSV, Excel, JSON, database, API. Method read_csv, read_excel, read_sql. Argument penting: dtype, parse_dates, na_values, index_col. Selalu cek df.info() setelah load.
Boolean indexing untuk filter row. loc dan iloc untuk selection presisi. Conditional dengan multiple kriteria pakai operator and atau.
GroupBy adalah split-apply-combine. Group by kolom, apply fungsi (sum, mean, count), combine hasilnya. Powerful untuk analisis kategorikal. Pivot table juga sering dipakai.