Mengambil data dari berbagai sumber (database, survei, web scraping, atau sensor).
- Pembersihan Data (Data Cleaning): Menghapus data yang duplikat, memperbaiki format yang salah, dan menangani nilai yang hilang (missing values).
- Analisis Eksploratif (EDA): Mencari pola, tren, atau anomali awal menggunakan statistik deskriptif dan visualisasi sederhana.
- Pemodelan dan Interpretasi: Menggunakan algoritma atau teknik statistik untuk menarik kesimpulan atau prediksi.
- Visualisasi dan Pelaporan: Menyajikan temuan dalam bentuk grafik atau dashboard agar mudah dipahami oleh pemangku kepentingan.
Tergantung pada tujuannya, analisis data dibagi menjadi empat tingkat kedalaman:
Table
| Jenis Analisis | Pertanyaan yang Dijawab | Contoh |
|---|---|---|
| Deskriptif | Apa yang terjadi? | Laporan penjualan bulanan. |
| Diagnostik | Mengapa itu terjadi? | Mencari korelasi antara cuaca dan penurunan pengunjung toko. |
| Prediktif | Apa yang mungkin terjadi? | Memprediksi stok barang untuk bulan depan berdasarkan tren. |
| Preskriptif | Apa yang harus dilakukan? | Memberikan rekomendasi otomatis untuk memberi diskon pada pelanggan tertentu. |
Pilihan alat biasanya bergantung pada volume data dan kebutuhan teknis:
- Spreadsheets: Microsoft Excel atau Google Sheets (untuk data skala kecil hingga menengah).
- Bahasa Pemrograman: Python (dengan library Pandas, NumPy) atau R (untuk statistik mendalam).
- Business Intelligence (BI): Tableau, Power BI, atau Looker (untuk dashboard interaktif).
- Database: SQL (untuk mengambil dan mengelola data dari database relasional).
Tips untuk Memulai
- Jika Anda baru memulai, fokuslah pada Pembersihan Data dan SQL. Sebagian besar waktu seorang analis data dihabiskan untuk memastikan data tersebut "bersih" sebelum bisa dianalisis dengan benar.
