Dashboard BI untuk
Analisis & Klasterisasi
Wilayah Jawa Barat
Platform Business Intelligence berbasis Smart City untuk menganalisis dan mengelompokkan 27 kabupaten/kota di Jawa Barat berdasarkan tingkat kejadian banjir dan jumlah produksi sampah menggunakan K-Means Clustering.
Business Intelligence · Semester 6 · 2025/2026
Latar Belakang & Konteks Masalah
Provinsi Jawa Barat menghadapi tantangan kompleks dalam pengelolaan lingkungan hidup di tengah pesatnya laju urbanisasi. Tingginya frekuensi kejadian banjir dan volume produksi sampah yang terus meningkat menuntut pendekatan strategis berbasis data untuk mendukung formulasi kebijakan yang proaktif dan terukur.
Konteks Penelitian
Platform ini dikembangkan sebagai bagian dari implementasi Business Intelligence dalam mendukung ekosistem Smart City Provinsi Jawa Barat, khususnya pada pilar Smart Environment dan Smart Governance.
Data yang digunakan bersumber dari Open Data Jawa Barat yang mencakup dua dimensi fundamental: rekapan historis kejadian bencana banjir dan volume penanganan sampah di wilayah kabupaten/kota di Provinsi Jawa Barat.
Melalui pendekatan analitik K-Means Clustering, metode machine learning unsupervised digunakan untuk mengelompokkan wilayah berdasarkan tingkat banjir dan volume sampah secara objektif. Hasil segmentasi ini membagi wilayah ke dalam kategori risiko Tinggi, Sedang, dan Rendah.
Dashboard ini dikembangkan untuk mendukung data-driven decision making dalam pengelolaan lingkungan di Provinsi Jawa Barat, memfasilitasi pemangku kepentingan dalam merumuskan strategi mitigasi risiko banjir dan optimalisasi pengelolaan sampah.
Tujuan Analisis
Mengidentifikasi wilayah prioritas untuk mitigasi risiko banjir dan pengelolaan sampah berdasarkan data historis.
Membangun model K-Means Clustering yang optimal untuk segmentasi wilayah berdasarkan profil kerawanan lingkungan.
Menyediakan Dashboard Business Intelligence interaktif yang komprehensif bagi pemangku kepentingan dan masyarakat.
Menghasilkan rekomendasi kebijakan berbasis data (data-driven) untuk alokasi sumber daya yang lebih presisi dan efisien.
Mendukung percepatan implementasi Smart Environment dan Smart Governance melalui tata kelola berbasis analitik cerdas.
Krisis Banjir
Jawa Barat mengalami ratusan kejadian banjir setiap tahun yang berdampak pada jutaan warga dan infrastruktur daerah.
Masalah Sampah
Produksi sampah yang terus meningkat di berbagai wilayah memperburuk kualitas lingkungan dan memicu risiko bencana.
K-Means Clustering
Metode machine learning unsupervised digunakan untuk mengelompokkan wilayah berdasarkan tingkat banjir dan volume sampah secara objektif.
Prioritas Penanganan
Mengidentifikasi wilayah dengan risiko tinggi agar pemerintah dapat mengalokasikan sumber daya mitigasi secara tepat sasaran.
Smart City Integration
Mengintegrasikan Dashboard Business Intelligence ke dalam ekosistem Smart City Jawa Barat untuk mendukung Smart Governance dan Smart Environment.
Data-Driven Policy
Menyediakan rekomendasi kebijakan berbasis data (data-driven decision making) yang terukur dan dapat diimplementasikan secara strategis.
Metrik Utama Analisis Data
Metrik utama digunakan untuk menggambarkan kondisi banjir, volume sampah, hasil clustering, dan kualitas model analisis data di Provinsi Jawa Barat.
Menampilkan total agregasi kejadian banjir dari dataset.
Menampilkan volume rata-rata produksi sampah (ribu ton/tahun).
3 Cluster Risiko (Rendah, Sedang, Tinggi).
Menampilkan persentase wilayah yang masuk cluster risiko tinggi.
Data historis analisis dari tahun 2015 sampai dengan 2023.
Metrik evaluasi untuk mengukur validitas model K-Means.
Pemangku Kepentingan Utama
Stakeholder utama berperan dalam mendukung pengambilan keputusan berbasis data untuk pengelolaan banjir dan sampah di Provinsi Jawa Barat.
Dinas Lingkungan Hidup
Pengelolaan Lingkungan
Bertanggung jawab atas pengelolaan lingkungan yang terintegrasi, pemantauan kualitas ekosistem, serta penanganan dan distribusi sampah berbasis data.
BPBD Jawa Barat
Mitigasi Risiko Banjir
Berperan aktif dalam kesiapsiagaan bencana dan mitigasi risiko banjir melalui identifikasi wilayah rawan secara komprehensif dan sistematis.
Pemerintah Daerah
Smart Governance
Fokus pada implementasi Smart Governance melalui pengambilan keputusan berbasis data untuk menetapkan prioritas wilayah dan koordinasi penanganan.
Bappeda / Perencana Kota
Pembangunan Berkelanjutan
Merumuskan kebijakan jangka panjang dan mengintegrasikan data lingkungan untuk mendukung perencanaan pembangunan berkelanjutan di Jawa Barat.
Masyarakat & Akademisi
Partisipasi Publik
Mendorong peningkatan edukasi lingkungan, mendukung penelitian lanjutan terkait Business Intelligence, dan memperkuat partisipasi publik.
Pertanyaan Bisnis Utama
Pertanyaan bisnis digunakan untuk mengarahkan proses analisis data dan mendukung pengambilan keputusan berbasis data dalam pengelolaan banjir dan sampah di Provinsi Jawa Barat.
Konteks Analisis
Analisis dilakukan terhadap data kejadian banjir historis untuk mengidentifikasi wilayah dengan tingkat kerawanan tertinggi.
Insight Analisis
Distribusi data tidak merata (right skewed), di mana beberapa wilayah mencatat frekuensi banjir yang jauh lebih tinggi dibandingkan wilayah lainnya.
Konteks Analisis
Pemetaan sebaran wilayah menggunakan metode K-Means Clustering untuk melihat pengelompokan berdasarkan volume sampah dan frekuensi banjir.
Insight Analisis
Clustering menghasilkan 3 kategori risiko, namun secara spesifik terdapat wilayah dengan produksi sampah tinggi dan frekuensi kejadian banjir tinggi secara bersamaan.
Konteks Analisis
Evaluasi statistik untuk mengukur korelasi antara volume sampah dengan frekuensi kejadian banjir di tingkat kabupaten/kota.
Insight Analisis
Berdasarkan hasil analisis, hubungan antara produksi sampah dan kejadian banjir tergolong lemah, mengindikasikan faktor lain yang lebih dominan memicu banjir.
Konteks Analisis
Identifikasi wilayah yang memerlukan intervensi segera berdasarkan tingkat kerawanan lingkungan secara keseluruhan.
Insight Analisis
Wilayah risiko tinggi menjadi prioritas penanganan utama untuk mendukung efisiensi mitigasi bencana dan manajemen lingkungan dalam kerangka Smart Governance.
Konteks Analisis
Evaluasi pembentukan klaster menggunakan machine learning unsupervised dalam membentuk segmentasi yang objektif.
Insight Analisis
Metode K-Means Clustering menghasilkan 3 kategori risiko secara optimal, yang menunjukkan pemisahan klaster yang valid untuk pengambilan keputusan berbasis data.
Timeline Progress Project
Roadmap pengerjaan proyek selama 5 minggu mencakup seluruh tahapan Business Intelligence dari pemahaman bisnis hingga delivery dashboard.
Business Understanding
Pemahaman mendalam tentang konteks bisnis, penetapan KPI, formulasi pertanyaan bisnis, dan pemilihan dataset yang relevan dari Open Data Jawa Barat.
Exploratory Data Analysis
Eksplorasi mendalam data banjir dan sampah melalui analisis statistik deskriptif, visualisasi distribusi, dan identifikasi pola awal.
ETL & Data Warehouse
Pembangunan pipeline ETL, pembersihan data, integrasi multi-source, dan perancangan skema Data Warehouse dengan model dimensional Star Schema.
K-Means Clustering
Implementasi algoritma K-Means, optimasi hyperparameter menggunakan Elbow Method, validasi dengan Silhouette Score, dan interpretasi hasil cluster.
Dashboard & Insights
Pembangunan dashboard BI interaktif, narasi data storytelling berbasis cluster, dan perumusan rekomendasi kebijakan berbasis data untuk stakeholder.
Eksplorasi Data Awal
Analisis statistik deskriptif dan visualisasi pola awal pada dataset banjir dan sampah Jawa Barat periode 2015–2023 sebelum dilakukan clustering.
Memuat data EDA...
Data Warehouse & Star Schema
Arsitektur dimensional model dengan Star Schema untuk mengintegrasikan data banjir dan sampah dari multiple source ke dalam satu repositori analitik.
K-Means Clustering Analysis
Implementasi algoritma K-Means Clustering untuk mengelompokkan 27 kabupaten/kota di Provinsi Jawa Barat ke dalam 3 klaster risiko berdasarkan frekuensi banjir dan volume timbulan sampah periode 2015–2023.
Unsupervised learning · k=3 · random_state=42
Risiko Rendah · Risiko Sedang · Risiko Tinggi
Kualitas clustering: Excellent
Distribusi Klaster Wilayah
Total 27 wilayah Provinsi Jawa Barat · Periode 2015–2023
Visualisasi Cluster — Scatter Plot
Volume Sampah Kumulatif (X) vs Total Kejadian Banjir (Y) · 2015–2023
Wilayah dengan frekuensi banjir dan volume sampah tertinggi yang menjadi prioritas utama penanganan lingkungan dan mitigasi bencana.
Rata-rata Centroid (2015–2023)
Wilayah (4)
Wilayah dengan tingkat risiko moderat yang memerlukan peningkatan kapasitas pengelolaan lingkungan dan program preventif berkala.
Rata-rata Centroid (2015–2023)
Wilayah (4)
Wilayah dengan kondisi lingkungan relatif terkendali. Fokus pada pemeliharaan kapasitas dan pemantauan rutin.
Rata-rata Centroid (2015–2023)
Wilayah (19)
Peta Sebaran Interaktif
Visualisasi geospasial digunakan untuk menampilkan persebaran wilayah berdasarkan hasil clustering tingkat banjir dan volume sampah di Provinsi Jawa Barat.
19
Risiko Rendah
wilayah teridentifikasi
4
Risiko Sedang
wilayah teridentifikasi
4
Risiko Tinggi
wilayah teridentifikasi
Distribusi Klaster Wilayah
Algoritma K-Means Clustering (k=3) mengelompokkan 27 kabupaten/kota di Provinsi Jawa Barat berdasarkan dua variabel utama: frekuensi kejadian banjir dan volume timbulan sampah periode 2015–2023.
🟢 Risiko Rendah
Wilayah dengan frekuensi banjir dan volume sampah relatif rendah serta memerlukan pemantauan rutin.
🟡 Risiko Sedang
Wilayah dengan tingkat risiko moderat yang memerlukan peningkatan pengelolaan lingkungan dan monitoring berkala.
🔴 Risiko Tinggi
Wilayah dengan frekuensi banjir dan volume sampah tinggi sehingga menjadi prioritas penanganan lingkungan.
Relevansi Smart City
Peta sebaran ini mendukung dua dimensi Smart City dalam pengambilan keputusan berbasis data:
Smart Environment — pemantauan risiko lingkungan berbasis data spasial dan pengelolaan lingkungan yang berkelanjutan.
Smart Governance — mendukung perencanaan kebijakan pengelolaan banjir dan sampah berbasis analitik klaster wilayah.
Memuat peta geospasial…
Klik marker untuk melihat detail wilayah berdasarkan hasil clustering metode K-Means (k=3) periode 2015–2023.
Dashboard BI Preview
Visualisasi interaktif hasil analisis banjir dan volume sampah di Provinsi Jawa Barat berdasarkan metode K-Means Clustering periode 2015–2023.
Loading Dashboard Data...
Insight Analisis Data
Merangkum temuan kunci dari Exploratory Data Analysis (EDA) dan pemodelan K-Means untuk mendukung pengambilan keputusan berbasis data yang objektif.
Kondisi Distribusi Data
Mayoritas Frekuensi Rendah
Sebagian besar wilayah kabupaten/kota di Jawa Barat mencatatkan jumlah kejadian banjir yang relatif rendah. Hal ini menunjukkan bahwa frekuensi banjir tinggi hanya terkonsentrasi pada wilayah tertentu.
Distribusi Right-Skewed
Analisis distribusi data memperlihatkan pola right-skewed (condong ke kanan), mengindikasikan adanya outlier di mana sebagian kecil wilayah menghasilkan volume sampah dan frekuensi banjir yang sangat ekstrem.
Hubungan Sampah & Banjir
Korelasi Non-Linear
Berdasarkan Exploratory Data Analysis (EDA), tidak ditemukan korelasi linear yang kuat secara langsung antara total produksi sampah dengan frekuensi kejadian banjir di berbagai wilayah.
Variabilitas Karakteristik Wilayah
Tingginya volume sampah di suatu wilayah tidak selalu berbanding lurus dengan tingginya angka banjir. Variabilitas ini sangat dipengaruhi oleh anomali geografis, infrastruktur drainase, dan tata ruang masing-masing daerah.
Segmentasi & Rekomendasi
Karakteristik 3 Klaster (K-Means)
Segmentasi menghasilkan Cluster 0 untuk Risiko Rendah (mendominasi), Cluster 1 untuk Risiko Sedang, dan Cluster 2 untuk Risiko Tinggi (seperti Kabupaten Bogor yang memiliki tingkat banjir tertinggi).
Mitigasi Bencana Terarah
Insight analisis ini menyarankan agar kebijakan pemerintah daerah difokuskan pada mitigasi bencana terarah dan perbaikan pengelolaan tata ruang kota berdasarkan segmentasi risiko secara objektif.
Rekomendasi Berdasarkan Hasil Analisis
Rekomendasi dan interpretasi hasil digunakan untuk mendukung pengambilan keputusan berbasis data dalam pengelolaan banjir dan sampah di Provinsi Jawa Barat.
Wilayah Risiko Rendah
Merupakan wilayah yang relatif aman dari ancaman banjir ekstrem dan timbulan sampah sangat tinggi. Memerlukan pemantauan rutin dan monitoring kondisi lingkungan secara berkala untuk menjaga stabilitas.
Wilayah Risiko Sedang
Wilayah dengan tingkat kerawanan menengah. Fokus utama adalah pada peningkatan pengelolaan sampah, pengawasan produksi sampah, serta peningkatan kebersihan lingkungan untuk mencegah eskalasi risiko.
Wilayah Risiko Tinggi
Menjadi prioritas utama penanganan banjir dari pemerintah. Memerlukan mitigasi lingkungan lebih lanjut serta membutuhkan perhatian khusus dalam pengelolaan infrastruktur drainase dan tata kelola sampah.
Identifikasi Prioritas via Clustering
Metode K-Means Clustering membantu identifikasi wilayah prioritas secara objektif tanpa bias subjektif, memisahkan wilayah ke dalam segmen kerawanan yang berbeda untuk intervensi spesifik.
Mendukung Konsep Smart City
Visualisasi data dan dashboard interaktif ini mendukung perwujudan Smart Environment dan Smart Governance melalui pengambilan keputusan berbasis data (data-driven decision making).
Contoh Representasi Klaster
Karakteristik wilayah berdasarkan hasil clustering
Data-Driven Decision
Pengambilan keputusan didasarkan pada fakta data objektif.
Smart Environment
Mendukung pemantauan dan keberlanjutan lingkungan hidup.
Smart Governance
Peningkatan tata kelola pemerintahan berbasis teknologi informasi.
Download Center
Pusat data digunakan untuk menyediakan dataset, hasil clustering, dan output ETL yang mendukung proses analisis dan visualisasi Business Intelligence.
Dataset Banjir dan Produksi Sampah Jawa Barat (2015–2023)
Dataset gabungan multi-source dari Open Data Jabar. Berisi data kejadian banjir dan volume sampah. Dataset digunakan untuk analisis Business Intelligence dan clustering wilayah. Dataset terdiri dari 243 baris dan 11 kolom.
Hasil Analisis K-Means Clustering
Dataset hasil preprocessing dan clustering wilayah. Mengelompokkan wilayah ke dalam kategori: Risiko Rendah, Risiko Sedang, dan Risiko Tinggi. Digunakan untuk visualisasi dan analisis prioritas penanganan.
Data Warehouse & Output ETL
Berisi hasil proses ETL dan struktur data warehouse. Meliputi: dim_waktu, dim_lokasi, fact_banjir_sampah. Digunakan sebagai sumber analisis dan visualisasi dashboard BI.
Sumber Referensi Resmi
Berikut adalah tautan sumber rujukan resmi yang digunakan sebagai dasar penyusunan dataset dan dashboard Business Intelligence ini:
- Open Data Jabar — Volume Sampah yang Ditangani Berdasarkan Kabupaten/Kota di Jawa Barat
- Open Data Jabar — Jumlah Kejadian Bencana Banjir Berdasarkan Kabupaten/Kota di Jawa Barat