Audit Kualitas Metadata Portal Satu Data Indonesia
Inspeksi langsung 200 dataset dari data.go.id di 20 K/L terbesar · 5 Mei 2026.
- Disusun oleh
- Orionex Research Team
- Tanggal Publikasi
- 5 Mei 2026
- Estimasi Baca
- ~8 menit
- Referensi
- Lampiran proposal program AI Incubation for Public Sector
Ringkasan Temuan
Empat angka kunci yang merangkum skala dan urgensi masalah kualitas metadata di portal Satu Data Indonesia.
Top 20 K/L by Dataset Count
Seluruh 20 K/L dengan dataset terbanyak masuk klasifikasi POOR, dengan completeness score 0,000 di seluruh sampel.
Bar menunjukkan jumlah dataset yang dipublikasikan tiap K/L (filter Walidata di portal). Warna merah merepresentasikan klasifikasi POOR pada keseluruhan sampel; tidak ada satu pun yang PARTIAL atau COMPLETE.
17 Bidang SDI · 0% Terisi
Tidak satu pun dari 17 bidang Satu Data Indonesia (SDI) terisi pada keseluruhan 200 dataset yang diaudit. Total: 0 dari 3.400 slot.
Tiga Temuan Utama
Pola yang muncul konsisten lintas seluruh 20 K/L yang diaudit.
Tidak satu pun dari 200 dataset memiliki metadata SDI terisi
Pada keseluruhan sampel 20 K/L terbesar, completeness score rata-rata adalah 0,000 dengan 0 dari 3.400 slot bidang SDI terisi. Setiap dataset menampilkan banner peringatan non-kepatuhan SDI dari portal sendiri.
Semua dataset per K/L share tanggal publish yang sama
Pola seragam tanggal publikasi mengindikasikan upload massal melalui sistem tanpa enrichment metadata. Contoh: 10 dataset Kabupaten Demak dipublikasi serentak 22-05-2023; 10 dataset Provinsi Bali serentak 24-07-2023.
Mayoritas dataset tidak memiliki file yang bisa diunduh
Hanya 24% dataset menyediakan file data (XLSX, JSON, SHP, CSV, XLS). Sisanya 76% hanya menampilkan tombol "Request Data", sehingga portal berfungsi sebagai katalog metadata kosong, bukan repositori data aktual.
AutoInsight oleh Orionex — AI Metadata Enrichment untuk Portal Satu Data Indonesia
Pengisian 9.525.151 slot metadata kosong secara manual tidak feasible. Ekstrapolasi dari sampel ini menghasilkan 420.227 jam analis dan IDR 168,1 miliar biaya tenaga kerja.
AutoInsight adalah platform AI Orionex yang secara otomatis mengekstrak, menginferensi, dan mengisi 17 bidang SDI berdasarkan judul dataset, konten dokumen, dan konteks instansi pemerintah. Akurasi proyeksi rata-rata 81% (≥ 14/17 bidang), sehingga analis hanya melakukan review draft selama 2 menit per dataset.
Laporan ini disusun oleh Orionex Research Team sebagai lampiran proposal program AI Incubation for Public Sector untuk penguatan kualitas data Portal Satu Data Indonesia, dengan AutoInsight sebagai solusi yang diusulkan.
Dampak: Tanpa vs Dengan AutoInsight
Proyeksi dampak diterapkan pada 560.303 dataset di portal data.go.id.
| Indikator | Tanpa AutoInsight | Dengan AutoInsight |
|---|---|---|
| Waktu per dataset | 45 menit | 2 menit (review draft AI) |
| Total jam analis | 420.227 jam | 18.677 jam |
| Biaya total | IDR 168,1 miliar | IDR 7,5 miliar |
| Waktu selesai (50 analis) | 4,8 tahun | 1,9 bulan |
| Completeness score | 0,00 | ≥ 0,81 |
| % dataset POOR | 100% | < 5% |
Konteks Regional
Indonesia memiliki portal open data terbesar di kawasan, namun completeness metadata mendekati nol; gap terbesar sekaligus peluang transformasi terbesar.
Metodologi
Catatan teknis dan limitasi audit ini.
- Metode Sampling10 dataset pertama dari halaman listing tiap K/L (urutan default portal), pada 20 K/L dengan jumlah dataset terbanyak menurut filter Walidata.
- Parser & Sumber DataHTML hasil Next.js SSR di data.go.id, di-parse via Playwright MCP dan WebFetch. Konten metadata terdeteksi pada pola DOM: div.font-bold (label) + div.overflow-hidden (value).
- Ukuran Sampel200 dataset (20 K/L × 10 dataset). Tanggal audit: 5 Mei 2026.
- Definisi Skor KelengkapanCompleteness score = jumlah bidang SDI terisi / 17. Klasifikasi: POOR < 0,40 · PARTIAL 0,40–0,79 · COMPLETE ≥ 0,80.
- LimitasiSampel 10 dataset per K/L mungkin tidak merepresentasikan portofolio penuh; halaman selanjutnya tidak diaudit. Validasi silang menunjukkan pola 100% POOR konsisten lintas tipe pemerintahan (provinsi, kota, kabupaten), mengindikasikan temuan sistemik dan bukan sampling bias.
Data Audit Mentah
200 record hasil inspeksi dataset, bisa difilter berdasarkan K/L atau dicari berdasarkan judul.
Laporan ini disusun oleh Orionex Research Team sebagai lampiran proposal program AI Incubation for Public Sector untuk Portal Satu Data Indonesia (data.go.id). Solusi yang diusulkan: AutoInsight oleh PT Orionex Solusi Digital.
Tanggal audit: 5 Mei 2026 · Sumber data: data.go.id (Portal Satu Data Indonesia).