Peran Teknologi dan Penelisik Data di Balik Panama Papers

Kamis 12 Mei 2016 17:52Administratordibaca 324 kaliSemua Kategori

katadata 017

Pada Selasa lalu (10/5), konsorsium wartawan investigasi atau International Consortium of Investigative Journalists (ICIJ) akhirnya membuka bank data Dokumen Panama atau lebih dikenal The Panama Papers ke publik. Isinya memuat daftar 214 ribu perusahaan cangkang di luar negeri (offshore) yang didirikan di 21 negara suaka pajak (tax haven). Selain itu, informasi lebih dari 100 ribu entitas offshore lainnya yang masuk dalam investigasi Offshore Leaks tahun 2013.

Bank data ini bagian dari investigasi ICIJ bersama 376 jurnalis dari 76 negara, yang bersumber dari bocoran data firma hukum Mossack Fonseca di Panama.  Disebut bank data karena menyimpan 11,5 juta dokumen berukuran 2,6 terabita. Ini setara dengan 2.200 film layar lebar berdurasi 90 menit lebih dengan kualitas tinggi (High Definition/HD) atau 6.816 film standar DVD. Karena itulah, Panama Papers disebut sebagai kebocoran data terbesar dalam sejarah jurnalistik.

Bukan perkara mudah memilah, menyisir, hingga mengelompokkan jutaan dokumen dalam beragam format itu. Mulai dari spreadsheet, surat elektronik (e-mail), PDF, hingga format lama yang sudah tidak dijumpai lagi saat ini. Termasuk menampilkannya berdasarkan domisili negara asal pemilik perusahaan cangkang itu sehingga mudah diakses dan dimengerti oleh pengakses dari berbagai penjuru dunia. 

Mar Cabra, anggota ICIJ dan Kepala Tim Data Panama Papers, mengungkapkan proses kerja besar selama 12 bulan untuk mengolah bank data tersebut, yang juga melibatkan koordinasi dengan 376 jurnalis dari 76 negara. Ia menilai pekerjaan itu sangat menantang karena berbagai hal.


Pertama, jumlahnya sangat besar dengan data berukuran 2,6 terabita. Kedua, semua data itu tidak datang bersamaan. Tim Panama Papers berhadapan dengan informasi yang masuk secara bertahap, disertai dengan banyak gambar. Mayoritas dokumen itu berupa e-mail serta bank data. Ada juga dokumen dengan format PDF dan TIFF. 


Mayoritas data tersebut tidak terstruktur dan masih dalam format mentah aslinya. Alhasil, tim harus merekonstruksi dan menghubungkan kode-kode dari dokumen tersebut. "Jadi, kami harus melakukan konversi jutaan dokumen tersebut," kata Cabra dalam wawancara dengan situs teknologi Source, yang dilansir Selasa (10/5) lalu.

Hal seperti itu, dalam kapasitas lebih kecil, sebenarnya juga telah dilakukan Cabra bersama timnya saat mengolah data dan menampilkan dokumen Offshore Leaks tahun 2013 dan Swiss Leaks tahun lalu. "Pemogram kami, Rigoberto Carvajal, benar-benar ahli sulap. Ia sangat mahir mengutak-atik bank data," katanya. Bersama Miguel Fiandor, Carvajal mengekstrak dan mereproduksi bank data, yang dikenal sebagai proses reverse-engineer.


Perbedaannya, bocoran data Panama Papers saat ini menghadirkan informasi yang jauh lebih besar, dengan keterlibatan klien kelas atas Mossack Fonseca. ICIJ kemudian menggabungkan dua bank data menjadi URL Offshore Leaks. Jadi, orang bisa mencari informasi dari bank data terbesar ini mengenai perusahaan offshore. "Namun kami tidak merilis keseluruhan dokumen sebanyak 11,5 juta itu. Yang kami buka adalah data terstruktur yang berasal dari bank data internal Mossack Fonseca," ujarnya.


Keterlibatan para penelisik atau wartawan data seperti Cabra dan perangkat teknologi serta piranti lunak, sangat berperan penting dalam pengolahan dan pembuatan bank data terstruktur tersebut. Cabra mengaku, memanfaatkan teknologi open source yaitu Apache Solr untuk mengerjakan indeks dan Apache Tika untuk memproses dokumen.


Piranti lunak itu mampu memproses banyak dokumen dengan beragam format. Apache Tika bisa dipakai bersama dengan Tesseract untuk mengkonversi dokumen.


Sedangkan untuk konversi gambar, tim Cabra membangun 30-40 server sementara di Amazon sehingga mereka dapat memproses dokumen secara paralel. "Jika kecepatan server membutuk, kami menambah jumlah server. Namun jika sudah cukup cepat, kami mengurangi jumlahnya karena tentu saja setiap server membutuhkan biaya," ujarnya.


Kemudian, tim memasukkan data-data tersebut. Namun masalahnya, Solr tidak memiliki fasilitas pengontrol aplikasi atau user interface. Oleh karena itu, mereka memakai Project Blacklight, sebuah piranti lunak open source yang biasa digunakan oleh pustakawan. Dengan begitu, proses pencarian data menjadi lebih mudah.


Sebagai contoh, tim bisa mencari informasi berdasarkan tahun dan jenis berkas. Sebab, bocoran data Mossack memiliki rentang waktu hampir empat dekade, mulai 1977 hingga akhir 2015. Rantai pengolahan dokumen itu dibangun oleh web developer tim Panama, Matthew Caruana Galizia.


Sebagai visualisasi dari bank data internal Mossack Fonseca, tim Cabra bekerja menggunakan Linkurious. Piranti lunak memungkinkan menampilkan data dalam bentuk grafik. Ditambah piranti lunak ekstraksi Extract, Transform and Load (ETL) bernama Talend, mempermudah pengerjaan untuk mengubah data dari SQL menjadi Neo4j. Yaitu format bank data dalam bentuk grafik yang digunakan oleh Panama Papers.


Ketika data sudah diubah formatnya, langkah selanjutnya adalah memasukkannya dalam Linkurious. "Dalam dua menit, kita sudah bisa melihatnya dalam bentuk jaringan. Jadi, semua orang bisa mengaksesnya dari belahan dunia manapun," kata Cabra.


Visualisasinya pun sangat mudah dipahami semua orang. Bahkan, dia mengklaim, wartawan yang tidak begitu mahir teknologi bisa memanfaatkan dokumen-dokumen tersebut bagaikan seorang pesulap.

Untuk berkomunikasi dengan ratusan wartawan dari puluhan negara, tim Panama Papers memilih Global I-Hub yang memiliki piranti lunak bernama Oxwall. Ini seperti jejaring sosial Facebook, yang memiliki dinding dengan tampilan aktivitas terbaru dari setiap anggota dalam jaringan tersebut. Di sana ada forum yang berisi topik-topik diskusi dan tautan. "Kami bisa berbagi dokumen dan berbincang dengan orang-orang lain dengan seketika," katanya.

Untuk menjaga kerahasiaan dan kebocoran komunikasi internal itu, tim Panama Papers memakai dua tahap autentifikasi dengan fasilitas Google Authenticator. Menurut Cabra, awalnya sempat timbul masalah karena sejumlah wartawan tidak memahami sistem tersebut. Apalagi, ada kekhawatiran bahwa para wartawan dari negara-negara berkembang tidak memiliki ponsel pintar untuk menjalankan dan mengakses sistem itu.


Untungnya, masalah itu cepat teratasi. Semua wartawan memakai platform itu untuk berkomunikasi dan mengaksesnya setiap hari atau beberapa kali dalam sepekan. Mereka berbagi saran dan bertukar pemikiran. Cabra berkisah: suatu hari, rekan saya dalam ICIJ dari Spanyol berkata, “Ya Tuhan, saya menemukan (bintang sepakbola, Lionel) Messi!” Lalu semua orang merespons, “Ya Tuhan, Messi!”

Peran wartawan data

Menurut Cabra, yang paling penting dicatat adalah keterlibatan banyak wartawan. Mulai dari yang sangat fasih menggunakan teknologi, mengulas bocoran dokumen Edward Snowden, hingga memahami segala bentuk enkripsi dan bekerja dengan pengembang hebat. Selain itu, para reporter investigasi tradisional yang memiliki banyak sumber dan jeli dalam menggali dokumen maupun berbicara dengan orang-orang.


"Jadi, setiap perangkat yang kami ciptakan bisa menjangkau semua wartawan yang terlibat. Kami harus menyediakan perangkat sederhana untuk pekerjaan rumit ini," katanya. Jadi, tim Panama Papers memakai platform: Global I-Hub untuk berkomunikasi, serta kombinasi dari Solr, Blacklight dan Linkurious.


Tim Data Panama Papers hanyalah tim kecil. Cabra, wartawan asal Spanyol yang mempelajari jurnalisme data serta reportase investigasi di Universitas Kolumbia, bekerja bersama ICIJ sejak 2011. Kala itu, ICIJ hanya terdiri dari empat orang. Lalu, jumlah anggota bertambah dan tidak tergantung pada proyek yang dikerjakan. Mereka merekrut dua pemrogram dari media massa La Nación di Kosta Rika, yaitu Rigoberto Carvajal dan Matthew Caruana Galizia.


ICIJ sekarang memiliki 12 staf, yang separuhnya adalah anggota tim data dan riset. "Kami memiliki empat pemrogram dan tiga wartawan," kata Cabra.

Dalam merekrut anggota, ICIJ mengutamakan faktor kepercayaan. Setiap anggota baru harus mendapat rekomendasi dari rekan yang telah dikenal sebelumnya. Pertimbangannya, mereka tidak bisa mempercayakan data begitu saja kepada sembarang orang. Harus ada referensi dari orang dekat untuk mengerjakan data tersebut.


Selain itu, ICIJ membutuhkan kerjasama dengan organisasi-organisasi media. Para wartawan harus terpercaya dan mematuhi perjanjian. Setiap orang yang bergabung dengan proyek ini wajib menandatangani suatu perjanjian yang mengharuskan mereka tunduk pada kebijakan embargo.


Mereka juga mesti menaati waktu publikasi Panama Papers ini, yang dilakukan serentak. Jika mempublikasikan dokumen itu bersamaan, ledakannya akan luar biasa. Namun jika rahasia ini bocor, kekuatannya akan berkurang. "Di sini, di Spanyol, dua media yang bekerjasama dengan kami takjub dengan reaksi dunia terhadap publikasi Panama Papers," katanya. 


Menurut Cabra, kehebohan Panama Papers telah menunjukkan sebuah kekuatan dari hasil proses kerjasama tim. "Seperti inilah seharusnya. Tidak ada jalan lain yang bisa dilakukan untuk menganalisa 11,5 juta dokumen dengan ukuran 2,6 tera bita tanpa adanya kolaborasi semacam ini."

Sumber : katadata.co.id (12 Mei 2016)
Foto : katadata.co.id





BERITA TERKAIT
 

Awal Mei, ICIJ Buka Data 200 Ribu Perusahaan dalam Panama PapersAwal Mei, ICIJ Buka Data 200 Ribu Perusahaan dalam Panama Papers

Ini merupakan bank data terbesar yang pernah dirilis ke publik, dengan menampilkan ratusan ribu perusahaan cangkang berikut nama para pemiliknya di sejumlah negara suaka pajak (tax havens).selengkapnya

Menkeu: 79 Persen Data Ditjen Pajak Cocok dengan Panama PapersMenkeu: 79 Persen Data Ditjen Pajak Cocok dengan Panama Papers

Menteri Keuangan (Menkeu) Bambang Brodjonegoro menemukan adanya 79 persen kecocokan data sejumlah nama Warga Negara Indonesia (WNI) yang disebutkan dalam Panama Papers dan data menurut Direktorat Jenderal (Ditjen) Pajak. "Kami menemukan kesamaan 79 persen (nama) yang ada di Panama Papers. Itu diyakini punya rekening di luar negeri dan tahun ini akan dilakukan penegakan hukum.selengkapnya

Dirjen Pajak: Saya Tidak Punya Data Panama PapersDirjen Pajak: Saya Tidak Punya Data Panama Papers

Komisi XI DPR RI meminta Direktur Jenderal Pajak (Dirjen Pajak) Kementerian Keuangan (Kemenkeu) Ken Dwijugeasteadi membuktikan data wajib pajak di Panama Papers untuk segera bisa mengikuti tax amnesty. Pasalnya, realisasi tax amnesty baru 0,6 persen dari target.selengkapnya

Data PPATK Lebih Seram Ketimbang Panama PapersData PPATK Lebih Seram Ketimbang Panama Papers

Sekian lama dokumen Panama Papers bikin heboh, Kepala PPATK Muhammad Yusuf baru buka mulut. Dia mengaku punya data yang lebih lengkap ketimbang Panama Papers. Kata Yusuf, data yang telah diverifikasi PPATK pada 2015, terdapat transaksi mencurigakan sebanyak 56 ribu laporan. "Sejauh ini pemeriksaan Pusat Pelaporan dan Analisis Transaksi Keuangan (PPATK) terhadap data yang dimiliki baru pada tahapselengkapnya

Ada Orang RI di Daftar Panama Papers yang Belum Lapor PajakAda Orang RI di Daftar Panama Papers yang Belum Lapor Pajak

Direktorat Jenderal (Ditjen) Pajak Kementerian Keuangan telah menelusuri data dari nama-nama orang Indonesia yang terseret dalam daftar Panama Papers. Hasilnya, ada beberapa dari nama pebisnis dan politikus Indonesia yang masuk dalam daftar Panama Papers yang belum pernah melaporkan pajak atas aset maupun harta kekayaannya.selengkapnya

Daftar Tax Amnesty, Ini Dokumen yang Harus DilengkapiDaftar Tax Amnesty, Ini Dokumen yang Harus Dilengkapi

UU Pengampunan Pajak atau tax amnesty telah resmi diterapkan. Pemerintah pun menaruh harapan besar dengan terlaksananya program pengampunan pajak ini. Salah satunya adalah dengan adanya tambahan pemasukan penerimaan negara hingga Rp165 triliun yang berasal dari tarif tebusan.selengkapnya

BERITA TERPOPULER


Istri Ingin Gabung NPWP Suami, Begini CaranyaIstri Ingin Gabung NPWP Suami, Begini Caranya

Pasangan suami-istri bisa memilih menjadi satu kesatuan dalam kewajiban pajak atau sebagai satu Nomor Pokok Wajib Pajak (NPWP). Bila sebelumnya istri sudah memiliki NPWP, maka harus dihapuskan dan dialihkan ke suami. Bagaimana caranya?selengkapnya

Ikut Tax Amnesty, Balik Nama Aset Tanah dan Saham Bebas PajakIkut Tax Amnesty, Balik Nama Aset Tanah dan Saham Bebas Pajak

Selain lolos dari sanksi pidana pajak, Wajib Pajak (WP) peserta Program Pengampunan Pajak (Tax Amnesty) akan diberikan fasilitas pembebasan pajak penghasilan (PPh) oleh pemerintah. Insentif ini dapat diperoleh jika pemohon melakukan balik nama atas harta berupa saham dan harta tidak bergerak, seperti tanah dan bangunan.selengkapnya

Pilih Ikut Tax Amnesty atau Pembetulan SPT?Pilih Ikut Tax Amnesty atau Pembetulan SPT?

Direktur Jenderal (Dirjen) Pajak, Ken Dwijugiasteadi menegaskan, program pengampunan pajak (tax amnesty) bukan merupakan kewajiban bagi setiap Wajib Pajak (WP). WP berhak untuk memilih pembetulan Surat Pemberitahuan (SPT) Tahunan Pajak Penghasilan (PPh) dengan aturan main yang berbeda, salah satunya mengenai pengusutan nilai wajar harta.selengkapnya

Paket ke-13, Tarif PPh Final UMKM TurunPaket ke-13, Tarif PPh Final UMKM Turun

Meski sudah selusin, pemerintah berencana kembali menerbitkan paket kebijakan ekonomi ketiga belas. Dalam paket kebijakan ekonomi yang segera keluar ini, pemerintah akan menurunkan tarif pajak penghasilan (PPh) final untuk Usaha Mikro Kecil dan Menengah (UMKM) sebesar 1% omzet.selengkapnya

Ini Sanksi Bagi yang Tak Laporkan Harta saat Ikut Tax AmnestyIni Sanksi Bagi yang Tak Laporkan Harta saat Ikut Tax Amnesty

Menteri Keuangan Bambang Brodjonegoro sudah menyiapkan sanksi tegas bagi wajib pajak yang tidak melaporkan harta dan asetnya secara benar saat mendaftarkan diri dalam pengampunan pajak (tax amnesty).selengkapnya



KATEGORI BERITA :




BERITA TERBARU :


Penerimaan pajak akhir September diprediksi 61,5%Penerimaan pajak akhir September diprediksi 61,5%

Direktorat Jenderal (Ditjen) Pajak harus kerja keras menambal penerimaan pada September, yang pada tahun sebelumnya terbantu dengan adanya program amnesti pajak. Menurut Catatan Ditjen Pajak, dari awal tahun sampai 31 Agustus 2017, realisasi penerimaan pajak telah mencapai 53,5% dari target Anggaran Pendapatan dan Belanja Negara Perubahan (APBNP) 2017 sebesar Rp 1.283,57 triliun.selengkapnya

Penetapan Nilai Harta Oleh Pajak Tidak RelevanPenetapan Nilai Harta Oleh Pajak Tidak Relevan

Pemerintah telah mengeluarkan Peraturan Pemerintah (PP) Nomor 36 tahun 2017. Dalam naskah peraturan itu, bagi wajib pajak yang mengikuti amnesti pajak, PP ini berlaku atas harta bersih yang belum atau kurang diungkap, termasuk bagi wajib pajak yang tidak memenuhi ketentuan pengalihan dan/atau repatriasi harta.selengkapnya

Aturan Baru Pajak Ini Potensi Timbulkan DisputeAturan Baru Pajak Ini Potensi Timbulkan Dispute

Pemerintah telah mengeluarkan Peraturan Pemerintah (PP) Nomor 36 tahun 2017. Dalam naskah peraturan itu, bagi wajib pajak yang mengikuti amnesti pajak, PP ini berlaku atas harta bersih yang belum atau kurang diungkap.selengkapnya

Waktu keluarnya PP 36 dinilai kurang tepatWaktu keluarnya PP 36 dinilai kurang tepat

Pemerintah telah mengeluarkan Peraturan Pemerintah (PP) Nomor 36 tahun 2017. Dalam naskah peraturan itu, bagi wajib pajak yang mengikuti amnesti pajak, PP ini berlaku atas harta bersih yang belum atau kurang diungkap, termasuk bagi wajib pajak yang tidak memenuhi ketentuan pengalihan dan/atau repatriasi harta.selengkapnya

BI memprediksi ekonomi 2019 tumbuh 5,3-5,7 persenBI memprediksi ekonomi 2019 tumbuh 5,3-5,7 persen

Deputi Gubernur Bank Indonesia Perry Warjiyo memprediksi bahwa ekonomi Indonesia tumbuh 5,3-5,7 persen pada 2019, dan manfaat ekonomi dari reformasi struktural yang saat ini sedang berjalan, akan terasa signifikan.selengkapnya

Menteri: `doubel tax deduction` dorong investasi risetMenteri: `doubel tax deduction` dorong investasi riset

Menteri Perencanaan Pembangunan Nasional (PPN)/Kepala Badan Perencanaan Pembangunan Nasional (Bappenas) Bambang P Soemantri Brodjonegoro mengatakan penerapan "double tax deduction" menjadi cara terbaik untuk mendorong sektor swasta melakukan investasi riset.selengkapnya

DJP gunakan penguatan data kejar penerimaan pajakDJP gunakan penguatan data kejar penerimaan pajak

Direktorat Jenderal Pajak Kementerian Keuangan memastikan akan memanfaatkan penguatan basis data dan sistem informasi perpajakan untuk mengejar penerimaan pajak di 2018.selengkapnya

Cara BPRD DKI Tagih Tunggakan Pajak Kendaraan MewahCara BPRD DKI Tagih Tunggakan Pajak Kendaraan Mewah

Badan Pajak dan Retribusi Daerah (BPRD) DKI Jakarta akan mengundang 15 asosiasi pemilik kendaraan mewah. Hal itu didasari adanya 1.700 kendaraan roda empat ataupun roda dua yang nunggak Pajak Kendaraan Bermotor (PKB).selengkapnya

Sri Mulyani: Kenaikan Anggaran Subsidi Bukan PencitraanSri Mulyani: Kenaikan Anggaran Subsidi Bukan Pencitraan

Pemerintah menaikkan anggaran subsidi dalam Rancangan Anggaran Pendapatan dan Belanja Negara (RAPBN) 2018. Jika dalam outlook 2017 dipatok Rp 168,87 triliun, pada tahun depan anggaran subsidi dinaikkan menjadi Rp 172,4 triliun.selengkapnya

Usai Suku Bunga Turun, Pengusaha Minta Menkeu Relaksasi PajakUsai Suku Bunga Turun, Pengusaha Minta Menkeu Relaksasi Pajak

Bank Indonesia (BI) menurunkan suku bunga acuan 7-Days Reverse Repo Rate sebesar 25 basis poin menjadi 4,5 persen. Upaya ini dinilai pengusaha belum cukup untuk mendongkrak pertumbuhan ekonomi lebih tinggi. Masih ada permintaan dari pelaku usaha, salah satunya relaksasi pajak.selengkapnya



 
TAGS # :