Data demografis anonim masih dapat digunakan untuk mengidentifikasi Anda

[ware_item id=33][/ware_item]

Jika Anda salah satu dari sedikit orang yang membaca ketentuan layanan, Anda mungkin menemukan terkubur dalam kebijakan privasi berbagai perusahaan klausa yang mengatakan bahwa mereka dapat mengumpulkan dan menjual data Anda ke pihak ketiga.


Data, kata mereka, dianonimkan, tetapi sebuah studi baru yang diterbitkan di Komunikasi Alam menunjukkan bahwa, tergantung pada apa yang Anda bagikan, masih mungkin untuk mengidentifikasi kembali Anda dengan akurasi yang mencengangkan. Para peneliti dari Imperial College London dan University of Louvain di Belgia menciptakan model pembelajaran mesin yang dapat mengidentifikasi kembali individu dari set data yang dianonimkan, bahkan dari “set data yang sangat tidak lengkap.”

Pengungkapan seperti itu datang pada saat di mana lebih banyak orang waspada terhadap perusahaan yang menjual data mereka kepada pihak ketiga, dan telah merusak implikasi privasi untuk data anonim yang saat ini disimpan (dan dibagikan) yang dikumpulkan dan digunakan oleh banyak perusahaan dan lembaga akademik..

Bagaimana cara kerja anonimisasi data?

Kecuali Anda benar-benar keluar dari grid, Anda secara teratur menghasilkan banyak data pribadi — mulai dari pembelian daring dan rute berjalan hingga lebih banyak data pribadi seperti catatan kesehatan.

Kumpulan data semacam itu adalah debu emas bagi pengiklan yang ingin meningkatkan penargetan mereka (baca: Cambridge Analytica), dan bagi para peneliti yang mencari tren dalam kesehatan masyarakat, dan untuk mengajarkan pengenalan wajah pada kecerdasan buatan.

Untuk melindungi identitas di balik data, 'praktik terbaik' umum adalah menghapus informasi pengidentifikasi yang jelas seperti nama, alamat email, dan nomor telepon serta jaminan sosial.

[Ingin lebih banyak privasi dan berita keamanan? Mendaftar untuk buletin blog ExpressVPN.]

Teknik anonimisasi yang ketinggalan jaman

Banyak metode anonimisasi populer tetap tidak berubah sejak 1990-an, gagal mengadopsi teknik anonimisasi yang lebih kompleks dalam menanggapi ledakan data online sejak.

Ada beberapa contoh, sejak tahun 2000, dari data yang diduga anonim yang dirilis dan kemudian diidentifikasi kembali..

Pada 2017, jurnalis berhasil "mengidentifikasi kembali politisi dalam set data riwayat penelusuran anonim dari 3 juta warga Jerman, mengungkap informasi medis dan preferensi seksual mereka."

Studi baru juga menunjukkan pekerjaan sebelumnya di mana para peneliti dapat "mengidentifikasi secara unik individu-individu dalam lintasan taksi anonim di NYC, perjalanan berbagi sepeda di London, data kereta bawah tanah di Riga, dan dataset ponsel dan kartu kredit."

Beberapa titik data diperlukan untuk mengidentifikasi kembali Anda

Para peneliti di balik penelitian ini telah membuat formulir online di mana Anda dapat menguji peluang Anda untuk diidentifikasi (hanya untuk warga AS dan Inggris) dari perusahaan asuransi kesehatan hipotetis dengan hanya tiga titik data: jenis kelamin, tanggal lahir, dan kode pos Anda.

Misalnya, jika Anda adalah laki-laki AS yang lahir pada 12 November 1990, dan saat ini tinggal di kode ZIP 02139, ada 54% jika majikan atau tetangga Anda bisa mengidentifikasi Anda.

Data demografis anonim masih dapat digunakan untuk mengidentifikasi AndaTetapi persentase itu meningkat ketika Anda menambahkan lebih banyak atribut: Menambahkan status perkawinan Anda saja dapat meningkatkan peluang mengidentifikasi Anda hingga 99%. Atribut lain termasuk jumlah kendaraan, kelas kerja (industri yang dipilih), dan kepemilikan rumah.

Data demografis anonim masih dapat digunakan untuk mengidentifikasi Anda

Bagaimana seharusnya perusahaan menganonimkan data kami?

Jelas dari penelitian ini bahwa praktik anonimisasi saat ini tidak cukup melindungi privasi orang dan membuat mereka rentan untuk diidentifikasi ulang oleh siapa pun yang memiliki akses ke data tersebut..

Sayangnya, tidak banyak yang dapat dilakukan individu di sini — terserah perusahaan dan lembaga yang menyimpan, menjual, dan menggunakan data ini untuk mengubah cara mereka menganonimkan data. Regulasi seperti GDPR UE dan Undang-Undang Privasi Konsumen California keduanya mengharuskan individu dalam semua set data menjadi anonim dan tidak mungkin untuk diidentifikasi kembali, tetapi meminta pertanggungjawaban perusahaan mungkin terbukti sulit..

Salah satu cara untuk mencegah identifikasi ulang dalam data anonim adalah dengan mengadopsi privasi diferensial, sebuah model matematika yang dengan hati-hati menambahkan sejumlah "suara" acak ke dalam data sebelum dikirim ke server, membuat data sedikit lebih mendekati perkiraan daripada akurat, tetapi cukup melindungi privasi individu. Perusahaan seperti Apple dan Google telah memasukkan privasi diferensial ke dalam pengumpulan data mereka.

Kami akan segera melihat perbedaan privasi diuji: akan digunakan dalam sensus A.S. berikutnya.

Langkah yang dapat Anda ambil untuk melindungi diri sendiri

Jadi, ketika perusahaan meminta izin Anda untuk berbagi data anonim dengan pihak ketiga, apa yang harus Anda lakukan? Pertimbangkan untuk menganonimkan data Anda sendiri. Tidak setiap perusahaan benar-benar berhak atas tanggal lahir Anda yang sebenarnya, kode pos Anda yang sebenarnya, jenis kelamin atau status perkawinan Anda, atau bahkan harus nama asli Anda. Jika detail tidak penting untuk penggunaan layanan tertentu, taburkan beberapa inkonsistensi. (Dan jika nama yang salah eja mulai muncul di kotak surat Anda, Anda akan tahu persis perusahaan mana yang menjual Anda.)

Lebih baik lagi, hanya melakukan bisnis dengan perusahaan yang benar-benar dimuka tentang data apa yang mereka kumpulkan, yang tidak pernah mengumpulkan data apa pun yang tidak mereka butuhkan, yang tidak pernah membagikan atau menjual informasi pribadi Anda dengan pihak ketiga, dan yang mengambil anonimisasi bahkan diagnostik dasar informasi sangat serius (dan bahkan memungkinkan Anda untuk memilih keluar, jika Anda mau). Kita tahu setidaknya satu.

Data demografis anonim masih dapat digunakan untuk mengidentifikasi Anda
admin Author
Sorry! The Author has not filled his profile.