Anonimleştirilmiş demografik veriler sizi tanımlamak için kullanılabilir
Hizmet şartlarını okuyan az sayıda kişiden biriyseniz, verilerinizi üçüncü taraflara toplayıp satabileceklerini belirten bir fıkranın çeşitli şirketlerin gizlilik politikalarında gömülü olduğunu görebilirsiniz..
Diyorlar ki veriler anonimleştiriliyor, ancak yeni bir çalışma Doğa İletişimi paylaştığınız şeye bağlı olarak sizi şaşırtıcı bir doğrulukla tekrar tanımlamanın mümkün olabileceğini gösterir. Imperial College London ve Belçika’daki Louvain Üniversitesi’nden araştırmacılar, “çok eksik veri kümelerinden” bile anonimleştirilmiş veri kümelerinden bireyleri yeniden tanımlayabilen bir makine öğrenme modeli oluşturdular.
Bu tür açıklamalar, daha fazla kişinin verilerini üçüncü taraflara satan şirketlere karşı dikkatli olduğu ve birçok şirketin ve akademik kurumun topladığı ve kullandığı şu anda depolanan (ve paylaşılan) anonim veriler için zarar verici gizlilik etkileri olduğu bir zamanda gelir..
Veri anonimleştirme nasıl çalışır??
Tamamen şebekeden ayrılmadıkça, çevrimiçi satın alımlarınızdan ve koşu rotalarınızdan sağlık kayıtlarınız gibi daha kişisel verilerinize kadar düzenli olarak çok sayıda kişisel veri üretiyorsunuz..
Bu tür veri paketleri, hedeflemelerini iyileştirmek isteyen reklamverenler için altın tozudır (okuma: Cambridge Analytica) ve halk sağlığı alanındaki eğilimleri arayan ve yapay zekaya yüz tanıma öğretmek için araştırmacılar için.
Verilerin arkasındaki kimlikleri korumak için genel “en iyi uygulamalar”, adlar, e-posta adresleri, telefon ve sosyal güvenlik numaraları gibi açık bir şekilde tanımlayıcı bilgileri kaldırmak olmuştur.
[Daha fazla gizlilik ve güvenlik haberleri mi istiyorsunuz? ExpressVPN blog bültenine kaydolun.]
Eski anonimleştirme teknikleri
Popüler anonimleştirme yöntemlerinin birçoğu 1990’lardan bu yana değişmeden kaldı ve o zamandan beri çevrimiçi verilerin patlamasına yanıt olarak daha karmaşık anonimleştirme teknikleri benimsemedi.
2000 yılına kadar uzanan, sözde anonim veri kümelerinin serbest bırakılıp sonra yeniden tanımlandığı birkaç örneği olmuştur..
2023’de gazeteciler başarılı bir şekilde “3 milyon Alman vatandaşının anonim bir tarama tarihi veri kümesinde politikacıları yeniden tanımladı, tıbbi bilgilerini ve cinsel tercihlerini ortaya çıkardı.”
Yeni çalışma aynı zamanda araştırmacıların “NYC’deki anonimleştirilmiş taksi yörüngelerindeki bireyleri, Londra’daki bisiklet paylaşım gezilerini, Riga’daki metro verilerini ve cep telefonu ve kredi kartı veri kümelerini benzersiz bir şekilde tanımlayabildikleri” önceki çalışmalara da işaret ediyor.
Sizi yeniden tanımlamak için çok az veri noktası gerekiyor
Çalışmanın arkasındaki araştırmacılar, sadece üç veri noktası olan varsayımsal bir sağlık sigortası şirketinden tanımlanma şansınızı (yalnızca ABD ve İngiltere sakinleri için) test edebileceğiniz çevrimiçi bir form oluşturdular: cinsiyetiniz, doğum tarihiniz ve posta kodunuz.
Örneğin, 12 Kasım 1990’da doğan ve şu anda 02139 posta kodunda yaşayan bir ABD’li erkekseniz, % 54 işvereninizin veya komşunuzun sizi tanımlama şansı.
Ancak, daha fazla özellik eklediğinizde bu yüzde artar: Medeni durumunuzu tek başına eklemek sizi en fazla % 99. Diğer özellikler arasında araç sayısı, çalışma sınıfı (seçilen endüstri) ve ev sahipliği sayılabilir..
Şirketler verilerimizi nasıl anonimleştirmeli??
Bu çalışmadan, mevcut anonimleştirme uygulamalarının insanların gizliliğini yeterince korumadığı ve bu verilere erişimi olan herkes tarafından yeniden tanımlanmaya karşı savunmasız bırakmadıkları açıktır..
Ne yazık ki, bireyin burada yapabileceği pek bir şey yok – bu verileri depolayan, satan ve kullanan verileri ve verileri anonimleştirme şeklini değiştirmek için kullanan şirketlere ve kurumlara bağlıdır. AB’nin GDPR ve Kaliforniya’nın Tüketici Gizliliği Yasası gibi düzenlemelerin her ikisi de tüm veri kümelerindeki kişilerin anonim olmasını ve yeniden tanımlanmasının imkansız olmasını gerektirir, ancak şirketleri sorumlu tutmak zor olabilir.
Anonimleştirilmiş verilerde yeniden tanımlamayı önlemenin bir yolu, bir sunucuya gönderilmeden önce verilere kontrollü miktarda rastgele “gürültü” ekleyen ve verileri doğrudan biraz daha yaklaşık hale getiren matematiksel bir model olan farklı gizliliği benimsemektir. ancak bireyin mahremiyetini yeterince korur. Apple ve Google gibi şirketler veri toplamalarına farklı gizlilik kattılar.
Kısa süre içinde teste ayrıcalıklı gizlilik getirilecek. Bir sonraki ABD nüfus sayımında kullanılacak.
Kendinizi korumak için atabileceğiniz adımlar
Bir şirket anonimleştirilmiş verileri üçüncü taraflarla paylaşma izninizi istediğinde ne yapmalısınız? Verilerinizi anonim hale getirmeyi düşünün. Her şirket gerçek doğum tarihinize, gerçek posta kodunuza, cinsiyetinize veya medeni durumunuza, hatta gerçek adınıza sahip olmaya hak kazanmaz. Bir ayrıntı, belirli bir hizmeti kullanmanız için önemli değilse, etrafınıza bir miktar tutarsızlık serpin. (Ayrıca, posta kutunuzda benzersiz bir şekilde yanlış yazılmış bir ad görünmeye başlarsa, tam olarak hangi şirketin sizi sattığını bilirsiniz.)
Daha da iyisi, yalnızca hangi verileri topladıkları konusunda tamamen açık olan, asla ihtiyaç duymadıkları hiçbir veri toplamayan, kişisel bilgilerinizi asla üçüncü bir tarafla paylaşmayan veya satmayan ve hatta temel tanıyı bile anonimleştiren şirketlerle iş yapın bilgi ölümcül ciddi bir şekilde (ve hatta dilerseniz dışarıda bırakmanıza izin verir). En az birini biliyoruz.