Riwayat YouTube Anda terbuka: Peneliti mengidentifikasi cacat keamanan yang melekat dalam streaming video

Kelemahan keamanan lalu lintas YouTube terbuka

Sementara meneliti bagaimana Penyedia Layanan Internet (ISP) dapat mengoptimalkan layanan mereka untuk meningkatkan pengalaman menonton video pengguna, pakar keamanan cyber Ran Dubin menyadari bahwa ISP dapat memastikan lebih dari sekadar kualitas menonton — mereka dapat, jika mereka mau, menentukan ketepatan judul video yang ditonton pengguna mereka.

Metode Dubin berbeda dari pendekatan pemantauan biasa dalam hal itu hanya menganalisis pola lalu lintas, sedangkan teknik pemantauan tradisional melihat data yang tidak terenkripsi, mengeksploitasi kelemahan dalam protokol, atau menganalisis paket individu.

Meskipun YouTube menggunakan enkripsi untuk mengamankan data Anda, Dubin menjelaskan kepada ExpressVPN, siapa pun yang menonton jaringan Anda dapat menentukan dengan tepat apa yang Anda tonton — tetapi ada cara Anda dapat melindungi diri Anda sendiri..

Memetakan aliran ke pola

Dubin memberi tahu ExpressVPN,

“Saya menemukan bahwa semua aliran sebenarnya memiliki pola yang sangat istimewa. Dan pola-pola itu dapat diidentifikasi. ”

Peramban Anda melakukan dua hal ketika Anda menggunakan YouTube untuk mengalirkan video:

  1. Ini membuka saluran terenkripsi dengan YouTube di mana semua data ditransfer.
  2. Ia meminta dan menerima bagian kecil video pada kualitas tertentu, tergantung pada kecepatan koneksi jaringan Anda.

Meskipun dienkripsi, mekanisme penyandian menghasilkan data yang cukup untuk pengamat pasif yang canggih untuk mengumpulkan apa yang Anda tonton. Di tangan yang salah, data ini dapat dengan mudah dijual atau digunakan untuk menargetkan dan mendiskriminasi hampir semua orang.

Setiap video memiliki tanda tangan unik dan dapat dilacak

Penelitian Dubin menemukan bahwa ketika video Anda sedang dimuat, siapa pun yang mengamati koneksi — seperti ISP Anda, seorang peretas yang mengetuk jaringan Wi-Fi Anda, atau agensi pemerintah — dapat mengikuti pola berbeda dari aliran data terenkripsi dari waktu ke waktu..

Pola ini ada karena video diunduh dalam ‘potongan’, menciptakan puncak dan keheningan dalam aliran lalu lintas. Dengan menganalisis jumlah bit per puncak — ditentukan, misalnya, dengan jumlah warna atau gerakan cepat dalam potongan video itu — suatu tanda tangan untuk video itu dibuat, yang memungkinkannya diidentifikasi secara unik..

Geser kutipan dari kuliah Dubin di Black Hat Europe 2016Geser kutipan dari kuliah Dubin di Black Hat Europe 2016. Dengan izin dari R. Dubin.
Ran Dubin, Amit Dvir, Ofir Pele, dan Ofer Hadar. “Saya Tahu Apa yang Anda Lihat Menit Terakhir – Kotak Peramban Chrome.” Kuliah, Black Hat Europe 2016, London, 3 November 2016.

Untuk mencocokkan setiap pola dengan video, pengamat pasif harus memiliki daftar yang sudah dikompilasi dari semua video yang ingin mereka pantau. Meskipun akan sulit untuk menyusun daftar semua video yang tersedia di YouTube (mengingat bahwa sekitar 300 jam konten baru diunggah setiap menit), dimungkinkan untuk menyusun daftar tersebut untuk video populer — atau video yang menarik.

Potensi untuk penyalahgunaan privasi

Meskipun menentukan video apa yang Anda tonton bukanlah hal yang mudah, analisis pasif ini dapat menjadi sangat merepotkan jika kelompok dengan motif yang salah dapat menentukan apakah Anda menonton video di salah satu dari daftar yang dikompilasi ini:

  • Video yang terkait dengan politisi tertentu
  • Video yang terkait dengan gerakan resistensi tertentu
  • Video informasi tentang kondisi kesehatan tertentu
  • Video yang terkait dengan penghentian merokok atau kecanduan lainnya

Ini meningkatkan kemungkinan bahwa siapa pun dapat ditargetkan, digabungkan, atau didiskriminasi oleh pemerintah, ISP, atau penyedia asuransi kesehatan mereka hanya dengan video yang mereka tonton.

Cara kerja analisis lalu lintas jaringan YouTube pasif

Bayangkan seorang pengamat berdiri di luar rumah Anda dan mengamati semua paket yang dikirim ke pintu Anda.

Meskipun setiap paket memiliki ukuran, bentuk, dan berat yang berbeda, pengamat dapat mencocokkannya dengan katalog paket yang diketahui dan menyimpulkan apa yang Anda pesan, meskipun mereka tidak pernah membuka paket Anda..

Saat Anda menggunakan YouTube, setiap paket tidak hanya memiliki tanda tangan yang unik — ia juga membawa alamat IP pengirim (YouTube) dan penerima (Anda). Dengan alamat IP ini, seorang pengamat dapat menentukan apakah suatu paket dikaitkan dengan video YouTube — bersama dengan identitas Anda.

Pengamat ini bisa menjadi peretas yang mengontrol router di kedai kopi lokal Anda, administrator jaringan Wi-Fi kampus Anda, atau ISP Anda.

Dubin: “Saya bahkan bisa menebak video apa yang Anda tonton setelah sekitar 30 hingga 40 detik waktu menonton.”

Penelitian Dubin bahkan berlaku ketika Anda hanya menonton sebagian video — dan berpotensi secara real time juga. “Saya memiliki demo berbeda yang menunjukkan bahwa saya dapat memprediksi dalam bagian waktu nyata dari video, juga. Namun, keakuratan algoritme ini belum selesai. “Ia memperkirakan bahwa diperlukan waktu menonton sekitar 30 hingga 40 detik untuk menentukan video mana yang Anda tonton.

Haruskah kita khawatir tentang pemantauan massa video?

Iya dan tidak. Meskipun pengawasan pada titik ini mungkin dilakukan, biayanya mahal, karena pengamat perlu menyusun daftar semua video YouTube yang ingin mereka identifikasi dan kemudian menganalisisnya satu per satu. Ini mungkin terdengar berat, tetapi hanya perlu dilakukan sekali untuk setiap video yang menarik.

Kondisi jaringan variabel dapat menimbulkan tantangan tambahan, karena packet loss dan penundaan jaringan menciptakan ketidakpastian. Namun, Dubin menunjukkan bahwa ia masih dapat mencapai tingkat keberhasilan prediksi yang sangat tinggi dalam kondisi ini.

Karena pola pra-rekam hanya cocok secara probabilistik dengan yang diamati, satu set data yang sangat besar kemungkinan akan berisi beberapa kecocokan salah. Dubin menjelaskan bahwa sementara studinya mengamati nol false-positif dengan ukuran sampel 2000 video, secara drastis meningkatkan jumlah judul dapat meningkatkan jumlah ini karena “fitur Bit-Per-Peak mungkin tidak 100% unik.”

Sementara analisis ini secara teoritis dapat berlaku untuk layanan dan tipe data lain (pikirkan Netflix, Facebook, atau Spotify), Dubin tidak akan berspekulasi tentang layanan lain mana yang rentan. Tetapi dia mengatakan dia mungkin merencanakan proyek penelitian berikutnya di sekitar layanan seperti ini.

Cara melindungi aktivitas YouTube Anda dari dilacak

Meskipun YouTube secara teoritis dapat menambah kebingungan pada video mereka, Ran Dubin memiliki saran tentang bagaimana Anda dapat melindungi diri sendiri hari ini:

“Anda dapat menggunakan VPN [atau] Anda dapat menggunakan jaringan Tor untuk membuat identifikasi jauh lebih sulit.”

Menggunakan jaringan seperti Tor atau VPN menghapus alat identifikasi langsung: alamat IP Anda. Dengan menggunakan VPN, seorang pengamat masih dapat melihat video mana yang ditonton dari server VPN, tetapi lalu lintas itu akan bercampur dengan ratusan lalu lintas pengguna lain, menggagalkan kemampuan untuk menentukan siapa yang menonton dan dari mana.

Kembali ke metafora paket, VPN atau Tor pada dasarnya menciptakan gudang reshipment di mana semua paket ditujukan dan dikirim. Di dalam, mereka terakumulasi, dikemas ulang, dan isian sesekali ditambahkan untuk kebingungan lebih lanjut. Saat barang-barang dikemas kembali dikirim ke rumah Anda, seorang pengamat tidak bisa lagi menebak apa yang ada di dalam atau siapa yang mengirim paket..

ISP Anda, atau pengamat lain apa pun antara Anda dan penyedia VPN Anda, akan melihat lebih sedikit informasi. Karena langkah-langkah kebingungan yang diterapkan oleh aplikasi VPN modern, pola lalu lintas Anda tidak akan lagi cocok dengan yang mereka mungkin rekam, membuat data yang mereka kumpulkan dari Anda tidak berarti.

Waspadalah terhadap metadata Anda!

Bahkan data terenkripsi membawa metadata. Saat Anda mengalirkan video YouTube melalui HTTPS, metadata ini datang dalam bentuk cap waktu, alamat IP, ukuran video, panjang video, dan — seperti yang ditunjukkan Dubin — pola yang digunakan untuk mentransmisikan data.

Jaringan proksi seperti jaringan Tor atau VPN dapat membantu menghapus metadata itu dengan mengaburkannya atau dengan merutekannya melalui lapisan proksi.