Şifrelenmiş İnternet Trafiğinin Makine Öğrenmesi Yaklaşımı İle Sınıflandırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Türkiye

Tezin Onay Tarihi: 2021

Tezin Dili: Türkçe

Öğrenci: Mesut UĞURLU

Danışman: İBRAHİM ALPER DOĞRU

Özet:

İnternet kullanım oranı dünya genelinde %62’inin üzerindedir ve bu oran günden güne artmaktadır. Bu artış ile birlikte internet üzerinden akan trafikteki bilgilerin gizliliğini sağlamak önem kazanmaktadır. Bunun için şifreleme algoritmaları ve protokoller kullanılmaktadır. Kullanıcılar için faydalı olan bu durum saldırganlar tarafından gizlenmek amaçlı da kullanılmaktadır. Saldırganlar şifrelenmiş trafik ile IDS/IPS ve antivirüs sistemlerini atlatabilme yeteneği kazanmaktadırlar. Şifrelenmiş trafiğin deşifrelenmesi işlemi yapılmadan içerik analizi yapılamadığı için mevcut ticari güvenlik çözümleri bu durum karşısında yetersiz kalmaktadır. Bu çalışmada XGBoost, Karar Ağacı ve Rassal Orman sınıflandırma algoritmaları kullanılarak şifrelenmiş paketler üzerinden giden-gelen veriler analiz edilerek trafiğin sınıflandırılması amaçlanmıştır. Bu sayede deşifreleme yapılmadan sadece akan trafik üzerinde gelen giden paketlerin boyut, süre gibi bazı meta verileri kullanılarak sınıflandırılması ile ağ uzmanları ve siber güvenlik uzmanlarının ağ üzerindeki analiz yetenekleri artırılarak siber saldırıların tespiti ve saldırılara karşı önlem alınması mümkün olmaktadır. Bu çalışmada önerilen modelin test edilmesi için ISCX VPNnonVPN veri seti kullanılmıştır. Oluşturulan yapı ile şifreli paketler yüksek başarı oranı ile sınıflandırılmış ve XGBoost sınıflandırma metodu kullanılarak %94,53 başarı yakalanmıştır.