Mobil uygulama ağ trafiğinin derin öğrenme yöntemleri kullanılarak sınıflandırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2023

Tezin Dili: Türkçe

Öğrenci: İmren DAŞDEMİR YAŞAR

Danışman: Aysun Coşkun

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Bilişim alanında ortaya çıkan hızlı ilerlemeler ticari ve bireysel internet kullanımını her geçen gün daha da artırmaktadır. Ayrıca, internet kullanım karakteristiği sabit masaüstü iş istasyonlarından mobil yöne doğru kaymaktadır. Tez çalışmasında, son yıllarda genel internet kullanımında ağırlığı gittikçe artan mobil uygulama ağ trafiğinin sınıflandırılması üzerine odaklanılmıştır. Bu kapsamda, mobil uygulama ağ trafiğinin makine öğrenmesi, derin öğrenme ve özellik seçme yöntemleri ile otomatik sınıflandırılması gerçekleştirilmiştir. Tez çalışmasında, sırasıyla 2019 ve 2022 yılında yayınlanarak araştırmacıların kullanımına sunulan MIRAGE-2019 ve MIRAGE-COVID-CCMA 2022 olmak üzere iki güncel veri seti kullanılmıştır. MIRAGE-2019 veri seti AccuWeather, Comics, Dropbox, Duolingo, Facebook, FourSquare, Groupon, Messenger, OneFootball, Pinterest, Slitter.io, Spotify, Subito, Trello, TripAdvisor, Twitter, Viber, Waze, Wish ve Youtube olmak üzere toplam 20 adet mobil uygulamaya ait 317 731 adet mobil ağ trafiği verisi içermektedir. MIRAGE-COVID-CCMA-2022 veri seti ise Discord, GotoMeeting, Meet, Messenger, Skype, Slack, Teams, Webex ve Zoom olmak üzere toplam 9 adet iletişim ve iş birliği mobil uygulamasını ait 263 619 adet mobil ağ trafiği verisi içermektedir. Bu kapsamda, tez çalışmasının birinci sınıflandırma uygulamasında MIRAGE-2019 veri seti üzerinden 20 sınıflı, ikinci sınıflandırma uygulamasında ise MIRAGE-COVID-CCMA-2022 veri seti üzerinden 9 sınıflı otomatik sınıflandırma gerçekleştirilmiştir. Sınıflandırma uygulamalarının deneylerinde makine öğrenmesi olarak Destek Vektör Makinesi, k-En Yakın Komşu, Adaptif Güçlendirme ve Rastgele Orman sınıflandırıcılardan; derin öğrenme olarak ise Evrişimli Sinir Ağları, Uzun Kısa Süreli Bellek, Çift Yönlü Uzun Kısa Süreli Bellek ve Kapılı Tekrarlayan Birim sınıflandırıcılardan yararlanılmıştır. Özellik seçme işlemleri ise Minimum Fazlalık Maksimum Uygunluk, k-En Yakın Komşu ve Rastgele Orman olmak üç farklı yöntem ile gerçekleştirilmiştir. Sınıflandırma uygulama sonuçları MIRAGE-2019 veri seti için %90’ın ve MIRAGE-COVID-CCMA-2022 veri seti için %95’in üzerinde bir genel doğruluk ve ağırlıklı F1-Skoru başarısı ile otomatik sınıflandırma yapılabileceğine işaret etmektedir. Tez çalışması sonucunda elde edilen bir diğer önemli çıkarım ise özellik seçme aşamasının sınıflandırma sürecine dahil edilmesinin hemen hemen bütün sınıflandırıcılar için sonuçları olumlu yönde etkilediğidir. Ayrıca gerek çalışma süresi gerek sınıflandırma başarısı açısından en uygun sınıflandırma yapısının Minimum Fazlalık Maksimum Uygunluk ile seçilen özelliklerin Rastgele Orman sınıflandırıcı ile sınıflandırılması olduğu sonucuna varılmıştır.

Anahtar Kelimeler : Akış özellikleri, derin öğrenme, makine öğrenmesi, mobil ağ trafik sınıflandırması, özellik seçme