Hibrit analiz yöntemlerini kullanarak makine öğrenmesi yardımıyla android kötücül yazılımların tespit edilmesi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2019

Öğrenci: ABDURAHMAN AYDIN

Danışman: İBRAHİM ALPER DOĞRU

Özet:

Günümüzde, insanların bilgiye erişimini ve haberleşmesini kolaylaştıran akıllı mobil cihazlar, insan yaşamının önemli bir parçası haline gelmiştir. Yapılan istatistiklere göre dünya çapında en yaygın kullanılan mobil işletim sistemi Android'dir. Android cihazların büyük bir pazar payına sahip olması ve kötücül yazılımların dağıtımının kolay olması, Android'i kötücül yazılım geliştiricilerin hedefi haline getirmektedir. Uygulama marketlerindeki kötücül uygulama sayısının fazla olmasının sebebi, yüklenen uygulamaların yeterli bir güvenlik taramasına tabi tutulmamasıdır. Android cihazların güvenliğinin temini için kötücül uygulamaların tespitinin etkin bir biçimde yapılması gerekmektedir. Android kötücül uygulamaların tespitinde statik, dinamik ve hibrit analiz yöntemleri kullanılmaktadır. Tez çalışması kapsamında hibrit analiz uygulanmış olup, hem statik hem de dinamik analiz yöntemlerinin avantajlarından faydalanılmıştır. İyicil uygulamalar AndroZoo veri setinden, kötücül uygulamalar Drebin veri setinden alınmıştır. Android SDK kapsamında yer alan Monkey ve Monkeyrunner araçları kullanılarak yapılan işlemler Android Sanal Cihaz üzerinde gerçekleştirilmiştir. Statik analiz aşamasında tehlikeli izinler, dinamik analiz aşamasında ise sistem çağrıları ve ağ trafiği incelenmiştir. Elde edilen veriler Temel Bileşen Analizi yöntemi (TBA) kullanılarak Random Forest ve Naïve Bayes makine öğrenmesi algoritmalarıyla ve ayrıca TBA yöntemi kullanılmadan Destek Vektör Makinesi ve K En Yakın Komşu algoritmalarıyla sınıflandırılmıştır. Kullanılan makine öğrenmesi algoritmaları içerisinde sınıflandırma işlemini en başarılı olarak random forest yönteminin yaptığı tespit edilmiştir. TBA + random forest algoritmasının doğruluk oranı %98,7, TPR'si %99,2, FPR'si %1,8, duyarlılık oranı %98,2 ve F-Measure değeri %98,7'dir.