Zararlı web sayfalarının tespiti ve sınıflandırılması için yeni bir sistem önerisi


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2018

Öğrenci: CANSU KADI

Danışman: URAZ YAVANOĞLU

Özet:

Gün geçtikçe değişen ve büyüyen web teknolojileri, kullanıcıların bunlara olan ilgisinin artmasını fırsat bilen saldırganlar tarafından hedef haline gelmiştir. Kullanıcılar web sayfaları ile alışveriş, bankacılık, rezervasyon, fatura ödeme gibi etkileşim gerektiren önemli işlerini yapabildikleri gibi yalnızca bilgi de edinebilmektedir. Tüm bu işlemlerde başka kimselerin eline geçmesi istenmeyen hassas bilgiler paylaşılabilmektedir. Yalnızca bu web sayfalarına girilmesi halinde bile bu bilgilere ulaşılabilmek mümkün olmaktadır. Bu saldırılardan korunmak için web sayfasının güvenliğinden emin olmak gerekmektedir. Kurum ve kuruluşlarca kullanılan siber tehdit istihbaratı ile zararlı web sayfası tespitinin önemi daha da artmakla beraber bu amaçla yapılan çalışmalar da artarak geliştirilmiştir. Bu çalışmada da zararlı web sayfalarını tespit etmek için yeni bir sistem önerilmiştir. Zararlı ve zararsız web sayfalarının sözcüksel ve popülerlik özelliklerini, HTML özelliklerini ve JavaScript özelliklerini içeren bir veri seti oluşturulmuştur. Veri setindeki özellikler, incelenen çalışmalardan seçilen ve şüpheli olabileceği değerlendirilip önerilen özelliklerden seçilmiştir. k-En Yakın Komşu (k-NN), Destek Vektör Makineleri (DVM) ve Yapay Sinir Ağları (YSA) yöntemleri ile sınıflandırma işlemleri yapılmıştır. Yapılan testlerde YSA kullanımıyla %98,71 doğruluk oranına ulaşılmıştır. Veri seti üzerinde hesaplanan en düşük yanlış pozitif oranı ise DVM sınıflandırıcısı kullanılan testlerde %0,006 olarak ölçülmüştür. Elde edilen bu oranlar incelenen çalışmalardan daha yüksek olup, seçilen özellik sayısı da daha azdır. Bu özelliği ile işlem karmaşıklığı azaltılmıştır.