SÖZCÜKSEL ANALİZ KULLANARAK KÖTÜ NİYETLİ URL'LERİ DERİN ÖĞRENME TEKNİKLERİ İLE TESPİT ETME


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: Cemile SARICAOĞLU

Danışman: Mehmet Demirci

Özet:

Günümüzde yeni geliştirilen teknolojiler insan hayatını kolaylaştırmaktadır. Fakat internet ve siber âlem siber saldırılara açık bir ortamdır. URL'ler saldırı için kullanılan temel araçlardan bir tanesidir. Kötü niyetli URL'ler phishing, spam, finansal dolandırıcılık ve malware gibi pek çok internet suç aktivitesi için temel bir mekanizmadır. İnternetteki kötü niyetli URL'leri etkili bir şekilde tespit etmek ve sınıflandırmak amacıyla araştırmacılar tarafından kara liste hizmetleri geliştirilmiştir. Kötü niyetli URL'leri kara listeye almak hem kötü niyetli URL'nin hem de yeni oluşturulan URL'nin varyasyonlarını bulmakta tamamen etkili olmadığı için bu durum sorunun yalnızca bir kısmını çözmektedir. Devamlı güncelleme yapılması gerektiği için de zaman alıcı bir yaklaşımdır. Kötü niyetli URL'lerin saldırı türlerine göre tespit edilmesi ve sınıflandırılması bu saldırıları engellemek için kritik öneme sahiptir. Bir tehdidin türünü bilmek, saldırının ciddiyetinin tahmin edilmesini sağlamakta ve etkili bir önlem alınmasına yardımcı olmaktadır. Bu tez çalışmasında, kötü niyetli URL'lerin saldırı türlerine göre tespit edilmesi ve sınıflandırılması için derin öğrenme kullanan bir yöntem önerilmiştir. Aynı zamanda literatürde çok sayıda örneği olan makine öğrenmesi yöntemi de kullanılmıştır. URL'lerin proaktif tespiti için sözcüksel analiz kullanılmıştır. İyi huylu, spam, phishing, malware ve defacement olmak üzere beş farklı URL türü hem makine öğrenmesi hem de derin öğrenme yöntemleri ile incelenmiştir. İki yöntemde de ikili ve çoklu sınıflandırma yapılmıştır. Sonuçlar kendi içlerinde karşılaştırılmıştır. Alınan sonuçlar literatür ve makine öğrenmesi algoritmaları ile karşılaştırıldığında daha başarılı sonuçlar elde edilmiştir.