SINIF DENGESİZ BÜYÜK VERİDE DOLANDIRICILIK TESPİTİ VE AÇIKLANABİLİRLİK


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2020

Tezin Dili: Türkçe

Öğrenci: DUYGU SİNANÇ TERZİ

Danışman: ŞEREF SAĞIROĞLU

Özet:

Elektronik ortamlarda gerçekleştirilen dolandırıcılık, doğası gereği dinamik bir problemdir. Çözüm modellerinin geliştirilmesi için eğitim sürecinde kullanılacak olan verilerin temini ve temin edilen verilerin etiketlenmesi zor, dolandırıcı olarak etiketli verinin miktarı ise genele oranla oldukça azdır. Büyük veri çağının sınıflar arası farkı daha da artırması ve geleneksel makine öğrenmesi yaklaşımlarının dengeli sınıf dağılımı varsayımı üzerinde tasarlanmış olması, dolandırıcılık tespit sürecini daha da zorlaştırmaktadır. Bu bağlamda, ilk defa bu tez kapsamında dolandırıcılık tespiti problemi sınıf dengesiz büyük veride veri bilimi bakış açısı ile ele alınmıştır. Telekom ve kredi kartı dolandırıcılığı özelinde, üç yeni tespit yöntemi ve bir açıklanabilir yapay zekâ yaklaşımı geliştirilmiştir. İlk yöntem, hem kullanıcıların belirli bir zaman diliminde yaptığı aktivitelerde oluşan anormal durumlardan hem de bilinen dolandırıcı aktivitelerinden faydalanılan, büyük veri analitiği tabanlı bir tespit sunar. İkinci yöntem, çoğunluk ve azınlık sınıf arasındaki dengesizliği gidermek amacıyla büyük veri analitiği ile kümeleme tabanlı yeniden örnekleme yaptıktan sonra sınıflandırma gerçekleştirerek dolandırıcılığı tespit eder. Üçüncü yöntem ise, dolandırıcılık verisini zamansal ilişkilerini koruyarak görüntüye dönüştürüp, özelliklerin ikili ilişkilerini çıkardıktan sonra derin sinir ağı ile sınıflandırmayı sağlar. Bu yöntemlere ilave olarak, geliştirilen yöntemler açıklanabilirlik açısından ele alınmış ve üçüncü yöntemin ne öğrendiğini daha iyi ortaya koymak amacıyla ısı haritası tabanlı yeni bir açıklanabilirlik yaklaşımı geliştirilmiştir. Bu yaklaşım, dolandırıcı-görüntü dönüşümünü sağlayan üçüncü tekniğin ürettiği ve belirli bir ölçekteki renk haritalarından oluşan görüntüler üzerindeki ilişkilerin daha net ifade edilmesini sağlamaktadır. Bu tez çalışmasında önerilen yöntemlerin; dolandırıcılık problemlerinin karşılaşılmadan çözümlenmesi, mevcudiyeti halinde otomatik olarak tespiti ve kullanıcılar ile hizmet sağlayıcıların karşılaşacakları risklerin azaltılmasına katkılar sağlaması beklenmektedir. Ayrıca, önerilen açıklanabilirlik yaklaşımının ise sadece dolandırıcılık değil diğer yapay zekâ modellerinin sonuçlarının da yorumlanmasına katkılar sağlayacağı öngörülmektedir