Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2024
Tezin Dili: Türkçe
Öğrenci: Berrin DEĞİRMENCİ
Danışman: Oktay Yıldız
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:
Barınma, tüm dünyada üniversite öğrencileri için önemli bir sorun oluşturmaktadır. Üniversite öğrencilerinin büyük bir bölümü öğrenim hayatlarının bir döneminde devlet yurtlarında kalmaktadır. Ülkemizde 2023 yılı verilerine göre devlet yurtları 900 bin yatak kapasitesine ulaşmış olmasına rağmen, halen barınma sorunu yaşayan öğrenciler bulunmaktadır. Bu noktada yurtların iyi organize edilmesi, mevcut kapasitenin en uygun şekilde kullanılması ve ihtiyaç sahibi öğrencilere ortam oluşturulması büyük önem arz etmektedir. Gerçekleştirilen bu tez çalışmasında, Kredi ve Yurtlar Genel Müdürlüğü (KYGM)’nde barınan öğrencilerin; yurttan ayrılma nedenlerinin veri madenciliği yöntemleriyle analiz edilmesi, yurt şartlarının iyileştirilmesi veya sosyal ortamın düzenlenmesi için öneriler sunulması, ayrılma nedenleri ve barınan öğrencilerin çeşitli özellikleri analiz edilerek; ayrılması baştan öngörülen öğrencilerin yurt başvuru ve yerleştirme kriterlerinin yeniden gözden geçirilmesinin sağlanması amaçlanmıştır. Mevcut veri üzerinde ilk aşamada veri ön işleme ve öznitelik analizi gerçekleştirilmiştir. Öznitelik seçimi, korelasyon tabanlı özellik seçimi ve bilgi kazancı kullanılarak yapılmıştır. Temel makine öğrenmesi yöntemleri ile modellerin aşırı uyumunu önlemek için 10-kat çapraz doğrulama kullanılmıştır. Ankara ilinde barınan öğrenci verileri ile oluşturulan yurt öğrenci veri kümesinde, karar tablosu (decision table) %86,95 doğruluk ve %89 AUC, adaboost %86,93 doğruluk ve %89 AUC, karar kütüğü (decision stump) %86,93 doğruluk ve %85 AUC ile iyi performans gösteren sınıflandırıcılar olmuşlardır. %91,6 ile en iyi AUC alanına sahip random forest %86,3 doğruluk oranı göstermiştir. Öncelikli öğrenci verileri dikkate alınan öncelikli öğrenci veri kümesinde ise logistBoost %81,89 doğruluk ve %88 AUC, karar ağacı (J48) %81,59 doğruluk ve %83 AUC oranı ile en iyi performans veren algoritmalardır. Sınıflandırıcılar; doğruluk, hatırlama, kesinlik, f-ölçüsü ve ROC eğrisi gibi metrikler kullanılarak değerlendirilmiştir. Sonuçlar; yurt öğrenci veri kümesinin decision table, öncelikli öğrenci veri kümesinin logistBoost algoritmalarını kullanarak daha iyi sınıflandırıldığını ortaya çıkarmıştır.
Anahtar Kelimeler : Yurt memnuniyeti, kümeleme, sınıflandırma, makine öğrenmesi, veri madenciliği