Açıköğretim öğrencilerinin okul terkine etki eden faktörlerin veri madenciliği ile keşfi


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Eğitim Bilimleri Enstitüsü, Eğitim Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2024

Tezin Dili: Türkçe

Öğrenci: SELMA TOSUN

Danışman: Dilara Bakan Kalaycıoğlu

Özet:

Bu çalışmanın amacı, açık ve uzaktan eğitimde okuyan öğrencilerin sistemler üzerinden elde edilebilecek verileri ile okul terki ve akademik başarı durumlarını tahmin etmek ve sınıflandırma performansı yüksek veri madenciliği modellerini belirleyerek bunlara göre akademik başarı ve okul terkinde etkili olan değişkenleri ortaya çıkartmaktır. Araştırmada, yükseköğretimdeki açık ve uzaktan eğitim öğrencilerinin demografik ve kişisel verileri ile ağırlıklı genel not ortalaması puanı değişken olarak alınarak okul terki riski taşıyan öğrencileri erken tespit edebilmek için veri madenciliği algoritmaları ile bir model geliştirilmiştir. Çalışmada veri madenciliği yaklaşımının eğitim alanında kullanılması ile bu algoritmalara dayalı olarak elde edilen sonuçların güvenirlik ve geçerlik değerlerinin ne düzeyde olduğu belirlenmiştir. Bu araştırma amacı bakımından nicel araştırma yöntemlerinden olan ilişkisel araştırma modelindedir. Araştırmanın türü, çalışma grubu, veri toplama araçları ve verilerin analizine yönelik işlemler, veri madenciliği için Alanlararası Standart Prosedürler (CRISP-DM) sürecinde yer alan aşamalar ile ilişkilendirilerek ele alınmıştır.  Araştırma, İstanbul Üniversitesi Açık Ve Uzaktan Eğitim Fakültesi’nde (İÜ AUZEF) 2021-2022 bahar dönemine kadar en az bir defa bir programa kayıt olan tüm öğrencilerin İstanbul Üniversitesi öğrenci bilgi sistemi veri tabanından elde edilen verileri ile yürütülmüştür. Analiz sürecinde okul terki ve akademik başarıya göre öğrencilerin Sınıflandırılmasında Rastgele Ağaçlar, C&RT, C5.0, CHAID, QUEST gibi Karar Ağaçları İle Naive Bayes (NB), Lojistik Regresyon (LR), Yapay Sinir Ağları (YSA) ve Destek Vektör Makinesi (DVM) gibi çeşitli VM algoritmaları kullanılmış ve bunların performansları doğruluk, duyarlılık, hassasiyet, kesinlik, negatif öngörü değeri, F1 puanı, MCC, AUC kriterlerine göre değerlendirilmiştir. Araştırmanın sonucunda okul terkine göre öğrencilerin sınıflandırılması için oluşturulan modellerin genel doğru sınıflandırma oranlarının 0,754 ile 0,790 arasında değiştiği görülmüştür. Tüm veri setinde genel sınıflandırma doğruluğu en yüksek model C5.0’dır. Ayrıca C5.0 modeli diğerlerine göre en yüksek duyarlılık, F1 puanı, kesinlik, negatif öngörü değeri ve MCC değerine de sahip olduğundan okul terkinin tahmininde modelin yeterli geçerliliğe sahip olduğu sonucuna varılmıştır. En yüksek hassasiyet C&RT modeli; en yüksek AUC değeri ise yapay sinir ağları modeli ile elde edildiği için bu üç modelin okul terkinin belirlenmesinde kullanılabileceği sonucuna ulaşılmış ve terkte etkili olan faktörler bunlar aracılığı ile ele alınmıştır. Modellerin okul terki için sınıflandırma yaparken ilk iki sırada ağırlıklı genel not ortalamasını ve öğrenci kayıt yılı faktörünü kullandığı; daha sonra ise modellere göre önem sırası farklılaşsa da program türü, yaş, kayıt/geliş şekli, öğrenim tipi, program düzeyi, ikamet ili ve cinsiyet değişkenlerinin sınıflandırmada etkili olduğu sonucuna ulaşılmıştır. Araştırma sonucunun okul terkinin azaltılmasına yönelik geliştirilecek stratejilere katkı sunması beklenmektedir.